Skip to content

Latest commit

 

History

History
36 lines (21 loc) · 1.15 KB

README.md

File metadata and controls

36 lines (21 loc) · 1.15 KB

python_zhihu

一个知乎爬虫(最新),模拟登录,获取答案,

python环境:python3.X 依赖的包:requests

下载文件到某个文件夹,然后运行,根据提示执行程序,

验证码问题:程序会下载验证码到文件目录下,你需要手动填写验证码,登录一次之后,会记录你的cookies下次可以直接登录,无需填写密码等,cookies文件也在程序文件目录下。

实例化:

from python_zhihu import ZhiHu

zh=ZhiHu()

下载某个问题下的高赞答案:

zh.get_answer_text('某问题的url')

这个方法会下载某个问题下的高赞文字答案,存储在一个txt文件中

下载某个问题下所有的图片:

zh.get_answer_img('某问题的url')

这个方法会下载某个问题下的答案中的所有图片,并且按照回答人的昵称归类

更新

通过不同的方式(邮箱或手机号)登陆

2016-12-14,继续更新

有同学提交了一点代码,可以自动打开验证码图片,并且可以按赞数排序,棒!

后期可能会加上更多功能,敬请期待....