前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Hell is empty and all the devils are here.

Hell is empty and all the devils are here.

作者头像
不二小段
发布2018-04-08 12:12:26
8620
发布2018-04-08 12:12:26
举报
文章被收录于专栏:不二小段不二小段

废话不多说,有空再闲聊。这(只)是一篇技术贴。

如何用十行代码备份一个知乎问题下的(所有)回答。

已经备份好的前600回答: https://pan.baidu.com/s/1jHFOQWY

Step1 安装zhihu-oauth库

直接在命令行中使用命令“pip install zhihu-oauth”安装即可。

Step2 初次登录,并保存token文件

代码语言:javascript
复制
from zhihu_oauth import ZhihuClient
from zhihu_oauth.exception import NeedCaptchaException

client = ZhihuClient()
try:
    client.login('email or phone', 'password')
except NeedCaptchaException:    # 保存验证码并提示输入,重新登录
    with open('a.gif', 'wb') as f:
        f.write(client.get_captcha())
    captcha = input('please input captcha:')
    client.login('email or phone', 'password', captcha)
client.save_token('token.pkl')

Step3 十行代码,保存回答

知乎新增了访问限制,在600个答案左右会要求手动输入验证码

代码语言:javascript
复制
from zhihu_oauth import ZhihuClient
import zhihu_oauth
client = ZhihuClient()

client.load_token('token.pkl')
#client.set_proxy('')

ques = client.question(68546899)
print(ques.title)

answers = ques.answersfor answer in ques.answers:
    print(answer.author.name)
    answer.save(ques.title)

暂时没太好的解决办法。试着加了代理池,没什么效果。所以先存了前600回答。

Step -1

顺手的事情,做个词云。名字就叫,救救孩子。

大家按需自取,尽早备份。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-11-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 不二小段 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
验证码
腾讯云新一代行为验证码(Captcha),基于十道安全栅栏, 为网页、App、小程序开发者打造立体、全面的人机验证。最大程度保护注册登录、活动秒杀、点赞发帖、数据保护等各大场景下业务安全的同时,提供更精细化的用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档