前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何用 Python 监控知乎热榜,及时发现高潜力问题?| 系统篇

如何用 Python 监控知乎热榜,及时发现高潜力问题?| 系统篇

作者头像
州的先生
发布2021-08-12 10:22:03
7510
发布2021-08-12 10:22:03
举报
文章被收录于专栏:州的先生州的先生

喜欢玩知乎的朋友都知道,知乎在很久以前就推出了一个类似于微博热搜的「热榜」栏目。

这个热榜目前有 50 个“热门”的问题。每个问题都带有十足的曝光度。

在之前,知乎「热榜」里面的话题,都是在各自细分领域里关注、讨论得火热的问题,才有机会出现在「热榜」里面。

但是最近州的先生发现,「热榜」列表里面,也开始出现一些冷门的问题,比如关注人数少、回答数少、最高赞也才几十个,甚至十几的问题。

比如,这个标称「50 万热度」的「热榜」31 位问题:

关注者只有 445 个,被浏览 11684 次,430 个回答最高赞的回答只有 3 个赞。

这个标称「6 万热度」的「热榜」47 位问题:

关注者为 586 个,被浏览 45159 次,回答数 156 个,最高赞回答的赞也未过百。

对于知乎的运营而言,把这些冷门问题放入热榜中,可能是为了避免热门问题带来的马太效应。

马太效应,一种强者愈强、弱者愈弱的现象,广泛应用于社会心理学、教育、金融以及科学领域。

知乎的运营者将这些冷门的问题放入「热榜」中,强行为这些问题带来曝光度,增加了这些冷门问题的活跃度。

对于知乎的创作者们而言,这不啻于一个天赐的流量机会。

要知道,在冷门问题里面回答问题,受制于问题本身的受关注度,回答能够被看到的机会很小。

在热门问题里面回答问题,受制于问题的火热程度,一方面高赞回答会受到更高的关注,另一方面火热的问题,回答者都想分一杯羹,导致自己的回答也是石沉大海。

寻找潜力问题是一个很苦很累的活(说到这里,咱们下一回是不是可以思考一下「用 Python 来搜索知乎高潜力的问题」?)

现在知乎官方给了一个现成的、官方提供了冷门高流量问题,岂不是正中创作者们的下怀。

现在我们知道可以在知乎热榜里面找自带官方浏览的冷门问题后,下一步就可以从「热榜」的这 50 个问题里面找出真正的名热实冷的问题了。

但是鼠标手一个问题一个问题地点击、查看、判断未免也太低效了。

还记得 Python 这个全能选手吗?用它来实现自动监控和判断知乎的「名热实冷」的问题吧。

整体的操作流程如下图所示:

首先使用 Python 登录知乎

然后请求「热榜」的网址:https://www.zhihu.com/hot ;

接着解析响应中的问题列表,提取出每一个问题的 URL,将其放入一个列表中;

随后遍历这个问题网址列表,请求每一个问题的 URL

解析提取出问题的关键性数据(关注者、被浏览数、回答数、最高赞等);

接着再用我们定义的规则与问题数据进行匹配(比如回答数不能超过多少,最高赞不能超过多少),如果匹配,将这些数据继续放入一个列表中,如果不匹配则跳过。

最后,如果存在匹配的问题,再将数据推送给配置的载体(邮件、钉钉群、企业微信群等)。

这样就实现了一整个「知乎热榜高潜力问题监控」系统操作流程,其结构如下所示:

(鉴于知乎登录成功后会长时间保持登录状态,所以州的先生偏向于使用 PyQt5 手动登录,然后持续自动监控)

下一篇文章,我们将继续介绍「知乎热榜高潜力问题监控」的 Python 代码实现,敬请期待!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-08-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 州的先生 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档