粉丝福利(附Python实现代码)爬虫简单分析代码

简书粉丝已破1000粉,为感谢各位看官的支持,给各位看官送波小福利。在本文章下点赞并评论,会从评论中随机抽取5位看官,每人送10元红包一份,抽奖时间为8月6号晚7点~

虽然1000粉丝不多,但也是对这大半年学习的肯定,本人现在读研,也没有额外的经济收入,看官们不要嫌少,等以后工作了,会给看官们更多更好的福利~


随机抽奖当然是使用我们的python爬虫啦,以以前的一篇文章为例,进行了代码的编写。

爬虫简单分析

  • 找包
  • 获取total_page,这个是评论的页数
  • json获取用户名称,存入list中
  • set转换去重,随机取5位用户

代码

import requests
import json
import random

def get_user(url):
    html = requests.get(url)
    json_data = json.loads(html.text)
    comments = json_data['comments']
    for comment in comments:
        nickname = comment['user']['nickname']
        user_list.append(nickname)

if __name__ == '__main__':
    user_list = []
    url = 'http://www.jianshu.com/notes/9315244/comments?page=1'
    html = requests.get(url)
    json_data = json.loads(html.text)
    total_pages = json_data['total_pages']
    urls = ['http://www.jianshu.com/notes/9315244/comments?page={}'.format(str(i)) for i in range(1,int(total_pages)+1)]
    for url in urls:
        get_user(url)
    user_list = set(user_list)
    print(random.sample(user_list,5))

注:这是随机抽样,每次运行结果不一样,这里只运行一次代码,获取幸运观众


运行结果我会公布在该文章中

结果以出炉:

我会联系各位中奖粉丝~谢谢大家的支持

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏tkokof 的技术,小趣及杂念

《KOF2002》“扯蛋”修改记录

   本人比较喜欢游戏,格斗游戏尤为喜欢,平日没事多会游玩几番,而这游戏之间便有曾经风靡一时的《KOF2002》。

752
来自专栏ChaMd5安全团队

N1CTF2018 APFS&Lipstick题解

APFS题目描述 Apple released the brand new APFS on WWDC 2017 with a bunch of new feat...

31710
来自专栏Android先生

如何写出一篇登得上大雅之堂的技术博客

本文原标题为:【Mac流派】程序猿修炼之道(7)-技能篇之如何写出一篇登得上大雅之堂的技术博客,后因标题如古时女人的裹脚布——又臭又长,遂改为:...

833
来自专栏生信技能树

【直播】我的基因组67:clinvar数据库

遗传变异的数据库注释非常简单,就是从数据库里面下载记录文件,然后根据坐标对应一下即可,甚至很多成熟的工具都可以自动下载数据库以及比对,就跟我们前面讲到的把vcf...

37610
来自专栏数据的力量

google的搜索技巧

1428
来自专栏吉浦迅科技

DAY3:阅读CUDA C编程接口

1703
来自专栏安恒网络空间安全讲武堂

[HCTF] admin出题人求挨打

HCTF2018-web-admin来自出题人的write up

301
来自专栏PingCAP的专栏

吴镝:TiDB 在今日头条的实践

TiDB 主要应用在今日头条核心 OLTP 系统 - 对象存储系统中,存储其中一部分元数据,支持头条图片和视频相关业务,比如抖音等。

7515
来自专栏Albert陈凯

分布式系统(Distributed System)资料

分布式系统(Distributed System)资料 希望转载的朋友,你可以不用联系我.但是一定要保留原文链接,因为这个项目还在继续也在不定期更新.希望看到文...

7638
来自专栏大数据挖掘DT机器学习

不编程,手把手教你如何从网络采集海量数据

作者:赵一鸣 摘自:微信公号“沙漠之鹰” 不少朋友都会问:几十万条租房,二手房,薪酬,乃至天气数据都是从哪里来的?其实这些数据在十几分钟内就可以采集到! ...

3838

扫码关注云+社区