前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >粉丝福利(附Python实现代码)爬虫简单分析代码

粉丝福利(附Python实现代码)爬虫简单分析代码

作者头像
罗罗攀
发布2018-07-03 14:39:15
8183
发布2018-07-03 14:39:15
举报

简书粉丝已破1000粉,为感谢各位看官的支持,给各位看官送波小福利。在本文章下点赞并评论,会从评论中随机抽取5位看官,每人送10元红包一份,抽奖时间为8月6号晚7点~

虽然1000粉丝不多,但也是对这大半年学习的肯定,本人现在读研,也没有额外的经济收入,看官们不要嫌少,等以后工作了,会给看官们更多更好的福利~


随机抽奖当然是使用我们的python爬虫啦,以以前的一篇文章为例,进行了代码的编写。

爬虫简单分析

  • 找包
  • 获取total_page,这个是评论的页数
  • json获取用户名称,存入list中
  • set转换去重,随机取5位用户

代码

代码语言:javascript
复制
import requests
import json
import random

def get_user(url):
    html = requests.get(url)
    json_data = json.loads(html.text)
    comments = json_data['comments']
    for comment in comments:
        nickname = comment['user']['nickname']
        user_list.append(nickname)

if __name__ == '__main__':
    user_list = []
    url = 'http://www.jianshu.com/notes/9315244/comments?page=1'
    html = requests.get(url)
    json_data = json.loads(html.text)
    total_pages = json_data['total_pages']
    urls = ['http://www.jianshu.com/notes/9315244/comments?page={}'.format(str(i)) for i in range(1,int(total_pages)+1)]
    for url in urls:
        get_user(url)
    user_list = set(user_list)
    print(random.sample(user_list,5))

注:这是随机抽样,每次运行结果不一样,这里只运行一次代码,获取幸运观众


运行结果我会公布在该文章中

结果以出炉:

我会联系各位中奖粉丝~谢谢大家的支持

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017.08.05 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 简书粉丝已破1000粉,为感谢各位看官的支持,给各位看官送波小福利。在本文章下点赞并评论,会从评论中随机抽取5位看官,每人送10元红包一份,抽奖时间为8月6号晚7点~
  • 爬虫简单分析
  • 代码
    • 注:这是随机抽样,每次运行结果不一样,这里只运行一次代码,获取幸运观众
      • 运行结果我会公布在该文章中
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档