前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >易班易瞄瞄指定话题用户动态自动爬取并保存

易班易瞄瞄指定话题用户动态自动爬取并保存

作者头像
SingYi
发布2022-07-14 15:01:08
4460
发布2022-07-14 15:01:08
举报
文章被收录于专栏:Lan小站Lan小站

因为最近有需要统计易瞄瞄指定话题下的用户发表的动态内容,还需要统计点赞数,发表时间等信息,因此随手写了一个小脚本,这个呢就不写教程了,直接放代码和效果图,需要自己手动获取易班的login_token,抓客户端包即可,或者浏览器F12,以前也写过易班登录JS。修改topicid既可切换话题

image.png
image.png
代码语言:javascript
复制
import re
import time

import requests

print('正在获取秘钥!')
info = input("请输入Token")
url = f'https://ymm.yiban.cn/news/list/news?loginToken={info}&page=1&size=100&topicId=2'
res = requests.get(url=url).json()
if res['message'] == "操作成功" and info['version'] == "暂无":
    data = res['data']['list']
    print('正在下载数据!')
    with open('易喵喵点赞数量.csv', 'w', encoding='utf8') as f:
        f.write('用户id,学号,用户名,文字内容,11点,赞数,发布时间
')
        print("正在写入数据!")
        for i in data:
            title = i['title'].replace('
', '').replace(',', ',')
            likenum = i['likeNum']
            time_local = time.localtime(int(i['createTime']))
            date = time.strftime("%Y-%m-%d %H:%M:%S", time_local)
            riqi = time.strftime('%H', time_local)
            if int(riqi) > 11:
                riqi = "11点前"
            else:
                riqi = "11点后"
            xuehao = re.findall('([2][0][1][1-9]d*)', title)
            if xuehao:
                xuehao = xuehao[0]
            userid = i['origin']['User_id']
            usernick = i['origin']['usernick'].replace(',', ',')
            f.write(f'{userid},{xuehao},{usernick},{title},{riqi},{likenum},{date}
')
            print(f'{userid},{xuehao},{usernick},{title},{riqi},{likenum},{date}')
    print("作者:Lan,www.lanol.cn")
    input("结果已生成在软件目录下")
else:
    input("获取失败,请联系Lan")
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档