学习
实践
活动
工具
TVP
写文章

【开放源代码】集齐转!微博点详细信息抓取

微博的转都是构成微博社交关系网络的重要组成部分,其中转发和评论都在之前的推送中发布过。 2021 微博最新转发爬虫发布 2021 新版微博评论及其子评论爬虫发布 今天就来补齐的信息,并开放源代码,以李医生的最后一条微博为例子。 其URL地址为: https://m.weibo.cn/detail/4467107636950632#attitude 抓取保存的 csv 格式如下: 其中 lid 为微博的 id,user_verfied_type 为给该微博点的用户的认证类型,-1 就是没用认证,普通用户。 : '名人', 1: '政府', 2: '', 3: '媒体', 220: '' } 遗憾的是,测试发现,一条微博暂时只能抓到的上限在

60340

微信朋友圈如何自动点

不给别人点也没啥坏处,但你不,难免会让你和好友之间有些疏远,给别人点吧我又嫌麻烦,于是一直想着做个自动点的东西,今天基本实现了,虽然诸多不完整和诸多限制,但还是决定分享出来,主要是我觉得还挺好玩的 就拿评论点按钮的第一个点做定位,上图中的定位点,其X坐标是991,Y坐标需要扫描,定位依据是该点的ARGB颜色值是-11048043,这个值是我调试好久才抓出来的。 还有个关于向上滑动多少的问题,我们只需要互动使上一个点过的朋友圈恰好不显示就行了。    考虑到所有的细节后,代码流程图就这这样了,是不是比人工点复杂多了。      代码代码我放在github.com/xindoo/autojs,会持续更新。这里我也贴一份出来。 color == -1) { continue; } if (color == buttonColor) { // 按下评论点按钮

28320
  • 广告
    关闭

    【11.11特惠】CODING DevOps免费试用

    代码托管、项目管理、CI/CD、制品库等多种CODING DevOps产品和服务开箱即用,千行代码 5 分钟完成构建,个人开发者或小规模团队免费使用,企业资源包7折起…

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    44万条数据揭秘:如何成为网易云音乐评论区的网红段子手?

    之前由于懒,总是评论区放个代码就草草了事,技术号们也不太好转载,以后争取《凹凸数读》的每篇文章都在这个《凹凸玩数据》里写下流程。 这位“失眠的陈先生”看来各种情话娴熟于手啊,下面就以他举例来看看如何成为网易云音乐评论里的热段子手吧。 数据可视化 先看看这347条评论的数分布。 很明显,数并不多,大部分都在500之内,几百却能跻身热,这也侧面说明了这些歌曲是比较小众的,看来是经常在新歌区广撒网。 我们使用len() 求出每条评论的字符串长度,再画个分布图 ? 也许我们可以通过分析规律收获点,成为热网红段子手。但最终能打动人心的,依然是基于歌曲本身的真诚分享,和点出歌中蕴含的真正共鸣。 本文相关代码: #下载链接 https://t.zsxq.com/F6UfUbA ----

    35020

    44万条数据揭秘:如何成为网易云音乐评论区的网红段子手?

    E8%AF%AD&limit=35&offset='+str(i) print('已成功采集%i页歌单\n' %(i/35+1)) data = [] html = restaurant(url) doc = pq(html) for i in range(1,36): # 一页35个歌单 a = doc ,大部分都在500之内,几百却能跻身热,这也侧面说明了这些歌曲是比较小众的,看来是经常在新歌区广撒网。 《网易云音乐热的规律,44万条数据告诉你》 也许我们可以通过分析规律收获点,成为热网红段子手。但最终能打动人心的,依然是基于歌曲本身的真诚分享,和点出歌中蕴含的真正共鸣。 本文相关代码: #下载链接 https://t.zsxq.com/F6UfUbA

    9620

    44万条数据揭秘:如何成为网易云音乐评论区的网红段子手?

    昨天在凹凸数读写了一篇新文章,有关网易云音乐热的分析,链接如下: 《网易云音乐热的规律,44万条数据告诉你》 之前由于懒,总是评论区放个代码就草草了事,技术号们也不太好转载,以后争取《凹凸数读》的每篇文章都在这个 = restaurant(url) doc = pq(html) for i in range(1,36): # 一页35个歌单 a = doc 这位“失眠的陈先生”看来各种情话娴熟于手啊,下面就以他举例来看看如何成为网易云音乐评论里的热段子手吧。 数据可视化 先看看这347条评论的数分布。 很明显,数并不多,大部分都在500之内,几百却能跻身热,这也侧面说明了这些歌曲是比较小众的,看来是经常在新歌区广撒网。 我们使用len() 求出每条评论的字符串长度,再画个分布图 ? 《网易云音乐热的规律,44万条数据告诉你》 也许我们可以通过分析规律收获点,成为热网红段子手。但最终能打动人心的,依然是基于歌曲本身的真诚分享,和点出歌中蕴含的真正共鸣。

    30930

    『网络爬虫』这应该《速度与激情》系列9部中最拉胯的一部!!

    由于豆瓣短评的爬虫比较简单且网上有诸多案例,这里不做非常详尽的讲解,我们就分请求网页、解析数据和存储数据三个部分对照代码做简单的介绍。 另外,我们会把完整代码上传到公众号的案例库,大家后台回复“955”即可领取可执行代码。 1.1. m,差:l) _type = 'l' for page in range(30): html = get_html(tid,page,headers,_type) 来自宁赋闲看电影的差,主要就是对剧情设定的不合理的吐槽,也获得了很多点支持: Carsdon'tfly?就离大谱哈哈哈哈有钱真好,这要是没钱烧燃不起来,绝对就是吐槽博主的新素材。 以上就是本次全部内容,欢迎大家点转发、分享在看。。谢谢~

    22920

    实战 | 用Python爬取《云南虫谷》3.6万条评论,并做数据统计可视化展示分析,好看!

    论点数 3.8. 评论最多的用户 3.9. 评论词云 1. 评论数", bins=np.linspace(0, 100, 26), vertical_xlabel=True, hovertool=False, title="评论点数直方图 评论点数 咱们就看看被点最多的几条吧 # pd.set_option('display.max_colwidth',1000) (df.sort_values(by='up',ascending=False 超8000的点~~ 3.8. 我们看看他都啥了: df.query('userid==640014751')[['nick','剧集','time','content']].sort_values(by='time') 有点无聊

    23810

    #互联网资讯晚知道#

    1、微博针对“杠精”采取新规定:一人拉黑 禁3天 2、微信订阅号信息流大改版:新增常读订阅号等功能 3、手机淘宝小程序"轻店铺"开启内测 支持个人企业入驻 4、数据显示网名月均使用手机流量达4.85GB 同比增长170% 5、微信推出短视频小程序,可分享但无评论点功能 【周边新闻】 1、传微信内测「语音进度条拖拽」功能 2、微软发布SQL Server 2019公开预览版 3、腾讯音乐近期将进行第一次

    21020

    网易云音乐评论爬取。

    第一页妥妥的差。这两天「出山」的评论区热闹非凡。 大部分的评论都是希望能尊重原创,然后下架花粥的歌。 当然,也有不少给花粥洗白的水军在评论区游荡... / 02 / 评论获取 具体代码如下。 replace(' ', '').replace(',', ',') # 评论ID comment_id = str(item['commentId']) # 评论点数 这位用户果真花粥的铁粉,愣是刷了43条评论,其中还有一条评论点数四十几万。 其中红圈为评论ID,都不一样,说明评论都是唯一的,不重复。 ? 第二位用户,一共25条评论,不过她并没有点数多的。 ? 第三位用户,一共24条评论,同样没有点数多的评论。 好了,列举三位花粥的铁粉,点到为止。 下面来看一下被爆抄袭后的评论用户。 ? / 04 / 总结 最后来看一下评论的反差(以点数为排序)。 ? ? 总而言之,一句话,且行且珍惜。

    2.9K74

    Ajax出错并返回整个页面html的问题

    有这样一个例子在thinkPHP视图页面执行一个给评论点的功能,为了强化用户体验,一般都采用ajax异步请求后台处理点数据,成功后页面执行局部更新后的数据即可。 以下代码描述了一个获取评论ID,到ajax请求的过程。根据后台处理规则,cmthot方法会返回一个更新的后点数据(data)返回到前台。 ajax获取的评论ID丢到模型(模型代码就不贴了)去处理后拿到的新增后的点数返回给前台。 前台(前述代码)通过.html重写了新的数据。 发现问题的根源出自路由 为了排错,当时就把ajax改成了a链接直接提交。返回的结果一切正常,也就是说后台控制器和模型均正常,没有错误。 url:"{:url('/cmthot')}", 最终就因为一条斜杠造成返回一页的html,所以还是要仔细。

    31010

    手写爬虫之糗事百科段子及神回复

    先贴代码吧,然后再说遇到的坑 #! = response.read() return html def get_content(html): text1 = html.decode('utf-8') text2 ':') f.write(comment) f.write(' 点数:') f.write(dianzan_num) = open_url(url) get_content(html) if __name__ == '__main__': main() 我是将爬取的代码整合到一个txt文件中 comment, # 神的内容 dianzan_num # 神评点人数 )  它这个编辑器自动换行了我去。

    24320

    pycharm快速删除一行快捷键:ctrl+x(剪切掉)「建议收藏」

    ,"做UP不容易,阿P的哲学前来支持,也希望得到UP主的支持","阿P的哲学前来支持UP主,期待回访","阿P的哲学也在做着做UP主,支持一下UP,期待回访","阿P的哲学已经给UP点支持了,也希望得到 UP的","支持UP,期待回访","做UP不容易,阿P的哲学愿与UP一起努力!"])) import time import webbrowser import random import pyperclip import os #有时间打开程序 time.sleep(5) #2双击点 pyautogui.doubleClick(x=1559, y=580, button="left") # 标 鼠标在(100,150)位置左击两下 #进入循环 rp=1 for rp in range 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/174713.html原文链接:https://javaforall.cn

    14020

    放假啦技术人!这里还有劳动节专属礼包等你来领!

    屏幕前的你,是否正十指翻飞,敲出代码千行? 屏幕前的你,是否正目不转睛,修复一个个bug? 屏幕前的你,是否正废寝忘食,将系统不断迭代优化? 屏幕前的技术人,你们辛苦啦! 点亮文末右下角的「在看」,在评论区留言写下你的假期愿望,截止到5月7日上午10:00,留言区评论点数排名前50的粉丝朋友可参与抽奖。 ? 旅途中,戴上颈枕,休息得更加舒适? 领取规则 截止到5月7日上午10点,留言区评论点数前50名的粉丝朋友(若数相同,以留言时间先后顺序排名),请在5月8日下午18点前私聊腾小云(微信号:txcloudsq)发送关注公众号截图、留言区评论集及点亮

    14110

    教你两招,轻松搞定html页面导出为pdf文件

    文章尾部我放置了自己的视频号,大家可以给我留言✌ 欢迎大家加我的微信:milogenius,做个朋友圈点之交? 需求场景 在招投标软件中,每个标段结束标之后,都会生成标报告 标报告主要包含项目信息,标段信息,投标人信息,投标人报价,标专家打分等情况,相对来说信息量还是比较大,假如我们要导出标报告该如何做 即方便实现,又避免了由于页面的变动而需要改动导出功能代码的尴尬 方案调研 查阅了一些资料,目前市面上流行的解决方案主要有以下几种 wkhtmltopdf iText html2canvas+jsPDF 实战案例 html2canvas+jsPDF 现在,我们来看看html2canvas+jsPDF的实现方式 首先需要引入html2canvas和jsPDF的依赖文件。大家可以从官网下载。 由于本文设计到的代码比较多,我会打包上传到csdn,大家可以自行下载 ? 大家在微信公众号后台回复 "html2pdf" 即可获取下载地址

    54430

    硬核看球,数据分析足坛转会窗口各队表现

    Fiddler 配置方法见: https://blog.csdn.net/c406495762/article/details/76850843 通过URL爬取新闻列表中新闻的id,title等信息,代码如下 : for i in range(1, 91): # 每一页20篇 url= '******************************* ' +str(i ) +'********' html = requests.get(url=url ,headers=header).content news = json.loads(html.decode('utf-8'))['news'] 'id_news']) pd_data.to_excel('id_news.xls', na_rep=False) 根据得到的新闻id列表,对每一个新闻具体信息进行获取,并存入MongoDB数据库中,代码如下 当然球迷的评论更是懂球帝好看的地方,所以讲每篇新闻热也爬取下来,看看谁是这一个月热王者。代码原理相同,此处不具体贴出。 主要获取热文本,点数: ? 下面开始我们的数据大餐。 ?

    24110

    vscode引入vue_vscode配置vue开发环境

    4.2选择项目的文件夹 4.3导入完毕后 5.保存工作区 保存工作区: 1.2.5选中工作区保存位置 1.2.6 最终保存为工作区 1.2.7、禁用eslint插件 代码不检查设置 若感觉对你有用,请评论点 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/164740.html原文链接:https://javaforall.cn

    19620

    如何用Python对某娅偷逃税进行微博舆情分析~

    1 发送请求 通过对请求头进行观察,我们不难构造出请求代码。 条数", data) .set_global_opts(title_opts=opts.TitleOpts(title="每日微博数量")) ) bar.render("词频.html ") 2 评论点top10 4107ba8182a44a119a9bffab4f248319.png 我们发现斗图君小海星这个用户所发表的评论点数最多,有7.5w+,下面让我们看看它的评论是什么, 722ebab4bc753ee20e96239b39cf4a0d.png 点这么多可能是发的时间早,位置比较靠前,另一个原因可能是内容符合大家的心声。 ("时间", data) .set_global_opts(title_opts=opts.TitleOpts(title="时间分布")) ) bar.render("词频.html

    32690

    项目阶段之flask(四)

    2.获取用户对评论的(难点) 1/添加is_like记录一下点, 2/先找到用户点过的评论编号,然后获取用户所有点过的评论编号 3/判断用户是否有对评论点 if 用户需要登录 and 该评论编号 3.点取消点后端实现 操作思路: 1/判断用户是否登录 2/获取参数 3/参数校验,为空校验 4/操作类型进行校验 5/通过评论编号查询评论对象,并且判断是否存在 6/根据操作类型点&取消点 判断用户是否有对该评论点 将图片设置到用户对象, 7/返回响应 接口文档: 请求路径: /user/pic_info 请求方式:GET,POST 请求参数:无, POST有参数,avatar 返回值:GET请求: user_pci_info.html user/pass_info 请求方式:GET,POST 请求参数:GET无, POST有参数,old_password, new_password 返回值:GET请求: user_pass_info.html GET,POST 请求参数:GET无, POST ,title, category_id,digest,index_image,content 返回值:GET请求,user_news_release.html

    31630

    扫码关注腾讯云开发者

    领取腾讯云代金券