最近在研究用 Python 来制作各个类别的机器人,今天先来分享一个自动发布新浪微博的机器人。...基本思路 其实要实现一个简单的自动发布微博机器人还是不难的,只需要每天按时找好要发布的素材(一般就是爬虫了),然后再通过微博开放出来的 API 接口,自动发布即可。...分别执行如下命令安装 python setup.py build python setup.py install 至此可以安装 weibo 库成功 准备工作与编写思路就是这些,下面我们来看看具体的过程与代码...自动发布微博 根据 weibo 库的说明文档,使用其操作微博还是相关容易的,只需要提供我们创建微博应用时的 App Key 与 App Secret 和应用回调地址信息即可。...那么现在自动发布微博搞定了,我们再来看看如何自动获取微博素材 微博素材 对于金山词霸的每日一句,我们可以使用如下的一个 API 来获得每天的信息 http://open.iciba.com/dsapi
一:获取app-key 和 app-secret 使用自己的微博账号登录微博开放平台,在微博开放中心下“创建应用”创建一个应用,应用信息那些随便填,填写完毕后,不需要提交审核,需要的只是那个app-key...在“微博开放平台”的“管理中心”找到刚才创建的应用,点开这个应用,点开左边“应用信息”栏,会看见“App key”和“App Secret”的字样,这两个东西是要在后面程序中使用的。...三:安装微博 python SDK 有两种安装方式: 1:http://github.liaoxuefeng.com/sinaweibopy/下载新浪微博SDK 2:python有个简单的安装方式:直接在命令行下键入...: sudo pip install sinaweibopy 四:实例验证,获取当前登录用户及其所关注(授权)用户的最新微博 这里需要注意的是在浏览器弹出一个页面,要先点击“授权”(这里进行的OAuth...以下为我的关注用户的微博: ? ? ? ? 拿上边代码为例,这里我们获取的信息有: ?
/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/7/1 上午3:29 # @Author : BrownWang # @Email.../0070m4EAly8fpp1pwqq26j3050050jrb.jpg 是否认证:False 微博说明:知名财经博主 头条文章作者 微博签约自媒体 关注人数:3301 粉丝数:111 性别:m 微博等级...:11 -----正在爬取第1页,第0条微博------ -----正在爬取第1页,第1条微博------ -----正在爬取第1页,第2条微博------ -----正在爬取第1页,第3条微博---...--- -----正在爬取第1页,第4条微博------ -----正在爬取第1页,第5条微博------ -----正在爬取第1页,第6条微博------ -----正在爬取第1页,第7条微博----...-- -----正在爬取第1页,第8条微博------ -----正在爬取第2页,第0条微博------ -----正在爬取第2页,第1条微博------ -----正在爬取第2页,第2条微博-----
(Python) PC 登录新浪微博时, 在客户端用js预先对用户名、密码都进行了加密, 而且在POST之前会GET 一组参数,这也将作为POST_DATA 的一部分。...由于要用的一部分微博数据用API获取不方便, 所以还是要自己写个小爬虫, 模拟登录是必不可少的。琢磨了一下这个东西,最终登录成功。...接下来再请求这个URL,这样就成功登录到微博了。 记得要提前build 缓存。 下面是完整代码(没加注释,凑合看吧): #!...很多豆友反馈有模拟登录新浪微博抓取数据的需求,其实对于一般的微博数据获取,如用户信息、微博内容等,使用微博开放平台API是更明智的选择:速度更快,而且节省许多网页处理的功夫。...熟悉Web的朋友只要定期维护模拟登录的代码就可以一直成功登录微博。如果不那么熟悉的话,其实可以采用更naive的思路来解决:直接将Cookie发送给新浪微博以实现模拟登录。
.decode("utf-8") # 预登陆获得 servertime, nonce, pubkey, rsakv def get_server_data(self, su): """与原来的相比,微博的登录从...注册的手机号) password = "123456" # 密码 cookie_path = "Cookie.txt" # 保存cookie 的文件名称 id = '4477416430959369' # 爬取微博的...', 'username', 'following', 'followed', 'gender']) start_crawl(get_cookies(), id) 第八步:获取id 你需要获得想要找的微博...首先找到你想爬的微博,这里以微博故事为例,在浏览器内按下F12,并且点击评论按钮 点击‘网络’,找到一条像图中的get请求。....decode("utf-8") # 预登陆获得 servertime, nonce, pubkey, rsakv def get_server_data(self, su): """与原来的相比,微博的登录从
Python抓取微博有两种方式,一是通过selenium自动登录后从页面直接爬取,二是通过api。 这里采用selenium的方式。...strlist = strName.text.split(' ') nickname = strlist[0] print('昵称:' + nickname) # 3.微博数...d*" # 匹配数字,包含整数和小数 cntArr = re.findall(pattern, strCnt.text) print(strCnt.text) print("微博数...filter=0&page=1 # filter为0表示全部,为1表示原创 print("微博内容") pageList = driver.find_element_by_xpath...匹配数字,只包含整数 pageArr = re.findall(pattern, pageList.text) totalPages = pageArr[1] # 总共有多少页微博
如何通过一个微博图片链接,找到这张图片的发布者?...比如下面这个微博图片链接: https://wx4.sinaimg.cn/orj360/4242e8adgy1hlugictxquj235s2pknpe.jpg 怎么找到这个图片对应的微博用户?...微博实际上将用户的元数据保存在了对应用户所发布的图片中,而URL就是其中的方式之一。我们以知名微博用户“来去之间”为例,通过访问其用户主页,查看URL可知其用户UID为1111681197。...当然有些用户设置了个性域名,不能直观地看到用户UID,我们则可以把鼠标移动到微博人物头像下方的“关注”和“粉丝”处,这时候在浏览器的左下角就会看到带数字串的URL,而数字串就是用户UID。...://wx4.sinaimg.cn/orj360/4242e8adgy1hlugictxquj235s2pknpe.jpg” 下面我们来拆分一下该URL: 第一部分:“wx4.sinaimg.cn”为微博的图片存储服务器域名
在平时的开发中,我们会看到不管是微信发朋友圈照片还是微博发布新鲜事,添加图片的时候都是选完后面还有个+号再去选择图片,这样的话比较方便用户去添加图片,有的右上角还有个-号方便用户去删除图片,而一般用户选择的图片多少都是不定的
需求分析 抓取 琢磨先生的新浪微博 ? 微博主页 抓取的内容包括:微博发布的时间,正文(仅提取文字),转发数,评论数,点赞数 ?...抓取的内容 数据是怎么加载的 新浪微博的数据是用ajax异步下拉加载的,在chrome的调试模式下可捕捉到相应的请求: ?...格陵兰', 'attitudes': 35, 'comments': 18, 'reposts': 1} {'id': '4276459473976711', 'text': '北极 微博视频', 'attitudes
❈ 本文简要讲述用Python爬取微博移动端数据的方法。可以看一下Robots协议。另外尽量不要爬取太快。如果你毫无节制的去爬取别人数据,别人网站当然会反爬越来越严厉。...环境介绍 Python3/Windows-10-64位/微博移动端 网页分析 以获取评论信息为例(你可以以自己的喜好获得其他数据)。如下图: ?
经过的一天的研究,把微博模拟登陆基本上弄清楚了,下面就把过程详细说明。...---- 工具和环境 1.语言:Python3 2.IDE: Pycharm 3.浏览器:Chrome 4.使用的库:re, rsa, base64, requests, PIL, urllib ---...- 模拟登陆过程 弄清楚所需的数据 首先我们在Chrome浏览器中打开微博登陆界面,然后Ctrl+shift+i开启开发者工具,在开发者工具的Network选项里找到Preserve log并勾选,然后登录你的微博...我们只需要找到这几个数据就可以模拟登录到微博,那么怎么找到这些数据呢?接着往下看… 获取servertime,nonce等数据 在登录页面里打开开发者工具,清除Network里的数据。...wvr=5&lf=reg"}}); 提取你自己的uniqueid值放入下列网址中get得到你的微博主页信息。
❈ 本文简要讲述用Python爬取微博移动端数据的方法。可以看一下Robots协议。另外尽量不要爬取太快。如果你毫无节制的去爬取别人数据,别人网站当然会反爬越来越严厉。...环境介绍 Python3/Windows-10-64位/微博移动端 网页分析 以获取评论信息为例(你可以以自己的喜好获得其他数据)。
(一)编程环境 操作系统:Win 10 编程语言:Python 3.6 (二)安装selenium 这里使用selenium实现。...如果没有安装过python的selenium库,则安装命令如下 pip install selenium (三)下载ChromeDriver 因为selenium要用到浏览器的驱动,这里我用的是Google...(四)分析微博登录界面 通常而言,m站的网页结构比pc站要简单的多,咱们可以从m站入手。...微博m站登录界面的网址是 https://passport.weibo.cn/signin/login 在Chrome浏览器中打开此地址,并右键点击界面的任何位置-->查看网页源代码,发现邮箱/手机号框的...(五)编写python程序 from selenium import webdriver import time browser = webdriver.Chrome("C:\Program Files
在前面的分享中,我们制作了一个天眼查 GUI 程序,今天我们在这个的基础上,继续开发新的功能,微博抓取工具,先来看下最终的效果 整体的界面还是继承自上次的天眼查界面,我们直接来看相关功能 微博功能布局...我们整体的界面布局就是左侧可以选择不同功能,然后右侧的界面会对应改变 创建微博 Widget 对于右侧界面的切换,我们可以为不同的功能创建不同的 Widget,当点击左侧不同功能按钮后,对应切换 Widget..."""子进程微博查询""" class WeiBoQueryThread(QThread): # 创建一个信号,触发时传递当前时间给槽函数 update_data = pyqtSignal...weibo_page = None total_pv = 0 timestamp = str(int(time.time())) def run(self): # 微博爬虫...,这里就不再展开说明了,我是把所有微博爬虫的代码都封装好了,这里直接调用暴露的接口即可 ❝对微博爬虫感兴趣的同学可以点点赞和在看,如果数量可观就专门写一篇文章,谢谢大家 词云制作 对于词云的制作,我们还是先通过
---恢复内容开始--- 需要用到的工具:python(pymouse、selenium)、chrome、webdriver 使用的webdriver一定要和chrome的版本相匹配,具体的对应关系可以参考以下博客...请务必选择正确的版本,我的这部分代码使用的是python2.7+64位系统,所以选择的是pywin32-221.win-amd64-py2.7.exe。 ? ...完成以上部分的内容之后正式进入到selenium+chrome+python+chrome的爬虫。
python爬虫,微博爬虫,需要知晓微博用户id号,能够通过抓取微博用户主页内容来获取用户发表的内容,时间,点赞数,转发数等数据,当然以上都是本渣渣结合网上代码抄抄改改获取的! ?...要抓取的微博地址:https://weibo.com/u/5118612601 BUT,我们实际应用的抓取地址:https://m.weibo.cn/u/5118612601(移动端的微博地址) ?...----" + "\n") fh.write(f"微博地址: {str(scheme)}\n微博内容:{raw_text}\n"...手里头有二份微博爬虫的源码,不同的爬取地址和思路,一起分享给大家,仅供参考学习! 一份还包含GUI界面,当然这是本渣渣参考的主要来源代码! ? 亲测可运行哈!! 关注本渣渣微信公众号:二爷记 ?...后台回复关键字:“微博爬虫” 获取所有源码
1:首先去微信企业号官网去申请一个帐号 2:在‘企业应用’里创建自建应用,并记住agentid。下面会用到 3:corpid,corpsecret在哪里,你自己百度找吧。多的是答案。 #!.../usr/bin/env python # -*- coding: utf-8 -*- #GuoYabin import requests,json,sys,imp imp.reload(sys)...def __init__(self): self.url='https://qyapi.weixin.qq.com/cgi-bin/gettoken' self.corpid = '你申请的微信企业号...corpid' self.corpsecret = '你申请的微信企业号corpsecret' def auth(self): params={'corpid':self.corpid,
全文简介 本文是用Python爬取微博移动端的数据。可以看一下Robots协议。另外尽量不要爬取太快。如果你毫无节制的去爬取别人数据,别人网站当然会反爬越来越严厉。...环境介绍 Python3 Windows-10-64位 微博移动端 网页分析 以获取评论信息为例(你可以以自己的喜好获得其他数据)。...Python代码 代码写的丑,凑合着看吧。
由于业务需要,研究了一下腾讯微博等登陆,下面分享一些经验给大家: 标题写的是腾讯微博的登陆,其实也可以隐身到腾讯旗下多个产品的登陆,比如QQ空间,webQQ等,想到这儿大伙是不是很激动呢?...下面我以Python为例: 分析登录过程 登录过程需要抓包,我是用的HttpWatch,大体步骤如下 第一步 手动登陆,抓包,记录登录过程 当输入完账号后想服务器请求验证码 等级登陆按钮后将登录信息发送至认证服务器...,实现第一次认证 服务器返回登陆成功信息,其中包含最终URL 第二次认证,获取腾讯微博的cookie 第二步 伪造登录过程 获取验证码 根据验证码计算出加密后的密码以及其他信息,发送GET请求至认证服务器
不知道大家在工作无聊时,是不是总想掏出手机,刷刷微博看下热搜在讨论什么有趣的话题,但又不方便直接打开微博浏览,今天就和大家分享一个有趣的小爬虫,那就是如何定时采集微博热搜榜&热评,下具体的实现方法我们接下来慢慢讲...首先我们需要找到微博排行、热度、标题,以及详情页的链接。...关于Python定时爬取微博热搜示例介绍的文章就介绍到这了,更多相关Python爬取微博热搜内容我们下次分享学习。若有收获,就点个赞吧
领取专属 10元无门槛券
手把手带您无忧上云