前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于selenium写微博爬虫(待续)

基于selenium写微博爬虫(待续)

作者头像
萌海无涯
发布2019-08-03 11:04:47
7120
发布2019-08-03 11:04:47
举报
文章被收录于专栏:萌海无涯

‍太热,热的写不动了。。

导入需要用到的包

代码语言:javascript
复制
from selenium import webdriverimport time

设置好浏览器模式,使用手机模式访问

代码语言:javascript
复制
# 手机浏览器的型号mobileEmulation = {"deviceName":"iPhone X"}
# 初始化options = webdriver.ChromeOptions()options.add_experimental_option('mobileEmulation', mobileEmulation)driver = webdriver.Chrome(chrome_options=options)

进行登录操作

不是上来就需要登录,貌似有些不登录不能操作,我们提前登录

验证码是滑块,这个搞不来搞不来,加个延时手动跳过吧。

代码语言:javascript
复制
# 请求URLdriver.get("https://m.weibo.cn/")
# 点击登录driver.find_element_by_class_name("lite-sign-in").click()
# 点击账号密码登录driver.find_element_by_class_name("b-left").click()
# 账号driver.find_element_by_id("loginName").send_keys("用户名")
# 输入密码driver.find_element_by_id("loginPassword").send_keys("密码")# 点击登录driver.find_element_by_id("loginAction").click()# 自己手动跳过,延时5秒time.sleep(5)# 验证码# driver.find_element_by_class_name("geetest_radar_tip").click()

判断登录后的跳转URl是否是登录成功的url

代码语言:javascript
复制
if driver.current_url == 'https://m.weibo.cn/?sudaref=security.weibo.com':    print("登录成功")

手机微博,是往下滑动翻页,我们用js代码来实现

代码语言:javascript
复制
# 翻页操作js="var q=document.documentElement.scrollTop=100000"driver.execute_script(js)time.sleep(3)
代码语言:javascript
复制
from selenium import webdriverimport time
# 手机浏览器的型号mobileEmulation = {"deviceName":"iPhone X"}
# 初始化options = webdriver.ChromeOptions()options.add_experimental_option('mobileEmulation', mobileEmulation)driver = webdriver.Chrome(chrome_options=options)

# 请求URLdriver.get("https://m.weibo.cn/")
# 点击登录driver.find_element_by_class_name("lite-sign-in").click()
# 点击账号密码登录driver.find_element_by_class_name("b-left").click()
# 账号driver.find_element_by_id("loginName").send_keys("用户名")
# 输入密码driver.find_element_by_id("loginPassword").send_keys("密码")# 点击登录driver.find_element_by_id("loginAction").click()time.sleep(5)# 验证码# driver.find_element_by_class_name("geetest_radar_tip").click()
# 块# driver.find_element_by_class_name("geetest_slider_button")
# 登录后地址if driver.current_url == 'https://m.weibo.cn/?sudaref=security.weibo.com':    print("登录成功")
# 点击搞笑
driver.find_element_by_xpath('//*[@id="app"]/div[1]/div[1]/div[2]/div/div[1]/div/div/ul/li[5]').click()

# 翻页操作js="var q=document.documentElement.scrollTop=100000"driver.execute_script(js)time.sleep(3)
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-07-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 萌海无涯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
验证码
腾讯云新一代行为验证码(Captcha),基于十道安全栅栏, 为网页、App、小程序开发者打造立体、全面的人机验证。最大程度保护注册登录、活动秒杀、点赞发帖、数据保护等各大场景下业务安全的同时,提供更精细化的用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档