腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
使用
selenium
重复
某些
过程
的
python
with
抓取
python
、
selenium
、
google-chrome
、
web-scraping
我试着从这个网站上
抓取
公司
的
联系方式: https://de.statista.com/companydb/suche?import webdriverfrom
selenium
.webdriver.common.by importByimport pand
浏览 6
提问于2020-09-25
得票数 0
回答已采纳
2
回答
Python
抓取
只能通过谷歌OAuth登录访问
的
数据
python
、
web-scraping
、
oauth-2.0
、
beautifulsoup
、
python-requests
我想从一个网站上刮一些数据,该网站
使用
谷歌OAuth进行身份验证。有些数据只有在我执行登录时才能访问。登录后与谷歌帐户,然后您将被重定向到网站
的
主页,所有的数据将很容易通过一个简单
的
点击访问。是否可以在后台执行此登录和身份
浏览 0
提问于2019-01-01
得票数 0
1
回答
使用
Python
对页面和浏览器扩展数据进行with
抓取
python
、
html
我正在尝试获取网页
的
文本数据,就像它在我
的
浏览器上
的
样子一样。我
的
问题是,我还
使用
了一个网页
的
扩展,它
的
给定数据(由于它而显示
的
文本)也要被收集。我知道urllib,但它只收集正常
的
网页数据,而不是扩展生成
的
数据。那么,如何收集这些数据有什么帮助吗?另外,我想问
的
是,这是否可能?
浏览 12
提问于2020-08-15
得票数 0
2
回答
将Gmail主题保存为文本文件?
gmail
因此,很难管理数以百计
的
电子邮件,所以我想自动化它。 那么,是否可以将所有或未读邮件
的
主题保存在文本、CSV或Excel文件中?
浏览 0
提问于2016-10-30
得票数 2
回答已采纳
1
回答
有没有任何快速
的
方法来刮一个有无限滚动
的
网站?
python
、
web-scraping
我正在尝试
使用
python
来
抓取
一个用无限滚动实现
的
网站。实际上,网络就是pinterest。我知道如何
使用
selenium
来
抓取
具有无限滚动
的
web。但是,WebDriver基本上模仿了访问web
的
过程
,而且速度慢得多,比
使用
BeautifulSoup和urllib进行
抓取
要慢很多。你知道有什么时间有效
的
方法来刮一个无限滚动
的
网页吗?谢谢。
浏览 0
提问于2014-12-29
得票数 0
回答已采纳
4
回答
使用
Scrapy进行
Python
数据
抓取
python
、
python-2.7
、
web-scraping
、
scrapy
我想从一个网站上有TextFields,按钮等
抓取
数据。我
的
要求是填写文本字段并提交表单以获得结果,然后从结果页面中
抓取
数据点。我想知道Scrapy是否有这个功能,或者是否有人可以推荐一个
Python
库来完成这个任务?附注:我正在
使用
selenium
Firefox驱动程序从其他网站
抓取
数据,但这个解决方案并不好,因为
selenium
Firefox驱动程序依赖于Firefox
的
EXE,即在运行刮板之前必须安装Firefox火狐有时会
浏览 1
提问于2013-05-28
得票数 8
回答已采纳
1
回答
在
python
中实现webautomation机器人
的
多线程还是多处理?
python
、
multithreading
、
selenium
、
multiprocessing
、
webautomation
我
的
脚本扫描nike.com上
的
某些
产品
的
价格,并将不断
抓取
产品
的
价格,直到它开始销售,在这一点上,它将创建多个实例,以登录到多个帐户购买产品。我已经有了
抓取
网站和检出产品
的
功能,但我想知道我应该
使用
多进程还是多线程来执行登录和检出
过程
? 在处理web自动化
过程
的
多个实例时,哪一个会更有效?如果有帮助的话,我在firefox中
使用
selenium
浏览 2
提问于2018-09-26
得票数 0
1
回答
当
Selenium
由于错误无法加载链接时,如何跳转到新网站?
python-3.x
、
selenium
、
selenium-webdriver
、
beautifulsoup
、
selenium-chromedriver
我有一个大约13.000个网站
的
列表。从这些链接中,我打算一个接一个地通过
Python
、Beautiful和
Selenium
来
抓取
信息。 对于大多数网站来说,
抓取
过程
很好。但是,
Selenium
偶尔会遇到特定链接
的
问题。不幸
的
是,这个错误阻止了整个刮擦
过程
。当我再次运行该
过程
时,我希望防止再次发生这种情况。在这里,我
使用
循环
的
第一部分来
抓取
链接:
浏览 1
提问于2021-04-29
得票数 0
回答已采纳
1
回答
用
Python
抓取
Ajax
python
、
ajax
、
screen-scraping
我一直在用
Python
练习我
的
抓取
能力。我得到了相当好
的
,但遇到了一些网站,让我相当难倒。他们利用Ajax来寻找附近
的
位置。有几个网站也是这样设计
的
。其中一个网站是www.applebees.com。即使
使用
firebug,我也找不到答案。
Python
如何通过ajax调用请求位置?我完全被难住了。该页面是www.applebees.com,在右侧有一个表单输入邮政编码,它拉出最接近该邮政编码
的
位置。但是,如果我在输入此邮政编码后拉出
浏览 3
提问于2012-02-27
得票数 1
回答已采纳
2
回答
使用
Selenium
和
Python
进行网络
抓取
:捕获JSON主体
python
、
ajax
、
json
、
selenium
、
web-scraping
我正在尝试
抓取
一个在后台运行一些AJAX
的
网页。
使用
python
和
Selenium
,我已经完成了加载网页、在表单中输入数据、单击提交和等待
的
过程
。在这一点上,我正在尝试捕获重新生成
的
JSON格式
的
数据,但是文章建议不可能将JSON主体提取出来。我试着自己研究一下
Selenium
代码,让它返回所有内容,但我没有太多
的
运气。有没有人遇到过类似的问题,并有解决方法
的
建议?我不需要
浏览 1
提问于2013-03-24
得票数 1
回答已采纳
1
回答
是否
使用
Python
通过Microsoft Live登录?
python
、
login
、
python-requests
我正在试着写一个程序,可以为战争机器4获取你
的
信息。我知道如何解析网页之类
的
,但我从来没有花时间通过
python
登录一个网站。现在,这带来了一个问题,因为我需要登录到我
的
Microsoft Live个人资料来获取我
的
统计数据。我试过我认为可行
的
方法,但每次都走进死胡同。这就是我目前所拥有的(这是有效
的
)import urllib2 password
浏览 10
提问于2017-03-13
得票数 1
1
回答
多元素硒屏幕截图
python
、
selenium
、
web-scraping
我
使用
Python
Selenium
来
抓取
一个网站。在刮擦
过程
中
的
某个时刻,我想拍一张截图。我只是“粗略”地想要拍摄一张涵盖特定WebElements
的
截图。如何拍摄包含多个WebElements
的
部分
的
屏幕截图?
浏览 2
提问于2022-11-23
得票数 0
回答已采纳
2
回答
如何
使用
selenium
web驱动程序托管由web
抓取
支持
的
后端服务?
python
、
selenium
、
selenium-webdriver
、
flask
、
web-scraping
因此,我正在开发一个项目来
抓取
一个网站并将数据传递给用户,但是我正在
使用
带有
python
/flask
的
selenium
/
selenium
web驱动程序。我本来打算用漂亮
的
汤,但我
抓取
的
网站需要在页面上进行一些交互。 我有一切工作与刮刀,我只是试图找出一种方法,使这项工作,如果我想要托管在一个网站上
使用
的
服务,如heroku。目前
Selenium
正在打开一个ch
浏览 20
提问于2020-05-03
得票数 1
2
回答
如何防止我
的
脚本在第一次循环后中断?
python
、
python-3.x
、
selenium
、
selenium-webdriver
、
web-scraping
我用
python
编写了一个脚本,
使用
selenium
从网页中获取一些特定
的
信息。由于该网页是保密
的
,我不能透露网站地址。无论如何,我期待着我现有的
抓取
器将点击网页上20个链接中
的
每个链接,并到达所需
的
页面,它将收集信息并返回到较早
的
页面,
重复
相同
的
操作,直到所有20个链接都耗尽。然而,
抓取
器点击一个链接,转到所需
的
页面解析信息,但没有返回主页
重复
浏览 1
提问于2017-10-14
得票数 0
1
回答
单击某个元素可
使用
python
web
抓取
功能动态更改内容
python
、
web-scraping
、
beautifulsoup
所以我从我
的
作品网站上收集了所有的数据,以获得我所有的班次和关于那些班次
的
数据,比如
python
和漂亮
的
汤。
抓取
移位是很好
的
,因为它们只是元素。但是要获得信息,比如谁在轮班,你必须单击一个元素,它会显示一个隐藏
的
元素,但也会根据你点击
的
日期更改信息。这可以
使用
javascript函数showFloorPlan('N','N','N','20200624')
浏览 17
提问于2020-06-23
得票数 0
1
回答
在
抓取
之前需要登录到站点
php
、
curl
、
web-scraping
、
autologin
我写了一个PHP脚本来
抓取
网站(zillow.com)上
的
搜索结果。但是,在用户登录到他们
的
站点之前,站点会隐藏部分结果。当我
的
抓取
器运行时,它不会收集任何登录所需
的
信息。它只
抓取
未登录
的
用户可用
的
信息。
浏览 0
提问于2014-07-17
得票数 0
1
回答
抓取
问题:“检查元素”与“查看页面源”不同
html
、
python-3.x
、
selenium
、
web-scraping
、
beautifulsoup
当我单击所需
的
选项卡,在显示其内容后,首先会出现两个问题。1-网页地址不改变,对所有标签都是相同
的
。2-当我看到带有浏览器(firefox和chrome)
的
“查看页面源”
的
页面源时,所有选项卡
的
页面源看起来也是相同
的
,而当我对其中一个选项卡
使用
“检查Elemnt”时,我看到我
的
目标内容以html形式显示
的
代码问题是,我无法通过
python
访问所需选项卡
的
内容,这是web世界中可用
的
浏览 2
提问于2020-02-06
得票数 4
回答已采纳
2
回答
使用
PHP爬行网站,但该网站运行JS生成标记
javascript
、
php
、
web-crawler
在过去
的
几周里,我一直在做网络爬行。
使用
PHP库(PHP简单DOM),im运行php脚本(
使用
终端)从其中获取一些URL和JSON一些数据。到目前为止这件事一直运作得很好。最近,我想扩展特定站点
的
爬行,并遇到了以下问题: 与其他站点不同
的
是,到目前为止,这个站点只回覆一个基本
的
标记服务器端,而是依赖于单个JS脚本来构建相关
的
加载标记。显然,我
的
PHP脚本无法处理这个问题(因为它没有执行JS,因此该站点在我所能知道
的
范围内大部分保持为空
浏览 0
提问于2018-04-29
得票数 1
回答已采纳
1
回答
用Laravel和
Selenium
进行Web
抓取
php
、
laravel
、
selenium
、
web-scraping
我目前正在
使用
Python
进行web
抓取
。我
使用
了
Selenium
和Beautifulsoup库来
抓取
。我最近知道
Selenium
适用于php/Laravel。我
的
问题是,我可以
使用
Laravel +
Selenium
web驱动程序
抓取
web吗?如果是,你能给我提供一些链接或存储库,以便我学习吗?我被迫在我
的
抓取
工作中
使用
php
浏览 19
提问于2019-11-19
得票数 0
2
回答
如何在
Python
中导出
Selenium
测试套件?
python
、
selenium-ide
我知道如何从
Selenium
IDE导出
python
中
的
测试用例。但是我想知道是否有可能在
python
中导出Test?
浏览 5
提问于2013-11-05
得票数 7
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券