腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Python
和
Selenium
抓取
难以
找到
的
web
表
、
、
、
、
我一直在
使用
Python
和
Selenium
从特定
的
州健康网页中
抓取
数据,并将表格输出到本地CSV。 我已经在其他几个州
使用
类似的代码获得了很多成功。我已经检查过是否有可以切换到
的
iframe,但是,我只是看不到页面上iframe中我想要
的
数据。
使用
Chrome
的
“检查”功能,我可以很容易地
找到
表格信息。但是,从原始URL开始,我需要
的
数据不在该页面上,并且我找不
浏览 3
提问于2020-08-18
得票数 0
1
回答
使用
Python
对页面
和
浏览器扩展数据进行with
抓取
、
我正在尝试获取网页
的
文本数据,就像它在我
的
浏览器上
的
样子一样。我
的
问题是,我还
使用
了一个网页
的
扩展,它
的
给定数据(由于它而显示
的
文本)也要被收集。我知道urllib,但它只收集正常
的
网页数据,而不是扩展生成
的
数据。那么,如何收集这些数据有什么帮助吗?另外,我想问
的
是,这是否可能?
浏览 12
提问于2020-08-15
得票数 0
1
回答
Python
-单击链接时
抓取
数据不会更改URL
、
、
我想从这里
抓取
数据:在该页面中有一个标题为“市场流动”
的
部分,下面有3列:“最活跃的人”,"%获得者“,"%失败者”,每一个都可以点击。该部分列出了10只股票。同样在第10只股票
的
末尾,有一个可点击
的
矩形“再加载10个”。 我想要做
的
是点击"%获得者“,同时点击”加载10多个“,查看排名前20
的
获得者列表,并在
Python
中
抓取
数据。
浏览 1
提问于2015-09-11
得票数 1
1
回答
用Laravel
和
Selenium
进行
Web
抓取
、
、
、
我目前正在
使用
Python
进行
web
抓取
。我
使用
了
Selenium
和
Beautifulsoup库来
抓取
。我最近知道
Selenium
适用于php/Laravel。我
的
问题是,我可以
使用
Laravel +
Selenium
web
驱动程序
抓取
web
吗?如果是,你能给我提供一些链接或存储库,以便我学习吗?我被迫在我
的
浏览 19
提问于2019-11-19
得票数 0
4
回答
Selenium
Webdriver
的
替代方案
、
、
我
使用
C#
和
Python
的
Selenium
Webdriver从网站获取数据元素,但
web
抓取
的
速度非常慢。
抓取
35000个数据
表
花了我大约1.5天
的
时间。
使用
Selenium
Webdriver,我可以执行Javascript来获取Java元素。有没有一些库可以不需要像Webdriver这样
的
东西来在网页上执行Javascript来检索元素,并
浏览 5
提问于2015-04-16
得票数 13
1
回答
如何
使用
python
从网站上检索值
、
我想知道有没有什么方法可以制作一个
python
脚本来从网站上获取一个所说
的
值,在我
的
例子中是一个离线数字,它在一个每5分钟刷新一次
的
网站上。我想要设置它,如果该值增加,它将发送给我一封电子邮件。我之所以想这么做,是因为我在一家拥有超过15,000名矿工
的
比特币开采设施工作,我们必须不断地监控他们。但是,在做诸如清洁之类
的
日常工作时,携带笔记本电脑是非常令人恼火
和
恼人
的
。我对
python
知之甚少,所以如果有人能给我指出正确
的</
浏览 3
提问于2020-10-01
得票数 0
1
回答
抓取
问题:“检查元素”与“查看页面源”不同
、
、
、
、
当我单击所需
的
选项卡,在显示其内容后,首先会出现两个问题。1-网页地址不改变,对所有标签都是相同
的
。2-当我看到带有浏览器(firefox
和
chrome)
的
“查看页面源”
的
页面源时,所有选项卡
的
页面源看起来也是相同
的
,而当我对其中一个选项卡
使用
“检查Elemnt”时,我看到我
的
目标内容以html形式显示
的
代码问题是,我无法通过
python
访问所需选项卡
的
内容,这是
web</
浏览 2
提问于2020-02-06
得票数 4
回答已采纳
2
回答
保存
Python
中url中
的
“另存为”重定向
、
、
我想要做
的
.我试过
的
."Urllib请求“、"Wget”
和
“request”库都为我提供了一个1KB文件,在文本编辑器中该文件会读到“无效请求”。这可能是有意义
的
,因为我输入
的
网站网址在默认情况下是空白
的
,而且我认为它不会像我
使用
“请求”库
的
"allow_redirects=True“那样将URL重定向到任何地方。我相信
浏览 0
提问于2020-05-06
得票数 1
回答已采纳
2
回答
在
使用
Python
进行
web
抓取
时,如何
使用
相同
的
连接?
、
、
很可能会让我
的
IP被禁止。有人建议我
使用
WebKit (如Ghost.py )来
抓取
数据,但在浏览器中模拟打开
的
选项卡使连接保持打开状态。我对WebKit知之甚少,是否有人能为我确认Ghost.py能够重用相同
的
连接,或者是否有其他更好
的
建议。
浏览 1
提问于2015-08-12
得票数 1
回答已采纳
1
回答
基于动态内容
和
隐藏数据
表
的
Selenium
Web
抓取
、
、
、
、
真的需要这个社区
的
帮助!html=browser.execute_script('return document.body.innerHTML') sel_soup=BeautifulSoup(html, 'html.parser'
浏览 15
提问于2018-02-14
得票数 2
2
回答
使用
Python
/
selenium
刮取网页
的
内容
、
、
、
、
我正在尝试刮掉
的
内容。我相信
表
是在JavaScript中呈现
的
,所以我
使用
的
是
selenium
包
和
Python
3。为了完成这样
的
任务,我看到
找到
了xpath
表
,以
抓取
它
的
内容,但我只是不知道如何识别正确
的
xpath。 如何提取表格内容?如果
使用
xpath,如何通过检查
web
页面的源来识别对应于
表</em
浏览 0
提问于2019-06-23
得票数 1
回答已采纳
1
回答
如何
使用
requests
和
pyqt5获取
web
数据?
、
、
我想输入如图所示
的
信息。 ? start_date': '2018-06-01', 'end_date':'2019-01-23'} response = requests.post(url, data = payload) 但是,我不能得到正确
的
结果正确
的
方法应该是什么? 如何
使用
pyqt5完成此操作
浏览 14
提问于2019-01-23
得票数 4
3
回答
硒找不到壁虎
、
、
我试图通过
使用
geckodriver控制firefox。
浏览 0
提问于2018-05-06
得票数 1
回答已采纳
1
回答
在
selenium
中
抓取
特定
表
、
、
、
我正在尝试
抓取
在页面的div中
找到
的
表
。到目前为止,我基本上是这样尝试
的
:# Then move exe file on C:\
Python
27\Scripts= driver.find_element_by_xpath('//div[@class="line-chart"]/table/tbody') print tabl
浏览 14
提问于2016-09-19
得票数 3
回答已采纳
1
回答
使用
selenium
、
python
实现
的
Web
抓取
表
、
、
、
、
我正试着把这些信息放到一个excel文件中,但似乎不知道如何
使用
import csv。我看了其他帖子作为参考,但我似乎不能将其应用于我正在做
的
事情。我对
selenium
是个新手。谢谢。from
selenium
.webdriver.support.ui import Selectimportcsv driver.get("https:
浏览 0
提问于2020-07-26
得票数 0
1
回答
使用
selenium
抓取
javascript
表
的
Python
web
、
、
、
、
大家好,这是我第一次发帖子,希望你是好
的
!from bs4 import BeautifulSoup driver = webdriver.Chrome(author_element = soup.find("table", cl
浏览 2
提问于2022-05-03
得票数 -1
1
回答
用漂亮汤将硒html表格放入熊猫数据
、
、
我已经成功地
使用
selenium
来
抓取
一个html
表
,它需要在
抓取
之前点击按钮。不过,我很难把这个解析成熊猫
的
数据。与URL一样,dataframe应该有5列
和
大约30行。from
selenium
import webdriver from bs4 import Beautif
浏览 1
提问于2020-04-03
得票数 2
回答已采纳
2
回答
在amazon lambda
python
中运行
selenium
webdriver
、
、
、
、
我想在amazon lambda中运行BeautifulSoup
和
selenium
webdriver,我
的
运行环境是
python
3.6。可以运行吗?如果是这样的话是怎么做
的
。我
的
意图是
使用
漂亮
的
Soup4
和
selenium
从网页中删除数据(因为它必须删除由javascript动态生成
的
数据)。
浏览 4
提问于2018-04-21
得票数 14
回答已采纳
2
回答
是否可以
使用
Selenium
WebDriver来驱动PhantomJS?
、
、
、
我正在浏览
Selenium
WebDriver
的
文档,例如,它可以驱动Chrome。我在想,“驾驶”PhantomJS不是更有效率吗? 有没有一种方法可以在PhantomJS中
使用
Selenium
?我
的
预期用途是
web
抓取
:我
抓取
的
网站加载了AJAX
和
许多可爱
的
JavaScript,我认为这个设置可以很好地替代我目前正在
使用
的
Scrapy
Python</
浏览 4
提问于2012-06-27
得票数 35
回答已采纳
2
回答
我不能用常用
的
网络刮擦工具从网站上刮
表
。
、
、
、
、
我正试图用
Python
从网站上
抓取
一个
表
,但由于某种原因,我所有已知
的
方法都失败了。在有一张45页
的
桌子。我已经尝试用
使用
: requests (呈现它)、BeautifulSoup
和
selenium
来刮掉它。这是我
的
代码之一,我不会在这里复制所有我尝试过
的
代码,方法类似于不同
的
Python
库:from
浏览 7
提问于2021-11-06
得票数 0
回答已采纳
点击加载更多
相关
资讯
使用Python找到和删除相似文件的方法
Python爬虫实战题荟萃
十分钟学会利用Python实现Web抓取技术的基本实现原理和方法
《权力的游戏》最终季上线!谁是你最喜爱的演员?这里有一份Python教程
Python系列教程(6)-利用 selenium 自动化网页操作
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券