腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Selenium
加载
页面
和
抓取
信息
的
问题
、
、
我试图从https://www.rollingstone.com/charts/artists/中
抓取
前200名艺术家,但在通过
Selenium
成功
加载
所有200名艺术家之后,
使用
.click()单击"load more“按钮
和
.implicitly_wait()函数,并将它们插入到我
的
数据库中,我只得到了前50名艺术家。div.c-content.c-content--charts > section.l-section
浏览 16
提问于2020-06-21
得票数 2
回答已采纳
1
回答
使用
Python对
页面
和
浏览器扩展数据进行with
抓取
、
我正在尝试获取网页
的
文本数据,就像它在我
的
浏览器上
的
样子一样。我
的
问题
是,我还
使用
了一个网页
的
扩展,它
的
给定数据(由于它而显示
的
文本)也要被收集。我知道urllib,但它只收集正常
的
网页数据,而不是扩展生成
的
数据。那么,如何收集这些数据有什么帮助吗?另外,我想问
的
是,这是否可能?
浏览 12
提问于2020-08-15
得票数 0
1
回答
从html
页面
不显示数据
的
url读取数据
、
r = s.get(link) print(soup.prettify()) 但是我看不到网页
的
内容
浏览 1
提问于2020-02-05
得票数 0
1
回答
如何通过Python获取Youtube搜索结果列表,并获取最大数量
的
视频?
、
、
v=" + x) print(n)
问题
是我得到
的
结果非常少(在30到50之间)。每次都有不同
的
数字。 我希望能得到300个左右
的
结果...这就是为什么我没有
使用
API --只是模仿浏览器搜索,就像普通用户一样。它会在无休止
的
回滚中给你更多
的
结果。 如何解决这个
问题
?我是个新手,几乎完全迷失了方向。
浏览 97
提问于2021-08-07
得票数 1
2
回答
使用
Python通过AJAX
抓取
网页
、
、
我知道
使用
Python
的
Beautiful Soup
抓取
HTML
的
基础知识。但是,
页面
会进行AJAX调用,以获取球员上场时间
的
数据。(我
使用
firebug识别了网络调用)。我
的
问题
是:有没有可能
使用
python来“
抓取
”这些
信息
?我需要什么工具,除了HTML我还应该知道什么?(我目前正在阅读有关JavaScript
和
AJAX
的
文章)。我为这个不明
浏览 0
提问于2013-11-02
得票数 0
1
回答
如何
使用
scrapy或
selenium
抓取
动态
页面
?
、
、
、
、
我正在尝试
抓取
web动态
页面
,但
使用
scrapy时,我不能检索所有
信息
,因为我想要
的
信息
是动态
的
。 我试着
使用
Selenium
,但与Scrapy不同
的
是,你不能指定头部,网站阻止了我。(我不能说出这个网站
的
名字,因为
抓取
是非法
的
,但它是一个著名
的
旅游元搜索引擎...)。我有一个带有验证码解算器
的
页面
(用脚本很难
浏览 23
提问于2019-06-13
得票数 0
2
回答
Python -如何在URL中不分页地刮分页
、
下面是示例
页面
: * 我知道如何
使用
刮取库(BS4、
Selenium
),但我不知道如何
抓取
这样
的
站点。我知道pubmed有API,但是API不返回我需要
的
信息
(天气文章是否可以免费下载)。像Python这样
的
抓取
站点通常
的
工作流程是什么?
浏览 0
提问于2019-07-05
得票数 0
回答已采纳
1
回答
使用
BeautifulSoup
和
拆分器从推特帐户检索文本
、
、
、
我正在尝试从
的
最新推文中检索文本 twitter_url = 'https://twitter.com/marswxreport?r-ad9z0x r-bcqeeo r-qvutc0"但是,它抛出一个错误,声明"'NoneType' object has no attribute 'text'"
和
soup.find_all在检查twitter
页面
时: &l
浏览 3
提问于2019-12-07
得票数 1
2
回答
如何解析由javascript编写
的
html文本?
、
、
、
、
我是新手,刮刮
和
需要刮一些数据集
的
数据挖掘项目。我要刮"“。跟踪每个链接并提取数据。我编写了一个
使用
xpth
和
css.But获取数据
的
工作
抓取
器,我在
页面
中看到了这个元素,它
使用
javascript来填充一个选项卡式表。xpath对于每个tab.So都是相同
的
,不能为单个选项卡提取数据,并从每个选项卡中获取数据存量增益百分比。 我可以从xpath
和
css中刮取数据,但是
页面
的一部分是从ja
浏览 6
提问于2017-04-21
得票数 1
回答已采纳
2
回答
Ruby -
页面
重定向时需要等待/休眠(刷新)
、
我正在
使用
Ruby创建一个网页爬行/
抓取
脚本。我正在
抓取
的
页面
是通过AJAX
加载
的
,并显示特定帐户
的
信息
。如果您在下拉菜单上选择了第二个帐号,
页面
将非常简短地重定向到另一个URL并返回到原始URL,只是
使用
通过AJAX
加载
的
不同
信息
。我想要能够刮
信息
的
两个帐户号码上列出
的
下拉选项。<
浏览 0
提问于2014-07-01
得票数 3
回答已采纳
1
回答
避免在
Selenium
中获取某些元素,比如定制
的
广告阻止程序。
、
有办法避免在
selenium
中
加载
某些元素吗?例如,由XPATH表达式定义
的
?如果这是必要
的
解决方案,我很乐意
使用
selenium
-wire来拦
浏览 5
提问于2021-07-21
得票数 0
2
回答
使用
CURL将特定数据输入数据库
、
、
我刚开始
使用
CURL,还是个PHP程序员新手。我想采取网页上
的
特定元素(通过AJAX
的
变化),并
使用
CURL输入到数据库中。到目前为止,我可以用CURL写一个网页
的
文本文件,但我真的不知道下一步该怎么做。
浏览 0
提问于2010-07-13
得票数 0
2
回答
cURL在这里
的
行为似乎不正确
我在我
的
shell上尝试执行以下命令:试着输入专利号
和
申请号: 6836866
和
10007391。然后点击获取书目数据按钮。 网页返回内容(一个“整齐”格式化
的
表格),但是curl调用似乎遇到了“一些”
问题
。我已经在浏览器上
使用
了firebug来确认上面的三个变量都是
浏览 0
提问于2008-12-14
得票数 0
1
回答
webcrawling-有哪些可能
的
方法来检测
使用
javascript
加载
的
页面
?
我想
抓取
一些网站。我正在
使用
selenium
/PhantomJS
抓取
JS(react、angular、jquery等)。
和
python爬行其他所有的东西。我
的
主要
问题
是,我无法区分
页面
是否
使用
JS
加载
。 任何想法都将受到欢迎!
浏览 2
提问于2018-03-16
得票数 0
2
回答
使用
selenium
/chromedriver阻止网页自动重载
、
、
我正在
使用
python
和
selenium
包
和
chromedriver来
抓取
网页。
页面
每30分钟自动重新
加载
一次(可能是通过java-script),这会破坏我
的
抓取
进度。网络
抓取
是通过脚本
和
与
页面
进行进一步交互所需
的
javascript ist来完成
的
。 有没有可能通过chromedriver
的
标志来阻止
页面
重
浏览 24
提问于2020-11-13
得票数 0
回答已采纳
2
回答
用Python中
的
Selenium
停止动态
页面
中
的
滚动
、
、
、
、
大家好,我试着用
selenium
和
scrapy从中
抓取
一些
信息
elem.send_keys(Keys.PAGE_DOWN)browser.execute_script("window.scro
浏览 0
提问于2015-10-04
得票数 2
回答已采纳
1
回答
for循环中
的
Webscrape后续
、
、
在我之前
的
问题
之后,我开始尝试自动化我在excel文档中准备
的
这个网站
的
url列表
的
过程。当我尝试20
和
30URL时,它工作得很好,但是当我增加它
的
时候,一个关于GetNodesTextAsArray中
的
ReDim
的
“脚本超出范围
的
错误”发生了,你知道为什么吗?
浏览 0
提问于2020-07-08
得票数 1
1
回答
有没有办法像Facebook那样在自扩展
页面
上
使用
BeautifulSoup?
、
、
、
当你接近底部时,一些网页可能会通过ajax扩展,Facebook就是一个众所周知
的
例子。我特别感兴趣
的
是截屏电影
的
电影列表
页面
。它确实有一个结尾,但当你向下滚动时,你可以看到它在添加电影。有没有办法
使用
BeautifulSoup来获取
页面
上
的
所有内容?
浏览 18
提问于2018-08-24
得票数 0
1
回答
用python3.x漂亮汤和urrllib.request
抓取
数据
、
、
、
、
我最近刚开始
使用
python,作为一个项目,我被要求学习如何从网站上
抓取
数据,但我很困惑,因为im更新到html,所以当我在python中做这个时。price_box = soup.find('div', attrs={'class':'price'})span class="priceText__1853e8a5">2,711.66 有人能向我解释我错过了什么或者我<
浏览 0
提问于2018-06-27
得票数 0
回答已采纳
1
回答
Python -如何刮除多个动态更新
的
表单/网页?
、
、
、
、
我一直在尝试
抓取
一个动态更新
的
网站,每个网页包含数百行,网站总共有数千页(就像在每个
页面
中点击"next“按钮或
页面
底部
的
一个数字,就像在Google搜索
页面
底部看到
的
那样)。因此,例如,如果我正要刮第101页,我在第100页,而第101页上
的
用户登录到他们
的
帐户,那么我就会错过那个用户
的
信息
。考虑到活动量,这可能是相当大
的
问题
。我试着在凌晨
的<
浏览 1
提问于2015-10-08
得票数 0
点击加载更多
相关
资讯
Coinbase:部分页面加载和APP登录出现问题
使用Selenium和Chromedriver遇到的一些问题
Python使用Selenium爬取淘宝异步加载的数据方法
Coinbase部分页面加载和App登录出现问题,正努力恢复服务
使用Java解析DOCX文件中的页面信息
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券