腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
无法
使用
selenium
python
从
网站
抓取
多个
URL
、
、
、
我正在尝试
从
here
抓取
文章的日期和网址。虽然我确实得到了日期列表和文章的标题(文本),但我
无法
获得相同的Urls。这就是我如何在文本和日期中获得
url
标题。例如,我可以提取一个链接,但
无法
提取所有链接。
浏览 38
提问于2021-08-09
得票数 0
回答已采纳
1
回答
如何在
python
语言中
使用
selenium
和chromedriver
抓取
此页面?
我正在尝试
使用
selenium
和chromedriver
从
网站
“”中
抓取
数据。当我运行代码时,chromedriver成功地输入了
url
,但
无法
加载页面,显示了一个空白页面。我尝试将目标
网站
切换到google.com,但
抓取
成功。我的结论是目标
网站
服务器检测到
selenium
并拒绝发送回数据。那么如何在
Python
语言中
使用
selenium
和ch
浏览 0
提问于2020-05-29
得票数 0
2
回答
Python
-如何在
URL
中不分页地刮分页
、
如何
使用
URL
访问下一页,内容如下:我知道如何
使用
刮取库(BS4、
Selenium
),但我不知道如何
抓取
这样的站点。我一直在玩谷歌Chrome开发工具,但没有成功。像
Python
这样的
抓取
站点通常的工作流程是什么?
浏览 0
提问于2019-07-05
得票数 0
回答已采纳
3
回答
通过
Selenium
Python
下载整个网页(html、image、JS)
、
、
、
、
我必须下载一个简单的超文本标记语言形式的
网站
,如www.humkinar.pk的源代码。我已经尝试过
selenium
的driver.page_source功能,但是它不能下载完整的页面,比如图片和javascript文件。有没有更好更简单的
python
解决方案?
浏览 0
提问于2017-08-21
得票数 3
2
回答
尝试将数据
从
网站
加载到json文件中。
、
、
我试图将数据从一个
网站
加载到一个json文件中。m=1" print(r.text)import json r=requests
浏览 2
提问于2020-05-10
得票数 0
1
回答
在到达cloudflare背后的
抓取
网站
的内容时需要帮助
我正在尝试
从
以下
网站
抓取
文章:
使用
Python
的。但是,如果我
使用
,例如requests.get() (甚至
selenium
),由于以下原因,我
无法
达到所需的内容: 有人能提出解决办法吗?
浏览 4
提问于2022-10-02
得票数 -1
2
回答
使用
python
抓取
动态javascript内容网页
、
、
、
、
我正在尝试
使用
Python
抓取
这个
网站
:'‘。但是,requests + BS4只给了我HTML格式的页面源代码。我假设这是因为内容是动态的。因此,我尝试了
Selenium
+ BS4来
抓取
网站
,但我仍然只能
抓取
页面源代码。from
selenium
.webdriver import Firefox from bs4 import BeautifulSou
浏览 4
提问于2020-02-02
得票数 0
1
回答
如何
使用
Scrapy自动获取请求头?
、
但是,有没有一种方法可以
使用
Scrapy请求自动获取这些请求头,而不是手动获取?我尝试
使用
:response.request.headers,但此信息还不够: {b'Accept': [b'text/html,application/xhtml+xml,application/xml
浏览 50
提问于2021-05-21
得票数 0
回答已采纳
1
回答
为什么我的Crawler会得到错误的HTML代码?
、
实际上,用jsoup库实现的爬虫代码可以工作,因为我的请求的结果是一些HTML代码,但是当我搜索一个明确写在
网站
上的单词时,没有找到它,因为一些div的来自于空的爬虫。然后我意识到,当您导航到
网站
并右键单击‘查看页面源’时,我得到了与相同的代码。当我将代码与进行比较时,右键单击“->”检查“”时,代码与“查看页面源”中的不同。
浏览 0
提问于2019-09-12
得票数 1
回答已采纳
1
回答
Python
无法
获取包含请求的API : Web
抓取
、请求、API
、
、
、
我试图通过
python
来
抓取
一个
网站
,但是我
无法
通过请求检索到正确的API,因为我
无法
获取产品信息:提前感谢:)
浏览 0
提问于2021-11-15
得票数 0
1
回答
为什么我的网络
抓取
没有返回任何东西?
、
我对
python
上的web
抓取
是个新手。我有问题,当我运行我的代码,返回是白色空白,但它不是错误。html.parser' for tag in sp.find_all('a'): if
url
is None: i
浏览 22
提问于2020-08-21
得票数 0
1
回答
在Chrome中
使用
Headless模式效率较低?
、
、
、
、
我
使用
selenium
+美汤(
使用
selenium
打开包含大量javascript的页面,并
使用
javascript命令将其转换为BeautifulSoup对象)来
从
体育
网站
上
抓取
数据,但由于某些原因,我不能
使用
无头浏览器。当我
使用
chromedriver实现无头浏览器时,我几乎不会像让chromedriver打开并运行时那样
抓取
大量数据。有没有人有类似的问题,或者有什么建议?document.d
浏览 2
提问于2020-05-09
得票数 0
1
回答
从
地下刮取历史气象资料
、
、
、
我对数据
抓取
很陌生,最近,我试图用
python
的
selenium
库
从
wunderground.com中
抓取
数据。但是,我发现,有时候
selenium
web驱动程序
无法
成功地打开网页,我认为这个问题可能与
网站
使用
的JavaScript有关,但不确定哪些部分出错了。有人知道怎么解决吗?提前谢谢。import webdriver from
selenium
.webdriver.support.ui import Sele
浏览 5
提问于2021-09-09
得票数 2
回答已采纳
2
回答
使用
PHP爬行
网站
,但该
网站
运行JS生成标记
、
、
使用
PHP库(PHP简单DOM),im运行php脚本(
使用
终端)
从
其中获取一些
URL
和JSON一些数据。到目前为止这件事一直运作得很好。显然,我的PHP脚本
无法
处理这个问题(因为它没有执行JS,因此该站点在我所能知道的范围内大部分保持为空白),因此我
无法
爬行该站点,因为内容尚未创建。谢谢,
浏览 0
提问于2018-04-29
得票数 1
回答已采纳
1
回答
抓取
问题:“检查元素”与“查看页面源”不同
、
、
、
、
我试图做一个网页刮一个网页,其中包括
多个
标签本身。当我单击所需的选项卡,在显示其内容后,首先会出现两个问题。1-网页地址不改变,对所有标签都是相同的。2-当我看到带有浏览器(firefox和chrome)的“查看页面源”的页面源时,所有选项卡的页面源看起来也是相同的,而当我对其中一个选项卡
使用
“检查Elemnt”时,我看到我的目标内容以html形式显示的代码问题是,我
无法
通过
python
访问所需选项卡的内容,这是web世界中可用的典型WEB
抓取
代码。这些代码通常是基于bs4的。 有没有人有任何想法或示例代
浏览 2
提问于2020-02-06
得票数 4
回答已采纳
1
回答
webcrawling-有哪些可能的方法来检测
使用
javascript加载的页面?
我想
抓取
一些
网站
。我正在
使用
selenium
/PhantomJS
抓取
JS(react、angular、jquery等)。和
python
爬行其他所有的东西。我的主要问题是,我
无法
区分页面是否
使用
JS加载。 任何想法都将受到欢迎!
浏览 2
提问于2018-03-16
得票数 0
4
回答
使用
Scrapy进行
Python
数据
抓取
、
、
、
我想从一个
网站
上有TextFields,按钮等
抓取
数据。我的要求是填写文本字段并提交表单以获得结果,然后
从
结果页面中
抓取
数据点。我想知道Scrapy是否有这个功能,或者是否有人可以推荐一个
Python
库来完成这个任务?(编辑) 我的要求是
从
ComboBoxes中选择值并单击search按钮,然后
从
结果页面中
抓取
数据点。附注:我正在
使用
selenium
浏览 1
提问于2013-05-28
得票数 8
回答已采纳
3
回答
与
多个
python
程序共享数据
、
、
我是
从
多个
网站
抓取
数据。为此,我
使用
selenium
和PhantomJs编写了
多个
web刮刀。我想要做的不是保存这些数据来分析它,我想把它发送到一个程序中去进行实时分析。我已经尝试过了,:我甚至不知道
从
哪里开始
浏览 7
提问于2016-08-03
得票数 0
回答已采纳
2
回答
如何旋转
Selenium
webrowser IP地址
、
、
、
、
我有一个
Python
脚本,每30秒访问一个
网站
,每次我都需要一个不同的IP地址。 其他方法?
浏览 10
提问于2019-12-19
得票数 18
1
回答
使用
Selenium
和Scrapy通过onclick
抓取
显示的数据
、
、
我
使用
Scrapy用
python
编写了一个脚本,以便
使用
身份验证
从
网站
上
抓取
数据。我正在
抓取
的页面真的很痛苦,因为主要是由javascript和AJAX请求组成的。页面的所有主体都放在允许
使用
submit按钮更改页面的<form>中。
URL
不会改变(而且是一个.aspx)。我已经成功地
从
第一页
抓取
了所需的所有数据,然后
使用
以下代码更改了单击此输入按钮的页面:
浏览 38
提问于2019-02-21
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券