腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
BeautifulSoup
和
Selenium
实现
Jquery
表
的
网络
抓取
、
、
我正在尝试从一个网站
的
表
中获取数据,这个网站每天都会从这个网站
的
http://mananciais.sabesp.com.br/HistoricoSistemas?SistemaId=0更新。我正在学习
BeautifulSoup
和
Selenium
,并尝试
使用
这些包访问数据。 然而,该网站
的
源代码没有透露表格中
的
数据。据我所知,该网站是
使用
jQuery
网格构建
的<
浏览 14
提问于2020-03-24
得票数 0
回答已采纳
1
回答
有没有任何快速
的
方法来刮一个有无限滚动
的
网站?
、
我正在尝试
使用
python来
抓取
一个用无限滚动
实现
的
网站。实际上,
网络
就是pinterest。我知道如何
使用
selenium
来
抓取
具有无限滚动
的
web。但是,WebDriver基本上模仿了访问web
的
过程,而且速度慢得多,比
使用
BeautifulSoup
和
urllib进行
抓取
要慢很多。你知道有什么时间有效
的
方法来刮一个无限滚动<
浏览 0
提问于2014-12-29
得票数 0
回答已采纳
2
回答
使用
BeautifulSoup
调用JAVA函数
、
、
我正在尝试从下面的网站中搜集一些数据特别是,我想要
抓取
花名册表格中
的
数据在名为" csv“
的
表
的
标题处有一个红色链接,如果您单击它,页面将以csv格式加载
表
信息。_trackEvent('Tool','Action','Embed'); }
浏览 0
提问于2013-11-24
得票数 0
1
回答
如何
使用
Python从
Jquery
表
中
抓取
、
、
、
、
我正试着从这个中
抓取
前十项。我正在
使用
Python
Selenium
/
BeautifulSoup
。该
表
似乎正在
使用
jquery
脚本进行加载。我是诚实
的
困惑,从哪里开始,因为教程
和
指南是不匹配
的
这个网站。 他们中
的
很多人说,检查元素中
的
Network来查找XHR数据。然而,这个网站在XHR选项卡中没有任何值加载,而是在JS选项卡中。我找到了URl https:/&
浏览 5
提问于2022-09-13
得票数 1
回答已采纳
1
回答
用python
抓取
出现在单击中
的
表
、
、
、
、
我想从这个中
抓取
信息。我对
网络
抓取
很陌生,并且尝试过
使用
BeautifulSoup
来做这件事。换句话说:我直接从页面中
抓取
的
HTML代码不包括我想要获得
的
表
。 我对我
的
下一步感到有点困惑:我是应该
使用
selenium
之类
的
东西,还是应该以更
浏览 1
提问于2017-09-10
得票数 1
回答已采纳
2
回答
如何在python中
实现
网络
抓取
、
、
、
、
我对python刚开始在python上
抓取
。我必须从这个中
抓取
数据 任何人都可以告诉我如何处理这个问题。是制造这种刮板
的
最好方法。我是否必须
使用
sele
浏览 9
提问于2017-10-09
得票数 0
回答已采纳
3
回答
硒自动化可以与BS4一起
使用
吗?
、
、
、
、
我正在
使用
selenium
进行自动化
和
抓取
。现在我发现有些网站
的
速度太慢了。如果我
使用
beautifulSoup
,那么我可以更快地
抓取
它们,但自动化却无法完成。有什么地方我可以自动化网站(按钮,点击,事件等)还能在
beautifulSoup
上用它刮网站吗?任何帮助都将不胜感激..。
浏览 2
提问于2020-04-09
得票数 1
回答已采纳
1
回答
为什么我
的
网络
抓取
没有返回任何东西?
、
我对python上
的
web
抓取
是个新手。我有问题,当我运行我
的
代码,返回是白色空白,但它不是错误。我只是做了与课程相同
的
代码,但它对我不起作用 import urllib.request def __urllib.request.urlopen(self.site) parser = 'html.parser'
浏览 22
提问于2020-08-21
得票数 0
2
回答
使用
Python在youtube中搜索打开第一个视频
、
、
、
我试了试,但不知道如何打开第一个视频。此代码在浏览器中打开搜索。 words = search.split() link += i + "+" webbrowser.open_new(link[:-1])
浏览 1
提问于2020-04-10
得票数 3
1
回答
如何让django项目点击url
的
特定标签
、
我正在开发一个
使用
python
和
Django
的
网页
抓取
代码。我已经提供了所需
的
url,并且已经获取了数据。但是在url上有一个标签,上面写着“显示更多结果”。如何让我Django项目点击url上
的
“显示更多结果”选项卡并立即获取新
的
结果。 我已经
使用
Beautiful Soup库来进行web
抓取
/
浏览 16
提问于2021-04-15
得票数 0
2
回答
美汤和硒不能刮网站内容
、
、
所以我试着
抓取
网页
的
内容。最初我尝试
使用
BeautifulSoup
,但是我无法获取内容,因为内容是动态加载
的
。在四处阅读之后,我试着根据人们
的
建议
使用
Selenium
,但是在这样做之后,我仍然无法获取内容。刮出来
的
东西跟美汤一样。 是不是就不能
抓取
这个网页
的
内容呢?(url) soup = bs(r.content, 'lxml') return so
浏览 35
提问于2021-08-11
得票数 0
回答已采纳
1
回答
为什么我
的
Selenium
代码只返回我所请求数据
的
一半
、
、
、
最近,我写了一个
selenium
网络
抓取
器,旨在提取包含美国所有总统选举数据
的
表
中
的
所有信息。表格在维基百科网站上。这是我
的
代码。from
selenium
import webdriver from bs4 import
浏览 2
提问于2020-11-21
得票数 0
1
回答
BeautifulSoup
find.all() web
抓取
返回空
、
、
、
、
当尝试
抓取
这个网站
的
多个页面时,我得不到任何内容。我通常会检查以确保我创建
的
所有列表都具有相同
的
长度,但返回
的
都是len = 0。我也用过类似的代码来
抓取
其他网站,那么为什么这个代码不能正常工作呢?我尝试过一些解决方案,但没有达到我
的
目的:this answer中建议
的
requests.Session()解决方案,.json as suggested here. import requestsfrom
浏览 14
提问于2020-11-28
得票数 0
回答已采纳
1
回答
selenium
Web驱动程序不返回Wikipedia
表
、
、
、
、
我正在努力搜集一张
表
,里面有美国所有总统选举
的
结果。为此,我想
使用
selenium
。我相信我要
抓取
的
表
是由客户端脚本(javescript)执行
的
,因此在
抓取
site.Note之前,我试图注意某个特定标记
的
存在:我尝试过用漂亮
的
汤直接
抓取
页面,但总是得到“无”
的
响应。from
selenium
import webdriver from bs4
浏览 16
提问于2020-11-21
得票数 1
回答已采纳
1
回答
用
Selenium
返回空DataFrame从网站中
抓取
表
、
、
、
、
我刚开始学习
网络
抓取
,并尝试从
的
'Holdings‘
表
中提取数据from
selenium
import webdriver from bs4 import
BeautifulSoup
浏览 3
提问于2021-12-22
得票数 1
回答已采纳
1
回答
用漂亮汤将硒html表格放入熊猫数据
、
、
我已经成功地
使用
selenium
来
抓取
一个html
表
,它需要在
抓取
之前点击按钮。不过,我很难把这个解析成熊猫
的
数据。与URL一样,dataframe应该有5列
和
大约30行。from
selenium
import webdriver from bs4 import
Bea
浏览 1
提问于2020-04-03
得票数 2
回答已采纳
1
回答
从flashscore.com
抓取
分数
、
、
、
我用Python构建了一个机器人来在flashscore.com上
抓取
分数,但是从站点中
抓取
的
数据加载到它
的
列表框中非常缓慢。我对
selenium
的
速度很好奇,所以我做了一个按钮来打印所有的文本,结果显示速度很快,所以一定是if elif块减慢了程序
的
速度。from tkinter import *import threading lblSt
浏览 0
提问于2015-05-09
得票数 8
2
回答
使用
python
抓取
动态javascript内容网页
、
、
、
、
我正在尝试
使用
Python
抓取
这个网站:'‘。但是,requests + BS4只给了我HTML格式
的
页面源代码。我假设这是因为内容是动态
的
。因此,我尝试了
Selenium
+ BS4来
抓取
网站,但我仍然只能
抓取
页面源代码。from
selenium
.webdriver import Firefox from bs4 import
Beautifu
浏览 4
提问于2020-02-02
得票数 0
2
回答
有没有办法
使用
BeautifulSoup
/requests
抓取
搜索框,然后进行搜索
和
刷新?
、
、
、
我正在努力使一个程序,可以在大多数网站上,如YouTube,ESPN,我
的
大学课程
表
等搜索请求… 我已经在网上寻找了各种解决方案,但其中许多都是简单地在你得到
的
url
的
末尾添加你
的
搜索查询,但这似乎并不适用于所有的网站,其中一些网站在你手动搜索时不会更新它们
的
URL,而许多其他网站可能会给每个URL一个唯一
的
'id‘。可以从任何网站上
抓取
搜索栏,然后指定搜索查询并输入它吗?有没有这样
的
函数呢?
浏览 25
提问于2019-05-10
得票数 0
回答已采纳
1
回答
使用
Python
和
BeautifulSoup
实现
网络
抓取
表格
、
、
我正在学习如何
使用
Python进行
网络
抓取
,因为我还是个新手。现在,我试图从这个网站https://theanalyst.com/na/2021/06/euro-2020-player-stats上获取2020年欧洲杯
的
统计数据。在运行我
的
初始代码(见下文)以从网页收集html之后,我找不到table标签及其data-table类。当我检查网站时,我可以看到
表
及其数据
表
,但当我打印出page_soup时,它不显
浏览 33
提问于2021-07-16
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券