腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
尝试
使用
bs4
抓取
表格
内容
、
、
所以我
尝试
用下面的代码
抓取
一个表的
内容
:r = requests.get(url) data
浏览 5
提问于2019-07-21
得票数 0
回答已采纳
2
回答
使用
python
抓取
动态javascript
内容
网页
、
、
、
、
我正在
尝试
使用
Python
抓取
这个网站:'‘。但是,requests +
BS4
只给了我HTML格式的页面源代码。我假设这是因为
内容
是动态的。因此,我
尝试
了Selenium +
BS4
来
抓取
网站,但我仍然只能
抓取
页面源代码。from selenium.webdriver import Firefox from
bs4
import BeautifulSou
浏览 4
提问于2020-02-02
得票数 0
1
回答
如何在没有HTML/标签的文本中清理我的数据?
我正在
尝试
抓取
这个网站(底部
表格
)的https://www.eia.gov/dnav/ng/hist/rngwhhdD.htm,到目前为止我已经得到了代码。我需要帮助清理
抓取
的数据。(我只需要文本和删除HTML代码/标签) (下面的代码是works) (我是在Jupyter notebook btw中这样做的) 我一直在
尝试
".text“和".strip”,但到目前为止还没有成功。import
bs4</em
浏览 19
提问于2019-10-05
得票数 0
回答已采纳
2
回答
Webscraping:未包含在BeautifulSoup页面中的表
、
我正试图从这个页面上的
表格
中
抓取
一张公司信息表:代码如下:from
bs4
import BeautifulSoup response = requests.get("https://tools.ceres.org
浏览 3
提问于2019-03-07
得票数 1
回答已采纳
1
回答
运行一个Flask服务器是否可以防止Node.JS中的web
抓取
?
、
、
、
我有兴趣
尝试
一个网络
抓取
项目。目标站点
使用
Javascript动态加载和更新
内容
。大多数在线讨论都表明,在
尝试
这样一个项目时,node.js、casper.js、phantom.js和nightmare.js都是相当流行的工具。Node.js似乎是最常用的。如果我正在运行一个烧瓶服务器,并且希望显示一个node.js的结果,例如,在我的站点上以
表格
格式刮擦,这是可能的吗?我会遇到兼容性问题吗?或者,为了保持一致性,我应该
尝试
使用
基于python的方法来
浏览 6
提问于2017-04-19
得票数 0
回答已采纳
3
回答
Python BeautifulSoup剪贴表
、
、
、
、
我正在
尝试
用BeautifulSoup创建一个
表格
抓取
。我写了这段Python代码:from
bs4
import BeautifulSoup soup = BeautifulSoup(page) print i.attrs['class
浏览 0
提问于2013-09-24
得票数 27
回答已采纳
1
回答
使用
BS4
从python中
抓取
团队统计表
、
、
、
我正在
尝试
从职业足球参考中
抓取
一个
表格
,特别是来自的团队进攻表。每当我
尝试
下面的代码时,我都会得到一个空列表或一个NoneType。我已经
抓取
了其他网站,如ESPN,没有任何问题。import requests url = 'https://www.pro-football-reference.com/years/{}这个页面确实有一堆
表格
,所以我假设这就是为
浏览 2
提问于2020-08-13
得票数 1
1
回答
如何在Python中对带有图片的
表格
进行and
抓取
并导出到Excel中?
、
、
我正试着从URL上盗取一张桌子 我可以
使用
Scrapestorm工具
抓取
表格
数据。我是python的新手,不能从这个URL获取数据。from
bs4
import BeautifulSoup soup = BeautifulSoup(page.text) Excel中所需的输出: e
浏览 61
提问于2020-12-23
得票数 1
回答已采纳
1
回答
如何
使用
bs4
从网站获取
表格
数据
、
我试图用
bs4
抓取
一个网站,里面有一个表,但我得到的
内容
元素并不像我从inspect得到的那样完整。我在里面找不到标签<tr>和<td>。如何获取该站点的完整
内容
,尤其是
表格
的标记?下面是我的代码: from
bs4
import BeautifulSoup link = requests.get("https://pemilu2019.kpu.go.idhitung-suara/"
浏览 62
提问于2019-04-24
得票数 1
回答已采纳
1
回答
从windguru中
抓取
表
、
、
我
尝试
过从中
抓取
表格
,但我无法
使用
BeautifulSoup找到该
表格
。import requestsurl = "https://www.windguru.cz/archive.php?
浏览 2
提问于2019-10-31
得票数 0
5
回答
Selenium WebDriver将WebElement数据追加到列表的速度非常慢
、
、
、
我正在
尝试
将webelement
内容
存储到python列表中。在正常工作的情况下,处理大约2,000行数据需要大约15分钟。
浏览 0
提问于2017-10-18
得票数 0
2
回答
days=7days“中
抓取
数据
、
、
我正在
尝试
从"“网站上
抓取
表格
,因为python的输出正在
抓取
表格
。import requests url = 'https://www.nseindia.com/companies-listing/corporate-filings-event-calendarborderSet maxHeight-900 scrollWrap').get_text().
浏览 3
提问于2020-10-27
得票数 0
1
回答
如何
使用
美丽的汤和熊猫从这个网站上捕获结构化格式的
表格
?
、
、
、
、
我想从这个网站上
抓取
表格
,因为它每小时都在更新,所以我也想跟踪变化。我
尝试
过
使用
selenium
抓取
数据,但它们都在一个列中,没有任何表。如何
使用
pandas和Beautiful Soup以结构化的格式
抓取
表格
并跟踪更改。这就是我想弄明白的代码。import pandas as pdsoup = BeautifulSoup(html, "html.parser&q
浏览 7
提问于2020-09-23
得票数 0
回答已采纳
1
回答
使用
find在python中
抓取
单个html表
、
、
、
我是python的新手,正在
尝试
从网页上
抓取
一个
表格
。我已经通过Chrome中的"inspect“访问了html。网页在这里: import
bs4
from
bs4
import BeautifulSoup as soupuClient.read()page_soup = soup(page_html,
浏览 0
提问于2017-11-16
得票数 0
2
回答
基于日期
抓取
表数据
、
、
、
我正在
尝试
抓取
kurs事务的表from
bs4
import BeautifulSoupheaders={ "User-Agent":"Mozilla/5.0
浏览 0
提问于2020-11-24
得票数 0
1
回答
Python_Web_scraping Html表
、
、
更具体地说,
使用
请求和
bs4
进行
抓取
。当
尝试
刮取以下链接时:“”import requests url ="http://directorybtr.az.govrequests.get(url) res.close() results = soup.find(
浏览 4
提问于2017-11-23
得票数 0
回答已采纳
1
回答
在BeautifulSoup和Git Bash上进行网络
抓取
并传输到CSV
、
、
、
所以我一直在网上
抓取
一个有
表格
的网站,理想情况下,我想在网上
抓取
成excel
表格
,并将其保存在
表格
中,我将输入我所拥有的,我已经
使用
了scrapy和BeautifulSoup,我对这两个都有问题。import requestsfrom
bs4
import BeautifulSoup url = 'https://pcpartpicker.com/products/video-card
浏览 1
提问于2018-11-23
得票数 0
2
回答
如何在不对整数值进行舍入的情况下
抓取
网站表?
、
、
、
我正在从一个德国网站上
抓取
表格
。德国人用逗号(,)表示小数(.)逗号为十进制。当我
抓取
表时,它会自动四舍五入或转换数据。例如,如果值是“2000”,则在德语中写为2.000。
BS4
将其转换为二(2) 有没有什么解决方案可以让我在不改变值的情况下
抓取
? 这是我的代码。https://buchholz-stadtwerke.de/wasseranalyse.html" df = pd.read_html(requests.get(url).text, flavor=&
浏览 16
提问于2020-09-28
得票数 0
回答已采纳
1
回答
丢失的桌子与美丽的汤网络刮擦
、
我一直在
尝试
从hockey.com网站上
抓取
团队数据,我只能读到from
bs4
import BeautifulSoup as bsimportrequests.get(site)data = soup.find_all('table') 即使html代码表明其中有表,也不返回任何
内容
为什么美丽汤找不到
表格
浏览 0
提问于2020-12-12
得票数 0
3
回答
在
使用
美汤
抓取
表数据时遇到麻烦
、
、
、
我想从这个site中
抓取
表格
数据。我
尝试
了下面的代码,但无论出于什么原因,
BS4
似乎无法获取表数据: import
bs4
as bs sauce = urllib.request.urlopen
浏览 30
提问于2020-10-24
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券