腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
:
获取
未出
现在
html
中
的
表
?
python
、
web-scraping
、
beautifulsoup
我想
获取
一个出
现在
https://www.coronavirus.vic.gov.au/exposure-sites上
的
表
当右键单击并检查元素时,很明显有一个具有可引用类
的
表
元素。可重现
的
例子: import pandas as pdfrom bs4 import
BeautifulSoup
"User-Agent":'https
浏览 12
提问于2021-08-16
得票数 0
回答已采纳
3
回答
在python中使用re.sub()替换
html
代码
python
、
regex
、
str-replace
我想对我
的
html
代码做一些小
的
修改来做一些格式化。如果我在python字符串中有下面的代码,我如何使用re.sub()函数来根据我
的
需要替换行。例如:在这种情况下,我试图在我
的
表
中
添加边框。tbody> <th>X</th> </tr><
浏览 5
提问于2014-12-22
得票数 0
回答已采纳
1
回答
使用网页
的
Python解析
的
HTML
与实际页面不同
python-3.x
、
web-scraping
、
beautifulsoup
、
html-parsing
我需要从
表
中
获取
和存储PM2.5和值。我使用
BeautifulSoup
4来抓取网页,但是我得到
的
解析
HTML
与实际页面不同。例如,我得到了这个而不是这个。 我编写了
获取
表
行和
表
数据等所需
的
代码,但是由于我分析过
的
HTML
缺少
表
主体
的
行,所以它找不到它们,所以
现在
我只能看到分析过
的
HT
浏览 1
提问于2020-07-23
得票数 0
回答已采纳
1
回答
从疯牛病网站提取数据
python
、
python-3.x
、
selenium
、
beautifulsoup
、
python-requests
如何使用Python3提取安全ID、安全代码、组/索引、Wtd.Avg价格、交易日期、交易量、可交付数量
的
百分比到交易数量
的
值,并将其保存到XLS文件
中
。下面是链接。 table = soup.find('div', attrs = {'id&
浏览 0
提问于2018-03-07
得票数 1
回答已采纳
2
回答
查询所有缺少
的
ids。
sql
、
sqlite
我
的
数据库中有两张桌子,用户和馈赠。用户
表
获取
id和数据,礼品
表
获得gift_id、user_id和数据。gitst.user_id与users.id相关联 如何从
未出
现在
“用户”
表
中
的
礼品
表
中
获取
所有user_id?
浏览 3
提问于2015-12-02
得票数 0
回答已采纳
1
回答
为什么此代码
中
的
http-响应
的
html
文件不完整?
python
、
web-scraping
、
beautifulsoup
、
python-requests
我试图通过使用python和模块“”和"
BeautifulSoup
“从网站(
BeautifulSoup
)
获取
一些数据,但我似乎得到了一个不完整
的
html
文件作为响应。例如,当我用浏览器检查
html
文件时,我得到
的
html
文件
中
的
表
标记与原始
html
文件相比,在响应代码时缺少行数。所以我
的
问题是:原因是什么,我怎样才能解决这个问题?下面是我用来在
表
浏览 1
提问于2020-12-26
得票数 0
回答已采纳
1
回答
使用Python将网站解析为CSV文件
python
、
html
、
xml
、
csv
我使用以下内容作为指南,作为python
的
新手,我不知道如何在我
的
数据集上实现它。 import pandas as pd
html
= requests.get(url).contentdf = df_list[-1]df.to_csv('my d
浏览 0
提问于2021-03-13
得票数 2
1
回答
<script>在<div id="xxxxx">下找不到
python
、
html
、
web-scraping
、
beautifulsoup
我在chrome浏览器上查看了开发工具,其中有我想在<script>
中
获得
的
信息,它位于我附加了元素图像
的
<div id="market-stats">下面。我使用了漂亮
的
汤来清除数据,但似乎<script>
中
的
信息从
未出
现在
终端
中
。我
的
假设是这部分信息可能不允许抓取?from bs4 import
BeautifulSoup
import r
浏览 2
提问于2022-11-26
得票数 0
回答已采纳
3
回答
使用
BeautifulSoup
在注释标记
中
刮擦
表
python
、
web-scraping
、
beautifulsoup
我正在尝试使用
BeautifulSoup
从以下网页
中
刮
表
:from bs4 import
BeautifulSoup
reference.com/boxscores/201702050atl.htm'
html
= page.text 页面上
的
大多数表都在注释标记
中</e
浏览 7
提问于2017-09-19
得票数 0
回答已采纳
1
回答
抓取Java网页
python
、
beautifulsoup
、
screen-scraping
我已经找到并阅读了相当多关于抓取
的
文章,但不知何故,作为一个初学者,我不知所措。我想从一个
表
()
中
获取
数据有什么建议从哪里开始呢?下面是我
获取
选项
浏览 3
提问于2019-02-19
得票数 0
3
回答
如何使用
BeautifulSoup
刮除非
HTML
标记
python
、
beautifulsoup
我正在尝试从一个标签为<a href="https: evisa.mfa.am ">
的
网站
中
获取
数据,例如,看看这个<br/>2. Airlines must provide advance passenger&
浏览 0
提问于2020-04-06
得票数 0
回答已采纳
2
回答
使用python语言将
html
转换为文本
python
我想用Python从
HTML
文件中提取文本。我想要
的
输出基本上与从浏览器复制文本并将其粘贴到记事本
中
得到
的
输出相同。我想要一些比使用正则表达式更健壮
的
东西,因为正则表达式在格式不佳
的
HTML
上可能会失败。我看到很多人推荐Beautiful Soup,但我在使用它时遇到了一些问题。首先,它会拾取不需要
的
文本,比如JavaScript源。而且,它不能解释
HTML
实体。例如,我希望将
HTML
源
中
的
浏览 0
提问于2010-08-19
得票数 2
回答已采纳
1
回答
如何从urllib2
中
的
python
中
的
url
中
获取
特定
的
标记数据
python-2.7
、
urllib2
我对python2.7非常陌生,我有一项任务要读取URL
中
的
表
。import urllib2 response = urllib2.urlopen('https://www.somewebsite.com/
浏览 3
提问于2017-06-16
得票数 2
回答已采纳
9
回答
"TypeError:类型为‘响应’
的
对象没有len()“
python
、
web-scraping
、
beautifulsoup
当我试图执行代码时它给出了错误消息。TypeError:类型为“Response”
的
对象没有len() response = requests.get(url) soup =
BeautifulSoup
(
html
, "
html</e
浏览 11
提问于2016-04-19
得票数 40
回答已采纳
1
回答
当我使用
BeautifulSoup
进行抓取时,这些不同
的
错误是什么?
python-3.x
、
web-scraping
、
html-table
、
beautifulsoup
import requestsfrom bs4 import
BeautifulSoup
pageSoup =
BeautifulSoup
"> <
html
xmlns="http
浏览 0
提问于2019-04-06
得票数 0
回答已采纳
2
回答
使用Python和
BeautifulSoup
从页面
中
获取
表
信息
python
、
html
、
beautifulsoup
我试图从
获取
信息
的
页面。 我试图从“名册”
表
中
获取
所有的信息,但由于某种原因,我无法通过“美丽
的
灵魂”(
BeautifulSoup
.I)获得它。当我查看页面的
HTML
时,我可以在一个非常大
的
注释和一个常规
的
div中看到
表
。如何使用
BeautifulSoup
从这个
表
中
获取
信息?
浏览 3
提问于2020-04-13
得票数 0
回答已采纳
1
回答
风车没有得到所有的
html
内容
python
、
screen-scraping
、
web-scraping
、
beautifulsoup
、
windmill
但是,我在从页面上
获取
HTML
表
内容时遇到问题。该
表
是由Javascript生成
的
-因此我使用Windmill来
获取
内容。但是,内容不返回
表
-如果我使用
BeautifulSoup
尝试解析内容,这会导致错误。(
html
['result'],markupMassage=my_massage)当您查看soup
的
输出时,
表
是缺失<em
浏览 3
提问于2012-03-09
得票数 0
回答已采纳
1
回答
使用python从站点保存文本文件
python
、
web-scraping
使用Python,我
的
任务只是从这个站点
获取
html
源代码-- --并将第一个文本文件保存在名为"corporate_action_rpt_20220621.txt“
的
表
中
,
现在
,我可以使用
BeautifulSoup
读取这一行
html
,如下所示: <a href="2022/06/bzx_equities_corporate_action_rpt_20220621.txt-dl"
浏览 10
提问于2022-06-22
得票数 0
回答已采纳
1
回答
检索动态网页内容PyQt5
python
、
pyqt5
在能够登录到一个受保护
的
网站后,我想刮掉动态加载
的
相同网页
的
一些内容。这个代码块可以正确地处理身份验证,但是如果我尝试访问类名为lang-py
的
前标记元素,我会得到None作为输出返回给我。_
html
= "" password = "password" def _
浏览 18
提问于2020-09-25
得票数 0
回答已采纳
2
回答
在
获取
table
HTML
数据时,如何在Selenium Python
中
获取
一个没有文本值
的
```<td>```标记?
python
、
selenium
我需要得到
HTML
表
的
数据作为列表。该
表
有100列和50行。并不是每个<td>都有文本值,而且每一行都不同(不同列
中
的
无文本值) 因此,当我使用row.text时,它会返回一个列表,忽略没有文本
的
列表。每一行
的
列表具有不同
的
长度。这不利于在excel文件
中
写入列表。 如果我这样做的话,一个接一个
的
<td>组成一个列表。这太慢了。for row in driver.find
浏览 24
提问于2019-06-10
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券