腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
从
soup
对象
中
提取
包含
所需
字符串
的
行
、
、
我有
soup
。我想
提取
包含
这三个必需信息
的
所有
行
。
soup
= BeautifulSoup(html,features="lxml") print (data3) 它打印[] print (
soup
)如下所示。
浏览 51
提问于2021-05-08
得票数 2
回答已采纳
1
回答
当“数据-附加-csv”
中
每一
行
的
数据来自网站时,
从
网站检索表
、
、
我试图
从
网站上删除以下使用“美丽汤”
的
数据:其中
包含
了所有篮球运动员
的
数据表。当我检查html源元素时。在每个表
行
('tr')
中
,玩家数据似乎
包含
在‘data -append’
中
。这是播放器表
的
一个tr
的
快照。data-row="0"
浏览 3
提问于2016-10-30
得票数 0
回答已采纳
3
回答
从
HTML脚本元素内部
提取
对象
键
的
值
、
、
、
--window.agency = < %- JSON.stringify({}) % >--></div> 我想要
的
输出是4243456。我如何使用lxml
的
美丽汤
提取
它呢?
浏览 5
提问于2017-12-15
得票数 2
回答已采纳
1
回答
BeautifulSoup
对象
内容到
字符串
、
、
我正在努力
从
网页中
提取
表格和表格标题元素。已
提取
表元素,没有任何问题。但是,我不能将h2类
提取
到单独
的
字符串
中
。我可以导入所有漂亮
的
汤
对象
,也可以导入
包含
所有h2元素
的
长
字符串
。如何将元素作为单独
的
字符串
对象
提取
到表或列表
中
?spirit-unlimited-battle-at-the- b
浏览 7
提问于2022-01-31
得票数 0
回答已采纳
1
回答
雅虎财务中使用Python
的
分析选项卡
、
、
我正在尝试
从
Yahoo "Analysis“选项卡中
提取
”未来5年(每年)“股票BABA
的
价值:。(
从
底部到第二排是2.85% )。首先进口包装:from urllib.request import urlopen as uReqtype(data)我可以使用正则表达式以某种方式<em
浏览 2
提问于2020-06-08
得票数 1
3
回答
Python爬行表元素
、
我试图从这个网页()中
提取
与表(Team )对应
的
所有元素。我想从“团队”中
提取
所有的数字-(这一
行
:17132.17-0.51 1.66 1.66 104.7 96.5 .300 .319 .493 10.9 20.5 .228 .501 11.6 79.6html')tables = bsObja.find_all("table") 尝试了上面的代码,希望我能得到所有表
的</e
浏览 2
提问于2016-12-26
得票数 1
回答已采纳
1
回答
如何有效地
从
docx/xml
中
删除表并
提取
文本
、
、
、
删除表后,我在从.docx中
提取
文本时遇到了问题。我正在处理
的
docx文件
包含
很多表,在
提取
文本之前,我希望将这些表处理掉。我首先使用docx2html将docx文件转换为html,然后使用BeautifulSoup删除表标记并
提取
文本。BeautifulSoup(temp)
soup
.table.decompose() Text =
soup
.ge
浏览 6
提问于2013-09-21
得票数 1
回答已采纳
3
回答
我无法
从
bs4
对象
中
定位重新生成
的
元素
、
、
我所遇到
的
问题让我抓狂。我正在尝试
从
Pro Football参考网站上
提取
文本。 我需要
的
信息在网页第二部分显示qb hurries
的
td元素
中
。该信息位于一个名为qb_hurry
的
td元素
中
。这是我到目前为止所知道
的
: res = requests.get('https://www.pro-football-reference.com/players/D/DonaAa00.
浏览 8
提问于2020-04-10
得票数 1
2
回答
Python中使用BeautifulSoup美化方法时出现奇怪
的
错误
、
、
、
我写了一个简单
的
"TextBasedBrowser“(如果你现在可以把它叫做browser :D)。到目前为止,用BS4抓取和解析网站
的
效果很好,但它
的
格式就像狗屎一样,几乎无法阅读。只要我尝试使用BS4
中
的
prettify()方法,它就会抛出一个AttributeError。我在谷歌上搜索了很长一段时间,但什么也没找到。= BeautifulSoup(html_page, 'html.parser') #
soup
=
soup
.
浏览 37
提问于2020-06-17
得票数 0
2
回答
表底
行
刮擦
、
、
、
我知道如何利用来抓取网页,但我正在努力想出最有效
的
方法来实现这一点。 (安卓)
包含
所有Nexus设备
的
列表,并在新版本可用时进行更新。最新
的
构建总是添加到相应表
的
底部。我列出了每个设备
的
名称,包括实名和代号,我只
提取
这些名称(如果是这样的话,设备本身每年只更新一次,而且只有一些设备仍在接收更新)。 ,
从
每个表中
提取
底部条目的最有效方法是什么?,我计划将底部
行
中
的
第一个<td&
浏览 6
提问于2016-01-25
得票数 1
回答已采纳
1
回答
如何在源代码中分解BeautifulSoup标签副本?
、
、
、
、
我有一个元素
提取
器,并且在源BeautifulSoup
对象
中
删除它有问题。示例: tag =
soup
.select('my-css-selector-or-something-else')
soup
= bs4.BeautifulSoup('
浏览 0
提问于2018-05-25
得票数 0
回答已采纳
2
回答
Web抓取返回空白结果、python代码
试图
从
indeed.com查询
中
刮取职务名称import requestsfrom bs4 import BeautifulSoupconsulting&l=&limit=20&ts=1546381706970&rq=1&fromage=last"page = requests.get(URL) 使用HTML解析器指定
所需
的</e
浏览 1
提问于2019-01-02
得票数 1
回答已采纳
2
回答
用于抓取表数据并存储为值以供将来计算
的
BeautifulSoup
、
、
、
非常新手
的
网络抓取,所以我很感谢所有的帮助。我正在尝试构建一个
从
NHL参考表中
提取
值
的
模型: 我只是尝试拉取与'Team Statistics‘表有关
的
值,该表
包含
聚合
的
团队数据。我正在取得一些进展,但在尝试
提取
每个团队
的
行数据并将其存储以供将来计算时,我被卡住了。= "https://www.hockey-reference.com/leagues/NHL_2019.htm
浏览 2
提问于2019-02-25
得票数 1
2
回答
如何返回整个数组而不是单个
字符串
在下面的练习
中
,我试图回复所有有四个以上字母
的
单词。max_length endend print timed_reading(4,"The Fox asked the stork, 'How is the
soup
浏览 1
提问于2018-09-19
得票数 2
回答已采纳
3
回答
跨<div>
的
数据抓取
、
、
、
我正在尝试从一组重复
的
包含
许多嵌入式
的
行
中
提取
信息。对于页面,我正在尝试编写一个抓取器来
从
页面
中
获取各种元素。由于某些原因,我找不到使用
包含
每行信息
的
类
的
标记
的
方法。此外,我无法分离
提取
信息
所需
的
部分。以下是一
行
的
示例以供参考: <div id="dTeamEventResults"
浏览 6
提问于2018-01-10
得票数 3
回答已采纳
1
回答
如何
提取
<a class..> Text</a>之间
的
文本,然后对列
中
的
文本进行排序
、
、
我需要帮助删除html代码< a >和< /a >元素,只有离开之间
的
文本(在图片中标记为黄色)。
soup
= BeautifulSoup( html, 'html.parser' )有什么想法吗?
浏览 3
提问于2020-02-08
得票数 0
1
回答
用BeautifulSoup
从
XML文档中
提取
unicode文本
、
、
我有这样
的
代码: url = open(fileid, 'r').read() find_all =
soup
.find_all("speech",
soup
)
浏览 1
提问于2017-05-16
得票数 0
2
回答
如何在<br>标记之间使用BeautifulSoup刮取文本?
、
、
、
我试图
从
标签中
提取
文本
字符串
,我感兴趣
的
文本
字符串
由一个标记隔开。: Lorem" <br> <br><div>Loremcollection1 =
soup
.select('div#foo > p:-
soup
-contains("
浏览 7
提问于2022-11-18
得票数 0
1
回答
使用Python
从
本地HTML文件创建具有名称和ID
的
CSV表
、
我是一个新手,尝试使用Python
从
本地HTML文件
中
获取数据,以
提取
名称,并将ID保存为CSV文件
中
的
表。<span name="Clarence Alan" src=" 我
的
代码有名字列表:for a in
浏览 1
提问于2022-01-09
得票数 0
1
回答
如何在使用BS4
从
多个标签中
提取
数据后划分信息
、
我是Python
的
新手。
从
文档中
提取
列表时出现问题。我
的
sources文件并不是真正
的
html,但它有一个标签来
提取
所需
的
数据。from bs4 import BeautifulSouppage = open(url)
soup
= B
浏览 1
提问于2016-06-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券