腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
使用
美
汤
从
HTML
中
提取
特定
的
标题
、
、
、
、
这是我正在
使用
的
https://patents.google.com/patent/EP1208209A1/en?oq=medicinal+chemistry专利示例。下面是我
使用
的
代码。我希望代码只显示引用
的
(3)计数,这样我就可以知道这项专利被cited.How了多少次,我可以让输出将引用
的
计数显示为3吗?请帮帮忙!soup = BeautifulSoup(patent, '
html
.parser'
浏览 29
提问于2020-09-07
得票数 1
回答已采纳
2
回答
使用
python
从
.docx文件中
提取
特定
的
表和图像
、
、
我正在尝试
从
word文档中
提取
一个
特定
的
表格,该表格紧跟在
标题
“缩写列表”之后,并在.docx文件
中
紧跟在
标题
“图形研究”之后
的
图像。我已经能够
使用
python-docx代码
提取
标题
,但是如何
使用
标题
或它们
的
位置解析文档来检索图像和我正在
使用
if re.match("Graphical", img.previ
浏览 49
提问于2020-07-16
得票数 0
1
回答
Python财务图表抓取
、
、
、
、
现在,我正在尝试
使用
以下代码
从
图表中
提取
股息收益率。df = pd.read_
html
('https://www.macrotrends.net/stocks/charts/BMO/Bank-of-Montreal/dividend-yield-history') 但是代码不会
提取
图表
的
数据。对于
从
网站上删除它有什么建议吗? 下面是我尝试<
浏览 1
提问于2021-09-24
得票数 1
1
回答
python-
提取
不丢失轴
标题
的
html
表。
、
、
、
、
是否有任何方法
从
表中
提取
数据,但仍然能够跟踪轴
标题
?Q2。哪种方法能更好地
从
html
表中
提取
数据?HTMLParser还是
美
汤
还是其他
的
?我试着
提取
这个收入表“收入”、“53 898.0”、“56 910.0”、“60 455.0”、“64 539.0” “总收入”、“53 898.0”、“56 910.0”、“60 45
浏览 2
提问于2013-03-11
得票数 0
回答已采纳
2
回答
Python
从
google结果
中
抓取链接
、
有没有办法,我可以刮某些链接,
从
谷歌
的
结果,包括
特定
的
词在链接。用
美
汤
还是硒?groups&oq=site%3Afacebook.com+friends+groups"要
提取
包含组链接
的
链接。
浏览 1
提问于2019-01-22
得票数 0
回答已采纳
1
回答
如何
使用
python
中
的
漂亮
汤
从
html
页面
中
获取
特定
的
单词
、
、
我必须
从
HTML
页面中
提取
特定
的
单词,并计算该单词被重复
的
次数。我如何
使用
python
中
的
美
汤
来做这件事呢?我如何将url传递到函数
中
,然后计算单词数? 这是我到现在为止
的
代码。
浏览 3
提问于2017-11-05
得票数 0
3
回答
如何
使用
美
汤
从
HTML
中
提取
特定
的
URL?
、
、
、
、
我想从
HTML
页面中
提取
特定
的
URL。bs4 import BeautifulSoup page = urlopen(url)我想要
的
urls实际上是img src。这里有一个来自HMTL
的</e
浏览 4
提问于2014-06-16
得票数 0
1
回答
使用
带有下拉选项
的
Python请求模块
、
、
、
我正试图从这个网页上抓取信息:import requests page = requests.get('https://www.tmea.org,但我希望能够提交一个
特定
的
选项并
提取
该信息。PO
浏览 0
提问于2019-02-20
得票数 3
回答已采纳
1
回答
ImportError:没有名为bs4
的
模块,因为在错误
的
python文件夹
中
、
我只是想从
HTML
文件中
提取
一个字符串。我不能让它起作用。每个人都在谈论
美
汤
但对我来说不管用..。这是我
的
错误:我已经安装了“美丽
汤
4”,但我相信它在错误
的
文件夹
中
: sudo pip install beautifulsoup4我正在
使用
Python3.2。我如何强迫美丽
汤
安装在另一个文件夹?
浏览 2
提问于2013-08-22
得票数 1
1
回答
JSSoup是否支持
提取
文本?
、
JSSoup是否支持
提取
类似于
美
汤
soup.findAll(text=True)
的
文本 文档没有提供关于这个用例
的
任何信息,但在我看来应该有一种方法。为了澄清我想要
的
是
从
页面上抓取所有可见
的
文本。
浏览 19
提问于2021-11-20
得票数 1
回答已采纳
2
回答
美丽
的
汤
find_all bug?
、
现在我用
美
汤
来解析
html
页面。但有时我通过find_all得到
的
结果比页面数还少。例如,此页面有18个
标题
跨度。但是当我
使用
下面的代码时,它只得到了两个!谁能告诉我为什么。提前谢谢你!soup = BeautifulSoup(page, '
html
.parser')#print
浏览 1
提问于2015-02-11
得票数 1
3
回答
解析随机网页
、
、
、
我需要解析一堆随机页面,并将它们添加到DB
中
。我正在考虑
使用
正则表达式,但我想知道是否有任何“特殊”技术(除了在已知文本/标签之间查找内容)。内容更像(并不总是):Text related to Title谢谢!
浏览 3
提问于2010-09-21
得票数 0
回答已采纳
1
回答
如何禁用所有不在列表
中
的
链接,
使用
漂亮
的
汤
、
、
我目前正在开发一个web应用程序(
使用
flask作为后端)。 在我
的
后端,我
使用
selenium检索给定url
的
页面源代码。我想遍历page_source并禁用其href不在列表
中
的
所有链接。类似于: body = browser.page_sourcefor link in soup.a: ifnot (link['href'] in
浏览 15
提问于2019-06-07
得票数 0
回答已采纳
2
回答
如何在Beautifulsoup
中
抓取
标题
文本对应
的
td
、
、
我正试着用
美
汤
抓取维基百科。我想要获取内部
的
文本,但只获取具有
特定
标题
文本
的
行
的
内容。我需要
的
信息在正确
的
表
中
,在与文本奖励
的
表头相对应
的
表数据
中
。我尝试过遍历表行并检查表头是否等于'Awards‘,但我不知道如何在表
中
没有'Awards’头<e
浏览 2
提问于2020-08-30
得票数 0
1
回答
tr
美
汤
中
特定
文本
的
提取
、
、
我一直在用漂亮
汤
从
html
代码
中
获取信息。通过执行以下步骤,我
提取
了下面的
HTML
片段:soup = BeautifulSoup(result.textCharacteristics: Militant Al-Takfir wa al-Hijran (Renunciation and Exile) faction示例
HTML
浏览 0
提问于2021-02-18
得票数 1
回答已采纳
1
回答
从新闻网站上抓取新闻
标题
、
、
、
我一直在努力从新闻网站上抓取新闻
标题
。为此,我遇到了两个python库,即“报纸”和“beautifulsoup4”。
使用
美丽
的
汤
库,我已经能够从一个
特定
的
新闻网站获得所有的链接,导致新闻文章。从下面的代码
中
,我能够从一个链接中
提取
新闻文章
的
标题
。,即报纸和beautifulsoup4,这样我
从
美丽
汤
库获得
的
所有链接都应该放在报纸库
的
url命令<
浏览 4
提问于2020-11-20
得票数 1
回答已采纳
1
回答
美丽
的
汤
:在H2标记之间
提取
数据
、
、
我有一个如下
的
html
文本 <h2 class="ArticleBody-styles-makeit-subtitle--LnHeO">1. Python</h2> 通过
使用
美
汤
,我们如何
提取
1.
HTML
</h2> ] text = item.findAll('h2') print(text.get_text()) 非常感谢您<e
浏览 8
提问于2019-12-19
得票数 0
回答已采纳
2
回答
Python,如何获取http头
、
、
、
、
我正在写一个脚本来“自动化我
的
生活”:)但是遇到了一个我无法解决
的
问题。这个python脚本抓取了一个页面并获得了我需要
的
“产品”
的
链接,问题是一旦我有了产品页面的链接来下载这个“产品”
的
pdf,你就必须按一个按钮,这就是问题所在,因为按钮
中
没有href:当按钮被按下时,查看http头,我看到要下载文件,它
使用
浏览 5
提问于2016-09-08
得票数 0
1
回答
如何
使用
wget下载整个动态页面?
例如,我正在尝试
使用
Linux
中
的
wget命令
从
网站下载一个页面,我想要
的
是包含在该页面的
html
代码
中
的
信息。我试过
使用
R
的
Rvest和Python
的
美
汤
,但它不起作用,所以现在我尝试wget,主要是我在.css和.js
中
得到
的
脚本,我不能从中
提取
有用
的
信息(据我所知),所以总而言之,我想从
浏览 3
提问于2018-10-12
得票数 1
1
回答
使用
美
汤
的
递归搜索
、
我正在尝试
从
嵌套
的
html
标记中
提取
信息: <div id="cover_1" class="default"></div> <div id="container_3" class="red">
浏览 1
提问于2013-05-01
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券