使用Beautifulsoup从特定属性获取文本_无法使用BeautifulSoup获取span属性的文本_使用BeautifulSoup从<pre>元素获取文本 - 腾讯云开发者社区

python、beautifulsoup、web-crawler

dialog" role="button" tabindex="-1"><i class="sp_KIvjPBBBAwk sx_b917e0" role="img"></i></a></span>] 我想要获取属性'aria-label‘中的文本。如果我使用'select‘，我想知道答案。谢谢。

浏览 6提问于2020-10-22得票数 2

2回答

如何用beautifulsoup4提取html？

python、beautifulsoup

我的代码：html = """<td class='Thistd'><a><img /></a>Here is some text.</td>""" tds = soup.findAll('td', {'class': 'Th

浏览 1提问于2015-10-14得票数 1

回答已采纳

1回答

Python re.sub，re.split未能在长篇中拆分单词

python、regex、python-2.7、beautifulsoup

我试图从存储在光盘上的HTML文档中列出单词列表。当我试图拆分这些单词并将它们添加到我的单词向量中时，我的结果是一团糟。文档正在被读到BS4中，比如：我不明白为什么会这样。我想审判失败是因为它错了？

浏览 3提问于2014-08-09得票数 1

回答已采纳

1回答

从<span类获取文本:使用优美的汤和请求

python、html、beautifulsoup、python-requests、request

因此，我尝试从网站获取特定文本，但它只给出了错误(soup.find=.text(‘span’，{‘class’)：‘文本-白色fs-14 no文本-截断属性-值’}).text AttributeError：'NoneType‘对象没有属性' text ')。我的代码：from bs4 import BeautifulSoup url = "h

浏览 10提问于2021-12-21得票数 0

1回答

如何从标记中获取属性？

python、python-3.x、web-scraping、beautifulsoup、python-requests

我正在使用美丽汤从网页中提取特定的数据。我试图获取特定标记的属性，但失败了。我必须从标记中提取属性'title'。下面是我试图从以下位置获取属性的特定html标记： <span id="currwx_icon" style="display: block;" class="weather_icon1 wxi

浏览 2提问于2022-09-20得票数 2

回答已采纳

2回答

使用BeautifulSoup从html中获取特定文本

python、html、text、beautifulsoup

class="time">1.89 s</div>我只需要得到所有其他标记之外的文本(文本是:我需要得到这个文本)。failed open').find_all("em")[-1].next_sibling但是我得到了一个错误: AttributeError：'No

浏览 3提问于2022-05-25得票数 0

回答已采纳

2回答

如何在没有额外信息的情况下有效地从网页簇中提取文本

java、python、web-scraping、beautifulsoup、scrapy

我有大约一百万的网页列表，我想有效地从这些网页上提取文本。目前我正在使用python中的BeautifulSoup库从HTML中获取文本，并使用请求命令来获取网页的html。这种方法除了文本之外还提取一些额外的信息，比如在body中是否列出了任何javascript。你能给我推荐一些合适而有效的方法来完成这项工作吗？我看了scrapy，但它看起来像爬行特定的网站。我们可以将特定网页的列表传递给它以

浏览 24提问于2019-05-22得票数 0

1回答

使用BeautifulSoup提取特定文本/属性值

python、web-scraping、beautifulsoup

以下代码行：print(results)<object name="aaa" type="folder"/><object name="ccc" type="folder"/> <object name="ddd" type="folder"

浏览 2提问于2022-05-17得票数 0

1回答

使用bs4与python一起解析文件，如何从锚标记中获取文本？

python、html、beautifulsoup

Title</TITLE><a href="facebook.com">Face book</a></HTML> 如何从带有bs4的锚标记中获取脸书和Google文本，每次使用soup.find_all('a').text时，它都会返回属性<

浏览 1提问于2022-06-14得票数 -3

回答已采纳

2回答

Python美丽的汤参数

python、beautifulsoup

我有这段代码，它使用BeautifulSoup从页面获取一些文本body = soup.find('div' , {'id':'body'})我想让它成为一个可重用的函数，它接受一些htmltext和标签来匹配它，如下所示 soup= BeautifulSoup(html) bodyht

浏览 0提问于2010-04-03得票数 8

回答已采纳

2回答

如何在html源代码中提取href属性

python、html、web-scraping、beautifulsoup

这是我正在处理的HTML源代码： <a href="/people/charles-adams" class="gridlist__link"> 所以我想要做的是提取href属性，在本例中应该是"/people我需要这个，因为我想获得的特定网页的soup.findAll方法的html源代码。但是我正在努力从网页中提取这样的属性。有人能帮我解决这个问题吗？附言:我正在使用这个方法，通过Python模块beau

浏览 24提问于2019-09-23得票数 0

2回答

将多行字符串连接到Python中的数组中

python、arrays、beautifulsoup

简而言之，我的代码应该从网站HTML中的特定标记(在beautifulsoup4的帮助下)获取文本，然后将它们加载到数组中。soup = BeautifulSoup(response.content) productData = soup.find_all("div", {"class": "de

浏览 0提问于2016-07-19得票数 0

1回答

如何使用Python中漂亮的汤提取标签中的内容？

python、python-3.x、beautifulsoup

我使用以下代码使用漂亮的汤提取div类：我想提取标签类中的内容，即-哪个文本更大。

浏览 4提问于2020-06-12得票数 1

回答已采纳

2回答

如何在Python中使用str.replace() <br>或'=‘？

python

我很难去掉我从某个网页上抓取的文本中所有多余的HTML标签，然而，Python中的str.replace()似乎不适用于<br>和=这样的目标，而<li></li>等其他标签将被成功地替换。

浏览 2提问于2017-04-14得票数 0

2回答

(python)使用漂亮的汤解析某些HTML输出标记

python、parsing、beautifulsoup

)在玩了一段时间之后，我想出了以下函数，它返回完整的<>标记，而不是简单的倒置<>中的部分from urllib2 importurlopen return str((BeautifulSoup(urlopen('http://www.reference.com/wordoftheday

浏览 1提问于2012-04-27得票数 1

回答已采纳

3回答

如何编写python脚本在网站html中搜索匹配的链接

python、scrape

我对python不是很熟悉，必须编写一个脚本来执行许多函数。基本上，我仍然需要的模块是如何检查匹配链接预先提供的网站代码。

浏览 1提问于2010-03-04得票数 4

回答已采纳

2回答

Python、BeautifulSoup* - <div>文本和<img>属性按正确顺序排列*

python、html、beautifulsoup

我有一个简短的HTML，我想通过使用BeautifulSoup运行。我有基本的导航系统，但这次我很困惑。img标签的“alt”属性，我希望看到以下结果:购买此项目将花费1银币和1金币。我可以执行以下操作来提取div-标记中包含的所有文本print html.get_text() 要获得div-标记中包含的所有文本，但这将给我这样的结果同样，通过这样做，我可以从img标记中获取alt属性

浏览 2提问于2013-12-15得票数 5

回答已采纳

1回答

AttributeError：'ResultSet‘对象没有属性'previousSibling’BS4

python、html、web-scraping、beautifulsoup

为一组特定的'td'标记和里面的文本刮表。为了过滤刮伤，我以特定的'img'标记为目标，并尝试使用previousSibling调用来获取所需的'td'。我已经尝试过previousSibling，previous_sibling，previous，并不断地得到错误：任何帮助都将不胜感激from urllib2 import ur

浏览 2提问于2017-04-10得票数 0

回答已采纳

1回答

在python中为任何网页URL文档搜索特定标题的文本

python、web-scraping、beautifulsoup、scrapy

使用这些库，我想抓取文档中特定标题下的所有文本。如果你们中的任何人能帮助我，我将不胜感激。我看过一些教程，教你如何使用漂亮的soap获取特定类名下的链接(通过查看源页面选项)，但如何获取简单的文本，而不是特定类标题下的链接。对不起，我的英语不好from bs4 import BeautifulSoup r=requests.get('https://pa

浏览 0提问于2017-10-25得票数 0

1回答

如何通过Python BeautifulSoup中的特定文本找到标记？

python、html、web-scraping、beautifulsoup

您知道如何在pythons BeautifulSoup中搜索特定的文本吗?查找标记？？更好的标记完整路径，包含一些string。例如，BS4的常用用法是：from bs4 import BeautifulSoup results = BeautifulSoup(website.c

浏览 4提问于2022-09-04得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云