为什么BeautifulSoup要提取未引用的标签？_提取锚标签BeautifulSoup的内容_使用Beautifulsoup提取标签的变量列表 - 腾讯云开发者社区

python、html、web-scraping、beautifulsoup

要获取我尝试的id： ids = soup.findAll(lambda tag: tag.name == 'span' and tag.findParent('p', 'intro') and tag.findParent

浏览 4提问于2019-06-12得票数 0

回答已采纳

2回答

为什么漂亮汤会改变html呢？

python、html、beautifulsoup

但是，当我将内容传递给BeautifulSoup并打印该汤时，它会更改HTML代码 print(soup)ÿþ<html> <title>ARRÊT SERVOS<

浏览 2提问于2020-07-25得票数 0

回答已采纳

2回答

网络抓取视频

python、video、screen-scraping

我正试图通过在上下载“鲍勃的汉堡”的一集电视节目来验证概念。任何关于如何用BeautifulSoup和请求做视频网络抓取的</e

浏览 3提问于2018-11-08得票数 2

2回答

Python - HTML到Unicode

python、html、unicode

我有一个python脚本，在那里我得到了一些html，并使用漂亮的汤对其进行解析。下面是我获取HTML的方法xml = etree.HTML(html) 当我使用这个的时候因此，如果有非unicode字符，我的代码不会中断。

浏览 1提问于2014-11-04得票数 0

2回答

从html文本中提取表格

beautifulsoup、lxml

我正在尝试从页面中提取文本并将其保存为dataframe。该页面未格式化为标签，因此pandas无法直接读取。我尝试使用bs4，但无法提取出确切的网址。from bs4 import BeautifulSoup soup = BeautifulSou

浏览 38提问于2019-02-24得票数 0

回答已采纳

3回答

如何解析html文件中的文本

python

import urllib2from HTMLParser import HTMLParser 我有一个H

浏览 3提问于2016-10-04得票数 1

回答已采纳

1回答

有没有办法从网站上的卷影根目录中提取信息？

python、python-3.x

我正在设置代码来检查任何网址的声誉，例如网站"“上的未检测到此URL的引擎尝试了requests.get(

浏览 11提问于2019-07-31得票数 3

回答已采纳

1回答

如何通过寻找标签中的标签来提取标签中的信息？

python、html、parsing、beautifulsoup、tags

假设我想提取24分钟每集信息或N13信息在评级之下。现在这只是代码的一部分，有些span标记不是dark_text类，而是其他类。但是当我寻找持有评级的标签时，当我找到它时，我无法提取它是什么级别，因为N13现在在div标签下，而不是span下，但是由于我在寻找“等级”或“持续时间”，所以我必须查找“span”标记。，所以如果它找到我要找的span标签，我就不能回到div标签。当我执行一个for循环时，它会打印出所

浏览 0提问于2018-03-14得票数 0

回答已采纳

2回答

使用BeautifulSoup抓取产品名称

python、python-2.7、beautifulsoup

我正在使用BeautifulSoup (BS4)构建一个抓取器工具，它允许我从位于“h1”标签之间的任何TopShop.com产品页面中提取产品名称。我不明白为什么我写的代码不能工作！from urllib2 import urlopenimport re ProductPage

浏览 0提问于2013-02-15得票数 0

回答已采纳

1回答

如何从a标记中提取所有的href并测试它们是否以'/‘开头？- Python

python、beautifulsoup

我用漂亮汤从a标签中提取出所有的but，但是其中一些引用开始时像"/videos.com“，而不是”www.范本/视频网站“，它们没有域名。所以，我要做的是从a标记中提取所有的hrefers，但是我想测试它是否以"/“开头，如果是这样，我将添加域"www.example.com”。我想要的是： domain_name = '

浏览 2提问于2017-08-11得票数 2

回答已采纳

3回答

获取属性错误：“NoneType”对象没有属性getText

python、function、beautifulsoup、nonetype

我已经写了一半的代码，从RSS提要中提取标题和链接，但这会导致上述错误。在获取文本时，这两个函数中都存在错误。我想去掉输入的标题和链接标签的字符串。from bs4 import BeautifulSoupimport re a= str(a) a=bsoup.find('link').getText(

浏览 3提问于2013-10-27得票数 1

回答已采纳

2回答

如何在python中使用BeautifulSoup获取有意义的内容

python、html、beautifulsoup

我有一些代码可以从这样的网页中提取身体：-from bs4 import BeautifulSoupsoup=BeautifulSoup(content.content, 'html.parser')printwebpage

浏览 1提问于2019-11-27得票数 0

回答已采纳

3回答

如何使用BeautifulSoup查找第一个锚标签的文本

python、beautifulsoup

我有一个这样的HTML结构 <a href="abc.com"> </a> <ahref="xyz.com">comments</a></p> 我想提取第一个锚标签的文本

浏览 1提问于2016-04-28得票数 1

2回答

使用BeautifulSoup解析格式错误的属性

python、html、beautifulsoup

我正在尝试提取一个包含无效的未转义引号的属性：像这样使用BeautifulSoup时： soup.find('meta')['content']有没有办法让BeautifulSoup把未转义的引号作为属性的一部分，这样结果就是mal"formed

浏览 1提问于2015-12-18得票数 4

1回答

为什么美丽汤没有从网站中提取所有的"a“标签

python、beautifulsoup

我正在学习BeautifulSoup，我试着从一个网站中提取所有的"a“标签。我得到了很多"a“标签，但很少被忽略，我很困惑为什么会发生这种情况，任何帮助都会受到高度赞赏。我使用的链接是：import re res = requests.get('https:/&

浏览 0提问于2018-08-21得票数 0

回答已采纳

1回答

使用Beautifulsoup，如何提取标签中未嵌入的信息

python、beautifulsoup

我正在尝试解析这个页面中的一些精选信息："<span class="ha-label">Adresse</span>""<span class</p><p></p>data, links

浏览 56提问于2018-08-01得票数 1

回答已采纳

2回答

从包含br标记的td标记中提取文本

python、python-3.x、beautifulsoup

我想从td标签中提取包含br标签的文本。from bs4 import BeautifulSoupsoup= BeautifulSoup(html, 'html.parser') print(s

浏览 0提问于2018-03-14得票数 1

回答已采纳

2回答

Python BS4美汤HTML.Parser在网站上不起作用

python、beautifulsoup

我有Python3.7代码，尝试从以下网站()提取足球统计数据。看起来我在BS4美丽汤中使用的超文本标记语言解析器根本没有提取网站中的任何标签。我首先尝试提取特定的标签，比如表示主队和客队的两个不同的div标签，以及包含球员姓名的标签。当这呈现了一个空的标签列表时，我只是简单地尝试提取该网站上的</em

浏览 26提问于2019-07-13得票数 2

回答已采纳

3回答

有没有更好的方法？

python、pycharm

当您从某个可迭代的实例设置属性时，如下所示： class DogWith100Legs(): for leg_i但PyCharm将突出显示leg_100并显示警告：“未解析的引用'leg_100‘for class 'DogWith100Legs’。我为什么要这样做？我想创建树状对象。就像BeautifulSoup一样。)中也有评论，人们说这是一种糟糕

浏览 58提问于2019-06-19得票数 0

回答已采纳

2回答

在Python中解析html后检查元素的存在

python、python-3.x、beautifulsoup

我想检查下面的列表(名为rank1)中是否有"TierRank unranked“元素 <div class="TierRankInfo"><div class="TierRank unranked"> </div> </div> 所以，我像这样编写代码。 rank1 = soup.find("div", {"c

浏览 32提问于2020-04-14得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云