为什么Beautiful Soup返回重复的结果？

、、、、

我正在创建一个抓取indeeds网站的项目，它工作得很好，但当我今天运行它时，突然间没有做任何更改，而不是返回整个页面的结果，它不仅显示了第一个结果的副本。也许有人能帮我改正这个错误？= BeautifulSoup(html_text, 'lxml')#print(html_text) driver= BeautifulSoup(cont

浏览 33提问于2021-10-22得票数 0

回答已采纳

1回答

如何使用python中的漂亮汤访问标签中的子标记？

、

我正试图从MLB.com检索2016年赛季的球员统计数据。我正在使用Python中的Beautiful，我需要提取表中的信息： r=requests.get(url)gdata=soup.find_all('div',{'id':'datagrid'}) print(gdata)

浏览 3提问于2017-05-01得票数 0

回答已采纳

3回答

我正在做网络抓取，我只想从任何网站的文本，所以我使用的Beautiful Soup。最初，我发现get_text()方法也返回了JavaScript代码，因此为了避免遇到应该使用extract()方法的问题，现在我遇到了一个奇怪的问题，在提取script和style标记之后，BeautifulSoup甚至在新的` `html中都无法识别它的主体。html，包括body标记，并且没有script和st

浏览 20提问于2015-07-05得票数 3

回答已采纳

1回答

使用BS4的Python语言中的WebScraping -获取动态生成的列表

、、

我需要抓取这个列表中的“最佳编码训练营”列表：https://www.switchup.org/rankings/best-coding-bootcamps 我的任务是应该可以使用BeautifulSoup (而不是Selenium)，然而，当我尝试这样做时，结果HTML不会返回训练营的列表，而是返回一个似乎是类的空元素：我的问题是，您认为只有使用Beautifu

浏览 6提问于2019-12-08得票数 1

回答已采纳

1回答

如何使用BeautifulSoup匹配嵌入了<a></a>的<div></div>中的文本？

、、

: set noexpandtab tabstop=2 shiftwidth=2 softtabstop=-1: soupsys.stdin.read(), 'html.parser', from_encoding='utf-8') from pprint import pprint pprint(soup.findclass="heading4"><a name="_S

浏览 1提问于2016-01-03得票数 1

1回答

我在使用漂亮的汤查找xml中的<name></name>时遇到问题

、

我正在尝试使用beautifulsoup.name获取漂亮的汤返回文本。但它只是给了我一个美丽汤对象的文档。对于如何使用Beautiful返回XML文件中的文本，有什么建议吗？import BeautifulSoup as bsoupsoup = bsoup(f) But I'm lookin

浏览 3提问于2014-06-28得票数 0

回答已采纳

1回答

解析HTML与美丽的汤。从特定标签返回文本

、、

我可以通过一个unix shell脚本解析一个html标记的完整参数，如下所示：print(soup(itemprop="name"))[<span itemprop="name"> Blabla & Bloblo<&#x

浏览 0提问于2014-08-12得票数 5

回答已采纳

1回答

将变量用作soup.find()的输入时，将返回None，但使用与输入相同的字符串值即可

、

我正在尝试使用Beautiful Soup中的find方法来获取某个标签的内部文本。当我输入一个变量作为find的参数时，它返回None，但是使用相同文本的str输入将返回我想要的结果。为什么会这样呢？以下是代码片段： soup = BeautifulSoup(raceResults, 'html.parser')

浏览 39提问于2020-06-14得票数 0

回答已采纳

2回答

漂亮的汤在获取链接方面有什么不同之处？

、、、、

为什么通过查找以<a href="开头的字符串的所有实例来获取beautiful soup内容并提取所有链接是不明智的。如果不能使用beautiful soup，还有什么其他方法可以提取链接？

浏览 1提问于2015-01-02得票数 0

2回答

漂亮汤还错了href值

、、、

我使用下面的代码为SERP做一些SEO，但是当我尝试读取href属性时，我得到了显示页面中其他有线URL的不正确结果，但没有显示预期的结果。我的密码怎么了？q=beautiful+soup&rlz=1C1GCEB_enIN922IN922&oq=beautiful+soup&aqs=chrome..69i57j69i60l3.2455j0j7&sourceid=chrome&ie=UTF-8&q

浏览 5提问于2021-11-16得票数 0

回答已采纳

2回答

刮擦可见文本

、、、

我是一个绝对的新手领域的网页刮和现在，我想从一个网页上提取可见的文本。= BeautifulSoup(url , "lxml")对于上面的代码，我得到以下结果： /usr/local/lib/python2.7/Beautiful Soup is not an HTTP client.' that document to Be

浏览 2提问于2016-11-12得票数 0

回答已采纳

1回答

python代码在旧版本的Python中有错误吗？

我在另一台服务器上运行相同的脚本，它运行得很好，但在新服务器上有问题。是不是因为新服务器的python版本已经过时了？其中一个错误是此Error was 'NoneType' object has no attribute 'get_text'代码如下 try: area= soup.find

浏览 1提问于2014-12-08得票数 0

2回答

美丽的汤找不到线

、、

在解析http://en.wikipedia.org/wiki/Israel时，我遇到一个包含文本的H2标记，但Beautiful Soup为它返回了一个None类型：PythonHistory">History</span></h2>u'History'

浏览 0提问于2013-08-30得票数 2

2回答

Wb抓取-- find_all不会产生任何值

、

我使用漂亮的soup4进行网页抓取，但是find_all('tables')没有结果。下面是我的代码：import urllib.request wiki="website and return the html to the variable 'page' #import

浏览 0提问于2017-08-12得票数 0

1回答

Python编码问题:学位符号和其他

、、

我想将网站数据与.txt文档中的文本进行比较。然而，我似乎遇到了编码问题。source = "my url".read()soup = BeautifulSoup(source) 文本文档是通过制作一个新的文本文档来创建的，该文本文档被编码为“在没有BOM的情况下以UTF-8编码”。看看发生了什么:在Eclip

浏览 0提问于2012-01-30得票数 4

回答已采纳

3回答

BeautifulSoup4 :文本中的符号

、、、

(我是个十足的Python/BeautifulSoup新手，所以如果我笨的话，请原谅我)from bs4 import BeautifulSoup [<option>foo</option>, <option>bar and baz</option>, <option>qux</option>] 我期待着同样的结果

浏览 3提问于2013-06-05得票数 1

回答已采纳

2回答

打印不带标签的h1标题

、

使用Beautiful Soup4，我尝试打印不带标签的h1内容。 headings = bs.find_all('h1')预期结果：实际结果:每个标题的前面和结尾都

浏览 6提问于2019-08-09得票数 0

2回答

美丽汤:如何获取与给定字符串匹配的数据

、、、、

例如:-这很好，但是当我要搜索这样的东西时，如何使用它：-如果不可能搜索多个字符串，那么执行类似事情的最佳方法应该是什么。

浏览 0提问于2019-06-27得票数 0

回答已采纳

1回答

美丽的汤，巨蟒和瑞典语

、、

在网页上，我要提取的信息如下所示：当我从Python脚本打印信息时，它看起来如下所示：我是Python的新手，我已经找到了答案，并在代码的开头尝试使用# -- coding: utf-8 --，但它不起作用。

浏览 1提问于2012-11-11得票数 3

回答已采纳

3回答

python:使用BeautifulSoup的谷歌搜索抓取器

、、、、

目标:传递一个搜索字符串到google上搜索，然后抓取url，title和小的描述，与url标题一起发布。到目前为止，我的跨度如下所示，我想删除<em>元素并连接其余的stings。</b><br /&

浏览 1提问于2012-07-17得票数 6

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用python中的漂亮汤访问标签中的子标记？

美丽的汤在使用get_text ()后不能使用

使用BS4的Python语言中的WebScraping -获取动态生成的列表

如何使用BeautifulSoup匹配嵌入了<a></a>的<div></div>中的文本？

我在使用漂亮的汤查找xml中的<name></name>时遇到问题

解析HTML与美丽的汤。从特定标签返回文本

将变量用作soup.find()的输入时，将返回None，但使用与输入相同的字符串值即可

漂亮的汤在获取链接方面有什么不同之处？

漂亮汤还错了href值

刮擦可见文本

python代码在旧版本的Python中有错误吗？

美丽的汤找不到线

Wb抓取-- find_all不会产生任何值

Python编码问题:学位符号和其他

BeautifulSoup4 :文本中的符号

打印不带标签的h1标题

美丽汤:如何获取与给定字符串匹配的数据

美丽的汤，巨蟒和瑞典语

python:使用BeautifulSoup的谷歌搜索抓取器

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐