如何在python中使用BeautifulSoup获得第二个跨度？

要在Python中使用BeautifulSoup获取第二个<span>标签，你需要首先安装BeautifulSoup库和解析器（通常是lxml）。以下是如何做到这一点的步骤：

安装BeautifulSoup和lxml

你可以使用pip来安装这些库：

pip install beautifulsoup4 lxml

解析HTML并获取第二个`<span>`

假设你有以下的HTML内容：

<html>
<head><title>Test Page</title></head>
<body>
    <span>第一个span</span>
    <span>第二个span</span>
    <span>第三个span</span>
</body>
</html>

你可以使用以下Python代码来获取第二个<span>标签：

from bs4 import BeautifulSoup

# 假设html_doc是你的HTML字符串
html_doc = """
<html>
<head><title>Test Page</title></head>
<body>
    <span>第一个span</span>
    <span>第二个span</span>
    <span>第三个span</span>
</body>
</html>
"""

# 创建BeautifulSoup对象
soup = BeautifulSoup(html_doc, 'lxml')

# 找到所有的<span>标签
spans = soup.find_all('span')

# 获取第二个<span>标签
second_span = spans[1] if len(spans) > 1 else None

# 打印第二个<span>标签的内容
if second_span:
    print(second_span.text)
else:
    print("没有找到第二个<span>标签")

解释

安装库：首先需要安装BeautifulSoup和lxml库，因为lxml是一个快速的解析器，适合与BeautifulSoup一起使用。
创建BeautifulSoup对象：使用HTML字符串和解析器创建一个BeautifulSoup对象。
查找所有<span>标签：使用find_all方法查找所有的<span>标签。
获取第二个<span>标签：由于列表索引是从0开始的，所以第二个<span>标签的索引是1。这里还进行了一个简单的检查，以确保至少有两个<span>标签。
打印内容：如果找到了第二个<span>标签，就打印它的文本内容。

应用场景

这种技术通常用于网页抓取和数据提取。例如，你可能想要从一个网站上抓取特定的信息，比如产品价格、新闻标题等，这些信息可能包含在<span>标签中。

参考链接

BeautifulSoup官方文档：https://www.crummy.com/software/BeautifulSoup/bs4/doc/
lxml官方文档：https://lxml.de/

如果你在实际应用中遇到任何问题，比如解析错误或者找不到元素，请确保你的HTML内容是正确的，并且你的选择器匹配了页面上的元素。

使用BeautifulSoup拉取标签值

、、、

有人能告诉我如何使用BeautifulSoup拉取标签的值吗？我阅读了文档，但很难浏览它。例如，如果我有： <span title="Funstuff" class="thisClass">Fun Text</span> 我怎么才能使用BeautifulSoup/Python拉出"Funstuff“呢？编辑:我正在使用版本3.2.1

浏览 1提问于2012-07-24得票数 6

回答已采纳

1回答

我一直在尝试使用Python中的漂亮汤从网站上抓取两个值，这给我带来了麻烦。以下是我正在抓取的页面的网址：下面是我想要刮掉的值：我试过： from bs4 import BeautifulSoup import requests source = requests.get('https://www.stjosephpartners.com/Home/Index').text soup = BeautifulSoup(source, 'lxml') gold_spot_shell = soup.find('div', class_ =

浏览 3提问于2020-09-04得票数 0

回答已采纳

2回答

从雅虎财经中抓取数据

我一直在尝试从雅虎财经中抓取数据，但每次尝试都会得到以下错误： Traceback (most recent call last): File "C:\Users\nnarn\PycharmProjects\papaproject\main.py", line 15, in <module> print(str(parsePrice())) File "C:\Users\nnarn\PycharmProjects\papaproject\main.py", line 8, in parsePrice soup=bs

浏览 34提问于2021-03-12得票数 0

1回答

如何使用xpath或bs4从两个不同的模板中获取价格？

、、

我有两个模板2个不同的价格。对于第一个模板，价格的id为priceblock_ourprice，并且打印正确，但是对于第二个模板，它没有打印价格。如何以csv格式打印价格？您可以使用xpath或漂亮的汤。此代码的问题存在于第一个try/except语句中。我附上了代码和输出(Csv)。如果有任何帮助，我将不胜感激。这是输出(CSV) import csv from selenium import webdriver from bs4 import BeautifulSoup import requests from lxml import html links = [

浏览 0提问于2018-07-16得票数 1

1回答

web数据抓取:拆分html内容

、、

我正在抓取一个网站，我能够将一个名为“性别”的变量缩减为： [<span style="text-decoration: none;"> Lass Christian, du Danemark, à Yverdon-les-Bains, avec 200 parts de CHF 100 </span>, <span style="text-decoration: none;">associé gérant </span>] 现

浏览 5提问于2016-09-15得票数 0

回答已采纳

1回答

bs4 'find()不接受关键字参数‘错误

from bs4 import BeautifulSoup import requests link = requests.get('https://www.amazon.sg/s?k=monitor&ref=nb_sb_noss_2').text soup = BeautifulSoup(link, 'lxml') product = soup.find('span', class_='a-offscreen').text product_name = product.find('a', c

浏览 421提问于2021-10-11得票数 0

2回答

用漂亮汤解析python网页

、、

我在从网站上获取数据时遇到了一些麻烦。网站来源如下： view-source:http://release24.pl/wpis/23714/%22La+mer+a+boire%22+%282011%29+FRENCH.DVDRip.XviD-AYMO 有些事情是这样的： FILMIE Tytuł............................................：La meràboire Ocena.............................................：IMDB6.3/10 (24) Produkcja.................

浏览 0提问于2012-06-27得票数 8

回答已采纳

1回答

如何使用BeautifulSoup获取特定格式的数据？

、、

我将创建一个python代码来使用BeautifulSoup获取给定链接股票的平均容量。我到目前为止所做的事： import bs4 import requests from bs4 import BeautifulSoup r=requests.get('https://finance.yahoo.com/quote/M/key-statistics?p=M') soup=BeautifulSoup(r.content,"html.parser") # p = soup.find_all(class_="Fw(500) Ta(end) Pstar

浏览 0提问于2020-09-03得票数 0

回答已采纳

2回答

美丽的汤找不到线

、、

在解析http://en.wikipedia.org/wiki/Israel时，我遇到一个包含文本的H2标记，但Beautiful Soup为它返回了一个None类型： $ python Python 2.7.3 (default, Apr 10 2013, 05:13:16) [GCC 4.7.2] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import bs4 >>>

浏览 0提问于2013-08-30得票数 2

3回答

BeautifulSoup码错误

、

我似乎找不到这段代码中的问题。我们会感谢你的帮助。 import requests from bs4 import BeautifulSoup url = 'http://nytimes.com' r = requests.get(url) r_html = r.text soup = BeautifulSoup(r_html) title = soup.find('span','articletitle').string

浏览 0提问于2018-07-14得票数 0

回答已采纳

4回答

从google搜索中获取温度的Python脚本

、、、

我正在制作一个python脚本，它将通过搜索关键字温度从google获得温度。我发现温度值存储在span id="wob_tm“中，来自于这个检查元素代码->。 <div> <div class="vk_bk sol-tmp" style="float:left;margin-top:-3px;font-size:64px"><span id="wob_tm" class="wob_t" style="display:inline"> 18 </span&

浏览 8提问于2016-01-29得票数 0

回答已采纳

1回答

使用bs4翻译页面后对其进行抓取

、、、

我试图通过转换成英语来抓取一个在法国的页面。这是我的代码，使用了漂亮的汤和用python编写的请求包。 import requests from bs4 import BeautifulSoup url = '<url>' headers = {"Accept-Language": "en,en-gb;q=0.5"} r = requests.get(url, headers=headers) c = r.content soup = BeautifulSoup(c) 但这仍然是给出了法语文本。有没有人能建议修改/替代代码。

浏览 16提问于2018-09-26得票数 0

1回答

如何更改python的这个公式？我是编程新手，任何帮助都很感谢

、

嗨，我目前已经从网上获得了这段代码。它当前获取以下报价器的url和公司信息。有没有办法更新这段代码，以显示行业和行业信息，而不是url和公司信息？编程新手，所以如果有任何帮助，我将不胜感激:) 代码如下： import bs4 as BeautifulSoup from bs4 import SoupStrainer import re import urllib.request import pandas as pd import requests symbols = ['SBUX', 'MET', 'CAT', 'JNJ'

浏览 36提问于2019-11-29得票数 2

回答已采纳

1回答

如何在Mac上安装BeautifulSoup4 to python3

、、、

我在/usr/bin/python中有原始的python2.7.5，我通过在/usr/local/bin/python3中下载python3.5.1包安装了Python3，然后我安装了BeautifulSoup4，如下所示： sudo easy_install BeautifulSoup4 Searching for BeautifulSoup4 Best match: beautifulsoup4 4.4.1 Processing beautifulsoup4-4.4.1-py2.7.egg beautifulsoup4 4.4.1 is already the active version

浏览 0提问于2016-02-21得票数 2

回答已采纳

1回答

python如何解析html

、

我想用BeautifulSoup解析python中的html div。我的代码： url = "http://german-bash.org/action/random" response = urllib2.urlopen(url) html = response.read() soup = BeautifulSoup(html) for div in soup.findAll('div','zitat'): output = div.find('span', 'quote_zeile').string

浏览 3提问于2013-12-05得票数 0

回答已采纳

1回答

如何获取div标记中的所有li标记

、、

我正在刮一个网站，以了解公司和产品的细节。它有div标记，其中有li标记，我希望在div标记中得到所有的li标记。我使用python3.5.1和BeautifulSoup 我的代码： from bs4 import BeautifulSoup import urllib.request import re r = urllib.request.urlopen('http://i.cantonfair.org.cn/en/ExpExhibitorList.aspx?k=glassware') soup = BeautifulSoup(r, "html.parser"

浏览 4提问于2016-02-26得票数 0

回答已采纳

2回答

在使用Beautifulsoup时删除标签

、、、

尝试用Kodi抓取个人脚本的网站，我的代码工作正常，但当BS呈现内容时，它仍然有标签在上面。这是Python的新手，所以请寻找简单易懂的答案。当前输出： <li> <span style="font-family:trebuchet ms,helvetica,sans-serif;"> <span style="font-size:16px;color:#EFEFEF;"> 04:30 - 05:30 The Tonight Show Starring Jimmy Fallon <s

浏览 4提问于2018-02-28得票数 0

2回答

如何在Python中搜索class元素？

、、、

我是Python的新手，我在网上看过很多关于web抓取的教程视频。这是来自目标网站的元素： <span class="status ng-binding"> 14 </span> 这是我的代码： import requests import bs4 headers = {"User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.132 Safari/537.36

浏览 2提问于2019-10-19得票数 0

2回答

使用BeautifulSoup获取span中的文本

、

我正试图用这个网站上的“美丽汤”从City、Country和Region那里取回： (别担心，这不是我的IP；虚拟ip) 这就是我想要的： url = "https://www.geodatatool.com/en/?ip="+ip # Getting site's data in plain text.. sourceCode = requests.get(url) plainText = sourceCode.text soup = BeautifulSoup(plainText) tags = s

浏览 6提问于2020-09-09得票数 0

回答已采纳

2回答

如何在“<span>contents <span>==$0”中获取“contents”

当我试图在这个网站()上获取一些房屋信息时，我在使用beautifulsoup4模块获取语句‘<span> contents <span>==$0’中的''contents'‘时遇到了一个问题，我总是得到一个'0'，而不是内容。.Thanks很多！下面是我的代码： import requests from bs4 import BeautifulSoup from Headers import headers def getSigleHouseDetail(houseurl): result = {} res

浏览 0提问于2018-10-20得票数 0

1回答

为什么我会得到“无”的回应?这到底意味着什么？

、、、

我正在学习python，在抓取一个web之后，我不太理解响应格式。为什么我没有得到作为这个代码的响应？ import requests from bs4 import BeautifulSoup quote_page = 'https://www.bloomberg.com/quote/SPX:IND' page = requests.get(quote_page).text soup = BeautifulSoup(page, "lxml") price_box = soup.find('span', class_="pric

浏览 0提问于2019-08-10得票数 0

回答已采纳

1回答

Python -传递urls与HTTPResponse对象

、、

我有一个URL列表，我想从中抓取一个属性。Python的新手，所以请原谅。Windows 7，64位。Python 3.2。下面的代码可以工作。pblist是由包含关键字'short_url‘的字典组成的列表。 for j in pblist[0:10]: base_url = j['short_url'] if hasattr(BeautifulSoup(urllib.request.urlopen(base_url)), 'head') and \ hasattr(BeautifulSoup(urllib.reque

浏览 0提问于2012-03-28得票数 1

回答已采纳

2回答

如何在.content中未包括的HTML标记中获取文本？

、、

我想把像这样的页面中的文本：刮成一个字符串。尤其是DBSOURCE中的文本块对于使用soup.findall(text=true)等，我似乎有多种建议，但什么也没有提出。至少在2018年之前，任何东西似乎都已经过时了(我正在使用python3.7)。我认为问题在于，我想要的内容超出了r.text和r.content的范围；当我使用ctrl搜索时，我要寻找的部分并不存在。 from bs4 import BeautifulSoup import requests url = "https://www.ncbi.nlm.nih.gov/protein/P22217" r =

浏览 6提问于2019-10-14得票数 0

回答已采纳

1回答

在BeautifulSoup中使用.select()从网页中拉取数字时使用哪些CSS选择器？

、

我正在尝试使用python从一个网页上拉取当前的股票价格。我在使用Beautiful Soup拉取数字时遇到了问题。我不知道该使用什么CSS选择器。我尝试了span，div，tr，tbody，td的组合。附件是HTML的图片。注意，我想要的数字是368.45： HTML：下面是我的python3代码的精髓(如果有必要的话，我使用Ubuntu )： res = requests.get(#webpage_url) res.raise_for_status() soup = bs4.BeautifulSoup(res.text, "lxml") stock_price

浏览 54提问于2018-06-19得票数 1

2回答

将数据附加到Python数组会导致错误。

、

我正在练习使用漂亮的汤，我试图让代码隔离页面中的链接，然后检索它们。我的"print (link.get(“href”))行打印链接的整个列表，因此该部分可以工作。我正在挣扎的是现在能够将列表保存到一个数组中，这样我就可以播放数据了。在本例中，Iam试图打印列表中的第5个元素。我得到的错误是"IndexError:超出范围的列表赋值索引“ 以下是代码： import requests from bs4 import BeautifulSoup i=0 array1 = [] r = requests.get("http://www.yellowpages.ca/bu

浏览 3提问于2016-01-07得票数 1

回答已采纳

2回答

如何在python中提取属性值？

、

我有一个html文件： <html>... <li id="123"></li> <li id="3455"></li> .... </html> 如何使用BeautifulSoup在python中单独获取所有in的值？所需的输出为：["123","3455"]

浏览 0提问于2012-07-14得票数 0

回答已采纳

2回答

如何在Python中从网站抓取和迭代表

、

我试图在Python语言中抓取和迭代一个表，然后将其输入到一个pandas DataFrame中，但我甚至在使用BeautifulSoup查找表时都遇到了麻烦。这是我通常做的事情，但在源代码中似乎没有表格。我该如何拉出这个页面上的主表？ from bs4 import BeautifulSoup import pandas as pd import numpy as np import requests url = 'https://markets.ft.com/data/director-dealings' site = requests.get(url) soup =

浏览 21提问于2020-11-07得票数 0

1回答

监测产品的可用性

、、、

我开发了这个Python脚本来监控Decathlon产品的可用性。问题是，对于我监视的所有产品，我都得到了相同的输出“不可用”，如果它们还在库存的话。这是因为库存的产品和没有库存的产品有相同的脚本。十项全能的剧本哪一部分我要刮？这是我的节目： import requests from bs4 import BeautifulSoup headers = { "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.10

浏览 4提问于2020-08-23得票数 0

回答已采纳

3回答

如何在python中抓取完整的instagram页面？

、、、

长话短说，我正在尝试创建一个Instagram python抓取器，它加载整个页面并抓取所有指向图像的链接。我让它正常工作，唯一的问题是，它只加载了Instagram显示的原始12张照片。有没有什么方法可以告诉我加载整个页面的请求？工作代码； import json import requests from bs4 import BeautifulSoup import sys r = requests.get('https://www.instagram.com/accountName/') soup = BeautifulSoup(r.text, 'lxml&#

浏览 5提问于2018-04-27得票数 0

回答已采纳

1回答

如何将嵌套在div下的所有div扫描到一个列表中？

、、、、

我目前正在开发一个使用Selenium和BeautifulSoup的网页刮刀器。我觉得我遇到的问题更多的是因为我缺乏Python经验，而不是因为我对库的体验。我的问题归结起来是，在div下没有嵌套类的div，它有一个类，我想把它抓取到一个列表中。我不完全确定如何运行这些嵌套的div，并将所有的信息放在一个列表中。我认为，我的部分问题是由于我没有使用Python中嵌套的for循环的经验，因为我认为当前for循环会导致无限循环。告诉我你想出了什么。谢谢! from selenium import webdriver from bs4 import BeautifulSoup import time

浏览 0提问于2018-01-31得票数 1

回答已采纳

3回答

我无法在Mac上的Eclipse中安装BeautifulSoup

、、、、

ImportError: No module named BeautifulSoup 我已经试过easy_intall和python setup.py install了，都不管用。即使在我安装了BeautifulSoup之后，我仍然得到相同的错误。我已经从python.org预装了Python2.7.2和Python2.7和3.2。我根据终端在python2.7的目录中安装了汤，如下所示。 running install running build running build_py running install_lib running install_egg_info Removing

浏览 2提问于2012-04-05得票数 0

回答已采纳

1回答

使用BeautifulSoup解析HTML标记时显示为空，但在浏览器中打开时具有内容。

、、、

在通过BS4解析html页面时，我遇到了一个问题。我在html页面中有一个隐藏的div，我想使用BeautifulSoup读取其中的内容。其内容由javascript函数动态生成，javascript函数通过body onload触发。问题是:当我在浏览器中调用页面时，标签有它应该拥有的内容。当我通过BS4解析同一个页面时，标签是空的。我找不到任何关于BS4无法处理onload生成的内容的信息，所以我不确定这里的问题可能是什么。 Python脚本： import urllib.request from bs4 import BeautifulSoup import time import

浏览 3提问于2015-10-10得票数 2

回答已采纳

1回答

python3 -如何从span中刮取数据

、、

我尝试使用python3和BeautifulSoup。 import requests import json from bs4 import BeautifulSoup url = "https://www.binance.com/pl" #get the data data = requests.get(url); soup = BeautifulSoup(data.text,'lxml') print(soup) 如果我打开html代码(在浏览器中)，我可以看到：但是在我的数据中(在控制台打印)，我看不到btc的价格：你能给我一些建议吗?如何刮

浏览 1提问于2018-11-07得票数 2

回答已采纳

1回答

如何在Azure web作业中安装扩展模块？

、、、、

我试图在Azure web作业中安排一个使用扩展模块的python脚本： import sys sitepackage = "D:\home\site\wwwroot\env\Lib\site-packages" sys.path.append(sitepackage) try: from bs4 import BeautifulSoup print("!!! BEAUTIFUL SOUP !!!") except ImportError as e: print(e) 我将所有适当的扩展模块pip安装在我的“site”文件夹的(ven

浏览 6提问于2021-03-01得票数 1

回答已采纳

1回答

如何在一个页面加载完所有搜索结果后使用python urlopen抓取？

、、、

我正在尝试抓取机票信息(包括机票信息和价格信息等)从使用python3和BeautifulSoup。下面是我使用的python代码。在这段代码中，我试图抓取2012-07-25从北京(北京)到丽江(丽江)的航班信息。 import urllib.parse import urllib.request from bs4 import BeautifulSoup url = 'http://flight.qunar.com/site/oneway_list.htm' values = {'searchDepartureAirport':'北京', &

浏览 2提问于2012-07-25得票数 5

回答已采纳

2回答

css:将鼠标悬停在li标记中的span上

我的代码出了什么问题？为什么当我将鼠标悬停在标签上时，不要改变标签中的背景。 <style type="text/css"> #menu ul{ list-style-type: none; margin-left: 0px; padding-left: 0px; height: 33px; } #menu li{ display: inline; margin-left: 5px; height: 33px; } #menu a{ color: #336699; height: 33px;

浏览 0提问于2010-11-12得票数 0

回答已采纳

2回答

如何在html源代码中提取href属性

、、、

这是我正在处理的HTML源代码： <a href="/people/charles-adams" class="gridlist__link"> 所以我想要做的是提取href属性，在本例中应该是"/people/charles-adams"，并带有漂亮的So模块。我需要这个，因为我想获得的特定网页的soup.findAll方法的html源代码。但是我正在努力从网页中提取这样的属性。有人能帮我解决这个问题吗？附言:我正在使用这个方法，通过Python模块beautifulSoup来获取html源代码： request = reque

浏览 24提问于2019-09-23得票数 0

1回答

如何在网络上刮取耐克产品的可用尺寸

、

我正试图从耐克的产品页面上抓取所有可用的大小。例如，本页：我试着加载这个网站并将它写到这样的文本文件中： import requests from bs4 import BeautifulSoup url = "https://www.nike.com/t/air-force-1-07-mens-shoe-JkTGzADv/315122-111" page = requests.get(url) soup = BeautifulSoup(page.content, 'html.parser') soupstirng = str(soup) with op

浏览 0提问于2020-10-08得票数 1

回答已采纳

1回答

使用BeautifulSoup获取搜索结果编号

、、、、

我试图在Python中使用BeautifulSoup来获取CNN中搜索结果的总数。网页上的源代码是 <div class="cnn-search__results-count"> "Displaying results 1-10 out of 2208 for" <strong>toronto</strong> </div> 如截图1所示：我写的代码是： from bs4 import BeautifulSoup import requests url_cnn = 'https://

浏览 1提问于2020-03-21得票数 0

回答已采纳

2回答

用BeautifulSoup提取数据

、、

我需要从文件中提取“7秒前结束”： <div class="featured__columns"> <div class="featured__column"><i style="color:rgb(149,213,230);" class="fa fa-clock-o"></i> <span title="Today, 11:49am">Ended 7 seconds ag

浏览 2提问于2016-03-09得票数 1

回答已采纳

3回答

如何在python中提取html表中的第二列？

、、

<table style="width:300px" border="1"> <tr> <td>John</td> <td>Doe</td> <td>80</td> </tr> <tr> <td>ABC</td> <td>abcd</td> <td>80</td> </tr> <tr> <td&

浏览 1提问于2014-08-05得票数 0

2回答

查找URL的评分

、、、

我正在尝试创建一个包含对20家银行的评论的数据框架，在下面的代码中，我试图获得20个客户的评分分值，但我发现这很困难，因为我是新的BeautifulSoup和Webscraping。 import pandas as pd import requests from bs4 import BeautifulSoup url = 'https://www.bankbazaar.com/reviews.html' page = requests.get(url) print(page.text) soup = BeautifulSoup(page.text,'html.pa

浏览 5提问于2019-02-22得票数 0

回答已采纳

1回答

Jekyll不使用红晕高亮笔高亮显示

我的Jekyll博客(Github页面)似乎没有正确地突出显示语法，无论是本地托管的还是托管在Github上的。我的_config.yml如下所示 #Others markdown: kramdown # Syntax highlighting highlighter: rouge kramdown: input: GFM syntax_highlighter: rouge 在一篇文章中，我尝试用python标记隔离代码块，如下所示 ```python 导入urllib2 从bs4导入BeautifulSoup urllib2.urlopen( "“).read()

浏览 1提问于2016-06-12得票数 6

1回答

在BeautifulSoup上下载PyCharm

、

我正在尝试通过BeautifulSoup安装PyCharm包，我也尝试通过命令行下载它。但我似乎无法在PyCharm上运行它。我一直收到以下错误 Collecting BeautifulSoup Using cached BeautifulSoup-3.2.1.tar.gz Complete output from command python setup.py egg_info: Traceback (most recent call last): File "<string>", line 1, in <module>

浏览 1提问于2016-05-12得票数 0

回答已采纳

1回答

如何在本网站上刮取股利

、

我正试图在这个网站()上获取股息收益。但它被包裹在“col-xs-9col-md-5”中，这会多次出现。有一段文字"Dvd.收益率(%)“只出现一次。我知道如何搜索"Dvd.收益率(%)“，但不知道如何进入下一行，即具有数字股息收益率的行。新手在蟒蛇，所以感谢您的建议！谢谢你提前一百万！ import requests from bs4 import BeautifulSoup URL = 'https://www.set.or.th/set/companyprofile.do?symbol=FTREIT&ssoPageId=4&langu

浏览 3提问于2020-03-04得票数 0

回答已采纳

1回答

用漂亮汤用xml处理编码错误

、、

因此，我的xml文件正在编码： <?xml version="1.0" encoding="utf-8"?> 我正试图用漂亮的汤来解析这个文件。 from bs4 import BeautifulSoup fd = open("xmlsample.xml") soup = BeautifulSoup(fd,'lxml-xml',from_encoding='utf-8') 但这会导致 Traceback (most recent call last): File "C:\Users\g

浏览 4提问于2019-02-22得票数 6

回答已采纳

1回答

BeautifulSoup已安装，但在运行dev_appserver时无法识别

、、

更新 By adding BeautifulSoup.py to my app source, this error was gone :) “谢谢，”内德·戴利说，“这花了很长时间，但却很有成果。从这里忽略我只安装了一个python2.5与BeautifulSoup，仍然没有运气！，我做错了什么，请帮助 bash-3.2$ ls -ltr /Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/site-packages total 1096 -rw-r--r-- 1 Harit admin 66866

浏览 3提问于2011-08-20得票数 1

回答已采纳

1回答

美丽的汤: FileNotFoundError：[Errno2]没有这样的文件或目录：

、、

我正在努力学习美汤。我使用下面的网址来学习。当我尝试运行代码时，我得到下面的错误。 FileNotFoundError: [Errno 2] No such file or directory: 'what_is_beautiful_soup_in_python-Google_Search.html' Python模块和HTML文件都保存在同一个文件夹中。文件名= what_is_beautiful_soup_in_python-Google_Search谁能帮我解决这个问题？ from bs4 import BeautifulSoup soup = BeautifulSo

浏览 24提问于2020-03-11得票数 1

1回答

没有方括号的数据帧总量来自每部电影BeautifulSoup Python报废

、、、、

我想要创建一个数据帧表，显示电影标题和总量。已经设法抓取了这两个值，但是当我创建数据帧表时，粗值显示在括号中。我想删除这些括号。下面是我到目前为止掌握的代码： from bs4 import BeautifulSoup import requests import pandas as pd url = "https://www.imdb.com/list/ls024149810/" page = requests.get(url) soup = BeautifulSoup(page.content, "html.parser") # Extract Title

浏览 6提问于2022-07-30得票数 0

回答已采纳

3回答

如何使用CSS选择器访问BeautifulSoup中的嵌套HTMLelement

、、

HTML是： <span class="_hylizj6"> <span class="_1m8bb6v"> <span>Cena</span> </span> <span>233 zł</span> </span> 使用BeautifulSoup和CSS选择器，如何访问"233 zł"？我试过： airbnb_soup.select('.hylizj6 span span') 但不去，尽管 airbnb_soup

浏览 0提问于2018-03-10得票数 0

回答已采纳