如何使用漂亮汤从span和em标记中提取数据

python、html、web-scraping、beautifulsoup

我正在编写一个从网页中提取数据的代码。>Recruiter Name:</em><span>Malika Pathak, Himani Adhikari</span></p><p> <em>Contact Company:</em><span>Cloud Analogy Softech Pvt

浏览 10提问于2018-07-29得票数 0

1回答

BeautifulSoup误解了<area>标签

python、beautifulsoup

我使用漂亮汤从烟草文档中提取元数据，如：meta_data = soup.document.metadata<area>GEE,ED/OFFICE; N408</area> 一个空的区域标记<area><

浏览 2提问于2014-07-29得票数 1

回答已采纳

2回答

包含多个全文行的python美观汤标记，很难以通用的方式找到。

python、beautifulsoup、parent-child

关于使用漂亮汤从一行中提取文本，有多个问题可以回答，但是，我找不到获得正确文本的解决方案，例如： <div> <span>bananas有趣的是，html2text可以为这种类型的文件生成完美的输出(没有标记)，但是漂亮汤似乎根本无法正确地完成它。“美丽汤”将

浏览 6提问于2022-06-24得票数 0

1回答

从span中删除<sup>标记中的文本，同时刮取文本的其余部分

html、python-3.x、web-scraping、beautifulsoup

我试着用漂亮的汤刮文本，我需要从一个具有特定类的span中获取文本，但是用另一个类丢弃同一span内的上标数字。我可以很容易地使用get_text从跨度中提取数字和内容，但最后我也得到了上标数字。解决方案需要能够丢弃sup标记的每个实例及其文本内容。示例HTML： <sup class="versenum&quo

浏览 2提问于2017-10-25得票数 1

回答已采纳

3回答

Python BeautifulSoup:从div标记中检索文本

python、python-3.x、web-scraping、beautifulsoup

我正在使用漂亮的汤提取谷歌游戏商店。但是，我坚持从div标记中检索文本。Div标记如下所示： a = <`div class="LVQB0b"><div class="QoPmEb"></div><div><span class="X43Kjb">Education.com</spa

浏览 6提问于2020-01-07得票数 1

回答已采纳

1回答

查找两组字符串之间的字符串(python / urllib2 /漂亮汤)

python、regex、beautifulsoup

我有以下网页网页的源代码，我正试图从<a href="...Reviews-WHATIWANT-City..." target="_blank"onclick="XX;">1,361 reviews</a>编辑(用漂亮的汤)：为了提取这些信息，我使用

浏览 2提问于2016-01-07得票数 0

回答已采纳

1回答

使用标签数据上的python从espn中提取数据-reactid

python、beautifulsoup、screen-scraping

我希望使用python从espn站点中获取一些数据。只会显示列的标题。在该链接内是数据反应链接，这些链接没有显示在urls中。如何浏览数据-反应链接？当您单

浏览 1提问于2018-11-25得票数 0

回答已采纳

1回答

从刮过的HTML中删除重复的子字符串/元素？

python、html、parsing、screen-scraping、redundancy

我从Kindle的书中提取了一大堆HTML。它有很多重复的元素和重复的子字符串。 </font> <div height="3em"> </d

浏览 4提问于2015-06-25得票数 0

回答已采纳

2回答

当数据作为搜索项给出时，提取数据和html标记。

python、web-scraping、beautifulsoup

我正在使用漂亮汤提取html数据。如果将数据作为搜索项给出，则需要提取html标记和数据，前提是标签可以是任何内容。作为一个示例，考虑到以下html代码 <h1>Python Program</h1> <span class = true>Geeks</spa

浏览 4提问于2022-08-30得票数 0

回答已采纳

1回答

使用BeautifulSoup获取包含id的span(s)中的内容

python、beautifulsoup

我很难使用Beautiful 4从存储在span标记中的许多html文件中提取内容<span cl

浏览 3提问于2016-03-19得票数 0

0回答

Python美汤-雅虎财务数据，年度与季度

python、beautifulsoup

我有一个关于如何使用漂亮的汤解析雅虎财经页面的快速问题。我可以成功地从BeautifulSoup中提取数据，但我不知道如何在年度数据和季度数据之间切换。因此，我只能提取年度数据。当切换到每季度时，url似乎没有改变。从浏览器检查，它似乎切换了一个表格，我不确定<e

浏览 9提问于2017-12-07得票数 2

2回答

如何使用漂亮的汤4从span标记中提取文本？

python-2.7、beautifulsoup、scraper

如何使用漂亮的汤在span标记中刮取文本？tag.has_attr("class"): for tag1 in soup.findAll('span'):我想在span标记<

浏览 4提问于2016-05-19得票数 2

回答已采纳

2回答

使用python的未标记文本提取不起作用。

python、beautifulsoup

我想从下面的标签中提取1626，使用python和漂亮的汤我已经尝试了这个答案，但我得到的只是一个空数组[]<h1 style="line-height:.85em; margin-top: 0" class="panel-border text-primary strong"> Laundry Dry Cleaning Equipme

浏览 2提问于2017-09-21得票数 0

1回答

从标记中提取惟一的类名

html、python-3.x、web-scraping、beautifulsoup

我正在把(对我来说)相当大的数据刮成一个漂亮的汤对象。典型的抓取结果是600页或更多的html标记，有许多嵌套的表。我试图更好地理解结构，以便有效地将数据从表中提取出来。这些汤对象中有多达500个表，其中有许多“重复”表类。以下是两个例子。<table class="TableClass1">在我的500张表格的文档中</e

浏览 0提问于2020-01-10得票数 0

回答已采纳

1回答

如何在html标记值下使用python和html标记中的漂亮汤解析html文件？

python、html、beautifulsoup

我的html文件多次包含相同的标记(<span class="fna">)。如果我想区分这个标签，那么我需要查看前面的标签。在漂亮的汤中，我只能在标签条件下应用，比如，soup.find_all("span"，{"id"："fna"})。这个函数提取标签(<span class="fna">)的所有数据，但是我只

浏览 0提问于2018-10-31得票数 3

回答已采纳

3回答

如何刮除YouTube频道创建者并链接到他们的频道？

python、web-scraping、beautifulsoup、youtube

我试着用漂亮汤从视频页面中提取频道创建者的名字，以及他们频道的链接。我试过使用class_关键字参数。因此，我得到了[]。我该怎么办？我是否需要通过父母的div标签，然后“下去”，就像他们在“美丽汤”中说的那样？对于特定的标记和类，我应该如何/可以使用soup.find呢？

浏览 2提问于2020-02-06得票数 2

回答已采纳

2回答

用漂亮汤在<br>之间提取文本，但没有下一个标签

python、html、web-scraping、beautifulsoup、html-parsing

我使用python +漂亮汤来尝试获取br之间的文本。<html></a><span class="strong">Title1</span><br>The Text I want to get<br></bo

浏览 3提问于2015-01-07得票数 1

回答已采纳

2回答

BeautifulSoup排除findAll中的标记

python、html、beautifulsoup、lxml

在漂亮汤中，如何在使用findAll时排除特定标签中的标签。<tr>标记中的标记。soup.findAll(['p']) 上面的代码将获取所有的<p>标记，但我需要在<tr>标记中提取<p>标记。

浏览 1提问于2020-08-13得票数 4

回答已采纳

1回答

美汤类名有多个空格，find_all提供[]

python、beautifulsoup

使用漂亮的汤，我试图提取值(317.69)，但得到的结果是空的。我试图提取的html代码块是： <span class="Trsdu(0.3s) Fw(b) Fz(36px) Mb(-4px) D(ib)">317.69</span> 我尝试了以下两种编码方式： value('span', class_='Trsdu(0.3s) Fw(b) Fz(36px) Mb(-4

浏览 18提问于2020-01-29得票数 0

1回答

如何抓取生成了数学符号html的数据，并将其精确地转换为文本格式？

python、html、python-3.x、selenium、beautifulsoup

我正在尝试从html中提取文本，用的是漂亮的汤类。html代码的格式如下。该代码使用数学标记来生成文本。""“<p> <math display="inline" xmlns="http://www.w3.org/1998/mathvariant=&q

浏览 2提问于2018-12-21得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用漂亮汤从span和em标记中提取数据

相关·内容