使用BeautifulSoup从具有不同类的多个跨度中提取文本

、、

我正在尝试从一个我通过BeautifulSoup解析过的网页中提取一些数据。span class="as-of-date"></span>USD</div> 我想从“标题”、“截止日期”和“数据”范围中获取信息”，“20-Jul-20”，“USD 36,636,694,134”)，(“基金净资产”，“2

浏览 8提问于2020-07-22得票数 0

1回答

使用h1和Python从多个标记(如具有类的BeautifulSoup和p标记)中提取文本

、

我已经知道了如何从itemprop中提取文本，但是我不能从我粘贴的<div clas="someclass">Extract This Text Here!</div>中提取文本，我只是粘贴了我的代码中不起作用的部分，但是如果需要的话，它会粘贴整个内容。我已经用BeautifulSoup和Python设置了一个变量来获取页面，但是它不会只抓取文本</em

浏览 1提问于2018-08-22得票数 0

回答已采纳

1回答

在python中尝试使用BeautifulSoup抓取任何数据时，为什么我总是得到无列表或空列表

、、、

我正在尝试从amazon.com中提取一个简单的产品标题，使用包含该标题的跨度所具有的id。这是我写的： import requests url = 'https://www.amazon.com/Acer-SB220Q-Ultra-Thin-Frame-Monitor/dp/B07CVL2D2S/ref

浏览 48提问于2021-02-12得票数 0

1回答

使用漂亮的汤在多个DIVs中提取正确的链接。这不是一个重复的问题

、

下面的代码从具有相同类的多个DIVs中提取链接，并正确地打印它们。然而，在每个DIV中有几个链接。我只想提取和打印每个DIV中的第一个链接。我应该用什么语法来完成这个任务。bikes</a></h1>from bs4 import

浏览 0提问于2019-08-19得票数 0

回答已采纳

2回答

从包含在具有相同类的div中的多个链接中提取的文本的单行打印问题

、

我正在尝试从一个具有相同类的几个div的页面中提取文本。每个div包含不同数量的文本链接。从每个div中提取的文本需要用一行打印出来。例如，如果一个div包含三个链接，另一个div包含两个链接，那么我希望从第一个div中的三个链接中提取文本，然后用一行打印结果，然后从第二个d

浏览 0提问于2019-08-30得票数 0

回答已采纳

2回答

更新Jquery Datatable单元格值

、

我有一个包含多个跨度的jquery datatable。表中加载了来自DB的ajax数据，然后当用户更改某个值时，会动态更新跨度，以匹配具有相同类的所有其他跨度。然而，我遇到的问题是，当我更新跨度时，datatable似乎不知道它已经更新了。我试着使用.draw()，但它似乎不起作用。如何让datatable在<em

浏览 0提问于2015-09-04得票数 5

回答已采纳

2回答

BeautifulSoup在标记中的代码片段中找到一个键值

、

我的目标是从页面源中获取“sitekey”的值。代码的片段是。所讨论的页面是soup = BeautifulSoup(url,'html.parser')不工作，因为有多个具有相同类名的d

浏览 4提问于2017-04-23得票数 1

回答已采纳

1回答

在xpath中获取文本值，而不包括脚本

、

你好，我刚开始使用web抓取和X路径，我在ID main中的scrapy (python框架)中使用了以下x路径，如何修改xpath以不收集“脚本”和“样式”中的文本？my_list=response.xpath('//*[@id="main"]//text()').extract() 在网上搜索后，我发现我可以使用|放置多个x路径(在我的</em

浏览 1提问于2019-12-02得票数 1

回答已采纳

2回答

从具有相同类名的多个跨度中检索文本

、、

我的朋友在他的网站上制作了他自己的随机数生成器，并要求我找到一种方法来制作某种脚本，可以自动回答随机数生成器的问题。我是一名工程师，不是程序员，所以我对此一无所知，我想学习。到目前为止，我所看到的是随机数生成器将4个不同的跨度放入一个分区中，因此它们都出现在各自的框中。它们都有相同的类名，不知何故，我想编写一个脚本，自动从跨度中检索信息并将其输入

浏览 2提问于2014-04-17得票数 3

1回答

漂亮的汤。将文本提取到数据帧中

、、

我试图从包含多个类似结构的录音的单一网页中提取信息。信息包含在具有不同类的div标记中(我对用户名、主文本和日期感兴趣)。下面是我使用的代码：import urllib sause =urllib

浏览 1提问于2018-04-16得票数 1

回答已采纳

1回答

提取没有子文本的父文本；解析HTML

、、、

我有一个使用Selenium & BeautifulSoup提取的汤标记元素。monster-source">Basic Rules </p>我试着从p元素中抓取文本，但是每次我尝试时，它也会抓住跨度。到目

浏览 4提问于2022-01-20得票数 0

回答已采纳

1回答

如何使用find_all()提取所需的元素

、、、

我正试图在amazon页面中提取作者的名字。问题是，有那么多具有相同类的标记，并且没有其他属性来标识确切的元素。现在我想提取作者的名字。它存在于第二个跨度标签中。尽我们所能，对于两个span标记都

浏览 2提问于2017-11-16得票数 0

回答已采纳

3回答

如何从我想要的<span class=“className”>文本中获取文本

、、、

如何根据标题获取文本，根据下面的屏幕截图，该标题相当于21,427。

浏览 1提问于2015-12-13得票数 4

回答已采纳

1回答

Python - BeautifulSoup* -无法提取跨度值*

、、

我有一个包含多个Div类/Span类的XML，我很难提取一个文本值。> soup = BeautifulSoup"lxml") spans = soup.find_all('span', attrs={'class&#x

浏览 5提问于2020-06-17得票数 0

回答已采纳

2回答

当使用find()使用漂亮的汤进行web抓取时，返回“‘None”

、、、

我正在尝试使用BeautifulSoup & Requests从英国广播公司网站上提取富时指数的价格，但当我运行它时，我得到的输出是'None‘。import sysfrom bs4 import BeautifulSoup URL = 'https://www.bbc.co.uk/news/topics.class_="gel-paragon nw-c-m

浏览 0提问于2018-10-04得票数 0

1回答

如何在点击更多按钮后抓取网站数据

、、、

我正在尝试使用BS4 + selenium学习web抓取。网站链接为 from selenium import webdriver from bs4 import <e

浏览 4提问于2017-06-20得票数 0

2回答

使用Python从HTML中提取歌曲长度和大小

、

我正在做一个简单的mp3下载从一个网站。在这样做的过程中，我在解析音频的时间和大小时陷入了困境： 1.69 mins 2.33 mb现在，我需要从上面的我正在使用python 3.4

浏览 3提问于2015-04-28得票数 1

回答已采纳

3回答

从HTML脚本元素内部提取对象键的值

、、、

--window.agency = < %- JSON.stringify({}) % >--></div> 我想要的输出是4243456。我如何使用lxml的美丽汤提取它呢？

浏览 5提问于2017-12-15得票数 2

回答已采纳

2回答

如何利用漂亮汤从div包围的span中提取文本

、

<label>Origin :</label> <span class="28816-origin">German,French,Swedish</span> </br>spans=soup.sel

浏览 0提问于2018-10-05得票数 0

回答已采纳

1回答

如何从具有特殊类名的网页中提取元素？

、、

我有一个txt文件与多个网址，每个网址是一篇文章与文本和他们相应的SDG (一篇文章1的例子) 文章的正文部分先是“div.text.为了提取它们，我使用以下几行代码： data = [] for row in inf:

浏览 8提问于2021-02-04得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用h1和Python从多个标记(如具有类的BeautifulSoup和p标记)中提取文本

在python中尝试使用BeautifulSoup抓取任何数据时，为什么我总是得到无列表或空列表

使用漂亮的汤在多个DIVs中提取正确的链接。这不是一个重复的问题

从包含在具有相同类的div中的多个链接中提取的文本的单行打印问题

更新Jquery Datatable单元格值

BeautifulSoup在标记中的代码片段中找到一个键值

在xpath中获取文本值，而不包括脚本

从具有相同类名的多个跨度中检索文本

漂亮的汤。将文本提取到数据帧中

提取没有子文本的父文本；解析HTML

如何使用find_all()提取所需的元素

如何从我想要的<span class=“className”>文本中获取文本

Python - BeautifulSoup* -无法提取跨度值*

当使用find()使用漂亮的汤进行web抓取时，返回“‘None”

如何在点击更多按钮后抓取网站数据

使用Python从HTML中提取歌曲长度和大小

从HTML脚本元素内部提取对象键的值

如何利用漂亮汤从div包围的span中提取文本

如何从具有特殊类名的网页中提取元素？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐