BeautifulSoup:如何从<div>获取不同的项

文章/答案/技术大牛

发布

1回答

、

我一直在和BeautifulSoup打交道，想搞一个网站。结构是这样的： <div class="content"> <a class="post-title" href我已经创建了三个空数组，分别名为"time“、"post-title”和"url“，我想将它们追

浏览 15提问于2020-06-13得票数 1

回答已采纳

1回答

使用BeautifulSoup从HTML中获取文本

、、、

我试着用Python2.7和BeautifulSoup4从我的电力供应商的BeautifulSoup4中获得当前的"5分钟趋势价格“。xpath是：xpath = "//html/body/div[2]/div/div/div[3]/p[1]"<div class="i

浏览 3提问于2013-09-10得票数 2

回答已采纳

2回答

在BeautifulSoup中查找具有特定id的div的数量？

、

我正在尝试找到一种方法来计算id为"blue“的div的数量。这在BeautifulSoup中是可能的吗？下面是我的代码： soup = BeautifulSoup.BeautifulSoup("<html><body><divid='blue'></

浏览 0提问于2016-04-16得票数 1

2回答

BeautifulSoup Python获取语法

、

我试图从维基百科页面收集一些数据，但我似乎无法缩小对div中的ui和li项的获取范围。到目前为止，我的情况如下：我正在阅读文档，我似乎找不到在哪里或如何深入到ul或divclass = mw-parser-output中的li

浏览 0提问于2018-02-06得票数 1

回答已采纳

2回答

python中的html数据抓取

、

我正在获取html格式的数据。如何从该格式中获取特定数据。完整的html将在django的post请求中出现。现在，我必须在html中的tables标记之间获取数据。已尝试beautifulSoup，但正在从urls获取数据。在python中获取标签之间数据的任何可能的方法。 python版本:2.7

浏览 4提问于2015-08-21得票数 2

1回答

如何从网页中抓取href (以前做过，但对一个网站不起作用？)

、、

我试图从以下网站的某些div类(class="card-img-block")中获取链接：import requestshtml = 'https://milled.com/OneKingsLane' req = session.g

浏览 1提问于2019-12-12得票数 0

回答已采纳

1回答

获取共享特定xpath的所有项的lxml

、、、

我试图从一个网站上获取所有的价格，使用xpath。所有的价格都有相同的xpath，或者我假设第一项有效.让我告诉你： soup = BeautifulSoup(5]/div/div/div/div[1]/ul/li[1]/article/div[1]/<e

浏览 4提问于2022-06-03得票数 -1

2回答

我想用Python从HTML文件中提取文本。我想要的输出基本上与从浏览器复制文本并将其粘贴到记事本中得到的输出相同。我想要一些比使用正则表达式更健壮的东西，因为正则表达式在格式不佳的HTML上可能会失败。我看到很多人推荐Beautiful Soup，但我在使用它时遇到了一些问题。首先，它会拾取不需要的文本，比如JavaScript源。而且，它不能解释HTML实体。例如，我希望将HTML源中的'转换为文本中的撇号，就像我

浏览 0提问于2010-08-19得票数 2

回答已采纳

2回答

检查div类是否存在返回错误

、、

当我用漂亮的汤登录一些产品后，我试着从网页上刮起东西来。有一种情况是，产品不再可用。该网页只有在没有产品的页面上才有一个div类，如下所示 <p>There is an error</p>if soup.find_all('div', {'class': 'alert'}):

浏览 1提问于2019-03-24得票数 0

2回答

使用Python和BeautifulSoup从页面中获取表信息

、、

我试图从获取信息的页面。我试图从“名册”表中获取所有的信息，但由于某种原因，我无法通过“美丽的灵魂”(BeautifulSoup.I)获得它。我尝试过soup.find("div", {'id': 'div_games_played_team'})，但它不起作用。当我查看页面的HTML时，我可以在一个非常大的注释和一个常规的div

浏览 3提问于2020-04-13得票数 0

回答已采纳

1回答

如何从网站上抓取所有价格

、、、

所以这就是我所拥有的，尽管这看起来很有趣.将印刷前10的价格只从齐洛。你怎么写这个来抓取页面上的所有项目？(奖金，如果你漂亮，也请告诉我如何保存所有的价格作为一个列表的变量<3)from bs4 import BeautifulSoup HEADERS = {'User-Agent':'Mozilla

浏览 2提问于2022-06-05得票数 -1

2回答

使用<td>提取BS4元素

、、、

当我使用BeautifulSoup时，我遇到的问题是找不到一种在class中提取表的方法。我试图提取信息的方式如下所示：谢谢你提前给我答案！

浏览 1提问于2021-04-30得票数 1

回答已采纳

2回答

无法找到匹配以下内容的适当正则表达式：

、

我试图获取响应文本的内容，即日期。但是，如果它不是日期，它就不应该获取内容。有人能帮帮我吗..。我目前的判断是：“更新/终止日期：^\d(\d/)” <div class="responseText"> 01/01/2

浏览 2提问于2019-11-04得票数 0

回答已采纳

2回答

在BeautifulSoup中使用过滤器时获取内部标记文本

我有：<div id="price">$199.00</div>我怎么才能得到$199.00的文本。使用不起作用，因为我从整个文档中获得了所有的innet文本。

浏览 1提问于2013-11-27得票数 0

1回答

基于节点实例的提取

、

相关的部分看起来是这样的。 ...顾名思义，RecurringText在所有文件中都是一致的。但是，VariableText会发生变化。它唯一的共同点是它是下一个编码部分。我想要Text1，Text2和Text3提取液。(直到和包含RecurringText)之前和之后(包括和之后)的内容(包括和VariableText之后)都可以被抛在后面。我在其他地方发现的从RecurringText提取的部分，但我不知道如何删除下一个项目，如果

浏览 3提问于2016-05-23得票数 0

回答已采纳

1回答

如何使用编码JSoup文档文本

我有一个这样的节点我需要像这样获取div元素的文本我从.text()方法得到的输出是在BeautifulSoup中，它将返回> something < not encoded输出。如何</e

浏览 0提问于2013-07-03得票数 0

2回答

为什么美丽汤只给我网站的第一个入口？

、、

我正在尝试从以下网站上列出的文章中获取标题、日期和作者：https://coreyms.com/ 这是我运行的代码 from bs4 import BeautifulSoupimport csvsoup=BeautifulSoup(source,'lxml

浏览 21提问于2019-09-21得票数 1

回答已采纳

2回答

使用BeautifulSoup提取外部div

、

如果HTML代码如下所示：<p>hello</p> <div class="nesteddiv"> <p>two</p> </

浏览 0提问于2011-06-11得票数 3

回答已采纳

2回答

如何使用BeautifulSoup从div标签中提取文本

、、

我试图从下面的html内容<div class="nowPrice"><div class="showPrice" style="color: rgb(14, 203, 129);">47,864.58</div><div class="subPrice">$47,864.58</div></div>中<em

浏览 2提问于2021-09-17得票数 0

回答已采纳

1回答

如何从csv文件中特定列的所有行中解析HTML编码的文本？

、

下面是“content”列中数据外观的图像：我在pandas中加载了一个csv文件。在列'Content‘中，每一行都包含不同长度的html编码文本。有些就像500+的单词。我的目标是去掉“content”列的所有行中的所有html编码。到目前为止我只有这个。dataset = pd.read_csv('NuggetData.csv') “‘Content”是表中的

浏览 44提问于2019-04-24得票数 1

点击加载更多