无法使用BeautifulSoup从隐藏标记中抓取“value”

文章/答案/技术大牛

发布

1回答

、、

我试图从这个链接中获取an 6,550的基本价格：https://www.plates4less.co.uk/private-plate_o/CSG1S它在一个名为BasePrice的隐藏输入中，当我查看页面时，源代码'6550‘在一个名为value的属性中 <input type="hidden" name="BasePrice" id="BasePrice" value

浏览 46提问于2021-08-07得票数 1

回答已采纳

2回答

使用请求从网页中收集某些值时遇到问题

、、、

我试图从网页中从表中获取一些动态值。表示我希望从该页面获取的值。应该有任何方法使用请求来抓取它们。为了让您知道，我在dev工具中查找了任何隐藏的api，还查看了页面源中的脚本标记来查找值，但我做不到。这就是我要找的。到目前为止，我写的是：from bs4 import BeautifulSoup url = "https:&#x

浏览 1提问于2020-06-28得票数 1

1回答

无法使用Bookingcom中的BeautifulSoup* find()获取所需的标签

、、

我尝试使用BeautifulSoup从Booking*com中抓取日期，但find()没有返回任何结果我想先在Booking*com搜索result page上得到旅馆的价格 HTTP响应填充得很好，我成功地从页面中获取了一些标记，但无法检索到所需的标记。我尝试了几种论证模式，但结果都是一样的； find(class_="bui-price-display__value")

浏览 14提问于2019-07-04得票数 0

回答已采纳

2回答

从下拉选项值中抓取Python BeautifulSoup

、、、

我尝试过用BeautifulSoup的input dropdown从网络上抓取数据<selected name="try"></selected>soup = BeautifulSoup

浏览 8提问于2018-11-24得票数 3

回答已采纳

1回答

我想使用BeautifulSoup从谷歌专利搜索中抓取专利链接，但我不确定谷歌是否将其html转换为无法通过BeautifulSoup解析的javascript，也不确定问题出在哪里。assignee=Roche&after=priority:20110602&type=PATENT&num=100' soup = BeautifulSoup(requests.get(url).contenthtml.parser&#

浏览 5提问于2021-06-03得票数 1

1回答

访问HTML注释中的标记

、、、

我已经通过BS4熟悉了使用Python进行web抓取的过程。我还没有找到嵌入在注释中的DOM标记的解决方案。例如，当试图从.html页面()获取数据时，检查页面上的表显示：我通常可以用BeautifulSoup抓取。但是，当我查看实际的页面源时，上述表被包含在注释标记中： <!<

浏览 0提问于2018-12-11得票数 0

回答已采纳

2回答

在Python 3中，抓取隐藏在标签中的网页上的所有文本

、、

我需要抓取一个网页()，但我遇到了一个问题--我需要在首页显示的文本绝对隐藏在许多不同的格式化标记中。我知道如何使用Beautiful Soup抓取常规页面，但这并不能满足我的需要(例如，文本丢失，一些标签通过...)from bs4 import BeautifulSoupencoding='utf-8') as outfile: website = req

浏览 1提问于2014-09-09得票数 0

0回答

Python BeautifulSoup找不到表ID

、、

我在使用BeautifulSoup抓取表时遇到了一些问题。以下是我的代码from bs4 import BeautifulSoup page = urlopen(site) soup = BeautifulSoup

浏览 4提问于2017-06-08得票数 1

回答已采纳

2回答

当你想抓取一个网页时，如果目标标签被省略号隐藏了怎么办？

、、

我在试着抓取一个网页。通过检查页面上的元素，我找到了我想要的标签。但是，当尝试使用BeautifulSoup抓取它时，目标标记是隐藏的。下面是被省略号隐藏的目标标记：target tag 下面是我的代码： url = 'https://www.jisilu.cn/data/cbnew/cb_index/'txt.raise_

浏览 47提问于2020-01-07得票数 1

2回答

提取标记内的所有内容，但不提取标记本身

、、

我正在使用BeautifulSoup从网站抓取文本，但我只需要用于组织的<p>标记。但是，我不能使用text.findAll('p')，因为还有其他我不需要的<p>标记。我想要的文本都被包装在一个标记中(假设是body)，但是当我解析它时，它也需要包含该标记。link = requests.get('link') text = bs4.Beaut

浏览 6提问于2017-02-02得票数 1

1回答

Webscraping返回变量而不是实际值

、、

我试图从https://sunshinetour.com/stats/中抓取数据，但是，如果我试图访问锚标记，它会返回一个变量，而不是实际值。这是我的代码： from bs4 import BeautifulSoupsoup = BeautifulSoup

浏览 30提问于2019-12-09得票数 0

回答已采纳

9回答

BeautifulSoup和Scrapy crawler有什么区别？

、、、

我对BeautifulSoup比较熟悉，但对Scrapy crawler不太熟悉。

浏览 323提问于2013-10-30得票数 146

回答已采纳

1回答

我可以使用BeautifulSoup来挖掘内联JavaScript吗？

、、

我想从一系列页面中抓取数据块，这些页面将数据隐藏在脚本标记内的JSON对象中。我对BeautifulSoup相当满意，但我想我可能找错了一棵树，试图用它从JavaScript获取数据。我不知道如何为BeautifulSoup识别这个特定的BeautifulSoup，除非var data的存在我能做这个吗？还是我需要另一个工具？

浏览 3提问于2014-11-27得票数 4

回答已采纳

1回答

使用BeautifulSoup从<cite>标记中抓取URL

、、、

我试图从谷歌抓取网址使用请求和美丽的汤网络抓取库。我注意到Google使用cite标签来保存URL。虽然这适用于绝大多数URL，但有时页面上的其他文本也包含在引用标记中。大多数标签都有一个class = "_Rm“或class = "Rm”。

浏览 4提问于2017-08-25得票数 0

1回答

当元素确实存在时，BeautifulSoup返回'None‘

、

的一侧提取信息，我当前的代码如下：page = requests.get(url) soup = BeautifulSoup

浏览 34提问于2021-02-27得票数 0

4回答

查找下面的带有pyparsing的标记

、、、

我正在使用pyparsing来解析HTML。我正在抓取所有的embed标记，但在某些情况下，有一个a标记紧跟在后面，如果它可用的话，我也想抓取它。</embed></object><br /><a href="blah">blah</a>我无法在结果对象中找到任何字符偏移量，否则我只需获取原始输入字符串的一部分并在其中工作

浏览 3提问于2009-11-20得票数 4

回答已采纳

2回答

使用python抓取AJAX电子商务站点

、、、、

我在使用BeautifulSoup抓取电子商务网站时遇到了问题。我做了一些谷歌搜索，但我仍然无法解决问题。但是当我运行python程序时，我无法在python结果中得到相同的代码和标记。在googling之后，我发现这个网站使用AJAX查询来获取数据。任何人都可以通过抓取AJAX站点来帮助我获得这些产品的数据。我想用在表格中显示数据。我的代码：from bs4 import

浏览 0提问于2019-01-28得票数 2

回答已采纳

1回答

Python:使用<main>提取HTML数据

、、

我目前正在学习使用BeautifulSoup包进行数据抓取。目前，我正试图从Box网站()上获得一份电影特许经营权的列表。from bs4 import BeautifulSoup listOfFranchiseLink = "https://www.boxofficemojo.com/fr

浏览 0提问于2022-06-22得票数 1

回答已采纳

1回答

从下拉列表中选择后抓取网页

、

当转到https://www.comparis.ch/carfinder/default时，“模块”下拉菜单是不活动的，直到你从“标记”下拉菜单中选择一些东西。我的目标是通过遍历所有"Marke“值的列表来抓取所有"Modell”值。由于URL在从“标记”下拉列表中选择某些内容时不会更改，因此我正在努力实现这一点。使用下面的代码可以很容易地获得"Marke“值的列表： from bs4 import BeautifulSoup<

浏览 17提问于2019-12-26得票数 0

回答已采纳

1回答

web抓取隐藏的DIV，只需单击网页中的一个按钮即可显示

、、、

我需要从一个网站抓取数据，有一个隐藏的div不会显示，直到你点击网站中的一个按钮。当我使用代码获取html内容时，即使我可以在“can”中看到隐藏的div数据，也无法获取隐藏的div内容。url、代码和隐藏DIV的详细信息如下：import bs4 d

浏览 10提问于2019-11-05得票数 0

回答已采纳

点击加载更多