抓取标签属性BeautifulSoup_用BeautifulSoup抓取<span>标签_BeautifulSoup抓取.text属性问题 - 腾讯云开发者社区

、、、

我将从该页面中抓取所有data-oid标记，但在输出中不返回任何内容代码 url = 'https://www.betexplorer.com/soccer/south-korea/k-league-2/bucheon-fc-1995-jeonnam/EDwej14E/' soup = BeautifulSoup(response.text

浏览 6提问于2021-07-25得票数 1

回答已采纳

2回答

如何用BeautifulSoup访问标签的属性值

、、

我正在使用BeautifulSoup和请求进行网络抓取。我知道如何在标记之间提取属性，但是如果我想要的是标签下面的数字'4.31'，知道如何获得它吗？</svg>我试过：soup.find('title') 所以数字基本上就是标签..。

浏览 5提问于2019-12-28得票数 1

回答已采纳

1回答

在我下面的示例代码中，我导航到了奥巴马的第一个Instagram帖子。我试着指向他的帖子和旁边的评论。 driver.get("https://www.instagram.com/p/B-Sj7CggmHt/") element = driver.find_element_by_css_selector("div._97aPb") 我希望这适用于任何帖子和任何Instagram用户的页面，但似乎帖子和评论的xpath发生了变化。不管是哪篇文章，我怎么才能找到图片+评论的组合块呢？会很感谢你的帮助的谢谢。我也希望能够单独指向图像和单独指向评论。我已经浏览了多个

浏览 10提问于2020-03-31得票数 1

1回答

如何在没有标记对象的情况下使用Beautiful soup抓取值

、、、

我试图从图片中抓取一些数据，基本上是黑值(241，86，89...)featured_challenges = soup.find_all('a')作为一个新手，我不知道如何找到黑值，因为它们似乎不属于任何标签或属性……有人能帮忙吗？

浏览 9提问于2020-08-01得票数 0

回答已采纳

1回答

通过任务进行练习，以连接到页面并从中获取信息

、、

我现在正在做这个任务：“使用BeautifulSoup并请求Python包打印出纽约时报主页上所有文章标题的列表。”目前，我只能连接到该页面：from bs4 import BeautifulSoupelse: print("Page not found!")

浏览 0提问于2020-08-08得票数 0

1回答

使用beautifulSoup在没有类的情况下从标记中抓取

、、

如果我想从锚标签中的href属性和字符串“水平零黎明”中抓取链接。我能用beautifulSoup做些什么来刮掉我需要的数据？

浏览 1提问于2017-05-26得票数 1

回答已采纳

3回答

抓取具有多个属性的标签

、、

我正在尝试抓取一个有3个属性的标签。我已经使用了这段代码，但是我没有得到任何结果。我知道这个标签存在于html源代码中。'https://www.immobiliare.it/69866648-Vendita-Quadrilocale-via-Mario-Ridolfi-32-Roma.html') soup = BeautifulSoup

浏览 1提问于2018-11-28得票数 1

2回答

我不理解此AttributeError的原因：'NoneType‘对象没有'find_all’属性

、、

import requestsurl="https://ratings.fide.com/top_lists.phtml"soup = BeautifulSoup(html,"html.parser") list = soup.find("tbody").find_all("tr",limit=

浏览 0提问于2021-01-05得票数 0

1回答

Web抓取:阅读所有的href

、、

我用python编写了一个小脚本来读取网页中的所有href。但它有个问题。例如，它不读href="pages.php?ef=fa&page=n_fullstory.php&NewsIDn=1648"。import urllibpattern = re.compile(regex) htmltext =

浏览 2提问于2017-05-11得票数 1

回答已采纳

1回答

如何限制BeautifulSoup发现的元素的数量？

、

当使用BeautifulSoup抓取网页时，是否有一种方法可以限制find方法家族找到的元素数量。例如，如果我只想要前5个标签，我可以使用BeautifulSoup做这个吗？

浏览 1提问于2020-06-09得票数 2

回答已采纳

1回答

在Morningstar上无法使用Beautiful Soup找到桌子

、、

我正试着用BeautifulSoup来抓取晨星财经。由于某些原因，我甚至找不到包含财务数据的表。我尝试过使用div标签和table标签。两个都不走运。from urllib.request import urlopen as uReq'http://financials.morningstar.com我要抓取的数据表应该在"financials“div

浏览 11提问于2019-06-21得票数 1

1回答

迭代URL以保存未知数量的图片

、、

我试图从同行评议网站上抓取多张图片，以进行一些基于图像的分析，但我在试图弄清楚是否可以更改URL以从一篇特定的论文中抓取每一张图片时遇到了麻烦。全文在这里：我正在使用的图像的URL是：。

浏览 0提问于2020-12-01得票数 0

10回答

使用Python进行Web抓取

、、、

我目前正在尝试抓取一个HTML格式相当差的网站(通常缺少结束标记，没有使用类或it，因此很难直接转到您想要的元素，等等)。到目前为止，我使用BeautifulSoup已经取得了一些成功，但偶尔(尽管很少)，我会遇到一个页面，在这个页面上，BeautifulSoup创建的HTML树与(例如) Firefox或Webkit略有不同问题通常是这样的:网站打开一个<b>标签两次，当BeautifulSoup看到第二个<b>标签时，它会立即关闭第一个标签，

浏览 3提问于2010-03-08得票数 9

回答已采纳

1回答

Python Web Scraper尝试让程序抓取某个特定位置的数据，而不是整个页面

、、

当前的程序正在抓取它看到的所有用标签“文章”和属性/类“故事”表示的标题，因此不仅从合并和收购栏目中抓取标题，而且还从市场新闻栏目中抓取标题。一旦机器人开始从市场新闻栏目中抓取标题，我就一直收到属性错误，因为市场新闻栏目没有任何摘要，因此没有文本可拉，导致我的代码终止。我试着写了一行新的代码，告诉程序不要寻找所有的标签和文章，而是寻找所有的标签，如果我给机器人一条更直接的路径，它将从自上而下的方法中抓取文章

浏览 11提问于2020-03-17得票数 1

回答已采纳

1回答

用BeautifulSoup抓取<span>标签

、、

我正在尝试用BeautifulSoup抓取页面，<span>标记中有<script>标记，如下所示 <span data-link="{include tmpl='productCardOrderCount

浏览 12提问于2021-03-08得票数 0

2回答

使用Beautiful Soup在Web上浏览链接

、、

我正在尝试抓取一个博客"“，并抓取其中的所有链接，以在每个抓取的链接中查找与人工智能相关的信息。标记和标签中有。imp

浏览 21提问于2019-08-11得票数 1

回答已采纳

2回答

Python -从图像(alt标记)中刮取文本

、

我一直在使用BeautifulSoup成功地从网站上抓取一些信息，但是我在从图片/链接中抓取"alt“标签时遇到了问题。下面是我迄今为止使用的代码：from bs4 import BeautifulSoup tree = requests.get(page) soup = <em

浏览 1提问于2020-04-24得票数 2

回答已采纳

2回答

不能从网站上刮掉一些"div“标签

、、

我正在尝试从这个页面中抓取职位：。可能是个新手的问题，但事实证明，我可以得到某些标签，而其他标签似乎是无法触及的，例如：from bs4 import BeautifulSouphtml = urlopen("https://www.fl.ru/projects/") textTag

浏览 0提问于2018-06-29得票数 1

回答已采纳

1回答

为什么对象没有'tbody‘属性？

、、、

我只是一个python初学者，主要是因为我的工作而抓取数据，我想知道为什么没有‘tbody’属性的原因。在HTML的tbody标签中很明显，它找不到。这只是一个简单的维基百科数据抓取脚本，这里是代码，有人能帮我吗？import requestsimport pandas as pd URL='https://en.wikipedia.org/wiki/List_of_countries_by_

浏览 32提问于2019-11-23得票数 0

1回答

如何在多个页面上抓取链接标题并通过指定的标签

、

我很难弄清楚如何使用BeautifulSoup来抓取页面上所有的100个链接标题，因为它是在"a href =.“下。我已经尝试了下面的代码，但它返回一个空白。from bs4 import BeautifulSoupimport bs4 page = urlopen(url) soup = bs4.Beautiful

浏览 17提问于2020-06-02得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云