使用bs4提取标题标签中的链接和标题

、、、

我使用了以下代码：import requests "https://www.olivemagazine.comtomatoes-and-lardo-on-toast-with-basil-oil/">Tomatoes and lardo on toast with basil oil</a></h3> 从这里，我想提取锚标签

浏览 20提问于2021-05-25得票数 0

回答已采纳

1回答

BeautifulSoup python:获取不带标记的文本并获取相邻链接

、、

我正在尝试从这个site中提取电影的标题和链接 from bs4 import BeautifulSoup #r = open('json.html','rb').read()a = b.findAll

浏览 15提问于2019-03-06得票数 0

2回答

仅提取链接和标题

、、、、

我试图提取这些链接的链接和动画网站的标题，然而，我只能提取整个标签，我只想要的href和标题。下面是我使用的代码：from bs4 import BeautifulSoup r = requests.get('http://animeonline.vip/

浏览 20提问于2016-09-09得票数 0

回答已采纳

1回答

如何使用漂亮的汤动态地抓取内部链接

、

我的需求是从网页中获取标题、图像和摘要。我成功地获得了标题，图片和锚标签链接。但是我不能找到如何发送这个锚标签链接来获取摘要。import requests source = reque

浏览 13提问于2019-08-19得票数 1

1回答

提取Youtube搜索结果的问题

、、

我是Python新手，学习了使用bs4进行Web抓取的基础。在这里，我试图提取Youtube搜索结果的所有链接，但它不像其他网站那样工作。我分析了搜索结果html数据，搜索结果的链接在带有id“视频标题”的锚标签中，但是标签没有出现在我的bs4解析的html文档中。from bs4</

浏览 0提问于2019-05-09得票数 3

回答已采纳

2回答

试图在标题和内容中进行擦拭和分隔。问题是，两者都有相同的类和标签，如何隔离？

、、

我试图在网络上抓取更多的，将其分为两个部分:标题和内容，问题是两者都有相同的类和标签。除了使用regex和硬编码之外，如何区分和提取excel中的2列？在图片()或提供的网站链接中，bold(除了字母表字母(A)和后面的‘回到顶部’)表示标题和解释(在粗体下面非粗体)表示内容(内容甚至由站点后

浏览 0提问于2019-04-22得票数 0

回答已采纳

3回答

获取属性错误：“NoneType”对象没有属性getText

、、、

我已经写了一半的代码，从RSS提要中提取标题和链接，但这会导致上述错误。在获取文本时，这两个函数中都存在错误。我想去掉输入的标题和链接标签的字符串。from bs4 import BeautifulSoupimport re a= str(a) i

浏览 3提问于2013-10-27得票数 1

回答已采纳

1回答

将标题列表与相应链接的单独列表配对的最佳方法？(bs4)

、、、

最终编辑:下面是解决方案- -原始文章：我使用bs4来刮一个食谱网站，在那里每个菜谱的标题没有保存在链接标签中因此，我从代码的一部分提取了菜谱的标题，从另一部分提取了链接，我得到了这两个列表(菜谱、链接)，但我不确定将每个标题<

浏览 1提问于2021-03-13得票数 1

3回答

使用BeautifulSoup从标题标签下提取数据？

、、、

在通过python中的BeautifulSoup库获取链接的HTML之后，我想提取链接的标题。基本上，整个标题标签是我想提取“标记”<e

浏览 1提问于2016-09-21得票数 2

回答已采纳

1回答

在html <script>中使用BeautifulSoup在python3中提取标题

、、、

我有一个html页面，我想提取标题，它在标签和内部对象_BFD.BFD_INFO。我已经访问了所有的数据，但它有很多其他的数据，如链接等，现在我不知道如何访问标题，我想提取。请帮我一把。到目前为止，我编写的代码是import urllib3.requestrequests.get('https://

浏览 1提问于2018-06-07得票数 0

回答已采纳

1回答

Web抓取youtube页面

、、

我正在尝试获得youtube视频的标题，并给出一个链接。import requests listed_url = "https://www.youtube.com/watch?= soup.

浏览 0提问于2021-10-14得票数 0

1回答

Python抓取--不可能刮这个站点吗？

、

我想刮下以下网站：https://www.globenewswire.com/NewsRoom 我的目标是将新闻稿和文章存储在我稍后使用的数据库中。我也对其他新闻网站这样做，为了更容易阅读，我删除了这里的代码(100%不影响提供给您的代码)。我的问题是，我不知道如何准确地抓取标题、链接和其他数据，因为html代码是用不寻常的属性构造的。下面的代码是我如

浏览 2提问于2021-06-27得票数 1

回答已采纳

1回答

转到链接的Python脚本

、

大家早上好,你能帮帮我吗？谢谢:)

浏览 2提问于2020-07-25得票数 0

回答已采纳

2回答

在使用链接模块时，如何从内容创建表单中隐藏"URL“标签？*

我使用链接模块向用户请求链接。我已经禁用了链接文本(I.E>，锚标记中的文本)，这样用户就不会被要求提供标题。我希望发生的是，我不会看到字段标签，后面是标签"URL*“。然而，情况并非如此。例如，我的字段标签是Download link。我在节点创建表单中看到的是像Download link*这样的标签，然后是文

浏览 0提问于2014-08-18得票数 1

回答已采纳

1回答

Python和Selenium -从多个兄弟姐妹中刮取数据

、、、

我试图抓取一页数据，然后在python中使用该数据，并让selenium单击链接和存储时间等. </td><tr> <a href>link3</a></tr&

浏览 2提问于2014-03-06得票数 1

回答已采纳

1回答

如何用美汤获取无序列表中的内容

、

nofollow" class="external text" href="Mylink.com"><font color="#547794"><u>My link Title</u></font></a> 我能够提取"a“标签，但我如何提取标题”我的链接标题“中的</e

浏览 5提问于2021-12-09得票数 1

回答已采纳

2回答

即使我有<title>标签，Google也会显示链接的名称，而不是结果中的实际标题。

、、、

我今天注意到，在某些情况下，在我的页面的谷歌结果中，一些标题结果不是用<title>标记显示的，而是用链接名称显示的。前面的例子如果contact链接是contact，标题是hi let's talk，google选择显示contact 当我提交包含翻译页面的更新的站点地图时，我注意到了这一点，例如，我有一个英文版本和一个意大利文版本这个奇怪的东西在意大利版本中</em

浏览 0提问于2015-07-12得票数 2

1回答

来自实体/路由的链接字段标题

、

我有一个Drupal链接字段配置为允许内部和外部链接，并启用标题字段，但可选。我希望用户能够引用内部实体，而不必在单独的标题字段中指定任何内容，并从实体标签中提取链接字段的标题。但是，当字段的内部title值被保留为null时，Drupal最终使用字段的uri值作为链接标题。这种行为在我看来很奇怪。我<e

浏览 0提问于2018-11-21得票数 2

1回答

使用BeautifulSoup解析HTML标记

、、、、

我正在解析一个有很多超链接的网页。通过在<a>标签中找到所有的“href”，能够使用漂亮汤提取超链接。接下来，我试图获得所有这些链接的“标题”，这些链接显示为<a>标记的标记内容。需要提取。感谢你的帮助。</a>import requests from bs4 import Beautiful

浏览 3提问于2017-10-12得票数 1

回答已采纳

1回答

在python中为任何网页URL文档搜索特定标题的文本

、、、

我已经搜索并介绍了python中的一些网络爬行库，比如scrapy，漂亮汤等。使用这些库，我想抓取文档中特定标题下的所有文本。如果你们中的任何人能帮助我，我将不胜感激。我看过一些教程，教你如何使用漂亮的soap获取特定类名下的链接(通过查看源页面选项)，但如何获取简单的文本，而不是特定类标题下的链接。对不起，我

浏览 0提问于2017-10-25得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

BeautifulSoup python:获取不带标记的文本并获取相邻链接

仅提取链接和标题

如何使用漂亮的汤动态地抓取内部链接

提取Youtube搜索结果的问题

试图在标题和内容中进行擦拭和分隔。问题是，两者都有相同的类和标签，如何隔离？

获取属性错误：“NoneType”对象没有属性getText

将标题列表与相应链接的单独列表配对的最佳方法？(bs4)

使用BeautifulSoup从标题标签下提取数据？

在html <script>中使用BeautifulSoup在python3中提取标题

Web抓取youtube页面

Python抓取--不可能刮这个站点吗？

转到链接的Python脚本

在使用链接模块时，如何从内容创建表单中隐藏"URL“标签？*

Python和Selenium -从多个兄弟姐妹中刮取数据

如何用美汤获取无序列表中的内容

即使我有<title>标签，Google也会显示链接的名称，而不是结果中的实际标题。

来自实体/路由的链接字段标题

使用BeautifulSoup解析HTML标记

在python中为任何网页URL文档搜索特定标题的文本

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐