使用bs4查找链接

腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

1回答

、、

我正在尝试使用bs4从脚本标记中获取链接这是我想要抓取链接的标签 html = """<script type="text/javascript">var player = new Clappr.PlayerdisableVideoTagContextMenu: true, events: { }&quo

浏览 36提问于2020-04-12得票数 0

回答已采纳

3回答

我试图刮一个网站，并找到一个提要的所有标题。我在获取我需要的a标签的文本时遇到了麻烦。下面是html的一个示例。 <td class="m" id="b1"><a href="/QSYcfT" id="c1" target="_blank" onClick="vPI('https://www.youtube.com/watch?v=BFNH-6K10Ic', 'QSYcfT', this.id); this.blur(); return false;"

浏览 1提问于2014-05-20得票数 4

回答已采纳

2回答

BeautifulSoup4不能正确查找元素

、、、

我使用requests和bs4从链接中提取第一个预览然而，当我尝试使用BS4的find方法查找带有类'result__snippet‘的div时，它返回None。但是当我将整个网页保存到我的硬盘上，直接打开它，并用bs4解析它时，soup.find('div', class_='result__snippet').get_text()返回了完美的输出。

浏览 9提问于2018-07-21得票数 0

回答已采纳

1回答

当我可以看到元素存在时，BeautifulSoup返回none

、、

我试着抓取这个reddit网站上图像的链接来练习，但是每当我使用BS4 ()来查找对象的类时，find似乎都返回none。有什么帮助吗？from bs4 import BeautifulSoup as soup page = requests.get("https://www.reddit.com/r/wallpaper/comments

浏览 2提问于2021-11-13得票数 0

1回答

仅从美丽的汤输出中提取图像链接

、、、

我是BeautifulSoup新手，我一直在尝试使用bs4和请求从网页中提取每个图像链接。但是，当我试图打印每个图像链接时，它会弹出html，而不是直接链接到任何图像。我尝试过从使用“查找”到使用“findAll”，但这仍然不能解决我的问题。import bs4 req = requests.get('https://www.gnu.org/home.en.ht

浏览 2提问于2019-07-21得票数 0

回答已采纳

1回答

我想在漂亮的汤中通过文本获得一个元素

、

elem = browser.find_element_by_partial_link_text("WEBSITE") 上面的代码找出带有链接文本的元素作为网站，但我不想在这里使用Selenuim，并使用bs4按文本查找元素。

浏览 0提问于2018-06-26得票数 0

1回答

使用python 3创建一个脚本来捕获网页上的链接

、、、、

我必须捕捉这个页面中所有主题的链接：import urllib.request print(link.get('href')) 但它会打印页面的所有链接，而不是像我希望的那样只打印主题的链接。

浏览 15提问于2016-07-18得票数 0

回答已采纳

1回答

使用bs4和Python问题递归查找所有链接

、

我使用下面的代码递归地从给定的网站收集所有链接，唯一的问题是我在输出文件的开头得到了这个链接：我怎样才能防止/消除这种情况呢？守则：import requests urls=[] # function created def scrape

浏览 2提问于2021-02-22得票数 0

回答已采纳

1回答

(用于使用python进行抓取)

、

当我试图抓取接受的URL时，它被链接到重定向的URL，并且无法刮除html.(使用bs4) 使用代码？？强文本从可接受的URL中查找最终URL的任何方法。

浏览 5提问于2022-06-21得票数 -1

1回答

如何通过'link_text‘找到这个元素？

、、、、

我正在写一个代码，可以自动化亚马逊销售商中心与Selenium + BS4的几个过程。我想通过链接文本查找元素，但在，，red rectangle is the part that I want to find by link text中不起作用我可以通过类名或xpath找到元素，但找不到带有链接文本的相同元素我需要通过链接文本来查找元素，因为我将使用帐户的名称作为我同事的变量。

浏览 30提问于2021-09-24得票数 0

1回答

使用BeautifulSoup从网站下载特定文件

、、

首先，尝试查找包含文件名的链接：import requestsimport refrom bs4 import BeautifulSoup url = requests.get("httpsv=123456789参数，就像文件版本一样，这就

浏览 1提问于2021-02-10得票数 1

1回答

使用漂亮汤- Python找到href

、

我试图从页面搜索中提取第一个链接，使用漂亮的汤，但由于某种原因，它找不到链接。from requests import getimport requests #print(soup.a['href']) -- return /我

浏览 1提问于2022-06-08得票数 0

回答已采纳

2回答

链接图像的精确计数

、、、

我正在尝试通过python查找带有链接的图像(扩展名.jpg，.png，jpeg)的数量。我可以使用任何库，比如漂亮的汤。但是我该怎么做呢。我使用了以下代码：soup = BeautifulSoup(open('HTMLS%5C110k_Source.htm'), "html.parser

浏览 0提问于2017-10-24得票数 0

3回答

美丽的汤使用正则表达式来查找标签？

、、

我真的希望能够让Beautiful Soup匹配任何标签列表，就像这样。我知道attr接受正则表达式，但是在漂亮的汤中有什么东西允许你这样做吗？输出：<div> asdfasdf我的目标是创建一个可以从网站抓取表格的抓取器。有时标签的命名不一致，我希望能够输入一个标签列表来命名表格的“数据”部分。

浏览 0提问于2014-07-15得票数 27

回答已采纳

2回答

如何使用python (仅限regex)在网站中刮取url链接

、、、

要求只对使用regex对的评等链接进行抓取，总计是250个评等链接，然后将其保存到txt文件中。我以前试过使用beautifulsoup4，但是它只需要使用正则表达式来提取，所以我不确定。我是否使用re.findall查找所有链接？from urllib.request import urlopen url = 'https://ww

浏览 5提问于2021-09-17得票数 0

回答已采纳

1回答

使用HTML5查找和删除bs4数据-*属性

、、

我想用bs4查找和删除所有这些数据-*属性。import redata_soup = BeautifulSoup('<div data-foo="value">foo!.*') : True}) 一旦找到，如何

浏览 1提问于2018-08-12得票数 3

回答已采纳

2回答

用python中的BeautifulSoup在“a”链接中搜索图像

、

我想得到包含图像的所有<a href=''> (jpg，png，jpeg)for a in soup.find_all('a', href=True):from bs4 import BeautifulSoupimport re url = requests.get("https://8ch.net/a/res/869528:jpg|jpeg|png))')

浏览 0提问于2018-10-16得票数 0

回答已采纳

1回答

如何在bs4* [ python 3]中没有类或id的情况下从标记中刮出url*

、、、、

此代码：从bs4导入BeautifulSoup头={“用户-代理”：“BeautifulSoup/5.0(WindowsNT6.1；WOW64；rv:77.0) Gecko/20190101火狐/77.0} Purl = '‘req =requests.get(紫，headers=header)汤= BeautifulSoup(req.content，'lxml') ProductUrl = [] #查找产品标题showName = soup.select('h2'，{

浏览 1提问于2021-12-05得票数 1

回答已采纳

1回答

导入是否超越了模块命名空间？

、、、、

我搞不懂如何在B模块中的模块A返回的对象上调用BeautifulSoup函数，而不需要模块B从bs4导入任何东西，或者必须通过模块A访问这些BS4函数。module_a.pydef function(): some_xml = "<name>Namespaces are strange

浏览 0提问于2018-04-04得票数 0

回答已采纳

2回答

如何用美汤找到所有评论

、、、、

四年前有人问过，但现在BS4的答案已经过时了。for comments in soup.find_all('comment'):所以那不管用...如何使用BS4查找所有评论？

浏览 3提问于2015-10-15得票数 13

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云