使用漂亮的soup获取特定页面中的标记时出现问题_如何使用漂亮的Soup4从推特用户配置文件中获取位置？_无法使用PDFBOX获取页面中书签的特定位置 - 腾讯云开发者社区

、

我正在尝试从这个页面的www.toctoc.com中获取每个帖子的信息，代码如下： page = requests.get('website_url') #website url was too longsoup = BeautifulSoup(page.content, 'html.parser') name_box = soup.find_all('div', attrs={'class': '

浏览 12提问于2019-03-12得票数 2

回答已采纳

4回答

漂亮汤嵌套标签搜索

、、

我正在尝试写一个python程序来计算网页上的单词。我使用Beautiful 4来抓取页面，但在访问嵌套的HTML标记(例如：<div>中的<div>)时遇到了困难。每次我尝试使用page.findAll() (页面是包含整个页面的漂亮Soup对象)方法查找这样的标记时，它都不会找到任何标记，尽管确实有。有什么简单的方法或

浏览 9提问于2017-10-01得票数 15

回答已采纳

1回答

在python中为任何网页URL文档搜索特定标题的文本

、、、

我已经搜索并介绍了python中的一些网络爬行库，比如scrapy，漂亮汤等。使用这些库，我想抓取文档中特定标题下的所有文本。如果你们中的任何人能帮助我，我将不胜感激。我看过一些教程，教你如何使用漂亮的soap获取特定类名下的链接(通过查看源页面选项)，但如何获取简单的文本，

浏览 0提问于2017-10-25得票数 0

3回答

python请求&漂亮汤机器人检测

、、、、

我试图使用请求&漂亮的汤来抓取页面的所有HTML元素。我正在使用ASIN (亚马逊标准标识号)来获取页面的产品细节。://www.amazon.com/dp/" + 'B004CNH98C'soup = BeautifulSoup(response, "html.parser") print(sou

浏览 1提问于2018-08-29得票数 2

回答已采纳

2回答

Python/ Beautiful数据显示问题

、、

一旦我检查了使用beuatifulsoup (在下面的代码中使用print(soup) )获取的数据，看起来就不太好了。它不同于我一次检查view-source:URL.我找不到我要找的田地。网址：提前感谢！-wide-1-

浏览 11提问于2021-07-22得票数 0

3回答

使用python解析多个结果页

、、

我正在尝试解析一个图书馆网站，以从特定的出版商那里获取信息。这是该网站的链接。这里我漏掉了什么？ print soup

浏览 1提问于2012-10-24得票数 0

回答已采纳

1回答

如何搜索youtube热门标题？

、

所以我试着用漂亮的汤在youtube上获取热门页面的标题。我真的很不熟悉python，漂亮的汤和stackexchange，所以对于任何错误和东西我深表歉意。souptrending = soup.find_Allyoutube热门话题的html，这样我就可以搜索每一个特定的标题。但是我得到了一个空的东西。它要么是[]，要么不是。

浏览 11提问于2019-06-08得票数 0

2回答

如何使用python收集一组连续的网页？

、、、、

这里，x是一个介于1到200000之间的数字。我想运行一个循环来获取所有的URL，并使用漂亮的汤从每个URL中提取内容。urllib.request import urlopencontent = urlopen(re.compile(r"https://example.net/users/[0-9]//")) 从每个

浏览 5提问于2015-05-20得票数 0

回答已采纳

1回答

带find all的美汤只给出最后的结果

、、、

我正在尝试使用漂亮的汤从一个页面中检索所有的产品。页面有分页，为了解决这个问题，我做了一个循环，使所有页面的检索都能正常工作。但是，当我进入下一步并尝试"find_all()“标记时，它只给出了最后一页的数据。如果我尝试当一个孤立的页面，它工作得很好，所以我客人，这是一个问题，从所有页面获取所有的html。以及它已经完成的部分： <em

浏览 9提问于2019-06-17得票数 1

回答已采纳

1回答

干刮和BeautifulSoup，以获取呈现iframe的js中的所有行

、、、、

我使用干刮和BeautifulSoup如下所示：from bs4 import BeautifulSoupsession = dryscrape.Session()response = session.body() soup= BeautifulSoup(response,'lx

浏览 2提问于2017-02-18得票数 1

回答已采纳

2回答

soup类选择器返回一个空列表。

、

我试图从google搜索页面中检索链接列表，但是漂亮的汤选择器返回一个空列表。我使用requests获取页面代码，并使用bs4 BeautifulSoup解析检索到的响应，然后使用soup.select方法获取某个类。最后我得到了一个空的列表import requests from bs4 import Beau

浏览 0提问于2019-07-20得票数 1

回答已采纳

3回答

如何刮除YouTube频道创建者并链接到他们的频道？

、、、

我试着用漂亮汤从视频页面中提取频道创建者的名字，以及他们频道的链接。我试过使用class_关键字参数。因此，我得到了[]。我该怎么办？我是否需要通过父母的div标签，然后“下去”，就像他们在“美丽汤”中说的那样？对于特定的标记和类，我应该如何/可以使用soup.find呢？soup = BeautifulSoup(response.text,

浏览 2提问于2020-02-06得票数 2

回答已采纳

2回答

用漂亮汤在<br>之间提取文本，但没有下一个标签

、、、、

我使用python +漂亮汤来尝试获取br之间的文本。span><br>The Text I want to get<br></body> print(span.next_sibling.next_sibling

浏览 3提问于2015-01-07得票数 1

回答已采纳

1回答

Beautifulsoup4安装错误。未创建bs4文件夹

、

在win-8上用python安装漂亮的汤时出现问题。我已经尝试从下载最新版本。通过cmd setup.py安装没有错误地安装了它，但是没有在c：\python\35-32\Lib\ bs4 -packages文件夹中创建站点文件夹。我做什么好？我使用的是python3.5。创建了一个漂亮的Soup4-4.5.1-py3.5.egg文件

浏览 2提问于2016-10-03得票数 2

5回答

用美汤拉动当前股价(雅虎)

、、、、

我在使用漂亮汤(python3)获取最新股票价格时遇到了问题 ? p=VTI")price = soup.find('span', attrs = {"data-reactid使用不同的页面，下面的页面工作得很好： response = requests.get("

浏览 110提问于2019-03-08得票数 1

回答已采纳

1回答

BeautifulSoup:读取跨度类元素

、、、、

我在使用python中的漂亮汤和请求插件从特定页面的span类元素中抓取信息时遇到了一些问题。它一直向我返回空白信息：“”。下面是我的代码：res = requests.get('https://www.theweathernetwork.com/ca/weather

浏览 11提问于2020-05-13得票数 0

2回答

BeautifulSoup排除findAll中的标记

、、、

在漂亮汤中，如何在使用findAll时排除特定标签中的标签。<tr>标记中的标记。soup.findAll(['p']) 上面的代码将获取所有的<p>标记，但我需要在<tr>标记中提取<p>标记。

浏览 1提问于2020-08-13得票数 4

回答已采纳

2回答

带有OR条件的Python正则表达式

、

我用漂亮的汤创建了我的代码，使我的url页面循环正常工作，并将我的项目移到了熊猫dataframe中。在下面这个子句中，我搜索宽度为10%和4个字符的项。for item in soup.find_all("t

浏览 0提问于2019-11-28得票数 0

回答已采纳

1回答

BeautifulSoup中文本和字符串的区别

、

当我搜索BeautifulSoup中包含特定文本的标记时，我使用find_all(string='text I want')soup.find_all(string='stackoverflow') 但我最近

浏览 4提问于2016-03-26得票数 1

回答已采纳

1回答

NameError:未定义名称“value_from_name”

、、、

我正在尝试使用漂亮的Soup4来解析一个登录页面的html，并从该页面获取令牌。verify=False).text) return soup.find(name=name)['value'] 我让它在另一个程序<e

浏览 0提问于2015-07-31得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云