腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
漂亮
的
soup
获取
特定
页面
中
的
标
记时
出现问题
python
、
web-scraping
我正在尝试从这个
页面
的www.toctoc.com
中
获取
每个帖子
的
信息,代码如下: page = requests.get('website_url') #website url was too long
soup
= BeautifulSoup(page.content, 'html.parser') name_box =
soup
.find_all('div', attrs={'class': '
浏览 12
提问于2019-03-12
得票数 2
回答已采纳
4
回答
漂亮
汤嵌套标签搜索
python
、
html
、
beautifulsoup
我正在尝试写一个python程序来计算网页上
的
单词。我
使用
Beautiful 4来抓取
页面
,但在访问嵌套
的
HTML标记(例如:<div>
中
的
<div>)时遇到了困难。每次我尝试
使用
page.findAll() (
页面
是包含整个
页面
的
漂亮
Soup
对象)方法查找这样
的
标
记时
,它都不会找到任何标记,尽管确实有。有什么简单
的
方法或
浏览 9
提问于2017-10-01
得票数 15
回答已采纳
1
回答
在python
中
为任何网页URL文档搜索
特定
标题
的
文本
python
、
web-scraping
、
beautifulsoup
、
scrapy
我已经搜索并介绍了python
中
的
一些网络爬行库,比如scrapy,
漂亮
汤等。
使用
这些库,我想抓取文档
中
特定
标题下
的
所有文本。如果你们
中
的
任何人能帮助我,我将不胜感激。我看过一些教程,教你如何
使用
漂亮
的
soap
获取
特定
类名下
的
链接(通过查看源
页面
选项),但如何
获取
简单
的
文本,
浏览 0
提问于2017-10-25
得票数 0
3
回答
python请求&
漂亮
汤机器人检测
python
、
html
、
web-scraping
、
beautifulsoup
、
python-requests
我试图
使用
请求&
漂亮
的
汤来抓取
页面
的所有HTML元素。我正在
使用
ASIN (亚马逊标准标识号)来
获取
页面
的产品细节。://www.amazon.com/dp/" + 'B004CNH98C'
soup
= BeautifulSoup(response, "html.parser") print(
sou
浏览 1
提问于2018-08-29
得票数 2
回答已采纳
2
回答
Python/ Beautiful数据显示问题
python
、
beautifulsoup
、
data-scrubbing
一旦我检查了
使用
beuatifulsoup (在下面的代码中
使用
print(
soup
) )
获取
的
数据,看起来就不太好了。它不同于我一次检查view-source:URL.我找不到我要找
的
田地。网址:提前感谢!-wide-1-
浏览 11
提问于2021-07-22
得票数 0
3
回答
使用
python解析多个结果页
python
、
html
、
parsing
我正在尝试解析一个图书馆网站,以从
特定
的
出版商那里
获取
信息。这是该网站
的
链接。 这里我漏掉了什么? print
soup
浏览 1
提问于2012-10-24
得票数 0
回答已采纳
1
回答
如何搜索youtube热门标题?
python
、
web-scraping
所以我试着用
漂亮
的
汤在youtube上
获取
热门
页面
的标题。我真的很不熟悉python,
漂亮
的
汤和stackexchange,所以对于任何错误和东西我深表歉意。
soup
trending =
soup
.find_Allyoutube热门话题
的
html,这样我就可以搜索每一个
特定
的
标题。但是我得到了一个空
的
东西。它要么是[],要么不是。
浏览 11
提问于2019-06-08
得票数 0
2
回答
如何
使用
python收集一组连续
的
网页?
python
、
regex
、
url
、
beautifulsoup
、
matching
这里,x是一个介于1到200000之间
的
数字。我想运行一个循环来
获取
所有的URL,并
使用
漂亮
的
汤从每个URL中提取内容。urllib.request import urlopencontent = urlopen(re.compile(r"https://example.net/users/[0-9]//")) 从每个
浏览 5
提问于2015-05-20
得票数 0
回答已采纳
1
回答
带find all
的
美汤只给出最后
的
结果
python
、
html
、
web-scraping
、
beautifulsoup
我正在尝试
使用
漂亮
的
汤从一个
页面
中
检索所有的产品。
页面
有分页,为了解决这个问题,我做了一个循环,使所有
页面
的检索都能正常工作。但是,当我进入下一步并尝试"find_all()“标
记时
,它只给出了最后一页
的
数据。如果我尝试当一个孤立
的
页面
,它工作得很好,所以我客人,这是一个问题,从所有
页面
获取
所有的html。以及它已经完成
的
部分: <em
浏览 9
提问于2019-06-17
得票数 1
回答已采纳
1
回答
干刮和BeautifulSoup,以
获取
呈现iframe
的
js
中
的
所有行
javascript
、
python
、
iframe
、
beautifulsoup
、
dryscrape
我
使用
干刮和BeautifulSoup如下所示:from bs4 import BeautifulSoupsession = dryscrape.Session()response = session.body()
soup
= BeautifulSoup(response,'lx
浏览 2
提问于2017-02-18
得票数 1
回答已采纳
2
回答
soup
类选择器返回一个空列表。
python
、
beautifulsoup
我试图从google搜索
页面
中
检索链接列表,但是
漂亮
的
汤选择器返回一个空列表。我
使用
requests
获取
页面
代码,并
使用
bs4 BeautifulSoup解析检索到
的
响应,然后
使用
soup
.select方法
获取
某个类。最后我得到了一个空
的
列表import requests from bs4 import Beau
浏览 0
提问于2019-07-20
得票数 1
回答已采纳
3
回答
如何刮除YouTube频道创建者并链接到他们
的
频道?
python
、
web-scraping
、
beautifulsoup
、
youtube
我试着用
漂亮
汤从视频
页面
中提取频道创建者
的
名字,以及他们频道
的
链接。我试过
使用
class_关键字参数。因此,我得到了[]。我该怎么办?我是否需要通过父母
的
div标签,然后“下去”,就像他们在“美丽汤”
中
说
的
那样?对于
特定
的
标记和类,我应该如何/可以
使用
soup
.find呢?
soup
= BeautifulSoup(response.text,
浏览 2
提问于2020-02-06
得票数 2
回答已采纳
2
回答
用
漂亮
汤在<br>之间提取文本,但没有下一个标签
python
、
html
、
web-scraping
、
beautifulsoup
、
html-parsing
我
使用
python +
漂亮
汤来尝试
获取
br之间
的
文本。span><br>The Text I want to get<br></body> print(span.next_sibling.next_sibling
浏览 3
提问于2015-01-07
得票数 1
回答已采纳
1
回答
Beautifulsoup4安装错误。未创建bs4文件夹
python
、
beautifulsoup
在win-8上用python安装
漂亮
的
汤时
出现问题
。我已经尝试从下载最新版本。通过cmd setup.py安装没有错误地安装了它,但是没有在c:\python\35-32\Lib\ bs4 -packages文件夹
中
创建站点文件夹。我做什么好?我
使用
的
是python3.5。创建了一个
漂亮
的
Soup
4-4.5.1-py3.5.egg文件
浏览 2
提问于2016-10-03
得票数 2
5
回答
用美汤拉动当前股价(雅虎)
python
、
python-3.x
、
web-scraping
、
beautifulsoup
、
stock
我在
使用
漂亮
汤(python3)
获取
最新股票价格时遇到了问题 ? p=VTI")price =
soup
.find('span', attrs = {"data-reactid
使用
不同
的
页面
,下面的
页面
工作得很好: response = requests.get("
浏览 110
提问于2019-03-08
得票数 1
回答已采纳
1
回答
BeautifulSoup:读取跨度类元素
python
、
json
、
web-scraping
、
beautifulsoup
、
python-requests
我在
使用
python
中
的
漂亮
汤和请求插件从
特定
页面
的span类元素
中
抓取信息时遇到了一些问题。它一直向我返回空白信息:“”。下面是我
的
代码:res = requests.get('https://www.theweathernetwork.com/ca/weather
浏览 11
提问于2020-05-13
得票数 0
2
回答
BeautifulSoup排除findAll
中
的
标记
python
、
html
、
beautifulsoup
、
lxml
在
漂亮
汤
中
,如何在
使用
findAll时排除
特定
标签
中
的
标签。<tr>标记
中
的
标记。
soup
.findAll(['p']) 上面的代码将
获取
所有的<p>标记,但我需要在<tr>标记中提取<p>标记。
浏览 1
提问于2020-08-13
得票数 4
回答已采纳
2
回答
带有OR条件
的
Python正则表达式
python
、
regex
我用
漂亮
的
汤创建了我
的
代码,使我
的
url
页面
循环正常工作,并将我
的
项目移到了熊猫dataframe
中
。在下面这个子句中,我搜索宽度为10%和4个字符
的
项。for item in
soup
.find_all("t
浏览 0
提问于2019-11-28
得票数 0
回答已采纳
1
回答
BeautifulSoup中文本和字符串
的
区别
python
、
beautifulsoup
当我搜索BeautifulSoup
中
包含
特定
文本
的
标
记时
,我
使用
find_all(string='text I want')
soup
.find_all(string='stackoverflow') 但我最近
浏览 4
提问于2016-03-26
得票数 1
回答已采纳
1
回答
NameError:未定义名称“value_from_name”
python
、
python-2.7
、
beautifulsoup
、
html-parsing
我正在尝试
使用
漂亮
的
Soup
4来解析一个登录
页面
的html,并从该
页面
获取
令牌。verify=False).text) return
soup
.find(name=name)['value'] 我让它在另一个程序<e
浏览 0
提问于2015-07-31
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫获取所有课程信息
Python爬虫库-BeautifulSoup的使用
一个猎头的Python学习笔记01
Python爬虫库-Beautiful Soup的使用
程序员爬虫框架实现
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券