腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Beautiful
Soup
访问
网站
主页
上
的
所有
元素
、
、
我想从这个
网站
上摘录一些新闻:
soup
= BeautifulSoup(response.content, 'html.parser')title =
soup
.select("header h1") print
浏览 12
提问于2020-11-12
得票数 0
1
回答
Python Web抓取:通过加载页面抓取页面
、
、
我正在建立一个网络抓取项目
使用
python与美丽
的
汤和请求模块,问题是我想要抓取
的
网站
有一个加载页面(完全不同于
主页
),然后它将我重定向到
主页
。我怎么能等到页面加载完成,然后从
主页
上
抓取数据呢?我知道Selenium可以处理这些类型
的
网站
,但
网站
必须
使用
web驱动程序启动,这是我不希望在我
的
项目中
使用
的
原因,这就是为什么我<em
浏览 15
提问于2020-10-25
得票数 0
2
回答
漂亮汤还错了href值
、
、
、
我
使用
下面的代码为SERP做一些SEO,但是当我尝试读取href属性时,我得到了显示页面中其他有线URL
的
不正确结果,但没有显示预期
的
结果。我
的
密码怎么了?q=
beautiful
+
soup
&rlz=1C1GCEB_enIN922IN922&oq=
beautiful
+
soup
&aqs=chrome..69i57j69i60l3.2455j0j7&sourceid=chrome&ie=UTF-8" r =
浏览 5
提问于2021-11-16
得票数 0
回答已采纳
3
回答
美丽
的
汤在
使用
get_text ()后不能
使用
、
我正在做网络抓取,我只想从任何
网站
的
文本,所以我
使用
的
Beautiful
Soup
。最初,我发现get_text()方法也返回了JavaScript代码,因此为了避免遇到应该
使用
extract()方法
的
问题,现在我遇到了一个奇怪
的
问题,在提取script和style标记之后,
Beautiful
我先说清楚我在做这件事
soup
= BeautifulSoup(HTMLRawData, 'ht
浏览 20
提问于2015-07-05
得票数 3
回答已采纳
1
回答
未在美汤中找到<span>标记内
的
元素
、
、
、
我曾经尝试过在Python中
使用
Beautiful
Soup
从
网站
抓取数据。当我检查
网站
本身时,我看到了以下内容:但是当我用美汤
的
时候,我看到
的
是:就好像出于安全和保护
的
目的我认为它是一个动
浏览 1
提问于2015-11-07
得票数 2
1
回答
使用
Python和
Beautiful
Soup
解析HTML时,jsl标记不显示
、
、
、
、
一点背景(我在编程方面是超级新手,请耐心听我说):<jsl jstcache="79"></jsl> 我假设这与
浏览 0
提问于2015-08-18
得票数 2
2
回答
解析
Beautiful
Soup
上
具有相同类
的
所有
元素
、
、
我想知道你
的
建议,如何优化我
的
代码。更准确地说,我希望解析具有这个类“value-decrease”
的
所有
元素
。r = requests.get(url, headers=HEADERS, params=params)
soup
= BeautifulSoup(html, 'html.parser') items =
soup
.find_all('div
浏览 37
提问于2020-04-18
得票数 1
回答已采纳
1
回答
推文中图片
的
URL
我有一个列表,其中包含许多推文
的
URL,例如这个列表中每个推文
的
https://twitter.com/EmilBakke/status/1264250412120649729。format=jpg&name=small)提取到URL列表中,然后将图像从图像URL下载到我
的
本地计算机。理想情况下,图像
的
文件名应该是图像链接到
的
tweet ID。我没有
使用
Twitter API来获取tweet URL列表,因此我不能
使用</
浏览 11
提问于2020-07-05
得票数 0
4
回答
在div类中查找值
、
我正在解析一个
网站
,在那里我遇到了一些类似的东西: <div class = "class-name" data-fmid="somenumber">
使用
beautiful
soup
,如何提取somenumber我目前正在获取与class-name相关
的
元素
:
soup
.find_all('div', {'class':'classname'}) 但不确
浏览 41
提问于2019-03-10
得票数 1
回答已采纳
4
回答
使用
PHP或Python
的
PHP抓取技术
、
、
我需要刮大约100个
网站
,在他们提供
的
内容非常相似。第二项质询。我
的
主要语言是PHP,但在Stackoverflow
上
搜索此处后,我发现Python中
的
"
浏览 2
提问于2011-01-03
得票数 3
1
回答
为什么BeautifulSoup不从网页中提取
所有
的HTML?
、
、
、
、
我试图从这个
网站
上提取文本:。这个
网站
有一些用英语和旁遮普语(一种印度语)逐行翻译
的
古老经文.它是一个非常好
的
平行语料库。我已经成功地在一个单独
的
文本文件中提取了
所有
的英文译文。这是检查
元素
屏幕截图:(突出显示
的
文本是翻译
的
旁遮普语) 在屏幕截图1中,属于class=lang_16
的
突出显示
的
文本没有在包含
所有
HTML
的
soup
对象中列出。=
浏览 2
提问于2016-10-10
得票数 2
回答已采纳
2
回答
如何从
Beautiful
Soup
获取URL?
、
、
、
、
我是Python
的
新手,正在尝试编写一个爬行程序;我想
使用
Beautiful
Soup
从BBC新闻中抓取一些数据。 <span>World</span> 在href = '
浏览 2
提问于2016-05-03
得票数 3
2
回答
如果要用python抓取图像,如何在Python中选择<div data- image =‘.“”>
、
、
、
我正在
使用
Python从一个
网站
上抓取一些图片。来自该
网站
的
所有
图像都
使用
<div data-image="https://......">进行存储。如何
使用
Python(
Beautiful
Soup
4)下载图片?非常感谢!
浏览 36
提问于2020-08-12
得票数 0
1
回答
解析源代码(Python)方法:漂亮
的
汤,lxml,html5lib
的
区别?
、
、
、
我一直在研究一些解析器,似乎
Beautiful
Soup
,lxml,html5lib是最受欢迎
的
。从这个
网站
上看,lxml似乎是最常用和最快
的
,而
Beautiful
Soup
速度较慢,但会导致更多
的
错误和变化。我对
Beautiful
Soup
文档、和像BeautifulSoup(markup,"lxml")或BeautifulSoup(markup,html5lib)这样
的
命令感
浏览 0
提问于2012-06-08
得票数 1
1
回答
基于动态内容和隐藏数据表
的
Selenium Web抓取
、
、
、
、
真的需要这个社区
的
帮助!html=browser.execute_script('return document.body.innerHTML')然而,我后来发现,如果我在
使用</em
浏览 15
提问于2018-02-14
得票数 2
1
回答
理解HTML
元素
在美汤中选择日期
、
我正在写一些代码,它将定位收益报告
的
发布日期。我遇到了一个问题,我无法
使用
Beautiful
Soup
选择特定
的
日期。) 您能否帮助我找到需要放入select()函数中以选择该信息
的
正确
的
HTML
元素
是什么?也可以解释为什么你选择HTML
元素
来做这件事?我试过了: elems =
soup
.select('sidebar-recent__even
浏览 17
提问于2020-02-22
得票数 0
3
回答
用于web抓取
的
Selenium与BeautifulSoup
、
、
、
我正在
使用
Python从一个
网站
上抓取内容。首先,我在Python
上
使用
了BeautifulSoup和Mechanize,但我看到
网站
上有一个通过JavaScript创建内容
的
按钮,所以我决定
使用
Selenium。既然我可以通过像driver.find_element_by_xpath这样
的
方法
使用
Selenium查找
元素
并获取它们
的
内容,那么当我可以
使用
Selenium做任何事情
浏览 1
提问于2013-07-03
得票数 53
回答已采纳
3
回答
Python 3.2美丽汤替代方案
、
、
我做了一个研究,发现非常优秀,因为我可以解析
所有
文档,创建dom对象,迭代,提取属性等(类似于JQuery)。但是我
使用
的
是Python3.2,并且没有稳定
的
版本(我想根本没有,我在他们
的
主页
上
看到
的
只有3.1 )。 所以我需要一些作为好
的
替代品。
浏览 1
提问于2011-11-08
得票数 4
回答已采纳
1
回答
使用
Beuatiful
Soup
匹配标题中
的
特定文本
、
、
、
、
基本
上
,我想找到包含某些关键术语
的
所有
链接。在我
的
例子中,我想要
的
这些链接
的
标题是这样
的
: abc...(普通文本),dce...(普通文本),...我想把
所有
包含"(common text)“
的
链接放到列表中。我得到了代码工作,我知道如何找到
所有
的链接。但是,我将链接转换为字符串以找到"(common text)“。我知道这不是一个好
的
实践,而且我不确定如何
使用</em
浏览 17
提问于2021-01-03
得票数 0
回答已采纳
2
回答
美汤找不到桌子
、
我正在尝试用Python和
Beautiful
Soup
从网页
上
的
一个表格中收集一些数据。然而,当我从页面中进行选择时,我得到
的
结果与在浏览器中得到
的
结果不同。具体地说,这些表完全缺失。以下是Firefox开发工具检查器中表格
的
屏幕截图: ? 这是我从
Beautiful
Soup
得到
的
输出: ? 我尝试过
使用
urllib而不是request,也尝试过
使用
不同
的<
浏览 15
提问于2020-04-25
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python基础教程 Beautiful Soup
Python 爬虫:爬取小说花千骨
网页解析之Beautiful Soup库运用
推荐:手把手教你用Python进行Web抓取
手把手教你用Python进行Web抓取
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券