腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
Beautiful
Soup
返回
重复
的
结果
?
、
、
、
、
我正在创建一个抓取indeeds网站
的
项目,它工作得很好,但当我今天运行它时,突然间没有做任何更改,而不是
返回
整个页面的
结果
,它不仅显示了第一个
结果
的
副本。也许有人能帮我改正这个错误?= BeautifulSoup(html_text, 'lxml')#print(html_text) driver= BeautifulSoup(cont
浏览 33
提问于2021-10-22
得票数 0
回答已采纳
1
回答
如何使用python中
的
漂亮汤访问标签中
的
子标记?
、
我正试图从MLB.com检索2016年赛季
的
球员统计数据。我正在使用Python中
的
Beautiful
,我需要提取表中
的
信息: r=requests.get(url)gdata=
soup
.find_all('div',{'id':'datagrid'}) print(gdata)
浏览 3
提问于2017-05-01
得票数 0
回答已采纳
3
回答
美丽
的
汤在使用get_text ()后不能使用
、
我正在做网络抓取,我只想从任何网站
的
文本,所以我使用
的
Beautiful
Soup
。最初,我发现get_text()方法也
返回
了JavaScript代码,因此为了避免遇到应该使用extract()方法
的
问题,现在我遇到了一个奇怪
的
问题,在提取script和style标记之后,
Beautiful
Soup
甚至在新
的
` `html中都无法识别它
的
主体。html,包括body标记,并且没有script和st
浏览 20
提问于2015-07-05
得票数 3
回答已采纳
1
回答
使用BS4
的
Python语言中
的
WebScraping -获取动态生成
的
列表
、
、
我需要抓取这个列表中
的
“最佳编码训练营”列表:https://www.switchup.org/rankings/best-coding-bootcamps 我
的
任务是应该可以使用
Beautiful
Soup
(而不是Selenium),然而,当我尝试这样做时,
结果
HTML不会
返回
训练营
的
列表,而是
返回
一个似乎是类
的
空元素: 我
的
问题是,您认为只有使用
Beautifu
浏览 6
提问于2019-12-08
得票数 1
回答已采纳
1
回答
如何使用BeautifulSoup匹配嵌入了<a></a>
的
<div></div>中
的
文本?
、
、
: set noexpandtab tabstop=2 shiftwidth=2 softtabstop=-1:
soup
sys.stdin.read(), 'html.parser', from_encoding='utf-8') from pprint import pprint pprint(
soup
.findclass="heading4"><a name="_S
浏览 1
提问于2016-01-03
得票数 1
1
回答
我在使用漂亮
的
汤查找xml中
的
<name></name>时遇到问题
、
我正在尝试使用beautifulsoup.name获取漂亮
的
汤
返回
文本。但它只是给了我一个美丽汤对象
的
文档。对于如何使用
Beautiful
返回
XML文件中
的
文本,有什么建议吗?import BeautifulSoup as bsoup
soup
= bsoup(f) But I'm lookin
浏览 3
提问于2014-06-28
得票数 0
回答已采纳
1
回答
解析HTML与美丽
的
汤。从特定标签
返回
文本
、
、
我可以通过一个unix shell脚本解析一个html标记
的
完整参数,如下所示:print(
soup
(itemprop="name"))[<span itemprop="name"> Blabla & Bloblo<
浏览 0
提问于2014-08-12
得票数 5
回答已采纳
1
回答
将变量用作
soup
.find()
的
输入时,将
返回
None,但使用与输入相同
的
字符串值即可
、
我正在尝试使用
Beautiful
Soup
中
的
find方法来获取某个标签
的
内部文本。当我输入一个变量作为find
的
参数时,它
返回
None,但是使用相同文本
的
str输入将
返回
我想要
的
结果
。
为什么
会这样呢?以下是代码片段:
soup
= BeautifulSoup(raceResults, 'html.parser')
浏览 39
提问于2020-06-14
得票数 0
回答已采纳
2
回答
漂亮
的
汤在获取链接方面有什么不同之处?
、
、
、
、
为什么
通过查找以<a href="开头
的
字符串
的
所有实例来获取
beautiful
soup
内容并提取所有链接是不明智
的
。如果不能使用
beautiful
soup
,还有什么其他方法可以提取链接?
浏览 1
提问于2015-01-02
得票数 0
2
回答
漂亮汤还错了href值
、
、
、
我使用下面的代码为SERP做一些SEO,但是当我尝试读取href属性时,我得到了显示页面中其他有线URL
的
不正确
结果
,但没有显示预期
的
结果
。我
的
密码怎么了?q=
beautiful
+
soup
&rlz=1C1GCEB_enIN922IN922&oq=
beautiful
+
soup
&aqs=chrome..69i57j69i60l3.2455j0j7&sourceid=chrome&ie=UTF-8&q
浏览 5
提问于2021-11-16
得票数 0
回答已采纳
2
回答
刮擦可见文本
、
、
、
我是一个绝对
的
新手领域
的
网页刮和现在,我想从一个网页上提取可见
的
文本。= BeautifulSoup(url , "lxml")对于上面的代码,我得到以下
结果
: /usr/local/lib/python2.7/
Beautiful
Soup
is not an HTTP client.' that document to
Be
浏览 2
提问于2016-11-12
得票数 0
回答已采纳
1
回答
python代码在旧版本
的
Python中有错误吗?
我在另一台服务器上运行相同
的
脚本,它运行得很好,但在新服务器上有问题。是不是因为新服务器
的
python版本已经过时了?其中一个错误是此Error was 'NoneType' object has no attribute 'get_text'代码如下 try: area=
soup
.find
浏览 1
提问于2014-12-08
得票数 0
2
回答
美丽
的
汤找不到线
、
、
在解析http://en.wikipedia.org/wiki/Israel时,我遇到一个包含文本
的
H2标记,但
Beautiful
Soup
为它
返回
了一个None类型:PythonHistory">History</span></h2>u'History'
浏览 0
提问于2013-08-30
得票数 2
2
回答
Wb抓取-- find_all不会产生任何值
、
我使用漂亮
的
soup
4进行网页抓取,但是find_all('tables')没有
结果
。下面是我
的
代码:import urllib.request wiki="website and return the html to the variable 'page' #import
浏览 0
提问于2017-08-12
得票数 0
1
回答
Python编码问题:学位符号和其他
、
、
我想将网站数据与.txt文档中
的
文本进行比较。然而,我似乎遇到了编码问题。source = "my url".read()
soup
= BeautifulSoup(source) 文本文档是通过制作一个新
的
文本文档来创建
的
,该文本文档被编码为“在没有BOM
的
情况下以UTF-8编码”。看看发生了什么:在Eclip
浏览 0
提问于2012-01-30
得票数 4
回答已采纳
3
回答
BeautifulSoup4 :文本中
的
符号
、
、
、
(我是个十足
的
Python/BeautifulSoup新手,所以如果我笨的话,请原谅我)from bs4 import BeautifulSoup [<option>foo</option>, <option>bar and baz</option>, <option>qux</option>] 我期待着同样
的
结果
浏览 3
提问于2013-06-05
得票数 1
回答已采纳
2
回答
打印不带标签
的
h1标题
、
使用
Beautiful
Soup
4,我尝试打印不带标签
的
h1内容。 headings = bs.find_all('h1')预期
结果
:实际
结果
:每个标题
的
前面和结尾都
浏览 6
提问于2019-08-09
得票数 0
2
回答
美丽汤:如何获取与给定字符串匹配
的
数据
、
、
、
、
例如:-这很好,但是当我要搜索这样
的
东西时,如何使用它:-如果不可能搜索多个字符串,那么执行类似事情
的
最佳方法应该是什么。
浏览 0
提问于2019-06-27
得票数 0
回答已采纳
1
回答
美丽
的
汤,巨蟒和瑞典语
、
、
在网页上,我要提取
的
信息如下所示:当我从Python脚本打印信息时,它看起来如下所示:我是Python
的
新手,我已经找到了答案,并在代码
的
开头尝试使用# -- coding: utf-8 --,但它不起作用。
浏览 1
提问于2012-11-11
得票数 3
回答已采纳
3
回答
python:使用BeautifulSoup
的
谷歌搜索抓取器
、
、
、
、
目标:传递一个搜索字符串到google上搜索,然后抓取url,title和小
的
描述,与url标题一起发布。到目前为止,我
的
跨度如下所示,我想删除<em>元素并连接其余
的
stings。</b><br /&
浏览 1
提问于2012-07-17
得票数 6
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫库-Beautiful Soup的使用
Python基础教程 Beautiful Soup
Python常用库二:Beautiful Soup
想看免费小说?就用Python批量下载!
Python爬虫之BeautifulSoup详解
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券