腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
:
有没有
办法
设置
find_all
()
方法
的
起
始点
?
、
、
这可以通过以下方式完成: soup.find_all(class_='foo', limit=n) 然而,这是一个缓慢
的
过程,因为我试图查找
的
元素位于文档
的
最底部。下面是我
的
代码: main_num = 1 main_page = 'https://rawdevart.com/search/?
浏览 23
提问于2021-02-11
得票数 2
回答已采纳
1
回答
将字符串转换为bs4.element模块
的
ResultSet对象
、
有没有
办法
将我
的
BeautifulSoup
的
ResultSet对象保存到一个文件中,然后读取该文件并能够使用
find_all
等命令 例如,我
的
代码是 import requestswebsite_link = 'https://stackoverflow.com/' request1 = requests.get(webs
浏览 112
提问于2020-11-02
得票数 2
回答已采纳
2
回答
BeautifulSoup
中"findAll“和"
find_all
”
的
区别
、
、
、
我想用Python解析一个HTML文件,我使用
的
模块是
BeautifulSoup
。import urllib, urllib2, cookielibsite = "http://share.dmhy.orgteam_id%3A407" r
浏览 5
提问于2012-09-09
得票数 39
回答已采纳
1
回答
无论其中是否有元素,都可以使用`
find_all
`按文本查找元素
、
例如print bs.find_all("a",text=re.compile(r"some"))当搜索
的
元素具有子级时返回[<a>sometext</a>],即img bs =
BeautifulSoup
("<html><a>sometext&
浏览 2
提问于2013-04-19
得票数 6
回答已采纳
0
回答
BeautifulSoup
.find_all()
方法
不能与命名空间标记一
起
使用
、
、
、
今天,我在使用
BeautifulSoup
时遇到了一个非常奇怪
的
行为。使用find
方法
时,一切正常: >>> <ix:nonfraction>lele</ix:nonfraction>
浏览 2
提问于2017-06-21
得票数 9
回答已采纳
2
回答
列表中
的
BeautifulSoup
find_all
、
我正在尝试使用
BeautifulSoup
find_all
命令两次。我第一次使用它来查找所有的表标签。然后,我在一个循环中使用了几个if语句,以缩小添加到列表中
的
表标签
的
数量。最后,我尝试在我
的
list上使用
find_all
命令,并收到错误"'list‘对象没有属性'find'“。 我知道这个错误基本上是说
find_all
不能查看列表,但我想不出任何其他
方法
来整理我
的
数据。
有没有</em
浏览 15
提问于2019-07-29
得票数 0
回答已采纳
3
回答
BeautifulSoup
`
find_all
`发生器
、
、
有没有
办法
把
find_all
变成一个内存效率更高
的
生成器?例如:soup =
BeautifulSoup
(content, "html.parser")我想代之以: soup =
BeautifulSoup
这里有一些内置
的
生成器,但不会在查找中产生下一个结果。有了成千上万
的
条目,
find_all
吸收了大量
的
内
浏览 6
提问于2016-12-29
得票数 6
回答已采纳
1
回答
在仅给定子字符串标题
的
情况下使用
BeautifulSoup
查找h3
、
、
('tr')[1].
find_all
('td')] 但是,有时表格
的
显示略有不同(使用"16“而不是"15"),如下所示: ?
有没有
办法
只使用h3名称
的
子字符串执行find
方法
?如果我可以编写相同
的
代码行,只需要“第一次广告休息时
的
得分”子字符串,我相信它可以在所有情况下工作。谢谢!编辑: 要进行测试,请下载this site
的
html版本,下面的代码片段应
浏览 21
提问于2020-04-08
得票数 0
回答已采纳
2
回答
无法在python中获取bs4表内容
、
、
这是密码,from bs4 import
BeautifulSoup
def getdata(url): return r.text soup =
BeautifulSoup
(htmldata, 'html.parser') t
浏览 7
提问于2022-06-05
得票数 0
回答已采纳
1
回答
使用NOTIN()
的
Kohana 3 ORM查询
、
、
、
有没有
办法
将与Kohana
的
对象关系映射一
起
使用?类似于: $products = ORM::factory('products')->notin('contry_id', $csl)->
find_all
();
浏览 0
提问于2012-02-24
得票数 0
回答已采纳
2
回答
用Python 3进行抓取
、
Python3:我是刚开始刮擦和训练
的
,我正在尝试从这个页面中获得所有的功能: import requests response = requests.get(url)soup =
BeautifulSoup
浏览 0
提问于2019-01-06
得票数 1
回答已采纳
2
回答
使用
BeautifulSoup
从html中查找文本
、
、
、
</em><em class="status">passed</em>This is the text I want to get</span>for el in doc.find_all('li', attrs={'class': 'print text'}):但
浏览 1
提问于2022-05-25
得票数 0
回答已采纳
1
回答
RuntimeError:超过了Python3.2 pickle.dump
的
最大递归深度
请原谅我
的
主题,我只是在练习我
的
蟒蛇技巧。=)from bs4 import
BeautifulSoup
from pickleusock: data = usock.read().decode("latin-1") soup =
BeautifulSoup
(text=True)[0]
浏览 1
提问于2013-01-28
得票数 3
2
回答
在
BeautifulSoup
中使用过滤器时获取内部标记文本
我有:<div id="price">$199.00</div>我怎么才能得到$199.00
的
文本。
浏览 1
提问于2013-11-27
得票数 0
1
回答
漂亮
的
Soup 4 HTML文档目录
、
我正在处理这一守则:import globimport re os.chdir: contents = f.read() soup =
BeautifulSoup
我
的
目标是找到以“ix:NonFraction.”开头
的
标签。因此,如
浏览 3
提问于2016-05-10
得票数 1
回答已采纳
4
回答
尝试使用python和bs4从特定td中抓取所有“a”文本
、
、
、
我正在尝试抓取,以提取'a‘标记中包含
的
文本,特别是在带有类
的
表中," table -main",然后针对其中
的
每一行。第一个td包含两个团队名称
的
文本,带有一个td类“h- text -左侧”。不确定问题是否与我
的
循环有关,但我得到
的
错误消息似乎是我在循环
的
最后一行中错误地使用了bs4。import requests headers = {'User
浏览 1
提问于2019-04-08
得票数 1
回答已采纳
1
回答
在注释标记中查找标记- Python
、
我正在尝试使用
BeautifulSoup
/Python从一个网站上抓取表格。由于这样或那样
的
原因,其中一个表似乎存在于注释标记中。我可以获得注释标记内
的
整个文本,但是我不知道如何对该文本运行
find_all
命令才能找到其中
的
表。我正在尝试获取Advanced St
浏览 12
提问于2017-01-29
得票数 0
回答已采纳
1
回答
一个特定
的
href爬行在python中
的
美丽
的
汤
、
、
、
、
在网站上,它有相同
的
href,但结果不同。例如,我
的
代码
的
结果是:67980001459640000126976500014565270001001379我只想带上数字from bs4 import
BeautifulSoup
from urllib.request import u
浏览 3
提问于2020-05-25
得票数 0
1
回答
使用Python BS4仅附加/查找具有属性或包含特定字符串
的
文本
的
元素
的
最佳实践是什么?
、
、
当前
的
discord.py (async.io)代码,用于打印任意一篇纽约时报文章
的
链接。def news(ctx): r = requests.get(url) else: await ctx.send('https:/
浏览 21
提问于2020-03-20
得票数 0
回答已采纳
2
回答
如何使用requests向下滚动youtube视频
、
、
我
的
代码
的
以下部分可以工作,但这里
的
问题是它只获取页面可见部分
的
视频名称。我想要做
的
是在页面中向下滚动。
有没有
办法
使用python中
的
request模块向下滚动??search_query={}'.format(word)) vide
浏览 0
提问于2019-08-05
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
BeautifulSoup常用解析库-爬虫干货系列5
Python爬虫库-BeautifulSoup的使用
Python爬虫库-Beautiful Soup的使用
Python爬虫简单笔记之BeautifulSoup4的简单用法
学爬虫的第48天,我打开bs4的大门,然后又被一脚踢了出来
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券