腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
SoupStrainer
和
BeautifulSoup
获取
具有
多个
属性
的
所有
标签
、
当class
属性
有几个不同
的
值时,我试图获得'td‘标记
的
所有
匹配项。事后我知道如何
使用
BeautifulSoup
完成此操作,但由于所需
的
时间较长,我试图通过
使用
SoupStrainer
选择性地解析每个页面来加快速度。我最初尝试了下面的方法,但似乎不起作用。strainer =
SoupStrainer
('td', attrs={'class': ['Val
浏览 0
提问于2017-07-18
得票数 0
3
回答
SoupStrainer
可以有两个参数吗?
、
、
我在stackoverflow或Google上找不到这样
的
问题,所以我还是会把它贴出来,以帮助任何偶然发现它的人。我想
使用
BeautifulSoup
中
的
SoupStrainer
来解析两个标记,而不是html文档中
的
一个。我知道我能做到:这将获得<p>标
浏览 4
提问于2014-12-31
得票数 4
2
回答
尝试
使用
BeautifulSoup
从本地文件收集数据
、
我想运行python脚本来解析html文件,并收集
具有
target="_blank"
属性
的
所有
链接
的
列表。import sys from bs4 import
BeautifulSoup
,
浏览 0
提问于2013-07-10
得票数 1
回答已采纳
1
回答
find_all()函数
和
BeautifulSoup
包
的
SoupStrainer
有什么区别?
、
以下代码用于在屏幕上打印html_doc
的
标签
,它是一个包含html代码
的
变量:下面的代码返回相同
的
结果: print(
Beautifu
浏览 1
提问于2017-11-10
得票数 1
1
回答
可以用一个
BeautifulSoup
文档
使用
多个
过滤器吗?
、
、
、
、
我
使用
Django
和
Python3.7。我想加速我
的
HTML解析。(req).read() bad_elts = comments_soup.findAll("span", text=re.compile(&
浏览 0
提问于2019-02-22
得票数 3
回答已采纳
1
回答
使用
httplib2
和
BeautifulSoup
递归搜索网站
的
链接
、
、
我
使用
以下方法从网页中
获取
所有
外部Javascript引用。我如何修改代码,以便不仅搜索网址,而且搜索网站
的
所有
页面?import httplib2status,关于如何使它只返回唯一
的
urls,有什么建议吗?事实上,大多数都是重复
的
。(请注意,
所有</
浏览 5
提问于2017-10-02
得票数 0
5
回答
使用
Python
和
BeautifulSoup
基于
属性
解析a标记
、
、
、
、
使用
这部分html: <a class="playerLink" href="http://bbroto.baseball.cbssports.com但是,我还没有弄清楚如何
使用
BeautifulSoup
引用Python循环中
的
子选项卡。以下是我
的
尝试: pl =
浏览 0
提问于2013-12-06
得票数 2
回答已采纳
4
回答
提取HTML表单
的
字段名称- Python
、
假设有一个链接"“,它基本上是一个
具有
两个表单(比如表单1
和
表单2)
的
超文本标记语言页面。我有一个这样
的
代码...from
BeautifulSoup
import
BeautifulSoup
,
SoupStrainer
if field.h
浏览 0
提问于2011-08-02
得票数 6
回答已采纳
2
回答
无法过滤图像
的
美化效果
、
我试图
获取
网页上图像
的
URL,并
使用
以下代码:from
BeautifulSoup
import
BeautifulSoup
,
SoupStrainer
我想过滤到看不见
的
图像
的
链接,比如: img style="position:absolute;z-index:-3334;top:0px;left:0px;visibility编辑:谢
浏览 1
提问于2017-04-25
得票数 0
回答已采纳
1
回答
漂亮
的
汤和过滤器,让链接不起作用,哈扎特,还总是正确
的
、
、
、
、
我正在
使用
Python3.3中
的
Beautifulsoup
4
和
Soupstrainer
来
获取
网页上
的
所有
链接。以下是重要
的
代码片段:for link in
BeautifulSoup
(r.text, parse_only=
SoupStrainer
正因为如此,我在
使用
链接‘’href‘
的</
浏览 4
提问于2013-07-30
得票数 1
回答已采纳
1
回答
如何对包含破折号
的
属性
使用
SoupStrainer
?
、
、
、
、
我
使用
的
是Django
和
Python 3.7。我想
使用
BeautifulSoup
和
SoupStrainer
在文档中查找
具有
属性
的
特定元素。但是如果
属性
中包含破折号,我该怎么做呢?我想这么做 my_strainer =
SoupStrainer
('a', data-id="aaa") 但这会导致错误 Can't assign to f
浏览 21
提问于2019-02-23
得票数 1
回答已采纳
3
回答
BeautifulSoup
`find_all`发生器
、
、
有没有办法把find_all变成一个内存效率更高
的
生成器?例如:soup =
BeautifulSoup
(content, "html.parser")我想代之以: soup =
BeautifulSoup
这里有一些内置
的
生成器,但不会在查找中产生下一个结果。有了成千上万
的
条目,find_all吸收了大量
的
内存。对于5792个项目,我看到一个略高于1GB内存
的
峰
浏览 6
提问于2016-12-29
得票数 6
回答已采纳
1
回答
在一组表格下选择一组特定
的
单元格,
使用
python
和
漂亮汤
、
、
、
每个网页都有一个或
多个
表。表
的
共同点是它们
的
类是相同
的
,考虑到"table_class."We需要同一列下
的
内容第三列,标题是每个table.Contents
的
标题意思,第三列中
的
href链接来自
所有
行。一些行可能只是纯文本,而有些行可能有href链接。您应该将每个href链接逐个打印在单独
的
行中。
使用
属性
进行筛选
的
无效,因为某些标记
具有
不同<
浏览 58
提问于2015-04-09
得票数 1
回答已采纳
3
回答
如何编写python脚本在网站html中搜索匹配
的
链接
、
基本上,我仍然需要
的
模块是如何检查匹配链接预先提供
的
网站代码。
浏览 1
提问于2010-03-04
得票数 4
回答已采纳
1
回答
我不能让两个程序同时运行
、
、
我一直在尝试让这两个脚本作为一个脚本工作,但没有成功。我正在尝试在Windows 7环境中运行它。import time print(tme) url
浏览 0
提问于2017-06-25
得票数 0
1
回答
使用
SoupStrainer
与lambda表达式
、
、
给定
具有
三个a标记
的
以下html:<html><head><title>The Dormouse's story</title></head><p class</p>我想要创建一个
SoupStrainer
实例,该实例将html_doc缩进,过滤a
属性
包含‘lister__ cla
浏览 5
提问于2017-09-14
得票数 0
回答已采纳
2
回答
使用
Beautifulsoup
和
Selenium从包含特定单词
的
网页中
获取
链接
、
、
、
我写了这段代码来登录我
的
FB帐户,并
使用
Selenuim
和
BeautifulSoup
获取
页面上
的
所有
群组链接,但
BeautifulSoup
使用
不能正常工作。我想知道如何在同一代码中
使用
Selenuim
和
BeautifulSoup
。 我不想
使用
Facebook API;我想
使用
Selenium
和
BeautifulSoup<
浏览 0
提问于2015-03-19
得票数 0
2
回答
如何获得“亚汤”并连接/加入它们?
、
、
、
我用
的
是“美酒汤”。现在,我想从该文档中检索几个“子汤”,并将它们连接到一个汤中,这样以后我就可以将它用作一个函数
的
参数,该函数期望
使用
一个soup对象。object and calls its methods目标是在resulting_soup中有一个对象,该对象/行为类似于
具有
以下内容
的
汤</p> 有方便
的
方法吗?如果有比find()更好
的
方法来检索
浏览 7
提问于2015-12-30
得票数 8
回答已采纳
1
回答
检索网页中
的
数字并存储在SQLite3 db中
、
、
、
、
每个论坛都有自己
的
桌子名。将这些对象存储在一个列表中,以便在循环中
使用
。
获取
一个网页.htm (带有请求),其中连接人员
的
数量被写在一个span标记中,类“nb- connected”看起来像这个<span class="nb-connect-fofo">1799 connecté我用
BeautifulSoup
得到字符串,用REGEX得到每个论坛应该做<e
浏览 0
提问于2017-06-30
得票数 4
回答已采纳
1
回答
在python中,表解析是如何工作
的
?那个漂亮
的
汤有什么简单
的
办法吗?
、
、
、
、
我试图了解如何
使用
漂亮
的
汤提取href链接
的
特定列下
的
内容,在一个表
的
网页。例如,考虑一下链接:。在这个页面中,带有类wikitable
的
表有一个列标题,我需要提取列标题下每个值后面的href链接,并将它们放在excel工作表中。做这件事最好
的
方法是什么?我在理解漂亮
的
汤表解析文档方面遇到了一些困难。
浏览 4
提问于2015-04-06
得票数 3
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券