腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Beautifulsoup
从
特定
属性
获取
文本
python
、
beautifulsoup
、
web-crawler
dialog" role="button" tabindex="-1"><i class="sp_KIvjPBBBAwk sx_b917e0" role="img"></i></a></span>] 我想要
获取
属性
'aria-label‘中的
文本
。如果我
使用
'select‘,我想知道答案。 谢谢。
浏览 6
提问于2020-10-22
得票数 2
2
回答
如何用
beautifulsoup
4提取html?
python
、
beautifulsoup
我的代码:html = """<td class='Thistd'><a><img /></a>Here is some text.</td>""" tds = soup.findAll('td', {'class': 'Th
浏览 1
提问于2015-10-14
得票数 1
回答已采纳
1
回答
Python re.sub,re.split未能在长篇中拆分单词
python
、
regex
、
python-2.7
、
beautifulsoup
我试图
从
存储在光盘上的HTML文档中列出单词列表。当我试图拆分这些单词并将它们添加到我的单词向量中时,我的结果是一团糟。文档正在被读到BS4中,比如:我不明白为什么会这样。我想审判失败是因为它错了?
浏览 3
提问于2014-08-09
得票数 1
回答已采纳
1
回答
从
<span类
获取
文本
:
使用
优美的汤和请求
python
、
html
、
beautifulsoup
、
python-requests
、
request
因此,我尝试
从
网站
获取
特定
文本
,但它只给出了错误(soup.find=.text(‘span’,{‘class’):‘
文本
-白色fs-14 no
文本
-截断
属性
-值’}).text AttributeError:'NoneType‘对象没有
属性
' text ')。我的代码:from bs4 import
BeautifulSoup
url = "h
浏览 10
提问于2021-12-21
得票数 0
1
回答
如何
从
标记中
获取
属性
?
python
、
python-3.x
、
web-scraping
、
beautifulsoup
、
python-requests
我正在
使用
美丽汤
从
网页中提取
特定
的数据。我试图
获取
特定
标记的
属性
,但失败了。我必须
从
标记中提取
属性
'title'。下面是我试图
从
以下位置
获取
属性
的
特定
html标记: <span id="currwx_icon" style="display: block;" class="weather_icon1 wxi
浏览 2
提问于2022-09-20
得票数 2
回答已采纳
2
回答
使用
BeautifulSoup
从
html中
获取
特定
文本
python
、
html
、
text
、
beautifulsoup
class="time">1.89 s</div>我只需要得到所有其他标记之外的
文本
(
文本
是:我需要得到这个
文本
)。failed open').find_all("em")[-1].next_sibling但是我得到了一个错误: AttributeError:'No
浏览 3
提问于2022-05-25
得票数 0
回答已采纳
2
回答
如何在没有额外信息的情况下有效地
从
网页簇中提取
文本
java
、
python
、
web-scraping
、
beautifulsoup
、
scrapy
我有大约一百万的网页列表,我想有效地从这些网页上提取
文本
。目前我正在
使用
python中的
BeautifulSoup
库
从
HTML中
获取
文本
,并
使用
请求命令来
获取
网页的html。这种方法除了
文本
之外还提取一些额外的信息,比如在body中是否列出了任何javascript。 你能给我推荐一些合适而有效的方法来完成这项工作吗?我看了scrapy,但它看起来像爬行
特定
的网站。我们可以将
特定
网页的列表传递给它以
浏览 24
提问于2019-05-22
得票数 0
1
回答
使用
BeautifulSoup
提取
特定
文本
/
属性
值
python
、
web-scraping
、
beautifulsoup
以下代码行:print(results)<object name="aaa" type="folder"/><object name="ccc" type="folder"/> <object name="ddd" type="folder"
浏览 2
提问于2022-05-17
得票数 0
1
回答
使用
bs4与python一起解析文件,如何
从
锚标记中
获取
文本
?
python
、
html
、
beautifulsoup
Title</TITLE><a href="facebook.com">Face book</a></HTML> 如何
从
带有bs4的锚标记中
获取
脸书和Google
文本
,每次
使用
soup.find_all('a').text时,它都会返回
属性<
浏览 1
提问于2022-06-14
得票数 -3
回答已采纳
2
回答
Python美丽的汤参数
python
、
beautifulsoup
我有这段代码,它
使用
BeautifulSoup
从
页面
获取
一些
文本
body = soup.find('div' , {'id':'body'})我想让它成为一个可重用的函数,它接受一些htmltext和标签来匹配它,如下所示 soup=
BeautifulSoup
(html) bodyht
浏览 0
提问于2010-04-03
得票数 8
回答已采纳
2
回答
如何在html源代码中提取href
属性
python
、
html
、
web-scraping
、
beautifulsoup
这是我正在处理的HTML源代码: <a href="/people/charles-adams" class="gridlist__link"> 所以我想要做的是提取href
属性
,在本例中应该是"/people我需要这个,因为我想获得的
特定
网页的soup.findAll方法的html源代码。但是我正在努力
从
网页中提取这样的
属性
。有人能帮我解决这个问题吗?附言:我正在
使用
这个方法,通过Python模块
beau
浏览 24
提问于2019-09-23
得票数 0
2
回答
将多行字符串连接到Python中的数组中
python
、
arrays
、
beautifulsoup
简而言之,我的代码应该
从
网站HTML中的
特定
标记(在
beautifulsoup
4的帮助下)
获取
文本
,然后将它们加载到数组中。soup =
BeautifulSoup
(response.content) productData = soup.find_all("div", {"class": "de
浏览 0
提问于2016-07-19
得票数 0
1
回答
如何
使用
Python中漂亮的汤提取标签中的内容?
python
、
python-3.x
、
beautifulsoup
我
使用
以下代码
使用
漂亮的汤提取div类:我想提取标签类中的内容,即-哪个
文本
更大。
浏览 4
提问于2020-06-12
得票数 1
回答已采纳
2
回答
如何在Python中
使用
str.replace() <br>或'=‘?
python
我很难去掉我
从
某个网页上抓取的
文本
中所有多余的HTML标签,然而,Python中的str.replace()似乎不适用于<br>和=这样的目标,而<li></li>等其他标签将被成功地替换。
浏览 2
提问于2017-04-14
得票数 0
2
回答
(python)
使用
漂亮的汤解析某些HTML输出标记
python
、
parsing
、
beautifulsoup
)在玩了一段时间之后,我想出了以下函数,它返回完整的<>标记,而不是简单的倒置<>中的部分from urllib2 importurlopen return str((
BeautifulSoup
(urlopen('http://www.reference.com/wordoftheday
浏览 1
提问于2012-04-27
得票数 1
回答已采纳
3
回答
如何编写python脚本在网站html中搜索匹配的链接
python
、
scrape
我对python不是很熟悉,必须编写一个脚本来执行许多函数。基本上,我仍然需要的模块是如何检查匹配链接预先提供的网站代码。
浏览 1
提问于2010-03-04
得票数 4
回答已采纳
2
回答
Python、
BeautifulSoup
- <div>
文本
和<img>
属性
按正确顺序排列
python
、
html
、
beautifulsoup
我有一个简短的HTML,我想通过
使用
BeautifulSoup
运行。我有基本的导航系统,但这次我很困惑。img标签的“alt”
属性
,我希望看到以下结果:购买此项目将花费1银币和1金币。我可以执行以下操作来提取div-标记中包含的所有
文本
print html.get_text() 要获得div-标记中包含的所有
文本
,但这将给我这样的结果同样,通过这样做,我可以
从
img标记中
获取
alt
属性
浏览 2
提问于2013-12-15
得票数 5
回答已采纳
1
回答
AttributeError:'ResultSet‘对象没有
属性
'previousSibling’BS4
python
、
html
、
web-scraping
、
beautifulsoup
为一组
特定
的'td'标记和里面的
文本
刮表。为了过滤刮伤,我以
特定
的'img'标记为目标,并尝试
使用
previousSibling调用来
获取
所需的'td'。我已经尝试过previousSibling,previous_sibling,previous,并不断地得到错误: 任何帮助都将不胜感激from urllib2 import ur
浏览 2
提问于2017-04-10
得票数 0
回答已采纳
1
回答
在python中为任何网页URL文档搜索
特定
标题的
文本
python
、
web-scraping
、
beautifulsoup
、
scrapy
使用
这些库,我想抓取文档中
特定
标题下的所有
文本
。如果你们中的任何人能帮助我,我将不胜感激。我看过一些教程,教你如何
使用
漂亮的soap
获取
特定
类名下的链接(通过查看源页面选项),但如何
获取
简单的
文本
,而不是
特定
类标题下的链接。对不起,我的英语不好from bs4 import
BeautifulSoup
r=requests.get('https://pa
浏览 0
提问于2017-10-25
得票数 0
1
回答
如何通过Python
BeautifulSoup
中的
特定
文本
找到标记?
python
、
html
、
web-scraping
、
beautifulsoup
您知道如何在pythons
BeautifulSoup
中搜索
特定
的
文本
吗?查找标记??更好的标记完整路径,包含一些string。例如,BS4的常用用法是:from bs4 import
BeautifulSoup
results =
BeautifulSoup
(website.c
浏览 4
提问于2022-09-04
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫获取所有课程信息
Python爬虫环境搭建,爬虫获取所有课程信息
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
享学课堂浅谈Python3中BeautifulSoup的使用方法
送上一碗鸡汤——BeautifulSoup网页解析
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券