腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
Python
.
text
方法
未
返回
正确
的
文本
、
、
我使用html获得结果,而当我尝试使用.
text
删除它们时,我得到了奇怪
的
输出。我使用parent
方法
来获取整个分数
的
父HTML元素。scraper脚本: html_soup =
BeautifulSoup
(response.
text
, 'html.parser') results = html_soup.find
浏览 19
提问于2019-07-24
得票数 0
回答已采纳
2
回答
添加转义html
的
BeautifulSoup
replaceWith()
方法
,希望它
未
转义
、
、
我有一个
python
方法
(),它接受一些html,并使用
BeautifulSoup
和Django
的
urlize将<a>标记包装在
未
格式化
的
链接周围:from bs4 import
BeautifulSoup
soup =
BeautifulSoup
(
text
, &q
浏览 5
提问于2015-10-04
得票数 9
回答已采纳
1
回答
如何使用编码JSoup文档
文本
我有一个这样
的
节点我需要像这样获取div元素
的
文本
我从.
text
()
方法
得到
的
输出是在
BeautifulSoup
中,它将
返回
> something < not encoded输出。如何从JSoup获取
未</e
浏览 0
提问于2013-07-03
得票数 0
7
回答
Python
/
BeautifulSoup
-如何从元素中删除所有标签?
、
如何才能简单地从
BeautifulSoup
中找到
的
元素中剥离所有标记?
浏览 1
提问于2013-04-25
得票数 88
1
回答
BeautifulSoup
在标记中找到一个部分字符串
、
、
、
、
由于某种原因,
BeautifulSoup
突然无法在我已经开始
的
新
的
Python
中找到我
的
任何标记
的
内容。我已经使用
BeautifulSoup
大约一年了,从来没有遇到过这个问题。我能够用".json()“在
Python
中成功地注入一个JSON有效负载,并使用html.parser将其传递给
BeautifulSoup
,而且每次都非常有效。现在,我正在尝试读取包含原始MySql
的
BeautifulSoup
浏览 2
提问于2021-04-22
得票数 0
1
回答
Python
web抓取javascript生成
的
内容
、
、
、
我正在尝试使用
python
3
返回
由生成
的
bibtex引用。url是可预测
的
,因此脚本可以在不必与网页交互
的
情况下计算出url。我已经尝试使用selenium,bs4等,但无法获得框内
的
文本
。url = "http://www.doi2bib.org/#/doi/10.1007/s00425-007-0544-9"from bs4 import <
浏览 3
提问于2015-02-03
得票数 8
回答已采纳
3
回答
python
[lxml] -清除html标记
、
、
))- len(
text
)) except: print sys.exc_info()我把上面的(丑陋
的
)代码组合在一起,作为我最初进军
python
领域
的
尝试。我正在尝试使用lxml清理器清理几个html页面,所以
浏览 2
提问于2010-06-01
得票数 15
2
回答
Python
格式不错
、
、
、
、
我正在尝试创建一个程序,打印出/r/笑话中
的
前5个笑话,但我在设置它
的
格式时遇到了一些问题,使它看起来很好看。我想让它像这样摆出来。Post Title: Post Content<item> 编辑:这是我
的
浏览 0
提问于2015-08-30
得票数 2
回答已采纳
2
回答
使用for循环从多个页面抓取Web第2部分
、
、
、
我最初
的
问题是: “我已经创建了一个网络抓取工具,用于从列出
的
房屋中挑选数据。 当涉及到更换页面时,我遇到了问题。我确实让循环从1变成了某个数字。例如,如果我
的
范围是(1-74),它将多次打印最后一页,因为如果超过最大值,页面总是加载最后一页。“ 然后我得到了Ricco D
的
帮助,他写了代码,它会知道什么时候停止: import requests url='https:这是我得到
的
错误。 有没有什么办法让
浏览 20
提问于2020-12-22
得票数 0
回答已采纳
1
回答
为什么
BeautifulSoup
找不到包含
文本
的
标签,但我可以运行" find“并在HTML中查看
文本
?
、
、
、
我使用
的
是
Python
3.7和
BeautifulSoup
4,搜索包含特定
文本
的
标签
的
正确
方法
是什么?我以为我能做到 soup =
BeautifulSoup
(code, features="lxml")no_images_msgs = ["No very similar images were"No similar images were found."] for no_i
浏览 16
提问于2019-06-13
得票数 0
1
回答
如何从
python
中
未
正确
关闭
的
标签中恢复文档?
、
这是我
的
问题
text
="""<!(
text
)我
的
错误是 File "test.py", line 31, in<module> File "/usr/lib
浏览 0
提问于2013-12-19
得票数 0
1
回答
为什么
BeautifulSoup
会错过<p>标记?
、
我使用
的
是
BeautifulSoup
,findAll
方法
缺少<p>标记。我运行代码,它
返回
一个空列表。但是如果我检查页面,我可以清楚地看到它,如下面的图片所示。from bs4 import
BeautifulSoup
url = 'https://www.kite.com/
python
/answers/how-to-e
浏览 1
提问于2021-03-09
得票数 0
2
回答
无法在
python
中获取<div>标记值
、
所需
的
值存在于div标记中:<span class="upc grey-
text
sml">Cost for 2: </span></div>soup.select('div.search-page-
text
'): 但在输出中,我得到了“零”。
浏览 8
提问于2015-05-03
得票数 0
回答已采纳
2
回答
使用漂亮
的
汤解析
python
、
、
、
我正试图通过一家餐厅结构不佳
的
网站进行解析,并打印出菜单标题如下:我正在使用
Python
库Beautiful,但我很难获得
正确
的
输出:import requestsr= requests.get(url,
浏览 1
提问于2015-04-25
得票数 2
回答已采纳
3
回答
网站
的
Python
正确
编码(漂亮汤)
、
、
、
、
我试图加载一个html页面并输出
文本
,尽管我得到了
正确
的
网页,但
BeautifulSoup
以某种方式破坏了编码。资料来源:import requestsr = requests.get(url) en
浏览 8
提问于2016-04-25
得票数 13
回答已采纳
3
回答
如何提取特定
的
段落标记
、
、
我想提取这个答复
的
内容: <p class="bio profile" ></div> 请假定还有其他具有不同类属性
的
附属器标记,但是我想使用类属性"bio-profile“来提取这个标记。我试过desc = bs.find ('p', {'class' : 'bi
浏览 5
提问于2014-03-25
得票数 0
回答已采纳
1
回答
当教程总是
返回
嵌入
的
文本
时,为什么使用
BeautifulSoup
获得多个搜索字符串
的
结果为零?
、
、
我开始学习编码,不明白为什么视频教程总是使用一种简单
的
方法
输入多个搜索字符串来
返回
标签中
的
嵌入标记,然后它们就会得到结果,但是我
的
len(query)在做同样
的
事情时总是带着一个很大
的
胖0回来。我使用
的
是几乎完全相同
的
代码。最后,对于这篇文章,假设我想
返回
URLS。它们位于"div“、"h3”和"href“标签后面。但是,让我们试着缩小"div“标记后面的"h3”<e
浏览 4
提问于2021-06-27
得票数 1
3
回答
从HTML中提取数据
、
、
我已经能够将网站上
的
内容放到一个字符串/文件中。现在,我想搜索包含以下内容
的
特定行: <li><span class="abc">Key 1:</span> <span class="aom_pb">Value 1</span></li>有一个gauranteed只有一个关键字1:在网站上,我需要得到
的
值1。什么是最好
的
方法
来做到这一点。
浏览 1
提问于2011-11-06
得票数 1
1
回答
如何在使用优美汤时获得
文本
标记
、
、
、
我是一个从事
文本
挖掘和玩具项目的纽比人,负责从网站上抓取
文本
,并将其分割成令牌。但是,在使用
Beautifulsoup
下载内容之后,我未能用下面的代码使用.split
方法
将其拆分import nltkfrom bs4 import
BeautifulSoup
url= 'http://
python<
浏览 2
提问于2017-09-05
得票数 0
回答已采纳
1
回答
如何在
文本
中用它
的
值替换标记
、
我怎么提取 I <img src="image.png" alt="love">
Python
获取字符串并将其拆分不起作用,
文本
由用户控制,可能包含<>
浏览 1
提问于2018-12-27
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券