腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
在
读取
或
解析
时
将
内容
放在
实际
元素
之外
、
、
我必须
解析
最后一个dd的
内容
,并将其文本作为其子p文本的列表。如下截图所示: with open('strange_dl.html') as f: p_elements=target.find_all('p') 所以你可以看到它并没有返回所有的<em
浏览 7
提问于2019-11-10
得票数 0
2
回答
如何让
BeautifulSoup
将
文本区域标签的
内容
解析
为HTML?
、
、
在
3.0.5之前,
BeautifulSoup
通常将的
内容
视为HTML。它现在将其视为文本。我正在
解析
的文档的textarea标记中有HTML,我正在尝试处理它。我
在
文档中找不到这一点,替代
解析
器也无济于事。有人知道如何
将
文本
解析
为HTML吗?>').match(xml_data)我正在寻找一种方法,获取
元素
,提取
内容
,用<em
浏览 2
提问于2010-04-19
得票数 4
回答已采纳
1
回答
BS4‘
元素
’到底是什么,
元素
是如何计算的,由哪个
解析
器来决定?显然很迷惑
、
、
、
人们经常会遇到这种类型的for循环: from bs4 import
BeautifulSoup
as bssoup = bs(mystring,'html.parser<span style="some other style">text nine</span></p>closing text' 我不再确定我期望的输出是什么了,但是当我运行这段代码
时
: counter10个
元素</e
浏览 15
提问于2019-05-08
得票数 1
回答已采纳
3
回答
urlopen('http.....').read()中的read()做了什么?[urllib]
、
、
请参阅bs1和bs2from bs4 import
BeautifulSoup
bs1 =
BeautifulSoup
(html.read(), 'html.parser谢谢 用python进行Web搜索的p
浏览 3
提问于2016-03-08
得票数 8
回答已采纳
1
回答
处理给
BeautifulSoup
的坏链接的最好方法是什么?
、
、
/d2o.py", line 43, in get_feed_links File "/Library/Python/2.5/site-packages/
BeautifulSoup
.py", line 1499, in __init__ File "/Library
浏览 0
提问于2009-01-17
得票数 1
回答已采纳
2
回答
C#类数组和索引器,一个类中的多个数组必须是公共的吗?
、
、
我有一个包含数组的XMLObject类,它将xml
元素
放在
一个数组中,
将
数据值
放在
另一个数组中,并将结束
元素
放在
第三个数组中。我还获得了一个XMLParse对象,它执行
实际
的
解析
,并在找到字符串
时
将它们存储到不同的数组中。我被禁止在这个任务中使用.Net的xml
内容
,必须是一个字节一个字节地读入。现在我
在
MSDN上阅读了有关索引器的
内容
,据我所知,我可以只有一个使用索引器的数组(因
浏览 0
提问于2011-05-25
得票数 1
回答已采纳
1
回答
用
BeautifulSoup
从XML文档中提取unicode文本
、
、
我有这样的代码: url = open(fileid, 'r').read() print fileid它从本地xml文件中获取某个
元素
。然后,它从中提取xml代码并打印一个列表。
浏览 1
提问于2017-05-16
得票数 0
1
回答
如何导航网站并使用Python提取数据
、
、
、
、
最后,我希望将其存储
在
csv
或
xlsx中(我想我会使用openpyxl
或
xlsxwriter)。
浏览 0
提问于2015-12-06
得票数 1
1
回答
向Android应用添加非本地化字符串
、
、
在
每个文件夹中,我都有名为strings.xml的文件,猜猜是什么,字符串。其中一些需要所有的语言,但一些只需要在一个应用程序的内部需求。
浏览 0
提问于2012-10-13
得票数 0
回答已采纳
1
回答
TFHppleElement (Hpple),
在
iphone上
解析
HTML
、
、
、
我正在使用Hpple,到目前为止,它很棒,但是我想把所有的div都
放在
另一个里面,这是我能做到的。但是,我无法进一步
解析
内容
( innerHTML,
在
源代码中它被标记为innerHTML而不是innerText)请求
元素
content
时
不会返回任何
内容
,因为
元素
中没有直接的文本,只有子节点/
元素
包含文本
在
iPhone上,除了Hpple和
解析
超文本标记语言
之外
,还有什么替代
浏览 1
提问于2010-05-19
得票数 3
回答已采纳
2
回答
当网络抓取
时
,我们把"html.parser“的论点
放在
哪里?
、
、
、
请看下面的代码片段from bs4 import
BeautifulSoup
html = requests.get(url, "html.parser")html2 = requests.get(url) soup2 =
BeautifulSoup
我们应该
将
"html.parser“
放在</
浏览 2
提问于2020-08-11
得票数 1
回答已采纳
1
回答
使用selenium
解析
网页
时
的表单、输入问题
、
、
、
我正在使用selenium和
beautifulsoup
4
解析
网页,但我
在
解析
特定网页
时
遇到了问题。当我
实际
查看页面上的html源代码,并使用selenium
或
bs4进行
解析
时
,我得到了不同的html源代码页面。区别在于形式和输入的存在。当我
解析
该页面
时
,我得到的html是 <form action="" method="post" name="
浏览 12
提问于2017-07-22
得票数 1
1
回答
BeatifulSoup不尊重void标记
、
、
BeatifulSoup4似乎
将
<br>、<img>和其他
解析
为容器:<!/title></head>line<br><p>wtf</p>doc = bs4.<e
浏览 3
提问于2014-10-21
得票数 0
回答已采纳
2
回答
具有多个根
元素
的“‘XML”文档
、
我有一个'XML‘文件,我不能控制它,我试图用包含两个根
元素
的etree.ElementTree
解析
它: ... data I do not care about ... data I wish to parse
在
尝试
解析
文件
时
,我得到了错误:'junk after
浏览 16
提问于2018-07-30
得票数 1
回答已采纳
1
回答
在
html标记之前运行脚本和DOM会不好吗?
在
html标记之前运行脚本和DOM会不好吗?我有一个浮动窗口脚本
在
我的页面上创建的div和表,它会损害搜索引擎爬行网站吗?这编码不好吗?
浏览 0
提问于2018-04-19
得票数 0
回答已采纳
1
回答
如何使用漂亮的汤从保存的html页面中删除td行号和行
内容
类。
、
我已经通过查看源代码保存了网页html
内容
。我是这样做的,因为我无法连接到网页,因为它在citrix环境中。我遇到的问题是,当我
读取
保存的html文件并使用漂亮的汤
读取
内容
时
,它创建了一个额外的表
元素
,其中包含td
元素
中的
实际
html
内容
。相反,我必须先找到html、body、table
元素
,然后才能从其中的页面中获得包含
实际
html
内容
的所有td
元素
; from
浏览 2
提问于2019-08-01
得票数 0
回答已采纳
2
回答
为什么find_all
BeautifulSoup
4函数不返回任何
内容
?
、
、
、
新的漂亮汤4,当我
在
YouTube上搜索东西
时
,我无法得到这个简单的代码来获取标签的
内容
。当我打印容器
时
,它只是
将
"[]“作为一个空变量打印出来。你知道为什么这个没捡到任何东西吗?这与没有
在
YouTube上抓取正确的标签有关吗?
在
search中,有一个结果的标签如下: <a id="video-title" class="yt-simple-endpoint style-scope ytd-video-renderer&qu
浏览 3
提问于2017-09-23
得票数 2
回答已采纳
1
回答
当父级位于隐含的命名空间中
时
,
BeautifulSoup
会删除子级。
、
、
、
网站
实际
上并不是每个名称空间都有标记,但是Firefox创建了一个标签,以避免模糊(具体来说,该站点有一个<html xmlns>标记,似乎混淆了驱动程序)。<div class='division'> &l
浏览 1
提问于2013-01-31
得票数 1
回答已采纳
1
回答
Web应用程序
在
iframe中无法
读取
自己的DOM
元素
。
在
iframe外面工作得很好
、
Gradio应用程序是
在
本地PC上托管的。Gradio应用程序是js/css/html。 当我直接在浏览器中加载Gradio应用程序时,一切正常工作。如果我
将
应用程序
放在
iframe中(否则是骨架HTML/而不是加载的其他脚本),似乎Gradio应用程序就不能再通过自己的js
读取
自己的DOM
元素
了。name="frame2" id="frame2" frameborder="0" marginwidth="
浏览 27
提问于2022-09-25
得票数 0
2
回答
解析
页面意味着什么?
、
我发现了以下的解释: 如果不存在任何异步
或
延迟:
在
浏览器继续
解析
之前立即获取并执行脚本。
解析
仅仅意味着加载页面的组件,如文本、图片和布局以及.?
浏览 2
提问于2016-08-31
得票数 1
点击加载更多
相关
资讯
干了这碗汤,你也可以愉快地爬虫了
Python爬虫学习(六)BeautifulSoup来袭
Python爬虫入门,快速抓取大规模数据2
Python爬虫实例之——小说下载
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券