腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSOUP
和
OpenStreetMap
XML
中
的
嵌套
标记
和
属性
python
、
xml
、
beautifulsoup
、
nodes
、
openstreetmap
请帮助写有意义
的
代码
的
任务:我需要计算所有的标签“
的
方式”在
XML
OpenStreet映射文件
中
,在每个"nd“标签
的
数量,并输入标签”路“
的
id,其中包括最大数量
的
标签"nd”。(我只认为使用词汇表会很有用)这是代码: from urllib.request import urlopen, urlretrieve from bs4 import
BeautifulSoup
resp = urlopen(
浏览 22
提问于2020-07-29
得票数 1
回答已采纳
3
回答
使用XSLT过滤非引用成员节点
xml
、
xslt
OpenStreetMap
xml
文档(除其他外)由一组“节点”元素
和
一组“方式”元素组成。这里有一个例子: <?
xml
version="1.0" enco
浏览 3
提问于2012-05-23
得票数 2
回答已采纳
2
回答
为什么
BeautifulSoup
要重新格式化我
的
XML
?
python
、
xml
、
parsing
、
beautifulsoup
我所做
的
工作如下:html = u'<body><b>In Body<b>Second level</b></b></body>' soup =最初,我有一个标签<b>,它包含一些文本(In Body),然后它包含另一个
标记
<b>。然而,
BeautifulSoup
“认为”我有
标记
<b>,在它之
浏览 1
提问于2015-02-22
得票数 2
回答已采纳
2
回答
如何导航到
BeautifulSoup
对象
中
的
特定
标记
?
python
、
xml
、
beautifulsoup
链接到我正在使用
的
url:response = requests.get(new_url)所有顶级
标记
(没有父
标记
的
标记
)似乎都是可访问
浏览 5
提问于2021-04-28
得票数 0
回答已采纳
1
回答
从
xml
获取
标记
名
python
、
xml
、
beautifulsoup
我有这样一个结构
的
文件:The gateway only supports upto 10 rules.</pwACL> Batch Number我想要获取标签名称
和
标签之间
的
数据。我尝试使用BeatifulSoup HTMLParser库,但它会自动将
标记
名转换为小写。我发现有一种可能性可以使用html5lib创建树与美丽
的
汤树构建器如下: parser = html5lib.HT
浏览 1
提问于2017-06-04
得票数 0
1
回答
解析
XML
时删除HTML
标记
的
优美汤
python
、
html
、
xml
、
beautifulsoup
我在
XML
文档
中
嵌套
了一些HTML,
嵌套
在其他更深层次
的
嵌套
标记
之间,这些
标记
仍然包含HTML、BODY
和
HEAD
标记
,但是
Beautifulsoup
正在删除/更改它们。有没有办法防止BS破坏这些标签
的
顺序?html1 = """ <?
xml
version="1.0&q
浏览 2
提问于2014-04-02
得票数 0
回答已采纳
2
回答
当
xml
标记
名包含大写字母时,
BeautifulSoup
引发AttributeError。
python
、
xml
、
google-app-engine
、
beautifulsoup
我正在尝试获取
标记
Name
的
所有
XML
属性
。获取此错误:当我执行以下代码时:<Product Code="1" HighPic="http://upload.wikime
浏览 3
提问于2014-02-04
得票数 1
回答已采纳
2
回答
漂亮
的
Soup解析
XML
文件
python
、
beautifulsoup
我正在使用Beautiful编写一个简单
的
Python来解析我需要
的
xml
文件
中
的
数据。它
的
工作方式,我需要它,但我有一个要求你们,因为我已经尝试谷歌这个,但似乎找不到我在寻找什么。
XML
字符串示例: <ProductAttribute MaintenanceType="C" AttributeID="Attachment Type" PADBAttribute="N" RecordNumber当我写<e
浏览 0
提问于2018-05-01
得票数 2
1
回答
美汤低大写标签默认?
python
、
beautifulsoup
、
lxml
我用
的
是LXML
和
漂亮汤。我有一个带有大写
标记
的
XML
文档。当我使用
BeautifulSoup
时,它似乎是小写
的
标签名称,这使我使用
的
find_all不直观。BS真的是这样做
的
,还是发生了其他事情?soup =
BeautifulSoup
( features= 'lxml', # 'html5lib', # 'html.par
浏览 2
提问于2022-05-25
得票数 0
1
回答
Python:访问
xml
文件
中
的
嵌套
子元素
python
、
xml
、
celementtree
我有一个
xml
文件
的
结构如下: </placeName>
和
python代码来解析它:parse_file =当我想迭代这个元素时 <placeName
xml
:id="ene.3&q
浏览 1
提问于2019-03-21
得票数 0
1
回答
使用
BeautifulSoup
抓取
标记
和
XML
文件
的
属性
python
、
pandas
、
beautifulsoup
拜托,我需要一些Python
的
帮助。我有可折叠
的
结果
XML
。print(bloc_elements) <a>data_a</a><c>data_c</c></Bloc>List into CSV file : a b c
浏览 5
提问于2021-01-09
得票数 0
1
回答
解析
嵌套
在
XML
文件
中
的
超文本
标记
语言(使用
BeautifulSoup
)
python
、
html
、
xml
、
parsing
、
beautifulsoup
我正在尝试解析description字段
中
包含超文本
标记
语言
的
XML
文件
中
的
一些数据。>从bs4导入
BeautifulSoup
descContent = soup.find_all我不确定哪里出错了;当我枚举descContent
中
的
条目时,它显示了我正在寻
浏览 3
提问于2018-05-20
得票数 1
1
回答
Python:
BeautifulSoup
在读取时会自动更改文本?
python
、
xml
、
xml-parsing
、
beautifulsoup
我正在使用
BeautifulSoup
对
XML
文件进行更改,但我注意到,如果我读取该文件,将其放入构造函数,然后在不对其进行任何更改
的
情况下将其吐出,
BeautifulSoup
已经对代码进行了一些更改。例如,
标记
和
属性
名称都是小写
的
,标签
中
属性
的
顺序也会改变。 实际上,我知道这不应该是一个问题,但是必须读取
XML
文件
的
程序非常挑剔,不会接受这些更改。我发现我可以在不
浏览 3
提问于2014-07-19
得票数 2
回答已采纳
3
回答
如何使用
BeautifulSoup
删除
嵌套
标记
中
的
内容?
python
、
html
、
nested
、
beautifulsoup
如何使用
BeautifulSoup
删除
嵌套
标记
中
的
内容?这些帖子显示了反向检索
嵌套
标记
中
的
内容:
和
>>> from bs4 import
BeautifulSoup
as bs>>> bs(html)
浏览 0
提问于2014-02-13
得票数 3
回答已采纳
2
回答
使用Python
中
的
BeautifulSoup
识别
和
替换
XML
的
元素
python
、
xml-parsing
、
beautifulsoup
我试图使用
BeautifulSoup
4来查找
和
替换
XML
中
的
特定元素。更具体地说,我希望找到“file_name”
的
所有实例(在下面的文件名为“Cyp26A1_atRA_minus_tet_plus.txt”
的
示例
中
),并将其替换为该文档
的
完整路径--该路径保存在“file_name_replacement_dir”变量
中
。因此,上面的
XML
片段重复了44次,只是在"File“行
中
浏览 1
提问于2015-06-26
得票数 2
回答已采纳
1
回答
修复格式错误
的
xml
时出现内存错误
python
、
beautifulsoup
、
lxml
、
elementtree
、
large-files
我有一些格式错误
的
非常大
的
XML
--它缺少顶级
标记
,并且有重复
的
属性
。为了解决这个问题,我在格式错误
的
XML
的
一个子集上测试了以下解决方案,它可以很好地添加
标记
并使用
BeautifulSoup
自动删除重复
的
属性
。import sysimport
xml
.etree.
浏览 0
提问于2020-02-20
得票数 0
1
回答
解析
XML
并使用
XML
元素重写文件名
python
、
xml
、
web-scraping
、
automation
我正在尝试解析
XML
并重命名原始
XML
,使用它
的
一个子元素,特别是作为要覆盖
的
XML
的
文件名
的
前缀。在下面的示例
XML
中
,我希望提取" to“元素,并将其名称"Tove”插入到新编写
的
XML
文件名
中
。如果原始文件名为"reminder.
xml
",是否可以解析名称"Tove“并将其插入到新编写
的
名为
浏览 11
提问于2020-04-22
得票数 1
回答已采纳
1
回答
python
中
的
漂亮汤
xml
格式设置
python
、
xml
、
beautifulsoup
我有一个
xml
数据集
标记
,格式如下:我认为,当他们创建数据集时,他们没有按必须设置id
属性
的
格式:但是,当在python
中
通过Beautiful库时,如下所示: s
浏览 1
提问于2017-03-30
得票数 1
回答已采纳
3
回答
从HTML字符串
中
删除所有div标签
python
、
regex
我正在试着去掉所有的div。<p>111</p> 所需输出:我试过了,但不起作用: release_conten
浏览 3
提问于2013-04-04
得票数 2
回答已采纳
1
回答
BeautifulSoup
从文本<TYPE>
中
删除
python
、
parsing
、
beautifulsoup
我需要从
标记
<TYPE>EX
和
</TEXT>以及<TYPE>
XML
和
</TEXT>之间
的
文本
中
删除所有部分。我正在考虑使用regex如下:
和
re.sub(r"(?is)<TYPE>
XML
[^>]*>(.*?)如何使用
Bea
浏览 1
提问于2014-11-20
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
走进Java接口测试之理解JSON和XML基础
Go语言xml格式
享学课堂浅谈Python3中BeautifulSoup的使用方法
XML学习笔记
【一起学爬虫】BeautifulSoup库详解
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券