腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
python
使用
lxml
解析
XML
,
并
给出
正确
的
解析器
参数
python
、
xml
、
parsing
、
xpath
、
lxml
我正在用
python
中
的
lxml
解析
xml
数据。 数据如下所示: string='''<?
xml
version="1.0" encoding="UTF-8"?()) 但是我想知道是否有一种方法可以在
解析器
中告诉
lxml
不应该处理字符串
的
第一行
的
换行问题。>','') 在
解析
之前,有没有一
浏览 26
提问于2021-03-23
得票数 0
1
回答
如何
使用
Python
3.8HTML
解析
xml
.etree?
python
、
html
、
xml
、
elementtree
我需要用
Python
3.8
XML
包
解析
HTML文件。这是可能
的
,因为有些
xml
.etree.ElementTree方法
的
参数
以"
xml
"或"html"作为值,但我找不到它是如何实现
的
。当我试图
解析
HTML文件时,我得到了一个异常:
解析器
在遇到
浏览 1
提问于2021-11-15
得票数 0
3
回答
如何消除BeautifulSoup用户警告?
python
、
beautifulsoup
安装BeautifulSoup后,每当我在命令行中运行
Python
时,就会发出以下警告: D:\Application\
python
\lib\site-packages\beautifulsoup4-4.4.1
浏览 4
提问于2015-11-04
得票数 67
回答已采纳
1
回答
如何使
Python
在bs4上正常工作?
python
、
xml
、
unicode
、
beautifulsoup
我正在尝试
使用
4 (bs4)将Inkscape SVG转换成一些专有软件
的
类似
XML
的
格式。我似乎无法让bs4
正确
地
解析
一个最小
的
示例。我需要
解析器
尊重自闭标记,处理unicode,而不是添加html内容。我认为用selfClosingTags指定'
lxml
‘
解析器
应该可以做到这一点,但是没有!去看看。 #!定位于html模板,但只用于分析html
的
子部分,而不是
解析
<e
浏览 1
提问于2016-03-22
得票数 2
回答已采纳
3
回答
如何加快
使用
BeautifulSoup
解析
10 up文件
的
速度
python
、
performance
、
parsing
、
beautifulsoup
、
lxml
我正在
使用
范围在3到10‘m之间
的
Beautifulsoup
解析
大型HTMl文件。不幸
的
是,99%
的
数据是我想要
解析
的
内容。我尝试过多种常见
的
优化,例如:( a)
使用
不同
的
解析器
,( b)
使用
SoupStrainer,( c)定义编码 ( b)和c)当我记录所需时间时,实际上没有任何效果。不同
的
解析器
有很大
的
影响。当我在1.5k
浏览 6
提问于2015-03-20
得票数 4
2
回答
使用
LXML
ETREE在
使用
Python
解析
本地计算机上
的
XML
文件时出现问题
python
、
xml
、
lxml
我在Mac上
使用
Python
2.7.3,
并
安装了
lxml
版本3.3.3。我在同一个目录中有几个
xml
文件,例如MyDir/file1.
xml
和MyDir/file2.
xml
。我正在尝试将每一个都引入
python
,并提取相关信息。但是,我似乎无法让etree
解析器
工作。MyDir",x))]
浏览 0
提问于2014-03-22
得票数 3
17
回答
bs4.FeatureNotFound:找不到具有您请求
的
功能
的
树构建器:
lxml
。你需要安装
解析器
库吗?
python
、
python-2.7
、
beautifulsoup
、
lxml
...File "/Library/
Python
/2.7/site-packages/bs4/__init__.py", line.join(features)) bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested:
lxml
我
的
终端
浏览 5
提问于2014-06-25
得票数 341
2
回答
处于恢复模式
的
etree.XMLParser还能抛出
解析
错误吗?
python
、
unit-testing
、
lxml
我有一个实用方法,它
使用
创建为etree.XMLParser(recover=True)
的
解析器
解析
XML
。我想在单元测试中测试失败
的
场景。除了抛出
lxml
.etree.XMLSyntaxError
的
空输入之外,我似乎不能破坏
解析器
。我
的
问题是:有没有可能为这个
解析器
构造一个StringIO或BytesIO输入,使得
解析器
抛出
解析
错误?下面是一些示例(
使用
浏览 1
提问于2019-05-22
得票数 1
1
回答
Python
3,BeautifulSoup删除段落标记
python
、
html
、
python-3.x
、
beautifulsoup
、
html-parsing
这是BeautifulSoup
的
预期行为吗?如果是的话,有人能解释为什么要这样做吗?编辑:只是想说明一下,我意识到这个html是无效
的
,但是我没有意识到BeautifulSoup会在这个程度上编辑无效
的
html。
浏览 2
提问于2014-08-11
得票数 2
回答已采纳
1
回答
从HDFS中读取
XML
文件用
lxml
.etree
解析
xml
、
apache-spark
、
hadoop
、
pyspark
、
lxml
我已经用
lxml
.etree用
Python
编写了一个
解析器
,现在我正试图在Hadoop集群上运行上述
解析器
。当我在本地运行该函数时,它按预期工作,但当我尝试将其应用到集群上
的
文件时,我会收到以下错误(我正在Pyspark,
python
3中执行以下操作)如何
使用
从集群中将
XML
文件加载到
lxml
.et
浏览 3
提问于2020-04-08
得票数 0
回答已采纳
1
回答
按标记
解析
python
中任何前缀
的
xml
节点子列表。
python
、
xml
、
lxml
、
domparser
我想得到一个项目的清单,独立于它们
的
前缀。我
的
目标是创建方法(如果存在类似的东西,请注意),他有一个
参数
(标签名)
并
返回元素列表。例如,在
参数
'item‘<media:item>
的
情况下,<abc:item>应该是该函数结果
的
一部分。
使用
lxml
很好,但它可以是任何基于
python
的
解析器
。不幸
的
是,我不能假设
xml</
浏览 2
提问于2015-07-23
得票数 1
回答已采纳
1
回答
Python
自定义
解析器
无法
使用
lxml
.etree.parse(.)函数
python
、
python-3.x
、
lxml
在
python
3.5项目中,我必须阅读一些
xml
文件,
并
决定
使用
lxml
库。由于我是在文件中阅读,根据文档,最有效
的
方法是
使用
lxml
.etree.parse(.)函数。我遇到
的
问题是,这个函数似乎总是
使用
默认
的
解析器
,即使我传递
的
是自定义
的
解析器
。
Lxml
.etree.fromstring(.)功能确实正常工
浏览 1
提问于2015-12-05
得票数 1
回答已采纳
1
回答
Python
和BeautifulSoup把我
的
标签弄乱了?
python
、
xml
、
beautifulsoup
这是原始
的
XML
文件:</book>with open(filename) as f : print(soup.root) 奇怪
的
是那么,当<meta>标记不在原始
XML
文件中时,为什么它是空
的
呢?(我可以发誓,这在两周前
浏览 2
提问于2013-03-17
得票数 0
回答已采纳
2
回答
Python
解析
html错误标记错误
python
、
html
、
parsing
<input type="checkbox" name="word_ids[]" value="34" class="list_check">这是我想
解析
的
html文件
的
一部分。但当我申请data = uh.read()tree = ET.fromstring(data) 它
浏览 2
提问于2016-09-25
得票数 0
1
回答
在venv中
lxml
的
中断安装不能与beautifulsoup4一起
使用
python
、
xml-parsing
/venvpip install beautifulsoup4看上去很成功。但是当我试图
解析
一个
xml
文件时,我得到了一个错误,就像我还没有安装
lxml
一样 soup = BeautifulSoup(您需要安装
解析器
库吗?, &
浏览 1
提问于2020-05-06
得票数 0
回答已采纳
1
回答
'BeautifulSoup‘和'
lxml
’之间有什么关系?
python
、
beautifulsoup
、
html-parsing
、
lxml
在“
lxml
's ”中,它写道:
lxml
可以通过BeautifulSoup模块与
lxml
.html.soupparser
的
解析
功能进行接口。它提供了三个主要功能: file ()和parse()用于
使用
BeautifulSoup将字符串或文件
解析
为
lxml
.html文档;convert_tree()将现有的BeautifulSoup树转换为顶级元素
的
列表同时,BS‘还可以
使用
lxml
作
浏览 2
提问于2015-08-25
得票数 3
回答已采纳
1
回答
意外重命名文件中
的
字段
python
、
beautifulsoup
、
python-requests
、
rss
、
lxml
我
使用
Python
4/
lxml
解析
xml
格式
的
RSS提要(特别是)。我发现,在从接收页面数据
的
请求到从文本读取页面数据
的
BS4转换过程中,链接字段
的
名称正在被更改。,但将其读入is 4/
lxml
并
打印结果为...</saleends><link/>https://foo.itch.io/bar<de
浏览 2
提问于2020-11-03
得票数 0
回答已采纳
1
回答
如何
使用
Python
解析
这个HTML表?
python-2.7
、
beautifulsoup
、
html-parsing
我正在尝试用
Python
2.7创建一个抓取脚本。 请求是可以
的
,但是我很难用Beautiful soup来
解析
这个表。我已经尝试了很多,在论坛上搜索了很多,但对我来说都不起作用,这是我第一次这样做。
浏览 10
提问于2017-02-07
得票数 1
回答已采纳
4
回答
在
Python
中
解析
格式错误
的
html时,
lxml
和libxml2中
的
哪一个更好?
python
、
html-parsing
、
lxml
、
libxml2
对于格式错误
的
html,哪一个更好、更有用?谢谢。
浏览 0
提问于2012-02-17
得票数 8
回答已采纳
1
回答
流
解析
Wiki
Xml
转储
python
、
xml-parsing
、
lxml
、
wikipedia
、
topic-modeling
我不确定以前是否有人问过这个问题,但是我一直找不到它,请原谅我
的
无知。我想
解析
(流
解析
)大约40 to
的
wikipedia
xml
转储。我正在尝试
使用
lxml
iterparse,也就是流
解析器
来为我完成这项工作,但由于某些原因,我编写
的
代码无法为我工作。</text></root> 在上面的
xml
结构中,我想做
的</em
浏览 1
提问于2012-12-03
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
BeautifulSoup常用解析库-爬虫干货系列5
Python3 XML 数据解析|Python XML Parsing
scrapy官方文档提供的常见使用问题
python笔记27-lxml.etree解析html
干了这碗汤,你也可以愉快地爬虫了
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券