前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python xml解析记录

Python xml解析记录

作者头像
py3study
发布2020-01-10 12:35:21
1.1K0
发布2020-01-10 12:35:21
举报
文章被收录于专栏:python3

Python的xml解析方式自带的有3种,xml.dom.*、xml.sax.*以及xml.etree.ElementTree,相对来说,xml.etree.ElementTree最快捷方便。

因为自己只使用了xml.etree.ElementTree,所以下面就简单记录下xml.etree.ElementTree相关的东西。

基本读写

参考:http://blog.csdn.net/wklken/article/details/7603071

代码语言:javascript
复制
xmlTree = ElementTree.parse('a.xml')  #读入
	xmlNodeList = xmlTree.getiterator('Item')  #获取指定节点
	for node in xmlNodeList:
		print 'node.tag:%s' % node.tag  #节点名
		print 'node.text:%s' % node.text  #节点文字
		if node.attrib.has_key('attr_name'):  #节点attribute
			print 'node.attrib[%s]:%s' % ('attr_name',node.attrib['attr_name']))
			keyPath = node.attrib['attr_name']

xml内含有namespace的坑

如果xml文件有namespace的,ElementTree会修改namespace的名字,一般会改成ns0之类的,如果不希望被更改的话,这样玩:

代码语言:javascript
复制
XML_NS_NAME = 'my_ns'
XML_NS_VALUE = 'http://xxx'
ElementTree.register_namespace(XML_NS_NAME, XML_NS_VALUE)  #在parse之前调用

有namespace的时候,查找需要转换namespace,比如有个节点的attr是:my_ns:name,那么在ElementTree内部会解析成{http://xxx}name,所以查找的时候也需要用{http://xxx}name才能找到。

附一个转换函数:

代码语言:javascript
复制
#xml有namespace的转换成正常可解析的值  有则转换,没有则返回原值
def ParseNameSpace(src, nsName, nsValue):
	if src.find(nsName) != -1:
		dst = src.replace('%s:' % nsName, '{%s}' % nsValue)
		print 'ns src:%s dst:%s' % (src, dst)
		return dst

	return src
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/08/18 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 基本读写
  • xml内含有namespace的坑
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档