我正在尝试用有文本的节点解析一个XML文档,然后声明一个子节点,然后有更多的文本。例如,以下XML中的第二个"post“元素:
<?xml version="1.0"?>
<data>
<post>
this is some text
</post>
<post>
here is some more text
<quote> and a nested node </quote>
and more te
我对ElementTree.iter()有一个问题。
所以我在这个链接中尝试了这个例子:
下面是我尝试过的方法:
import elementtree.ElementTree as ET
tree = ET.parse('XML_file.xml')
root = tree.getroot()
for elem in tree.iter():
print elem.tag, elem.attrib
我得到了这个错误AttributeError: ElementTree实例没有属性'iter‘
附加信息:我的Python版本是2.4,我单独安装了elementtr
在使用标准Python库中的ElementTree模块解析简单的超文本标记语言时,我遇到了一些问题。这是我的源代码:
from urllib.request import urlopen
from xml.etree.ElementTree import ElementTree
import sys
def main():
site = urlopen("http://1gabba.in/genre/hardstyle")
try:
html = site.read().decode('utf-8')
xml
我试图删除xml文件中的所有子标记,同时保持父标记不变。我已经尝试过循环遍历元素来创建列表并以这种方式删除它们,但是元素树模块不喜欢这样。
import xml.etree.ElementTree as ET
tree = ET.parse("myfile")
root = tree.getroot()
for parent in root.find('parent'):
child = parent.findall('child')
#print(len(child))
root.remove(child)
我有一个XML字符串
xml_str = '<Foo><Bar>burp</Bar></Foo>'
我正在用xml etree解析它
import xml.etree.ElementTree as ET
root_element = ET.fromstring(xml_str)
这将创建一个Element对象(Root_element),其中包含标签、尾部、文本和属性值。我可以在调试时看到所有的代码。但是,我在调试时看不到任何子元素。我知道孩子在那里,因为我可以在for循环中访问它们。
for child in root_elem
我试图用将一个HTML表解析为python (2.7)。当我尝试使用字符串的前两种方法之一时(如示例中所示),它的工作原理非常完美。但是,当我试图在etree.xml页面上使用urlib时,我会得到一个错误。我检查了每一个解决方案,我传递的变量也是str。关于下列代码:
from lxml import etree
import urllib
yearurl="http://www.boxofficemojo.com/yearly/chart/?yr=2014&p=.htm"
s=urllib.urlopen(yearurl).read()
print type (s)
我试图解析一个XML文档,以便只获取标记中的文本,但是当我测试-打印节点时,它只显示方括号,这意味着我的命令print(rede.text)返回"AttributeError:'list‘object没有属性' text '“。为什么XML内容存储为list对象,以及我如何访问标记中的文本?
import os
from xml.etree import ElementTree
file_name = '19008-data.xml'
full_file = os.path.abspath(os.path.join('WP19_Proto
我正在解析位于以下链接的XML:
我需要访问节点内部的数据,我编写的程序似乎告诉我,节点内部什么都没有。这是我的代码:
import urllib
import xml.etree.ElementTree as ET
#prompt for link where xml data resides
#Use this link for testing: http://python-data.dr-chuck.net/comments_42.xml
url = raw_input('Enter URL Link: ')
#open url and prep for pars
码
运行以下代码时,我无法将输出保存为xml文件,因为我得到了以下错误AttributeError:'ElementTree‘对象没有属性’tag‘(在回溯中)。关于SO有一个类似的命名问题,但我不认为它与我的问题相关,因为它与根节点的解析有关,而不是保存。
码
import xml.etree.ElementTree as ET
print('\n'*5)
xmlfile = 'widget.XML'
tree = ET.parse(xmlfile)
root = tree.getroot()
#ET.dump(tree)# prints the
请告诉我怎么做?我想接收所有孩子"alarmTime“的文本和标签。但是,我得到了一个错误。如何分配属性‘列表’?或者告诉我如何避免这个错误。
我的代码是:
import xml.etree.ElementTree as ET
tree = ET.parse('sample.xml')
root = tree.getroot()
for elem in root.iter(tag ='alarmTime'):
data = elem.getchildren()
print(data.text)
错误是:
AttributeEr
我有以下问题,试图从python中的一堆xml文件中获取信息。我没有做什么特别的事(如:
import xml.etree.ElementTree as ET
root = ET.parse(r'C:\Documents\XMLfolder\file.xml').getroot()
info = root.find('foo').find('bar').find('info').text
这适用于我拥有的大多数信息--但xml的一个部分采用以下格式:
<bar>
<info id="1">
我对Python的编码非常陌生,有一个问题我已经尝试了好几个小时了:
为了执行文本挖掘项目,我需要解析1600+ xml文件(0000.xml、0001.xml等)。
但是,当我有以下代码时,出现了一个错误:
from os import listdir, path
import xml.etree.ElementTree as ET
mypath = '../project/content'
files = [f for f in listdir(mypath) if f.endswith('.xml')]
for file in files:
我在用python 3.5
为了从word文档中提取文本内容,我使用了xml.etree.ElementTree。我无法将生成的XML内容写入其他文件。
下面是我的代码
import zipfile
import xml.etree.ElementTree
with zipfile.ZipFile('<path to docx file>') as docx:
tree = xml.etree.ElementTree.XML(docx.read('word/document.xml'))
我尝试过两种方法:tree.write('&l
我正在读取一个xml文件,并希望对节点的内容执行字符串操作。
import os
import elementtree.ElementTree as ET
from xml.etree.ElementTree import ElementTree
from xml.etree.ElementTree import tostring
xml_file = os.path.abspath(__file__)
xml_file = os.path.dirname(xml_file)
xml_file = os.path.join(xml_file, "Small1Review.xml
因此,我试图使用python来表示XML文件。我已经做到了。但是我的树中的每个子节点必须是双连接的,我不知道该如何做。我在网上找到了一些代码示例,但它们都使用类,教授不希望我们使用类。这是我的密码:
from xml.etree.ElementTree import ElementTree
from xml.etree.ElementTree import Element
import xml.etree.ElementTree as etree
def create_tree(): #This function creates the root element of my tree
我的代码是:
import xml.etree.ElementTree as ET
from lxml import etree
var1 = '<name>This is my text</name>'
page = etree.Element('first')
doc = etree.ElementTree(page)
second = etree.SubElement(page, 'second')
second.text = var1
doc.write('a.xml', xml_declarati