我希望将一个巨大的XML文件拆分成更小的部分。我想浏览整个文件,寻找一个特定的标签,然后抓取和之间的所有信息,然后将其保存到一个文件中,然后继续浏览文件的其余部分。我的问题是试图找到一种清晰的方法来记录标记的开始和结束,这样我就可以在使用"for line in f“浏览文件时抓取其中的文本。
我不想使用标记变量。有没有一种巨蟒式的方法来完成这件事?
我正在将大量大型xml文件解析为python中的sqlite3数据库。据我所知,(尽管我非常开放并寻求更多的性能选项),更好的选项是sqlite3 3用于插入的executemany()函数。parse_document(path): This object keeps track of the current 'document' type element from a