首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >为Apriori算法准备XML数据

为Apriori算法准备XML数据
EN

Stack Overflow用户
提问于 2015-01-18 14:24:01
回答 1查看 63关注 0票数 0

通常,Apriori算法以矩阵的形式接收输入,如下所示:

代码语言:javascript
运行
复制
TID A B C D E
T1 1 1 1 0 0
T2 1 1 1 1 1
T3 1 0 1 1 0
T4 1 0 1 1 1
T5 1 1 1 1 0 

而我的输入是XML数据,其一般形式为:

代码语言:javascript
运行
复制
 <article key="tr/gte/TR-0263-08-94-165">
<author>Frank Manola</author>
<title>An Evaluation of Object-Oriented DBMS Developments: 1994 Edition.</title>
<journal>GTE Laboratories Incorporated</journal>
<volume>TR-0263-08-94-165</volume>
<month>August</month>
<year>1994</year>
</article>

如何将这些数据转换为算法可接受的合适格式?任何建议。

谢谢

EN

回答 1

Stack Overflow用户

发布于 2015-01-18 14:41:49

假设您正在使用Python,最好使用元素树XML解析器(包含在下面的文档中)。这允许您将XML数据解析为python字典,然后可以根据需要进行翻译。注意,如果您的XML数据文件非常大,使用iterparse可以很方便地避免大量的内存需求。

https://docs.python.org/2/library/xml.etree.elementtree.html

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28007702

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档