文章/答案/技术大牛

发布

问为Apriori算法准备XML数据
EN

Stack Overflow用户

提问于 2015-01-18 14:24:01

回答 1查看 63关注 0票数 0

通常，Apriori算法以矩阵的形式接收输入，如下所示：

TID A B C D E
T1 1 1 1 0 0
T2 1 1 1 1 1
T3 1 0 1 1 0
T4 1 0 1 1 1
T5 1 1 1 1 0

而我的输入是XML数据，其一般形式为：

 <article key="tr/gte/TR-0263-08-94-165">
<author>Frank Manola</author>
<title>An Evaluation of Object-Oriented DBMS Developments: 1994 Edition.</title>
<journal>GTE Laboratories Incorporated</journal>
<volume>TR-0263-08-94-165</volume>
<month>August</month>
<year>1994</year>
</article>

如何将这些数据转换为算法可接受的合适格式？任何建议。

谢谢

xml

algorithm

mapping

apriori

回答 1

Stack Overflow用户

发布于 2015-01-18 14:41:49

假设您正在使用Python，最好使用元素树XML解析器(包含在下面的文档中)。这允许您将XML数据解析为python字典，然后可以根据需要进行翻译。注意，如果您的XML数据文件非常大，使用iterparse可以很方便地避免大量的内存需求。

https://docs.python.org/2/library/xml.etree.elementtree.html

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/28007702

复制

相似问题

问为Apriori算法准备XML数据
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为Apriori算法准备XML数据EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问为Apriori算法准备XML数据
EN