首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >用于Apriori算法的超市数据集

用于Apriori算法的超市数据集
EN

Stack Overflow用户
提问于 2012-03-18 07:40:12
回答 2查看 13.7K关注 0票数 5

“我要为”未来商店“超市的业务分析师开发一个软件,该软件对给定的超市销售交易的过渡数据进行关联规则挖掘,并通过编写Combo来准备折扣策略。该软件利用数据挖掘算法,即Apriori算法,将关联规则以用户友好的方式显示出来,以生成基于正关联规则的折扣策略。”

我可以从哪里获得超市数据集来检查我编写的Apriori算法?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-03-27 10:29:32

要获取市场数据集,您可以转到此处:fimi.ua.ac.be//并下载零售数据集。

这是一个来自比利时商店的匿名交易数据集。

它非常适合测试Apriori或其他频繁项集挖掘和关联规则挖掘算法。

票数 7
EN

Stack Overflow用户

发布于 2012-03-18 07:45:22

您应该为每个单元测试设计一个小的、特定的数据集,而不是寻找真实的数据集。数据集应该提供最小的必要前提来验证系统的单个功能。这将使其更容易检测错误,随着时间的推移维护测试,并向其他开发人员演示系统的功能和使用模式。

一个来自不同域的示例是对创建和验证网站登录的用户子系统进行测试。

  • addsNewUser -空dataset
  • throwsExceptionForDuplicateUsername -单用户dataset
  • correctPasswordPasses -相同dataset
  • throwsExceptionForIncorrectUsername -相同dataset
  • throwsExceptionForIncorrectPassword -相同dataset
  • throwsExceptionWhenNewUsernameExists -两用户数据集

更新:如果您需要一个非常大的数据集来执行集成或性能测试,那么您可能需要编写一个程序来生成一个随机的购买集合。我怀疑现有的超市是否愿意(或有能力)放弃他们真正的数据集。

话虽如此,多年前(HIPAA之前),当我作为一家医疗保险提供商的承包商工作时,我得到了一个样本数据集。它包含真实的患者信息,包括SSN和机密病历。:(

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9754769

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档