“我要为”未来商店“超市的业务分析师开发一个软件,该软件对给定的超市销售交易的过渡数据进行关联规则挖掘,并通过编写Combo来准备折扣策略。该软件利用数据挖掘算法,即Apriori算法,将关联规则以用户友好的方式显示出来,以生成基于正关联规则的折扣策略。”
我可以从哪里获得超市数据集来检查我编写的Apriori算法?
发布于 2012-03-27 10:29:32
要获取市场数据集,您可以转到此处:fimi.ua.ac.be//并下载零售数据集。
这是一个来自比利时商店的匿名交易数据集。
它非常适合测试Apriori或其他频繁项集挖掘和关联规则挖掘算法。
发布于 2012-03-18 07:45:22
您应该为每个单元测试设计一个小的、特定的数据集,而不是寻找真实的数据集。数据集应该提供最小的必要前提来验证系统的单个功能。这将使其更容易检测错误,随着时间的推移维护测试,并向其他开发人员演示系统的功能和使用模式。
一个来自不同域的示例是对创建和验证网站登录的用户子系统进行测试。
addsNewUser
-空datasetthrowsExceptionForDuplicateUsername
-单用户datasetcorrectPasswordPasses
-相同datasetthrowsExceptionForIncorrectUsername
-相同datasetthrowsExceptionForIncorrectPassword
-相同datasetthrowsExceptionWhenNewUsernameExists
-两用户数据集更新:如果您需要一个非常大的数据集来执行集成或性能测试,那么您可能需要编写一个程序来生成一个随机的购买集合。我怀疑现有的超市是否愿意(或有能力)放弃他们真正的数据集。
话虽如此,多年前(HIPAA之前),当我作为一家医疗保险提供商的承包商工作时,我得到了一个样本数据集。它包含真实的患者信息,包括SSN和机密病历。:(
https://stackoverflow.com/questions/9754769
复制相似问题