数据挖掘的九大定律

数据挖掘通用流程CRISP-DM的缔造者之一Tom Khabaza曾总结了在数据挖掘上的九大定律,如下所示:

(1)Business Goals Law:每个数据挖掘解决方案的根源都是有商业目的的。

(2)Business Knowledge Law:数据挖掘过程的每一步都需要以商业信息为中心。

(3)Data Preparation Law:数据挖掘过程前期的数据准备工作要超过整个过程的一半。

(4)NFL Law:NFL(没有免费午餐,No Free Lunch)。对于数据挖掘者来说没有免费的午餐,数据挖掘的任何一个过程都是来之不易的。

(5)Watkins’ Law:此定律以此命名是因为David Watkins首次提出这个概念。这个定律说的是在数据的世界里,总是有模式可循的。您找不到规律不是因为规律不存在,而是因为您还没有发现它。

(6)Insight Law:数据挖掘可以把商业领域的信息放大。

(7)Prediction Law:预测可以为我们增加信息。

(8)Value Law:数据挖掘模式的精准和稳定并不决定数据挖掘过程的价值,换句话说技术手段再精妙,没有商业意义和合适的商业应用是没有价值的。

(9)Law of Change:所有的模式都会变化。

上面这九条其实归根到底就是一条,商业决定数据挖掘。数据挖掘各类技术和算法的飞速发展不能让我们偏离以商业行为为核心的方向,只是纯粹为了追求高深的技术而忽略或损害到商业目的,就本末倒置了。

原文发布于微信公众号 - 数据的力量(shujudeliliang)

原文发表时间:2014-09-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

扫码关注云+社区