数据挖掘的九大定律

数据挖掘通用流程CRISP-DM的缔造者之一Tom Khabaza曾总结了在数据挖掘上的九大定律,如下所示:

(1)Business Goals Law:每个数据挖掘解决方案的根源都是有商业目的的。

(2)Business Knowledge Law:数据挖掘过程的每一步都需要以商业信息为中心。

(3)Data Preparation Law:数据挖掘过程前期的数据准备工作要超过整个过程的一半。

(4)NFL Law:NFL(没有免费午餐,No Free Lunch)。对于数据挖掘者来说没有免费的午餐,数据挖掘的任何一个过程都是来之不易的。

(5)Watkins’ Law:此定律以此命名是因为David Watkins首次提出这个概念。这个定律说的是在数据的世界里,总是有模式可循的。您找不到规律不是因为规律不存在,而是因为您还没有发现它。

(6)Insight Law:数据挖掘可以把商业领域的信息放大。

(7)Prediction Law:预测可以为我们增加信息。

(8)Value Law:数据挖掘模式的精准和稳定并不决定数据挖掘过程的价值,换句话说技术手段再精妙,没有商业意义和合适的商业应用是没有价值的。

(9)Law of Change:所有的模式都会变化。

上面这九条其实归根到底就是一条,商业决定数据挖掘。数据挖掘各类技术和算法的飞速发展不能让我们偏离以商业行为为核心的方向,只是纯粹为了追求高深的技术而忽略或损害到商业目的,就本末倒置了。

原文发布于微信公众号 - 数据的力量(shujudeliliang)

原文发表时间:2014-09-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SDNLAB

AD-WAN 2.0:只做最懂应用的广域网

在云计算、大数据、物联网和移动互联网等技术快速发展的背景下,业务和应用对网络的要求在不断提高,网络的“云化”趋势不可阻挡。随着SDN在业界逐渐生根发芽、落地实践...

2879
来自专栏程序员笔记

概念化游戏

1756
来自专栏Java帮帮-微信公众号-技术文章全总结

【大牛经验】入行Java的一些真实感受

声明:本文只是我的个人经验之谈,或者连经验之谈都算不上,因为我觉得自己还是个新手,没有什么经验可谈,就算是我分享一下自己从开始学习Java到现在的一些心路历程吧...

1681
来自专栏大数据文摘

谷歌欲自建量子计算机

633
来自专栏程序员笔记

首先要有个想法

1276
来自专栏企鹅号快讯

学Java有什么好方法?刻苦学技术让我最终成为自信的码农

我上大学的时候就时常听到关于程序员的一些趣闻,可能是因为专业的原因吧,因为我的很多学长毕业后也在往程序员的方向发展,所以我平时也经常关注这方面的事情。当然最重要...

1966
来自专栏大数据文摘

大数据助力发现阿尔茨海默症的最早征兆

1806
来自专栏鹅厂网事

架构师的四种兵器

鹅厂网事”由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网...

2218
来自专栏AI科技大本营的专栏

数据科学中的 R、Python 和 Julia —— 机器学习的学习随想 02

1. 我认为 R,Python 和 Julia 是机器学习和数据科学中三个最重要的语言。任何人如果想在这个领域有所发展,长远来说这三种语言都需要掌握。 2. ...

3438
来自专栏帮你学MatLab

《思考的艺术》读书笔记(一)

要想掌握思考的艺术,首先要了解思考,思考是能够指挥的心理活动,不同于做梦。既然能够指挥,就希望能够通过努力获得最大收益,如何才能持续有效的获得收益,书中给出很多...

2777

扫码关注云+社区