数据挖掘是“神马”

关于数据挖掘的作用,Berry and Linoff的定义尽管有些言过其实,但清晰的描述了数据挖掘的作用。“分析报告给你后见之明 (hindsight);统计分析给你先机 (foresight);数据挖掘给你洞察力 (insight)”。

举个例子说。

你看到孙悟空跟二郎神打仗,然后写了个分析报告,说孙悟空在柔韧性上优势明显,二郎神在力气上出类拔萃,所以刚开始不相上下;结果两个人跑到竹林里,在竹子上面打,孙悟空的优势发挥出来,所以孙悟空赢了。这叫分析报告。

孙悟空要跟二郎神打架了,有个赌徒找你预测。你做了个统计,发现两人斗争4567次,其中孙悟空赢3456次。另外,孙悟空斗牛魔王,胜率是89%,二郎神斗牛魔王胜率是71%。你得出趋势是孙悟空赢。因为你假设了这次胜利跟历史的关系,根据经验作了一个假设。这叫统计分析。

你什么都没做,让计算机自己做关联分析,自动找到了出身、教育、经验、单身四个因素。得出结论是孙悟空赢。计算机通过分析发现贫苦出身的孩子一般比皇亲国戚功夫练得刻苦;打架经验丰富的人因为擅长利用环境而机会更多;在都遇得到明师的情况下,贫苦出身的孩子功夫可能会高些;单身的人功夫总比同样环境非单身的高。孙悟空遇到的名师不亚于二郎神,而打架经验绝对丰富,并且单身,所以这次打头,孙悟空赢。这叫数据挖掘。

数据挖掘跟LOAP的区别在于它没有假设,让计算机找出这种背后的关系,而这种关系可能是你所想得到的,也可能是所想不到的。比如数据挖掘找出的结果发现在2亿条打斗记录中,姓孙的跟姓杨的打,总是姓孙的胜利,孙悟空姓孙,所以,悟空胜利。

用在现实中,我们举个例子来说,做OLAP分析,我们找找哪些人总是不及时向电信运营商缴钱,一般会分析收入低的人往往会缴费不及时。通过分析,发现不及时缴钱的穷人占71%。而数据挖掘则不同,它自己去分析原因。原因可能是,家住在五环以外的人,不及时缴钱。这些结论对推进工作有很深的价值,比如在五环外作市场调研,发现需要建立更多的合作渠道以方便缴费。这是数据挖掘的价值。

1、数据挖掘需要‘神马样’的流程?

2、哥,有没有详细点的,来个给力的!

3、数据挖掘在商业上的理解是?

4、数据在统计意义上有哪些类型?

5、他们的含义是什么呢?

6、基本的探测指标有哪些?

7、数据挖掘的算法有哪些呢?

8、需要掌握的工具有哪些?

9、知道这些工具不知道如何在工作中用呀?有没有‘浮云’般的角度?

10、结果如何可视化的展现?

11、还有没有更人性化、智能化的展现?

12、上面这图看起来很给力,背后很复杂吧?

13、职业的发展道路如何?

14、我的性格适合吗?(有志者,事竟成)

15、都说这行很累?NO! 懂得生活。。。。

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2013-12-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【AI 引擎】谷歌押注虚拟现实 | 腾讯神眼发布

1.谷歌押注虚拟现实业务 任命产品副总裁专注VR ? 据科技博客TechCrunch报道,谷歌正在加倍押注虚拟现实技术,其产品管理副总裁克雷·巴沃尔(Clay ...

35270
来自专栏人工智能快报

谷歌将在2019年终止与国防部的人工智能项目合作

谷歌将在2019年后终止其与五角大楼人工智能项目Maven的合作。Maven项目寻求利用人工智能技术来提高军用无人机识别物体的能力。

13220
来自专栏Python专栏

认真做事,是改变自己的最短路径

国庆七天回来,很多人都会不太适应,放了七天人都不知道去哪了。休息七天后突然上班,不巧的话第一天就要上强度,肯定是会有点不舒服的。

7510
来自专栏大数据

以大数据之名,变身!——In big data we trust

先关注一则旧闻11月20日,德国联邦网络局禁止在该国销售儿童智能手表,穿戴设备的麦克风,可让家长听到孩子的环境,涉嫌侵犯他人隐私。另10月,挪威消费者理事会在报...

21060
来自专栏华章科技

创业公司讲故事的七宗死罪

想象一下这样一个画面,你已经预定了一辆出租车,可是到现在连个鬼影都没出现,打电话去询问的时候接线员只是不耐烦地说,“他十五分钟以后就到”。十五分钟过去了,你还得...

9750
来自专栏企鹅号快讯

微信小程序小店+场景居然让营业额爆增2818%

微信小程序的热度无论是传统电商还是说资本市场热度越来越高,微信小程序自2017年1月9日上线以来已经上线了97项功能。第一批入驻微信小程序的企业无论是名企还是个...

35790
来自专栏镁客网

HTC推移动VR专利,搭载磁性保护盒 | 热点

11140
来自专栏智能算法

有胆看吗?AI首度参与编剧的恐怖片

科技讯7月29日消息,据国外媒体报道,一部名为《不可能的事》的独立恐怖片被标榜为首部由人工智能联合编剧的电影故事片。制片方表示,电影编剧中采用的AI工具历经了...

36750
来自专栏机器人网

人工智能与机器人将带给我们怎样的未来?

随着自动驾驶车与人工智能技术快速进展,机器人是否会大规模地取代人力,导致工作机会减少?针对这个问题,Google CEO Larry Page建议,通过适当地分...

34290
来自专栏顶级程序员

深度揭秘!暴利游戏外挂后面的黑色产业链

由公安部挂牌督办,一起特大“吃鸡”外挂案件被破获。警方一举捣毁6个国内的游戏点卡以及充值产品的在线交易平台,抓获犯罪嫌疑人15名,涉案金额高达3000多万元,真...

20230

扫码关注云+社区

领取腾讯云代金券