前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据的误导

大数据的误导

作者头像
刀刀老高
发布2018-04-11 11:14:22
4600
发布2018-04-11 11:14:22
举报
文章被收录于专栏:奇点大数据

大数据火了这么多年了,还是有不少朋友会跟我讨论,“你说大数据多大算大?”

有这样困惑的朋友可能还不少,而且大多集中在刚刚入行的朋友里。这就是“大数据”一词天然给我们带来的坑。再加上行业里动辄宣传和鼓吹Google、Facebook的机房有多大,存量有多大。就更容易让我们认为,必须数据量超级大才算大数据入了门,才算“大”数据。不过我的看法不尽相同。

认为数据很多才算大才有价值,就好比饭多了才好吃,音乐声音大才好听一样经不起推敲,是不是?

我们想一想,我们做大数据的目的究竟是什么呢?尤其是作为商业用途来说?那无非是为了多赚钱或者多省钱,不论是直接的还是间接的。一旦脱离开这些,谁来买单?谁来背成本?

Google和Facebook这样的公司搞大规模系统的目的也不是为了炫富,而是他们确实数据量膨胀到一定程度了,不得不使用一些我们平时应用场景里不多见的技术而已,所以“这些技术一定是大数据的必备条件”就自然变成了误导我们的信息。作为挑战尖端科技和中国这种人口基数的互联网公司的客观需求,研究超大规模架构集群技术是个方向而且绝对正确,但中小型公司我肯定是不建议盲目地邯郸学步的。

中小型公司需要大数据吗?答案是肯定的,不仅需要,而且非常需要。中小型公司要用大数据干什么?这种需求多少年来一直没有变过,还是刚刚说的要么多赚钱要么多省钱。多赚钱多省钱的途径在数据运营中最常见的就是指标管理,再有就是诸如财务分析、人力成本分析、工作效率及成果分析等。这些东西在我们日常生产生活中占了绝大多数的数据应用场景。对这些对象研究明白了就已经能解决大部分运营问题了。如果还想搞得深一些怎么弄?再把参考维度的数据增多就可以了,比如刚刚这些数据指标是否和气候变化有关?是否和地理位置有关?是否和大气污染程度有关?是否跟当前热播的电视剧有关?是否跟短时间内网上的一个热词有关?是否跟交通状况有关?是否跟人们使用的上网设备有关等等。这些数据的引入不需要搞得非常多,只要相互结合有效且丰富适度,就有得挖掘。甚至指标自身前后是否彼此有影响规律,也是个值得研究的课题。

在数据挖掘应用中有随机森林等算法就是尝试帮人们来寻找多彩多样的维度之间的联系的,在今后的文章中我们会逐一分享。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2015-12-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 奇点 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档