海量数据, 为何总是 "海量垃圾" ?!

2017.9.10, 深圳, Ken Fang

雷军说:我拥有海量的数据, 却不知道怎么用?每年, 花在存储海量数据的费用, 也是海量;足以使企业破产⋯ 为何会如此?

当我们将所谓 “海量数据分析” 的神秘面纱给揭开时, 打破 “海量数据分析” 的神话, 就会很容易的明白, 真正的问题到底出在哪?为何谷歌能做到的, 我们却做不到?

大家都明白的 Common Sense: 做海量数据分析, 要先能建立数据模型;有了数据模型, 我们才能从 “海量” 数据中, 去提炼出 “有用” 的数据。 海量数据分析最关键、最重要的ㄧ步:将海量数据 “转换” 为有用的数据。

而数据模型建立的前提是: @ 要能先分析出, 产生数据背后的 “用户的目的” 。例如:用户是基于什么样的社会事件?天灾?人祸?的触发, 而生成数据的。 @ 所采集到的数据, 从 “时间” 的纬度, 必需是要有 “延续性” 的。

所以⋯ @ 当我们所拥有的数据, 虽然是海量, 但, 我们却不知道, 这些数据是为何而产生的?更糟糕的是, 数据之间, 完全没办法, 经由 “时间”, 而归纳出 “人类行为的模式”。 这样的数据, 再如何的 “海量”, 也根本没法经由 “数据分析师”, 使用任何的数据分析工具, 建立出任何有效的数据模型;海量数据将永远没办法转换为有用的数据。

为什么谷歌能做得到? 因为, 谷歌有 “搜索引擎”⋯

“搜索引擎” 使得谷歌能⋯ @ 分析出产生海量数据, 其背后的用户的目的。 @ 能采集到随着 “时间” 的演进, 而持续生成的数据;人类的行为数据。

这也就是为什么:谷歌可以早ㄧ步的就能 “精准” 的预知到, 某种流行病, 接下来会在美国的那一州流行。

所以, 别再采集, 更别再存储: “海量”、“没目的”、“没意义”、“不持续性” 的数据了⋯

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

企业大数据分析:2014年值得期待的大趋势

【摘要】据国外媒体报道,据市场研究公司idc预测,2015年大数据市场规模将从2010年的32亿美元增长到170亿美元,复合年增长率为40%。大数据是一个庞大的...

1809
来自专栏互联网数据官iCDO

【互联网数据官】神策数据宣布完成4400万美元C轮投资

2018 年 4 月 11 日,神策数据(Sensors Data),在京举行融资发布会并宣布获得4400万美元C 轮融资,由华平投资领投,红杉资本中国基金、D...

2838
来自专栏腾讯研究院的专栏

董俊峰:大数据是重塑金融竞争格局的重要支撑

  12月18日,由新华网和中国科学院《互联网周刊》联合主办的2014中国互联网经济年会金融分论坛在北京JW万豪酒店隆重举办。来自互联网金融界的行业协会、知名专...

1849
来自专栏新闻即时

企业研发管理解决方案公司 ONES宣布已经完成A+轮600万美元融资

企业研发管理解决方案公司ONES宣布已经完成A+轮600万美元融资。本轮融资为华创资本领投,晨兴创投跟投。据悉,本轮融资将加速ONES产品研发和客户...

1866
来自专栏镁客网

深选科技朱岱:基于算法做工业大脑,让设备更聪明 | 镁客请讲

朱岱眼中,在智能制造2025等口号的带动下,缺少算法软件的工业设备还是不够“聪明”,而这是算法科学家可以大展身手的领域。

905
来自专栏数据猿

【案例】某物流集团:用数据驱动企业数字化转型

【数据猿导读】数据驱动的数字化转型是一个体系化工作,需要从理论体系、平台工具、数据、组织、机制五个方面,着手,建一个企业级的数据资产平台,梳理清晰整个集团的数据...

952
来自专栏技巅

传统企业打造互联网技术团队

1415
来自专栏人工智能

2018 年,聊天机器人将颠覆企业

编者按:2017 年,企业在聊天机器人的应用方面并未达到之前预测的程度,可以说,2017 年对于聊天机器人来说是失败的一年。本文作者 Farzin Shahid...

2160
来自专栏达观数据

达观数据携手天善智能共撰新作,探寻《数据实践之美》

数据科学 人类探索世界的新工具 未来,是一个数据服务的时代。 数据科学作为探索数据世界奥秘的工具正在逐步被人类像材料学一样掌握,数据思维、数据治理、数据分析与...

34513
来自专栏云计算D1net

2017年五大关键云趋势:容器、AI等

不可否认,云计算已经改变了大小型企业的运营模式。 一项来自思科的最新市场分析表明,未来5年内全球云IP流量将以2015年至2020年间30%的年复合增长率增长,...

3375

扫码关注云+社区