专栏首页数据中台大数据是啥,可以吃的吗?
原创

大数据是啥,可以吃的吗?

作者|影姿

关于大数据是什么,从一开始仅仅只想做数据,到开始意识到自己做的是对整个集团有核心意义的数据产品,再到走到外面,把数据能力对外输出,所有过程中,不断的有客户问到这个问题,有懵懂的、有善意的、也有挑衅的、不屑的。就像大数据本身一样,混乱又带有迷幻色彩。

现在对大数据的理解有两种极端:站在大数据的风口,很多人觉得大数据是未来,可以解决所有问题,包括人工智能;我自己不用想,大数据已经替我想好决定好一切了;还有一种,是大数据的概念炒了好几年,冷饭都抄成锅巴了,但是尝试过人的只收集齐了几万点伤害,觉得大数据不过如此

大数据并不一定要数据达到了多少体量才能算是大数据,但是如果数据简单量少到只需要用xlsx、SPSS等传统数据处理就能解决,就不需要再用大数据技术,有点杀鸡用牛刀的感觉。但大数据应用一定并不仅仅指分析,跳出传统数据分析的范畴,大数据应用领域可以指导使用在我们所有的生活工作业务、场景领域,例如个性化推荐、精准营销、风险监控等。

这几年多多少少沉淀下来的经验,和老板时谦虚时叫板时被骂总结到的体会,加上偶尔抽筋想增加修养磕磕绊绊看的书,有几点关于大数据的基本特征可以和大家探讨:

一、非竞争性

现在很多企业,对数据的保护是非常严格的,大家都觉得自己的数据很有价值,不能随便给别人使用。曾经有一度,我在做数据联盟的时候(这个可以以后另开一篇文章讲),每次和客户聊,都想传达一个概念,数据如果是一种资源,那也是可以被众多消耗方同时使用和反复使用的资源,个体的使用不会妨碍他人的使用。数据只有越被使用才能积累数据的应用价值(当然裸数据直接售卖的方式不在我所讨论的大数据应用范畴)。

二、价值无定值

延续上面说的,裸数据直接售卖,在我们积累了大量的数据应用实践经验之后再回过头来看,是觉得非常可笑的,所有想对某个数据字段定价,然后公开买卖的,都是短时和自绝的行为(个人观点,不要动砖头)。数据就像是无形资产一样,市场估值取决于买者对该项数据的需要程度,合适的数据服务应用于某个客户产品,产生的作用千差万别,硬要给某个数据定一个价,只能让数据贬值或让高买者对大数据产生不信任。但是并不是说数据是无价的,数据一定要有一个价值,然后让它流动应用起来,不断调整迭代到合适的附加值,聪明的数据应用者会最大程度利用具有真正附加值的应用模式创造财富。

三、会问问题

没有能够自动从大数据中获取经济价值的方式,没有捷径和想当然,我反对所有说只要有大数据就什么也不需要干了的说法。企业单纯的存储数据没有什么用处,而存储什么,清除什么,业内可以选择的高端技术都已经准备好静待选择。现在对于一家企业来说:前瞻性的深入理解哪些数据值得首先存储和处理,是第一要务。

大数据只提供答案,但它对该问的问题保持缄默,这些问题来自负责人的智慧,提出怎样的问题视关键!就像柏拉图说的那样:最终获胜的将是那些“知道如何提出问题的人”,只有那些知道怎么样提出问题的人才知道,哪些数据可能会回答问题,如何用这些数据回答问题。

大数据行业里最缺乏或者将来身价最高的人,就是既理解业务,又了解数据,知道怎么提出业务的问题,也知道怎么用大数据解答问题的大数据专家(打个广告:欢迎来数澜应聘产品经理提升身价)

大数据技术提供了高端快速的尖端技术,使得大数据处理技术能够日行千里。但是如果不选择正确有效的方向,反而累加为错误支付的成本。在大数据时代,一个正确的方向,正确的提问,正确的思路,比高精尖的科学技术、海量实时的模型算法更重要。

四、数据要有活性

长话短说,数据有保质期,需要不断更新,没有任何数据是一尘不变的,数据如果不更新,就像死水一样,所以如果有数据,就要赶紧用起来,存着又不知道该怎么用,存久了价值就指数下降了。

五、不直接售卖

也许大家觉得直接售卖现在也形成产业链了,看起来也是一种新模式了,我只想说说直接售卖的弊端:

(1)数据本身没有确切的定价,过早定价会降低溢价空间;

(2)售卖的方式无法形成技术壁垒(今天讨论的是大数据商业应用领域,科学研究是另一个话题),购买的数据可以再次低价售卖,形成恶性循环做低数据价值;

(3)数据安全问题,个体数据无法通过直接售卖的方式进行应用,但个体数据是非常值得研究和应用的数据内容,需要寻找一种安全脱敏合法的方式,将大数据反哺便利用户日常生活。

六、相关性而非因果性

中国人传统的理念讲因果,因此“大数据在乎相关性而非因果性”这个观念从国外传来时还是很颠覆的,不过大数据因为其强大的“广泛数据都可计算”特性,使得不需要再探究因果,根据现有充足海量的数据就可以做出分析或预测。但是关于这个特征是不是还要再颠覆一次,搞清楚因果,我还在实践中,也欢迎有体会的朋友们抛砖。

文章推荐:

行竹漫谈 当餐饮遇上大数据,嗯真香!

大数据时代,我们为什么要用Hadoop?

几个关键词,带你入门大数据

大企业都在用的“大数据赋能”,传统企业该怎么入门?

什么是数据资产?

数据中台案例 | 数字化为零售行业创造新可能

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 图文简述flume的巨大用途

    谈到大数据,我们很常会想到hdfs、mapreduce、hbase、spark、hive等高大上的大数据工具或底层组件,但我们不能忘了饮水思源,...

    希望的田野
  • 浅谈数据治理、数据管理、数据资源与数据资产管理内涵及差异点(建议收藏)

    随着信息技术的不断涌现和普及,业务发展加快了数据膨胀的速度,行业内衍生了较多的新名词,如数据治理、数据管理、数据资源管理、数据资产管理等名词的定义很多,概念容易...

    木东居士
  • 今儿聊一聊Mysql的性能优化

    没有特殊要求(即Innodb无法满足的功能如:列存储,存储空间数据等)的情况下,所有表必须使用Innodb存储引擎(mysql5.5之前默认使用Myisam,5...

    程序员小明
  • 图文简述MapReduce(一)

    提到大数据,其实最核心的在于计算,像双11实时统计交易量、智慧交通实时统计拥堵指数,这些离不开高并发计算。经常我们在听到mapreduce、以及...

    希望的田野
  • 图文简述HBase的用途(一)

    我们平常在存储数据时,会想到用Mysql关系型数据库、大硬盘文档存储等。但是,面临互联网自媒体时代的出现,采用Mysql来存储微信类评论数据、零...

    希望的田野
  • Flink 编程接口

    现实世界中,所有的数据都是以流式的形态产生的,不管是哪里产生的数据,在产生的过程中都是一条条地生成,最后经过了存储和转换处理,形成了各种类型的数据集。

    kk大数据
  • HBase的部署

    本文的HBase安装是在Hadoop已经安装好的基础上实现的,所以之前要导出JAVA_HOME、HADOOP_HOME( 单机模式不需要,伪分布式模式和分布式模...

    羊羽shine
  • GEO数据库挖掘(1)--SCI文章速成

    最近这段时间,相信好多人都在忙着写国自然标书,一晃2019年的2月份已经过去,今年只剩下10个月了,留给我们的时间不多啦(像不像导师或者主任开会时的讲话啊

    用户6317549
  • 用AI构筑信任的「生命线」

    只有机器敏锐地捕捉到了这一切,只见每个订单的风险分都在上升,系统亮起鲜红色的警示,当机立断拦截了这一地址下的订单,冻结「用户」的消费金额,一次别有预谋的黑产行动...

    机器之心
  • 用案例讲讲方案演讲技巧

    今天参加了一个省级云计算、大数据的联盟会议,感觉通过会议对方案的演讲技巧有相当大的冲击理解。其中,来自某省级大学的博士生导师、教授为大家讲了5G...

    希望的田野

扫码关注云+社区

领取腾讯云代金券