阿里车品觉:大数据时代的若干新思考

大数据究竟是什么?大数据未来将走向何妨?美好的大数据理想与现实之间还有多少距离?目前实践了些什么?遇到哪些困难?这些问题值得我们去思考。为此,阿里巴巴数据委员会联合阿里研究院《阿里商业评论》举办了一场大数据思想沙龙。邀请多位在商业世界数据第一线的实战领军人物,就以上问题展开深入的探讨。

车品觉,《决战大数据》作者、阿里巴巴集团副总裁、数据委员会会长。

不同状态的企业,对于数据的关注点不同

我们要非常注意企业所处的状态,包括企业状态和数据状态。一个企业处在不同的状态之下,对于数据的关注点是不同的。例如,目前的阿里巴巴,业务量大,数据多而杂,所以我特别希望从数据里产生出它的价值。而对于数据比较小一点的公司,由于还没有这么多数据,所以短期内不用担心这个问题。

我过去两个月不断的面试了很多人,往往我第一个问题就问他们什么是大数据?基本上,每个人的看法都不一样,而且很多人都来自很大的公司,但是也没有得出结论。目前,很多公司的BI好像还没到大数据的阶段,而只是找到应用数据的一个方法而已。

所以,当已经有海量数据,在这个海量数据中心里面寻找一些有价值的东西出来,这可能是大数据。记得马总曾说过:凡是已知某种关系,运用这个关系数据计算一个东西出来,或者找出一个规律出来,这不是大数据;凡是不知道某种关系,但是刚刚找到这种关系,并且运用这种关系能产生出额外价值的时候,这就是大数据。而如果这种大数据已经找到了,它逐渐也就不是大数据了,你要再寻找跨界的其他的数据出来。当能让这个数据产生新的价值的时候,就又找到了大数据。

当数据广度足够,问题更加简单

过去,很多机构数据不够广度,所以要用很复杂的算法才能得出想要的结论。今天,如果数据广度足够,很多时候就根本没有必要复杂计算了。例如,以前有人通过复杂的达人模型算法得出某用户是牛仔裤达人,但如果能够拿到他的微博数据,那么其实很容易就可以得出该结论的。

所以,以前的数据挖掘跟今天的数据挖掘将有很大差别的。也就是说,当一家公司的使命是将来想做一个大数据公司的话,可能要准备一些一手数据。当然,公司的收购策略,或者数据战略,不是一般的产品人能去影响的。但是,当数据的材料可以影响到没有这么复杂的算法还能实现业务,你就可以这样去做。

未来,BI部门像无人看管的汽车

前一段,我们将阿里巴巴的BI 部门改名为数据技术与产品部。整个部门不叫BI部门了,但仍有一个BI二级部门存在。未来,我想象中的BI部门可能会走向这个方向:它像一个无人看管的汽车,没有具体的小二负责,但可以走出正确的道路。当然,这不是在所有场景都能够实现,而是要先选择一些好的场景来实现。在这个场景中,数据、模型能像汽车一样自己走出来。

目前,淘宝BI数据已经尝试走向这条路了,未来怎么样可以做到像没有驾驶员的汽车一样自己找到出路,仍需要不断实践。

大数据在很多方面仍面临考验

很多公司高管会问:你拿着大数据,你能不能从数据里面进行拔高,把数据抽出来,真正找出问题?能不能从数据中直接告诉我今天到底发生了什么问题?能不能比我具有丰富经验的小二厉害?否则,老是讲数据很厉害,我感受不到。这其实代表了业务方的期望。其实,现阶段,很多事情大数据还是做不到,在很多地方还是不能经得起考验,所以,在很多人心目中,大数据可能还没到那回事。我们需要正视。

数据要“用”,还要“养”

从“用”和“养”的观点来讲,目前很多公司已经走在“养”的路上。例如,我们说高德是一家数据公司,因为它非常注重数据的“养”。

大数据转型革新时期,BI分析师更容易适应转型

凡是BI人员,肯定是很精通数据业务的。所以当做数据挖掘或很多其他数据工作的时候,他肯定会比其他人做的更好。当一个公司转型做数据业务时,分析师是一个非常容易转型成成功的business man的。例如,以往BI人员很怕临时需求,但是我发现一线分析师经过了这些锻炼,已经成为全能型人才:他能够从底层数据提取,到中间层数据挖掘,一直到最终解决问题全部完成。目前有一些人觉得分析师是不是已经落后了?其实,分析师成为公司未来商业应用最好的补充。

仅仅懂得做分析师不够,要做数据中间人

现在是转型中一个非常重要的点,因此仅仅懂得做分析师是不够的,我们业内最需要的是数据中间人。数据中间人就是可以“见人说人话,见鬼说鬼话”的人,可以在中间翻译,两边都可以翻译出来的人。

他要知道数据架构到底要解决什么问题。他要告诉产品经理,我们需要什么样的自动化产品帮到我们业务方,我们需要什么样的模型。所以,他其实是一个很高级的商业架构师,并不是一个很高级的技术架构师。

所有数据产品都会遇到的问题:到底通用产品要多通用,具体产品要多具体?

当通用性的产品到一个具体场景的时候没有办法满足那一个具体的场景,所以这个就不仅仅是数据产品会出现的问题,而是所有做产品的人都会面临的一个问题。例如淘宝,到现在已经开始提供全方位的服务了,所以不管是数据产品还是数据服务,就要想想,哪一些东西要做成产品,哪一些要做半产品就可以了。这时候,问题是什么样的半产品能被大家所用?所以,今年我们的部门里,也会有两三个人专注于分享数据、方法、工具出去,有一点像布道师。

找到你的“白米饭”

我刚进支付宝的时候,当时分析师都走光了,那个时候发现所有东西要重新开始。第一想到是“白米饭”(注:不可或缺的工作)。“白米饭”不能解决,其他部门都会说你们在搞什么?所以开始从“白米饭”开始一级一级的建立自己BI。我觉得BI团队的建立有一条时间线,我们淘宝是先“用”,从“用”再开展到“更多的用”,几个阶段的作用是很不一样的。所以,每家公司的数据部门都要思考:什么是你的白米饭?

同时,不管哪一个数据公司,有一些是数据分析师必须要做的事。例如:BI的总监和领导人一定要在管理层一起开会。可以不说话,但是一定要进去了解公司管理的理念和思路。否则这个BI部门就废掉了,这是我自己感受最深的一点。

做数据产品的原则

阿里巴巴做数据产品有以下一些原则:

首先,这是一个单纯的商业行为;第二,它不影响到用户的隐私;第三,它不能影响到其他的用户。(因此,如果该产品能够帮到一家,但对另外商户影响大了,就不能做。要保证在互惠互利的前提之下再看方案怎么样。)

此外,还有一个要求:当数据产生交叉的时候,数据必须要放在我们这里。最近,阿里与很多创新性公司展开了合作,例如一些保险公司很快将数据放进来进行实验。它可以先不全量放进来,而是放一些数据进来,看数据交叉之后能不能产生效果,如果效果很好,再考虑下一步。采取小步快跑的商业思路。

编辑崔瀚文 摘自阿里研究院

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2014-06-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

IBM提出五大能力驱动认知商业变革

1814
来自专栏机器之心

业界 | 对话科大讯飞胡郁:人工智能生态不会像互联网时代被几家垄断

机器之心原创 作者:高琳 6 月 28 日,讯飞开放平台「万物一听」智能硬件新品发布会在深圳举行,AI+ 生活的未来场景在发布会上带给人想象力上的无限冲击,科技...

2976
来自专栏镁客网

VR游戏的四招“生财之道”

1432
来自专栏PaddlePaddle

深度学习工程师想转行AI产品经理,怎么做?

第一,AI产品的产品经理有很高的技术壁垒,需要了解技术边界,才能提出产品的设计方案,而深度学习工程师具有技术优势。

1413
来自专栏Android 开发者

开发者须知:女性玩家和手机游戏注意事项

1533
来自专栏灯塔大数据

荐读|数据分析工具独领风骚 数据科学服务表示不服

企业需要从大量收集的数据中攫取价值,但很多企业似乎无法找到足够的数据科学家来做这件事。因此数据科学作为一项服务变呼之而出。 企业需要从大量收集的数据中攫取价值...

2535
来自专栏达观数据

零售业春天来了?四种方法带你提升线上销量

人工智能、机器学习和深度学习的发展改变了我们的生活。尽管有时人们还没有意识到,但实际上早已融入日常生活中:人工智能优化谷歌的搜索结果、亚马逊推荐的“猜你喜欢”,...

3516
来自专栏量子位

传统企业该如何拥抱AI?德勤说野心别太大,分四步实施

李杉 夏乙 编译自 HBR 作者 Thomas H. Davenport & Rajeev Ronanki 量子位 出品 | 公众号 QbitAI AI浪潮让不...

3684
来自专栏企鹅号快讯

腾讯发布国内首款智能耳机:跑步不用带手机,想听歌直接告诉它

智能穿戴设备脱离手机来满足用户的需求将成为标配。跟随Apple Watch 3的理念,一款内置语音识别助手、能独立于手机操作的智能耳机正式发布。 12月20日,...

2116
来自专栏新智元

人工智能下的可穿戴设备:如何争夺物联网的入口

作者介绍:杨剑勇 传感物联网创建人、物联网资深人士、百强科技名人,著有多篇文章被上千媒体转载,著有《物联网为何萎靡不振:不接地气》、《可穿戴设备出路:设计与科技...

39510

扫码关注云+社区