专访 | 神策数据CEO桑文锋:谁说大数据不需要「小而美」

从前任百度大数据部门的技术经理,到今天神策数据CEO,9年时间,桑文锋身上发生了许多变化。他笑称,这种变化从他的微信好友数量就能看出来。创业之前,他只有200多个好友,现在已经迅速逼近5000人的上限。

大数据行业9年的历程带给他很多挑战,也改变了他的很多看法,但让他对自己所选择的道路愈加坚定了。前不久,神策数据拿到了400万美元的A轮融资,桑文锋与他团队的坚持得到了认可。

近期,CDA约访到了桑文锋先生,听他聊聊他对大数据行业的看法。

下文根据采访实录整理:

桑文锋

神策数据CEO

CDA:大数据领域的创业公司日渐增多,您怎么看待目前市场中的机遇和挑战?

桑文锋:我自2007年从浙江大学研究生毕业之后进入百度,一开始在百度知道做研发工作,第二年就开始做数据领域的工作。

百度推崇用数据说话,它本身的数据规模也比较大,懂数据,对数据也比较重视。从2008年开始,我负责一个小团队,基于Hadoop搭建了一些数据处理平台,主要用来处理百度的产品数据,比如它的用户量、访问量等等。

那个时候没有大数据的概念,大家谈论的都是云计算。到2011年、2012年左右,大数据的概念就比较火了,当时意识到大数据技术很有价值,但是数据基本都集中在BAT。

最近三四年业内比较大,主要表现在:

一是移动互联网的发展,传感器的发展,让以前收集不到的数据现在可以收集到了,线下的行为转移到线上,这让一些规模比较小的公司也能够获取数据;

二是大数据处理的软硬件基础在不断成熟,摩尔定律,机器越来越便宜,性能越来越高,像Hadoop这种基础的大数据处理平台越来越成熟,很容易搭建并使用;

三是,虽然前几年大数据不乏炒作概念之嫌,但也有一点好处,就是提高了人们对于数据的重视程度,你不用再跟对方科普数据有多重要了,他已经开始自觉地关注如何让数据发挥更大的价值。

在这种大环境下,大数据技术能够在很多领域被很多企业利用。而我最终出来创业,其实赌了两个潮流:一个是创业潮,国家鼓励创业,重视创业,创业公司的数量不断增多,代表着企业对于数据的潜在需求越来越大。另外一个是互联网+,许多传统企业面临转型,从线下转到线上,转型过程中必定也会产生数据的需求。吴军在他的《浪潮之巅》中提到,科技领域的发展趋势就是一波波浪潮,跟着浪潮走会更容易把事情做成。目前互联网创业的浪潮能够推动我们去发现和把握时机。

CDA:什么样的数据分析产品能在竞争中存活?

桑文锋:数据分析不是一个新概念,早些年就已经有不少公司在这个领域发力,覆盖的用户量也很高。目前市场上的部分数据分析产品有优点,也存在着问题。好处在于一是简单免费,不足的地方在于数据采集能力比较弱,一般只能采集客户端的数据,服务端、数据库的数据不多,这就会影响后期的分析;第二点在分析能力,一般做宏观分析都没有问题,比较难实现的是多维度的交叉分析;第三点是数据安全,用户会对数据存储产生安全顾虑。

神策数据的定位是针对互联网公司的用户行为分析。有这么几个特点:

第一,提供私有化部署,用户可以把他需要的服务部署到自己的服务器上,数据不会出他自己的环境,打消了他们的安全顾虑。

第二,强调全端数据接入。不管是客户端的数据,还是服务端数据库的数据都可以接入,提供可视化埋点、代码埋点、工具导入等等,有了数据才能更好地分析。

第三,神策基于PaaS平台,一般比较常用的是SaaS服务,二者的区别在于SaaS很难进行二次开发和深度利用,它不提供接口,你也很难建模,而用户在PaaS平台可以进行二次开发和存储利用。从数据采集、存储、建模分析到可视化,用PaaS平台可以做到每一个环节对用户开放,把数据读取出来,进行深度利用。用Hadoop、Spark搭建的大数据框架也可以直接访问。

另外,用户的每一个行为就是一个事件,比如提交订单,浏览网页,可以理解为一系列事件。我们的平台可以自定义用户的事件以及事件相关的维度。要分析的产品各不相同,但事件的本质是一样的,我们有灵活的机制去适配。所以,所有的用户只需要用同一个数据分析平台就可以满足需求,没有太多定制化的东西,节省了很大成本。

大数据的概念很宽泛,专注于某一个领域更容易成功。比如我们专注于用户行为分析,把这一个点做好就可以了,如果泛泛地什么都去尝试,反而不能够垂直深入。

2015年是大数据落地的一个年份,前两年虽然有很多人在炒概念,但近期出现的数据公司都开始从某一个点切入,这是一种更务实更科学的方式。可能将来会出现行业的整合,但是目前那些小而精、小而美的产品存活下来的机会比较大。

很多人倾向于在现阶段要掌握数据,怎么能拿到数据怎么干,但我认为这种思路背离了以用户为中心的理念。不能只想着自己掌握数据,更重要的是要知道用户真正需要什么。所以我认为大数据本身发展大概会分成两个阶段:第一个阶段是能力阶段,第二个阶段是价值阶段。现在大家知道数据很重要,但是不知道怎么做,你要提供好的数据分析工具,让他有能力做,这是第一个阶段。这个阶段过后,工具普及了,人们更关注怎么从数据中挖掘更多的价值,这是第二个阶段。

CDA:企业怎样才能真正利用数据产生价值?

桑文锋不能把数据太神话了,一定要结合业务看待。我们最早从电商类的企业切入,因为对电商类的企业而言数据最关键,每一种商品的浏览情况、下单情况,用户的转化情况,每一种数据都直接与它的业务相关。在我们看来跟订单与交易相关的数据价值会更明显一些。比如,你去投放广告,你去衡量在不同平台投放广告的效果如何,就要去对比不同渠道转化的付费用户的比例有多少,平均客单价有多高、复购情况如何,只有经过这些分析,你才能知道不同广告平台的价值区别在哪里,就可以从拍脑袋的方式转化到数据驱动的方式。

现阶段对于创业公司来说,数据采集是比较难的。一方面是不知道怎么采集数据,另一方面是不知道应该采集哪些数据,更不知道怎样把这些数据建模。所以我们一方面提供全端接入的模式,一方面也建立了数据分析团队,帮助用户理清思路,梳理维度,让他们比较容易得落地;另外就是数据分析的理念问题,很多用户不知道怎么做数据分析,那么我们在产品之外还需要灌输理念,做一些科普的工作。这方面也是个坎,但是在过个三五年,数据驱动增长的理念应该就能够更广泛地被接受。

CDA:给想要投身这个行业的人留下一些建议吧

桑文锋:大数据不是听一两次课或者看一两本书就能摸清楚的,还是需要有实践经验,比如说我之所以对大数据有信心,就是在百度的那几年接触过各种技术,知道各种场景应该怎样做处理,你本身要有机会去处理一些数据相关的问题。如果想做数据工程师,就以开发平台架构已出发点,多去寻找这样的机会,对于分析师来说,则要首先培养自己数据驱动的理念,基于这种理念去做分析,自然能力就提升了。

对于大数据分析师这个岗位,我可以推荐一本书叫《精益数据分析》,主要讲互联网公司是如何做数据分析的。其实大数据分析的分析方法不难,难的是如何基于业务场景灵活运用,所以要先构建理念。这本书在应用上可以给你一些启发。也不要把自己局限于分析工作,多了解业务。

原文发布于微信公众号 - CDA数据分析师(cdacdacda)

原文发表时间:2016-08-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

一篇文章读懂BAT互联网大数据应用

文 | 傅志华 互联网行业在大数据的积累和应用以百度、腾讯和阿里巴巴最为值得关注。百度、腾讯和阿里巴巴在大数据的应用上虽然有共同的地方,但由于各自的数据来源和商...

392100
来自专栏PPV课数据科学社区

【聚焦】百度、腾讯、阿里三大巨头的互联网大数据应用

互联网行业在大数据的积累和应用以百度、腾讯和阿里巴巴最为值得关注。百度、腾讯和阿里巴巴在大数据的应用上虽然有共同的地方,但由于各自的数据来源和商业模式的不同,其...

73470
来自专栏灯塔大数据

2017年会成为大数据的扫盲年吗?

过去一年内,我们看到了大数据的井喷式发展,数据处理分析成为热门,大数据行业呈现出信息激进之势。这导致数据科学家、数据应用程序员和商业分析师等大数据方面的人才成为...

30670
来自专栏DevOps时代的专栏

荷兰 ING 银行从敏捷到 DevOps 的进阶之路

一、ING 介绍 ? ING 是一个总部位于欧洲荷兰的银行。我们有450多个运维开发的团队,全面服务于银行业。 ? 在 ING,IT 的角色从服务转向到战略上,...

354100
来自专栏前沿技墅

持续演进:云原生架构之我见

目前就职于华为-公司架构部,负责华为公司的Cloud Native、微服务架构推进落地,前后参与了华为手机祥云4.0、物联网IoT2.0的架构设计。曾任当当架构...

31830
来自专栏新智元

智能音箱2017大爆发,6大数据看懂亚马逊与谷歌之争

【新智元导读】 2017年下半年,智能音箱势必会掀起一场新的风暴。随着谷歌和苹果的重力出击,在国外,各家的争夺日趋白热化。亚马逊凭借先发优势,目前市场份额已经占...

413120
来自专栏云计算D1net

采用公共云的障碍正在减弱,但服务器的危险仍然存在

随着公共云继续扩展到主流IT,企业采用公共云的障碍似乎正在降低。麦肯锡公司最近的一项研究表明,云计算环境的安全问题不像过去那么突出。 如今,采用公共云变得越来越...

35690
来自专栏DevOps时代的专栏

DevOps能力成熟度三级评估结果公布

近年来,随着“互联网+”和云计算技术的发展,软件生产的模式发生了显著的变革。一方面传统行业互联网应用的种类越来越丰富,对软件开发效率的要求越来越高;另一方面容器...

26930
来自专栏DT数据侠

如何精准转化潜力客户?答案都在IBM的数据营销案例中

“数据驱动营销”这个词并不陌生,业界有很多运用数据驱动营销的例子。数据驱动营销最核心的理念和价值就是在对客户数据和营销执行数据分析结果的基础上做出下一步的市场营...

16400
来自专栏ThoughtWorks

一场国际水准的技术大会,一次领域驱动设计(DDD)实践者们的狂欢!

架构是为了解决业务问题而产生的,没有了业务,架构就没有了存在的前提!在解决同一个业务问题的前提下,更高效更低成本的架构,会淘汰低效高成本的架构。DDD让架构更高...

17030

扫码关注云+社区

领取腾讯云代金券