前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据是屠龙术(暨桑文锋《数据驱动》新书首发)

大数据是屠龙术(暨桑文锋《数据驱动》新书首发)

作者头像
用户1682855
发布2018-06-08 11:29:59
7280
发布2018-06-08 11:29:59
举报
文章被收录于专栏:前沿技墅前沿技墅
本文作者 桑文锋

神策数据创始人兼CEO,浙江大学计算机科学与技术专业硕士,在百度任职8年,从无到有构建了百度用户日志大数据平台,覆盖数据收集、传输、元数据管理、作业流调度、海量数据查询引擎及数据可视化等。历任软件工程师、高级软件工程师、项目经理、高级项目经理、技术经理,2015年4月离职创建神策数据,针对企业客户推出用户行为分析产品——神策分析,帮助企业实现数据驱动。2017年7月,桑文锋荣获第六届中国财经峰会“2017最佳青年榜样”荣誉。

中国互联网化20年,经历了从“拍脑袋”到“数据驱动”的演进。从2015年至今,我国企业互联网化进入全新阶段——数据化建设阶段,企业聚焦点逐步转向如何将企业内外部产生的数据高效应用,从而让企业决策不再依赖“拍脑袋”,而是靠“数据驱动”。

如今越来越多的公司有数据采集需求,如果说大数据是“屠龙术”,那么“龙”会越来越多。Gartner预测,到2020年大数据将成为主流的嵌入式技术,并被视为常规产品的一部分。行业领导者(如互联网、金融、零售、企业级服务等)一直积极应用海量数据的采集和分析,聪明的初创企业都在拥抱数据驱动方法。

数据驱动商业决策

大数据在企业的商业决策和商业价值决策中扮演着重要角色,这已经是普罗大众的共识。数据驱动是企业发展最基本的要求,百度也非常重视“用数据说话”,我们来看一个曾经发生在百度知道的例子。

2007 年我加入百度知道,当时的产品经理告诉我,每年暑假,百度知道的用户量和提问量都增长很快,因为一些学生需要完成假期作业,有问题就上百度知道提问,同学之间传播得也很快。2012 年,百度知道的团队成员对用户的提问类型做了分析,发现学生提问占了 10%。

于是在百度知道的APP上,专门增加了一个“问作业”的菜单。结果,作业相关的提问量一下上升到了 30%。

于是团队开始考虑开发一个独立的APP,用于学生提问。

终于,一款叫“作业帮”的产品诞生了。产品诞生后的半年时间,与作业相关的提问量提升了 4 倍。这就是一个典型的数据驱动商业决策的例子。

在硅谷,用数据驱动商业决策的案例,更比比皆是。

案例1:Google为员工提供免费午餐背后的数据意义

Google强大创新力的背后是数据。《重新定义公司:谷歌是如何运营的》(How Google Works)一书在“决策:共识的真正含义”一章中指出,制定决策的方式、时机和实施决策的具体方法与决策本身同样重要,数据越翔实,信息就越清晰,推理就越高效。作者指出要用数据做决策,观点的背后一定是数据的支撑,观点不能在缺乏数据支撑的情况下单独存在。

Google为员工提供免费午餐这一福利背后,也有着缜密的成本计算。Google为此需要支付的成本不足10美元,而员工为此却减少了外出就餐的时间浪费,对于时薪较高的员工,更是有效延长了工作时长,降低了生产力的浪费;而且不少员工就餐时会邀请朋友,还能兼顾招聘,成本核算后发现比猎头挖人成本低很多。类似的,谷歌用一套非常严谨的以数据为驱动力的决策流程,优化企业治理和商业决策。

案例2:PayPal的反诈骗之战

时任PayPal的CEO彼得•蒂尔(Peter Thiel)格外看重数据的价值,这与他创办过Thiel资产管理公司的经历有关。《支付战争》一书提到,当员工向彼得•蒂尔汇报工作时,若其汇报内容有丰富的数据做支撑,彼得•蒂尔会赋予他更大的自由权。

以PayPal数据分析为例,当时有些不法份子盗取信用卡,然后批量注册PayPal账号,再绑定这些信用卡并将信用卡支付给指定的账户,这些账户再把钱取出来。信用卡机构发现后,就让 PayPal 赔偿。PayPal因此的损失达到了交易额的 1.21%。

为解决这个问题,PayPal通过数据去分析这些诈骗份子的交易特征,发现有一些规律——比如都是新创建的账号,用户都向同一批账号支付,并且支付金额、使用频率都有一定的规律。因此它们把这一批关联的账号锁定,然后由人工进行审核,他们甚至还帮助联邦调查局抓捕了两个俄罗斯诈骗份子。由此积累的技术经验,后来都用在一家创业公司,它就是神秘的 Palantir1。

为了阻止程序自动注册账号,技术人员想到了一个办法:他们生成一些图片,图片上印有扭曲的字母,并且有一些背景划痕,用户可以识别这些字母,但是机器很难识别,这样自动注册就行不通了。现在这种图像识别码的方式已经非常普及,甚至到了滥用的地步,而它最早就是 PayPal 发明的,至少是最早商用的。

通过这两个措施,诈骗损失从交易额的1.21%,降到了0.48%,导致诈骗份子们只能“跑”到竞品上作案。

我认为数据驱动商业决策实现了以下三大价值。

  • 透过现象看本质,提升企业决策的准确性与科学性。 大数据时代改变了曾经仅依靠企业内部业务数据优化决策的情况,通过洞察“大”“全”“细”“时”数据背后的价值,赋予企业更加全面和准确的商业洞察力,大幅提升企业的商业决策水平,降低企业经营的风险。
  • 用数据说话,降低企业沟通成本。 “用数据说话”终止了企业团队之间因某一结果无休止争论的局面,降低了团队的沟通成本,缩短了企业研发时间。就像大家经常所说的,在争论中,如果两个人都没有数据,那么嗓门大的通常获胜。如果一个人有数据而另一个没有,那么有数据的通常会获胜。如果两个人都有数据,那就不需要争论了。
  • 赋予企业全面准确的商业洞察力,实现智能商业预测。 除了提升企业的商业决策水平之外,数据驱动商业决策还赋予企业商业预测的能力。大数据分析像一架望远镜,企业通过望远镜能够看到未来可能会发生的情况。智能商业预测帮助企业率先进一步挖掘市场,实现产品与服务上的创新,在诡谲多变的市场环境中取得先发优势。

————

本文节选自烫手新书《数据驱动:从方法到实践》,下方列出部分首批读者的肺腑之言,可以让你快速了解本书精华所在。一本如此之多业界巨子不辞亲力背书的领域扛鼎著作,只需轻点阅读原文,即可一亲芳泽!

  • 内容简介:本书是从理论到实践的全面且细致的企业数据驱动指南,从作者的百度大数据工作说起,完整还原其从零到一构建百度用户行为大数据处理平台经历。详解大数据本质、理念与现状,围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何将数据驱动方案落地,并指出数据驱动的价值在于“数据驱动决策”、“数据驱动产品智能”。最后通过互联网金融、电子商务、企业服务、零售四大行业实践,从需求梳理、事件指标设计、数据接入阶段、实际应用四大阶段介绍数据驱动在不同领域的商业价值,全面展示大数据在各领域内的应用情况与趋势展望。本书贴近企业真实场景,兼具权威性与前瞻性,是广泛适用的普及读物,适合对大数据、数据驱动感兴趣的企业高管、决策者、创业者、IT人员、营销人员、产品经理、相关专业的学生等。
  • 信息随时随刻在产生,它为世界指出两条路:一条路布满着那些故步自封、因循守旧企业的“尸体”;另一条则为拥有数据思维和掌握数据驾驭能力的企业铺就康庄大道。而此时此刻,你正处于交叉路口,手中恰好握着一张指引正确路径的“地图”。 ——哈佛商学院访问执行官、Coradiant公司联合创始人、《精益数据分析》一书作者Alistair Croll
  • 文锋分享了他在商业数据的真知灼见,不盲目舶来,他明确地知道哪些理论在国内是行不通的,并传递出更本土化的理论。本书的结构和内容都经过了反复打磨,无论是从技术严谨性,还是从内容的实用性上看,都堪称互联网商业数据的可贵佳作。 ——宋星,互联网数据官创始人、网站分析在中国创始人
  • 数据分析是一种修行,“修”的是思考的能力,“行”是落实成为方案的方法。文锋在这本内的描述正是他这几年创业的发现与精华,值得推荐。 ——车品觉,红杉中国专家合伙人、全国信标委大数据标准工作组副组长
  • 书中提到的很多问题场景,相信也是很多从业者经常遇到和面对的。对于希望提升数据决策能力、了解数据决策真相的从业者,这本书是很好的读物。 ——曹政,曾任百度商业分析部经理。现知名 IT 自媒体博主,互联网游戏出海领域创业者
  • 干货满满,源于实践又高于实践。本书字里行间体现出作者对大数据领域的理想情怀和脚踏实地的实干家精神,非常值得一读。 ——吕厚昌,Alex Lu,曾任百度高级总监,Headof Data,Pinterest
  • 我们相信桑文锋在驾驭数据驱动商业的能力,也相信他身上那股坚定的信念,他愿意花很多年将数据基础能力变成水和电一样提供给中国企业。我们也相信这本书,会给很多希望在商业战场上多一双数据的眼睛的企业家很多帮助。 ——王淮,《打造 Facebook 》作者,线性资本创始合伙人
  • 这是文锋丰富的百度经历以及与众多客户深度碰撞后的思考,从方法论的高度全链路定义了数据驱动四大关键环节,并以实践诠释了如何用数据驱动决策、产品和业务,值得细细品味。

——赵军科,百联大数据总监

  • 这本书清晰剖析了从采集建模到分析运用的数据驱动全链条,值得每个数据人阅读。

——赵祺,今日头条增长团队负责人,前车来了联席 CEO

  • 在不远的将来,不管你处在什么行业什么职位,数据分析都是你不得不具备的一种能力。本书提供给你一个极好的知识储备的机会,它有三点非常值得推荐:第一,浅显易懂地表达大数据的底层技术,让你能够明白数据怎么产生,怎么加工,怎么存储和运算;第二,抛开了晦涩难懂的各种模型和算法,将最普适的数据洞察和分析的方法呈现给你,让你能迅速具备“阅读数据”的能力;第三,清晰地将电商、互联网金融、零售、SaaS软件等行业鲜活的数据应用案例呈现给你,让你加深对数据应用的理解。

——胡晨川,《数据化运营速成手册》作者,饿了么数据专家

  • 本书快速武装企业的数据部门,快速积累数据,并让所有在践行数据驱动业务增长的企业,都可以快速上路,让数据驱动最终成为每个公司的“标配”。

——刘晨,纷享销客联合创始人,数据中心总经理

  • 与很多纸上谈兵的文字不同,这里面的每条经验都是一场场实战打出来的。

——孙文亮,杏树林数据总监

  • 作为数据驱动在初创公司的实践者,我们经历了从手动跑数据分析的“石器时代”到实时数据分析系统的“蒸汽时代”。工具已经成熟了,但在方法层面自己则一直瞎练野拳。一见到本书,就有相见恨晚之感,数据驱动终于有了成体系的“招式”!屠龙宝刀,要配上好武学,希望本书可以帮助更多公司实现数据驱动。

——黄震昕,造数科技创始人兼CEO

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-03-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 前沿技墅 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据处理套件 TBDS
腾讯大数据处理套件(Tencent Big Data Suite,TBDS)依托腾讯多年海量数据处理经验,基于云原生技术和泛 Hadoop 生态开源技术提供的可靠、安全、易用的大数据处理平台。 TBDS可在公有云、私有云、非云化环境,根据不同数据处理需求组合合适的存算分析组件,包括 Hive、Spark、HBase、Flink、Presto、Iceberg、Elasticsearch、StarRocks 等,以快速构建企业级数据湖仓。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档