前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >无数学不数据,一场16年的坚守 | 数据科学50人·宣晓华

无数学不数据,一场16年的坚守 | 数据科学50人·宣晓华

作者头像
DT数据侠
发布2018-08-08 14:47:30
5580
发布2018-08-08 14:47:30
举报
文章被收录于专栏:DT数据侠

如今,我们每个人都在谈论“数据科学”,《哈佛商业评论》杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟是怎样的一群人?他们在创造着什么令人着迷的东西?DT君将在2018年走访50位来自各行各业的顶尖数据科学家,希望能让你们了解这些神奇的人和他们的神秘事儿,为你们一窥数据科学的未来与未知。

1990年的一天,一位即将博士毕业的华人学生站在加州大学伯克利分校的萨瑟塔(Sather Tower)上向远方眺望。这所出过近百位诺奖得主的顶尖学府的标志性建筑于1914年建成,见证了近一个世纪的潮起潮落。而将同样被见证的,还有20年后横跨太平洋的一场大数据变革。

这是个满城尽谈大数据的时代,各种大数据的创业公司多如牛毛。

但如果时间倒转回16年前,情况可就不同了。当时,美国互联网泡沫(Dot-com Bubble)刚刚结束,刘强东的京东还在中关村做着光磁产品代理,马云还在构思一个叫做淘宝的个人网络购物网站。

这时候要是有人说要在中国做一家数据公司,你会怎么看?

有个人就这么做了,而且理由是“我想办的公司要和数学相关,除了数据挖掘想不到什么更合适的”。

说出这话的是那个曾经站在萨瑟塔上的华人学生,他叫宣晓华,一个押对了这场中国大数据变革的人。

(图片说明:加州大学伯克利分校标志性建筑萨瑟塔 | 图片来源:Hui Hui)

他2002年创立的华院数据,16年间,从几人发展到近1000人,并且在公司体系内成功孵化了20多家各垂直领域的大数据创业公司。

在成立的前10年,公司没有融资,却成功度过了大数据的“萌芽期”。这背后,宣晓华是怎样的一个人?华院又是怎样的一家公司?

▍因为数学,爱上数据

上海中心城区东北角的杨浦五角场地区,一直以来都以高校众多、创新氛围浓厚著称。12月初的一个午后,在离杨浦创新地标创智天地一路之隔的一幢大厦内,DT君见到了刚刚开完会的华院数据创始人宣晓华。他的另一个身份是中国工业和应用数学学会副理事长。

待人谦和、偶尔微笑、略带浙江口音的普通话,是他给DT君的第一印象。而在DT君接触的华院几位员工看来,低调、爱给员工讲数学,则是宣晓华的另外两个“标签”。

宣晓华对数学的喜好,从小就开始了,后来一直延续到大学、硕士。再后来他又赴美国加州大学伯克利分校攻读数学博士。这所名校曾经走出了国际数学大师、微分几何之父、沃尔夫数学奖(数学界的诺贝尔奖)得主陈省身等华人数学家。

一切都顺理成章,宣晓华走得原本是一条外人看来极为学术的路线,但因为在博士期间跟着导师接触了相对偏向应用的计算数学(Computational Mathematics),跟美国工业界有了更多接触,这条路线发生了转变。

当时,计算数学虽然研究的主要是算法相关理论,与各种方程、算法打交道,但却是当时美国工业界的大企业所迫切需要的。这门学科在电路仿真、航天航空、机械设计、金融等环节,都十分重要,在当时算是热门的专业方向。

等到毕业后,宣晓华顺利进入了当时如日中天的惠普公司,从事电路仿真方面的算法研究和大型软件开发。

“当时惠普公司内部也有一些人在做类似数据分析的工作,但相对简单。而我们做的事是怎么样通过计算,帮助工程师更快更好地做产品设计,有点像现在的机器学习中的一种底层的支撑。”宣晓华解释道。

1997年中国香港回归了祖国,在惠普工作了7年的宣晓华也做出了相同的决定——回国。

谈及原因,宣晓华坦承,90年代中国蓬勃发展的形象已经让他颇有感受。“当时,中国发展很快,我就想回去经历一下,但说实话,在回国前其实并没有什么大的计划。也许工作一段时间后,又回去(美国)了。”

在他看来,也许在惠普工作可以让自己生活地很好,但却少了些价值。“计算数学在美国的应用、电路仿真方面的人才相对较多,是个很成熟的领域。而在中国,这个领域一直很少人愿意做。”

我们应该都听说过百度李彦宏放弃美国的生活、被妻子逼回国创业的故事。

宣晓华的故事则是另外一个版本:他是主动回的国,而且一开始也没想过要创业。

直到在国内企业做了几年技术总监后,2002年,宣晓华才下定决心牵头做些事情。他们在上海创办了华院数据,员工一开始只有几个人,办公室也不大,但宣晓华却始终觉得,数据这件事,有未来。

在创业之前,对于做什么,他其实也有过思考,但想来想去,还是要符合两点:一是要和数学有关,因为自己的专业是数学,这也是自己希望继续从事的;二是要有市场。

当时能同时符合这两点的选择很窄,最直接的就是数据挖掘(Data Mining),既能用到算法,也有一定的市场。

“那时,互联网还不算是一个数据的主要来源,但信息化却是很多企业都有了的。银行、证券业的核心业务系统等,都会产生一些数据。”

(图片说明:宣晓华在一个签约仪式上分享其对数据及人工智能的看法。)

宣晓华当时对中国大数据的未来很有信心。“我觉得数据量级趋势是越来越大,不仅是公司里面,在政府、企业、金融体系里面,数据量越来越多。而这个时候,如果有一家公司能够帮助企业把数据变成价值、增加收入,还能帮助决策,这样的生意应该是可以做的。”

▍16年前为何无风来?

2002年,国内很少有人有大数据的意识。以现在的眼光看,当时要做一家数据公司肯定很难,但机会往往就在你认为最艰难的地方。

有数据意识的公司少,意味着你更不容易找到你的客户。宣晓华找了两个行业作为切入口,一个是金融,一个是电信。这两个行业当时在国外已经有了相对成熟的数据挖掘经验,而国内的企业也许会有通过数据分析服务于营销、扩大市场份额的需求。

但进一步接触后,宣晓华发现,当时的金融企业如银行等,对数据的分析处理需求并不大,没有这些“好像大家仍然活得很好”。而当时在国外,银行对数据分析处理的意识已经很强烈了。

在服务过少量的金融客户后,华院快速调整了业务方向,将主要突破口转向电信行业,这一次,果然找对了路。

2000年之后,中国电信行业发展很快,这体现在用户数的节节攀升。而其中,中国移动恰巧又是一家“好学”的公司,愿意尝试各种新的方法,最重要的是,这家公司也肯投入资金。这给华院这样做数据分析的初创公司提供了很大的机会。

大的全国性业务难以拿下,那就从省级公司做起,“各个击破”。新疆移动是华院的突破口,基于对方的内部经营分析系统留存的数据,做数据的整合分析,并分析用户的消费行为、使用偏好等,进而给出营销的具体建议。后来这样的合作又扩展到几乎所有的省级移动公司。

具体会给移动运营商提出哪些建议呢?宣晓华略有思索,回忆了两个他觉得可能跟每个手机用户都相关的业务:“比如会基于数据分析,向运营商提供资费套餐的建议,另外还推出了一种叫做“信用评分”的业务——也就是现在大家日常接触到的话费授信额度。”

这样的服务,华院一直做了7、8年。也正是靠着在电信行业的持续耕耘和稳定的业务来源,公司度过了大数据“萌芽期”,不仅稳定了下来,业务规模也越来越大,也开始进入新的业务领域,并且有能力孵化新的公司。

直到2010年,公司才真正意义上涉足第二个领域——电商。一来,当时中国电商开始起步,发展迅速,二来,曾经的移动业务也越来越不足以满足公司发展的需求。

“电商和移动运营商不同,运营商可以一次性付100万让你做一个项目,但电商的付费能力相对较弱,可能只是付几万块钱。”对此华院有着不同的应对战术。“你会发现这些电商商家的学习能力非常强,他们的竞争非常激烈。因此只要我们能推出好的解决方法,只要能对他们的业务有意义,他们就会很乐意去使用。”宣晓华点出了电商商家的特点。

华院推了一些针对中小网商的数据分析产品服务,希望靠“长尾效应”在电商领域打开一片新天地。

不仅仅是电商,按照华院方面的资料,后来公司的业务陆续扩展到了金融、电信、医疗、零售、电商等多领域,到2016年,实施的各种项目总计已超过600个。

( 图片说明:2012年,华院完成A轮融资,红杉资本参与其中)

一般而言,创业公司对外部资金的渴求往往都十分强烈。但在华院数据的发展过程中,有一点值得一提:成立的前10年内,公司没有对外融过资。

直到2012年,才有红杉资本的A轮资金注入。

对此,宣晓华的回答很直接:“公司成立后的前些年也没有人太关注数据这个领域,我们也没有去积极找投资。”

“另一方面...”宣晓华稍有停顿,这也是他态度严谨的一面,“是自己对外部投资也有一些顾虑,拿了别人的钱,对方肯定希望你发展得很快,但我们当时觉得,并没有那么多的行业愿意接受数据相关的产品服务。”

在DT君看来,围绕自己兴趣,不盲从接受外部资本的“指挥”,而是坚持自己的发展方向,这些特质和宣晓华的个性不无关系。

即便是公司规模越做越大、并且有了外部资本的助力,宣晓华对公司的发展仍旧有着坚持,并且做了一些独特的尝试。

2014年,华院数据开始深度孵化垂直领域的大数据公司,除了为创业者提供方向、资金、辅导外,华院顾问和技术团队也参与孵化,与创业者探索商业模式和新技术。

到目前为止,在这套模式下,公司已经成功孵化了华院分析、杭州数云、数尊等近20多家大数据应用公司,涉足互联网金融、医疗、风控征信、智能教育、时尚文化等多个领域。

“这种模式可以说是我们独创的,是一种新的企业管理模式,过去传统的企业内部大多都是事业部的形式,我们打破了这种模式,采用的是成立许多独立的公司,这是一种新的企业生态。”宣晓华曾经接受媒体采访时如此说道。

▍下一步:数据+智能

在交谈中,宣晓华毫不掩饰自己的数学情结。在他看来,数学本身是一个非常基础的学科,也是更深层次的应用的基础。包括人工智能等,都离不开基础的算法理论支撑。

(图片说明:宣晓华在中英开放数据与大数据论坛上演讲)

他这样想,也这么做了。

他跟自己博士时的导师史蒂文·斯梅尔(Stephen Smale,1996年美国国家科学奖、数学菲尔兹奖和沃尔夫奖得主)合作,发起成立了斯梅尔数学和计算研究院(Smale Institute of Mathematics and Computation)。

研究院研究的是偏基础理论的课题,但也是相对长远的。“虽然是基础的研究,不一定有经济上的效益,但也许未来有一天,就可能在特定领域孵化出新的业务。”他补充道:“做这件事更多还是自己的兴趣,我也希望我自己的员工能够在做技术开发的同时,也能接触一些更长远的研究。”

(图片说明:宣晓华(左)与导师史蒂文·斯梅尔(中),后者是1966年菲尔兹奖及2007年沃尔夫奖得主。)

一方面是加强基础的研究,另一方面则是在最前沿的领域谋求突破。

宣晓华表示,“数据+智能”会是公司未来最重要的方向。目前,公司已开始着力研发一些相对前沿的产品,比如分维(Fra+)智能画像引擎,通过小数据输入,跨学科模型智能分析,刻画立体的人,这已在金融、保险、营销广告、HR等领域实现应用。

另外,公司还开发了一款叫做华院智影的产品。这是一套基于人工智能的医学影像辅助诊断系统,目前已和上海的一些知名医院如上海胸科医院、仁济医院等有了合作,希望能帮助医生提升决策效率。

在宣晓华看来,如果人工智能技术真的能做到大规模的应用,那么无疑是颇有意义的一件事。

他也表示,公司还将持续推动孵化生态的发展,孵化出更多垂直行业应用的大数据、人工智能方面的创新公司。

回顾过去16年在大数据挖掘和人工智能领域的经验,宣晓华觉得,大数据是一种思维和方法,要有量化的思维。但是,数据有时候不够成熟,在必要时候还需要加入人的判断。

这不是他第一次提出这样的思考,他进一步解释:“我们不应该老是去关注到底有多少数据,大数据不是目标,怎么样去分析应用,让决策更好、做事更有效率、世界更美好才是目标。换句话说,也就是更加智能。”

文 | 胡世龙 : hushilong@dtcj.com

题图 | 视觉中国

▍关于数据科学50人

数据科学50人项目是DT财经旗下数据侠计划重点内容产品,旨在与数据科学领域KOL共同挖掘数据内容的价值。我们从商业数据科学领域选出最具代表性的50位先锋进行深度专访,50人由DT财经独立评审并发布,第一财经数据科技及合作伙伴倾力支持。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-01-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DT数据侠 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ▍因为数学,爱上数据
  • ▍16年前为何无风来?
  • ▍下一步:数据+智能
  • ▍关于数据科学50人
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档