【干货】大数据创新驱动智慧民生

本文共10000字,建议阅读时间20分钟

讲座选自清华大学苏州研究院大数据处理中心首席技术官赵勇于2015年4月8日在青岛大数据高峰论坛金融大数据分论坛上所做的题为《大数据驱动的个性化财富管理》的演讲。

我简单介绍一下自己,我是清华硕士,在美国芝加哥大学读博士,后来在美国微软公司工作几年,主要做广告大数据平台。2012年和我们中心的林辉主任一起创立清华大学苏研院大数据处理中心,主要做央企,国家部委大型中央数据统计,后来做用户端行业大数据。

先讲一下大数据爆发原因。实际上数据的问题,包括大数据问题,是一直存在的。为什么最近大数据才在全球非常火爆?

这里面我们总结有好几个方面的原因。

第一是数据源种类和数量和整个容量在越来越大。现在,我们讲到的像互联网的数据非常大,每天像FACEBOOK,谷歌可能产生几十T,几百T数据,智能传感器,手机,GPS,还有智能电表,物理世界各种采集器也非常多。像手机的话,这是前两年数据,有好几十亿手机在全球。

另外一个是科学仪器和医疗仪器产生数据也非常多,这一张图是美国大型强子对撞机,里面的探测器比这个楼都要大,这一个是用来发现上帝粒子的。

另一个是美国在墨西哥州上面一个天文望远镜,要把地球1/4的天空都拍摄记录下来给公众开放。癌症治疗里面伽马刀是医疗数据的一个应用。

这些数据源造成一个大数据的大爆发。原来我们数据很简单,做报表,做统计,做同比,环比,他们统计经常用到的一些手段。大数据爆发的另一个原因是数据分析的复杂度也非常高。

这里面举一个癌症制药里面的例子,目前癌症治疗里面最先进的技术叫做靶向治疗,所谓的靶向治疗,就是药物是根据病人基因组定制出来的,病人把这个药服进去之后,能够有效的跟癌细胞绑定,要么是摧毁这个癌细胞,要么阻碍癌细胞增长,可以有效起到对癌细胞的控制作用,对病人的损害可以降低。

为了和这个癌细胞匹配,要找到这个靶点有四百万的计算任务,单台计算机要算五十年,病人跑到医院,对他说等一会配一个药,要五十年以后才配出来就什么都晚了。

实际上个世纪80年代很多人就提出了数据爆炸或者数据暴雨各种概念,也就是现在的数据多的我们已经没有办法去处理了。上午朱博士也讲到。

我们现在科学有一个新的分支是数据科学,最早是实验科学,通过物理,化学,实验,我们找到一个规律比如元素周期表。

后来通过实验科学里面总结出经验上升到理论科学,我们才有现在的数学、物理、化学各方面的理论。尤其物理方面理论几十年没有新的进展,现在物理学的博士和博士后是最苦的,学校里面待六年,八年没有办法发现新的科学理论,博士毕业论文也很难写。

到最后很多转成做计算机和做统计变成大数据科学家了。后来没有办法,像强子对撞机,先有理论模型,有预测,然后使用大型计算和物理设备采集验证模型,演变成了计算科学。

计算科学其实核心最终处理是这个数据,像强子对撞机一年产生数据几十PB,现在常见硬盘几个T,几十PB相当几千块、几万块的硬盘数据,一年产生那么多。后来微软的数据科学家,也是图灵奖获得者Jim Gray把数据科学分离出来,把它定义成一门新的科学。

微软研究院院长、副总裁TonyHey,他提出数据就像暴雨一样一直下,我们真正用到的数据就像打一把伞接一点水用来浇花,90%甚至99%的数据还没有被用起来,但我们具备这个采集数据的基础设备和工具,还有方法。这就是当前数据爆炸给我们带来的无法处理的问题。

另外大数据爆发的一个原因是现在所有的企业,个人,政府都意识到数据的价值。实际很多企业有特别宝贵的数据,是放在那里长灰。

之前的信息系统叫做信息管理系统MIS,所谓的信息管理系统就是我买进计算机做一个数据库,把数据采集放在那里就完了。但现在数据实际在各个方面都对我们非常有价值,上午讲座也讲到,数据是新时代的黄金和石油。

一个企业拥有数据就拥有黄金和石油,就存在爆发和价值增长潜力。数据现在影响到我们所有的方面,像个人生活相关的,我们用微信,还有旅游APP,携程,去哪儿这些,我们每天都用这些数据。

企业发展的话,对于企业我们要做精准营销,互联网营销,新媒体营销,包括社会媒体营销,数据是决定我们企业的生死和发展。对于区域经济,就是像我们的智慧城市,和区域经济发展紧密相关,其核心就是依赖大数据来产生智慧的。

从国家发展战略来说,大数据已经上升到美国的国家战略,同时世界财富论坛都把大数据列为未来新的经济增长点。

对于我们国家来说,像李彦宏,马云,开会的时候经常跟几个常委建议大数据,现在大数据也逐渐上升成我们国家的整体战略。大数据在我们整个的生活各个方方面面都起到重要的作用,它的价值越来越被大家所认同。这是大数据爆发另外一个原因。

大数据爆发的最核心的原因是因为有这么多数据,同时我们对数据价值需求又越来越大,但现有系统和方法没有办法处理这个数据。

我们总结很多这方面的问题,首先比如速度方面问题,原来有一个数据库,把数据写进去就行。现在一个城市比如南京,就有四十万摄像头,这个摄像头每分每秒都产生数据,你说要把数据都实时写到系统里面,做实时监控,这数据速度方面就处理不过来。

比如云南火车站发生砍人事件,系统采集处理,过好几个小时以后才告诉你,那就晚了。这一方面的系统基本没有办法满足现在的需求。

刚才我们也说数据种类和架构,有各种各样的数据源和数据结构。比如有文本,有语音,有图片的,有图像,各种生物指纹,传感器数据,种类完全不一样,原来拿一个格式化的数据库就存起来,现在可能需要各种新型的数据存储手段和处理手段。

扩展性问题,原来处理数据买一台计算机就行,现在我们知道阿里淘宝双十一的时候,一天就是几百亿交易额,像微信红包,峰值春节当天达到每分钟八亿次,像这样的话,扩展性问题就是说后台,像腾讯和阿里,他们是需要几千台,几万台甚至几百万台计算机存储和处理数据,微信用户将近七亿,七亿用户每天发语音发图片发视频,数据存哪里?后台数据处理中心。

现在腾讯新建中心的有二十多万台物理服务器。现在服务器都是八核、十六核,算起来二十万台就是相当于160万个计算机来处理和存储这样的数据。

关于成本问题,最早的大型机只有美国军方,包括一些重要的科研单位才能买得起这样的计算机。到现在我们一个手机性能相当于一台超级计算机。

要对整个IT信息,IT架构进行成本论证,像腾讯这样的数据中心也是由普通的服务器构建,整体我们处理信息的成本在下降,但是企业要把原有的信息系统全部迁移到大数据架构成本很高。

企业不可能一天由原来信息系统一下子全部转变大数据信息系统,要把应用迁移,数据迁移,还要有相关IT人才,有对企业和自己应用了解的专业人员才能把它迁移过来,所以这一个成本和代价是很高的。

关于价值挖掘这一问题,网上有一些笑话。有的企业非常重视大数据,请一些专业团队,花好几百万,对原有数据进行挖掘。挖掘出来结果没有什么用,并没有对企业的生产和效率起到提升的作用。

所以我们不能光说大数据非常有用,真正大数据对自己的企业数据建模和数据分析出来结果,真正要被企业所用,对企业有好处,投入和产出要成正比,投入最好小,产出大,这样大数据迁移才有意义,否则就是浪费钱。另外关于安全隐私,不管知道不知道大数据这个概念,了解不了解这个行业的,都会提到数据安全和隐私怎么保证。

钱存银行里面首先不能丢其次不能少,数据也一样,数据越集中越危险,微信里面通过所有微信信息可能知道你住什么地方,职业是什么,每天去什么地方,对哪些感兴趣,哪些朋友全知道,基本没有隐私可言,对数据保障还有数据安全,个人隐私不泄露也是一个问题。

最后是智慧城市最核心问题。

智慧城市实际上我们从2012年就开始介入,国家也是从第一批试点城市到现在有三批,应该第四批正在申报,加起来也有将近三百多个城市,但是真正能够建设出有效果的城市非常少,为什么?就是没有办法解决互联互通和共享问题。

我们曾经做过四川的医疗网络系统。在一个医院里面,我们去调研,病人的信息,病历信息是一家公司开发的,病床信息一家公司开发,影像是一家,社保联通又是一家开发。

最后院长说我想看一下我们全院统计信息。病人、病房、药品信息等要分别进入各个系统去看,费劲死了,要把所有的这些不同服务厂商的数据和系统都打通,这些厂商都不愿意公开它的这个数据结构。说是商业机密,一个医院想做互联互通都很难,全国想把医疗系统、医保系统打通,打通社区医院,乡村医院,不同医院,一个病人的病例全国医院都可以调看,不用再花钱,根本不可能。

即使可以看到,但是你到协和医院,可能说原来那个医院采集数据不太准,影响医生判断,还得重新采一次。智慧城市、智慧医疗讲起来很简单,真正实施到处都是问题,主要的问题就是在于互联互通数据共享问题。

大数据一方面是数据源数据量越来越大,原有信息系统没有办法处理数据快速增长的问题,就爆发了。

大数据问题凸显引发新一代信息技术的四驾马车。这些名词大家听过,物联网,云计算,移动互联网,大数据,其实我们现在天天生活都在接触这些信息技术。由于大数据问题的爆发他们才应运而生,而且可以部分解决大数据的问题。

几个系统到底什么关系,很多人搞不清楚,有的认为是平级,有的认为可能有一个包容关系。我们总结一下几个信息系统的关系。

我们如果把智慧城市比作是一个人体的话,这一个物联网,就是我们的感官,通过物联网我们可以看见,听见,摸得见,感知得到这样的数据,采集起来。物联网还有很多传导和网络,能够把信息传输采集起来。

我们把物联网叫做感官和神经。云计算是强健的体魄和心脏,没有这个能量也没有办法支撑运算,很多城市都建设云计算中心,是提供强大计算能力,有计算能力还要有核心数据,真正智慧怎么产生?就是通过对数据的加工,最后可以形成对我们生活工作各方面有益的决策,辅助,才能形成智慧,智慧核心是数据,大数据就是智慧城市的核心。

这里面把大数据比喻成聪明的大脑。真正智慧装在大脑里面,你说大脑能不能离开我身体?不可能。大脑能不能离开我的这一个感官和神经?不能。但最核心是大脑对数据处理和加工才能带来智慧。

所以现在我们说智慧城市,如果离开数据采集,数据分析和数据的使用,这一个智慧是空谈,只能够说我们是建设基础网络,建设基础数据采集,目前对数据的利用还是处在很低级很简单的程度。

下面一节讲一下我们在做国家部委,央企,惠民工程过程当中总结的经验,数据为什么能够驱动创新。核心我们提出数据生产要素化,可能听着有一点晦涩,我们原来学资本论,定义生产要素是人,劳动力,资金,自然资源,比如一个农民拿着锄头在地里面种田,他能够产生作物,基本生产要素是土地,锄头这些工具还有劳动力。

现在有数据,如果把数据也当成一个新的生产要素的话,整个什么要素的配比会发生变化,会引起变革。

举一个简单的例子,比如阿里巴巴的小贷,余额宝上线几天就有了几百亿资本,阿里巴巴的放贷这个周期最快可以六分钟决定是否给一个企业放贷,传统银行要花一个月调查企业的生产状况,经营状况,资本周转状况,有没有被处罚信息,了解它的征信要花一个月。传统花一个月,但阿里上面有淘宝,天猫,一淘网所有的用户数据,他们的资金周转状况,运营状况,整个下一步的发展计划都可以看到也可以预测出来。

原则上阿里小贷可以说你企业下一步需要多少钱都可以算出来提前给你准备好,数据把这个周期给提前了很多很多。他们开玩笑说马云做十五年原来最终目的想做金融,原来不在金融这个行业可以到这里面抢国有银行的钱,分国有银行利益,这是我们说数据生产要素化才能够真正起到这个数据变革和创新。

我们认为数据所起到创新的作用是各个方面。可以有管理创新,有机制创新,理念创新,模式创新和技术创新。如何实现创新,因为现在是互联网时代,很多人说互联网概念到底什么,互联网有很多核心的作用。

我们认为比较核心的是扁平化。互联网把世界上每一个人和另外一个,和一些资源的距离,一些中间环节全部去掉。所以我们说现在互联网要实现创新的话,我和我们中心的林主任总结三个重要的概念,就是开源众包和长尾。

开源比如原来苹果IOS系统,在手机占市场比例原来超过80%,谷歌刚刚领导安卓系统的时候,最初市场份额就一丁点。过两三年反超,现在安卓在整个手机操作系统里面占80%到90%,苹果也就占到不到10%,剩下的赛班,微软的Windows Phone基本只占一点点,Google把手机操作系统开源,全球所有牛人可以在这个操作系统上面贡献力量,才达到这个效果。

众包意思不是说一个人一个公司打天下,而是所有人贡献力量。比如小米手机为什么可以取得那么大成功,他有一百个人的市场调研团队,在互联网上问所有用户,你喜欢手机是什么样的颜色,什么样的配置,什么样的价格,这些人在互联网上搜集几十万用户反馈,最后才把小米手机生产出来。为什么小米手机有那么多的米粉?

所有参与这个过程的用户都觉得我是这个手机的爸爸妈妈,因为我的点子放在这个手机里面最终形成这个手机,所以一个新的或者一个产品在各方面,是用全球的,集中全球所有人智力做这个事情,这就是众包。

另外所谓长尾,现在我们都知道BAT太猛,阿里巴巴除了做金融也做医疗信息服务,也做现代农业,做物流,什么都做。是不是这个市场就阿里巴巴一家就完了,不用我们再干活?实际不是这样。

整个市场是长尾,所谓的长尾就是大的市场可能被BAT这些大公司切去,未来的市场一定是行业细分垂直化的。

比如电商,阿里巴巴主要做消费类的电商,你说我做金属材料电商或者我做电器的电商,如京东,未来茶叶电商,甚至火锅原料电商不可能阿里巴巴全做,剩下的中小公司可以在这些行业做创新做贡献,找到自己市场份额。我们总结有这三块来形成创新。

还有一个更重要的,以前我们做产品设计的时候或者是做我们整个企业流程管理的时候,都是叫应用驱动开发。

现在整个概念反过来了,叫做数据驱动开发。应用开发先从应用场景梳理,系统设计到结构分析最后再实现。举一个简单的例子,比如说公安系统,公安系统如果要做一个警务综合系统,所有警察办案,出警,接警,案件调查这个过程非常的复杂。对公安这个系统,如果是原始模式应用大概几千种,系统设计报告,这一桌子都铺不完,几个月做不完。

稍微数据做改动这个系统要重新改动,要半个月到一个月才能完成,后来他们愁的不得了,这个怎么解决,我说反过来来看。怎么解决?

用数据驱动开发。核心公安应用这个数据可以分析一下,哪些种类数据,按时间分析,对产生/使用频度,总体数据体量做分析,分析这些数据怎么用,数据的应用场景,比如对人口数据处理有十几种,对事件处理也几十种。

通过对数据接口,数据标准,数据处理方式结合好之后再开发应用,这个应用都是分类别。有这个接口之后,我跟他说现在你就自由了,原来你找一家服务公司,做任何改动都这一家公司说了算,他说要多少钱就多少钱,但现在你可以找不同服务公司,找不同的外包厂商,根据你的接口和访问标准来开发应用。

同时公安系统内部IT人员也可以每天加应用,这样就掌握灵活度了,因为是从数据来驱动的,这样来开发,就转变了原有的按应用场景来开发的模式。按应用场景梳理几千个应用搀杂一起完全找不到头绪,只能够应用服务公司来做。数据驱动才是最核心的,现在企业发展包括产品开发都是用数据来说话。

我们如果在座有很多企业家的话,整个商业系统都在围绕数据产生重构,我们梳理几个,需求重构,供应重构,竞争重构,主体重构。包括余额宝,美甲,上门4S店洗车服务,原来没有接触过这个行业的冲入这个行业里面抢钱,是数据创新、数据颠覆模式。

竞争重构:原来都是单一竞争,比如我做一个产品,你再做一个产品,价格比你低,成本比你低,可以抢你的钱,现在不一样,现在可以说整个一个生态竞争。比如说微信,腾讯本来已经有了QQ,而且有了几亿用户,干什么要出微信,现在都是移动端,出社交网络,自己革自己命,如果腾讯不出可能阿里会出一款产品,或者小米的米聊会胜出,腾讯本身生态就会被别人破坏,也许一天之内他就会死掉。

我们知道现在FACEBOOK非常猛,FACEBOOK之前有一个社交网络叫做MySpace,可能很多人没有听说过,当时也是全球好几亿用户,后来最后卖掉的时候估值才几千万美元。因为那些用户都跑到FACEBOOK,新的社交平台上面,原来那个社交平台很快就不行了。所以是一个生态的竞争重构。

供应重构这个例子后面会讲一讲。产品生产与交付按需提供,以前服装厂商包括雅戈尔和杉杉,我跟他们都有接触,新款服装从设计到成形到门店周期非常长,是跟不上整个时装界发展速度的。

后面会讲ZARA的例子,再讲服务数字化带来的变革。这里面像在线教育,他们说未来预测学校都不会存在了。所有的人都在网上面上课,拿学位证毕业,想拿几个拿几个,只要有精力。滴滴也是,原来市场非常垄断,滴滴一个手机APP就可能把用户和出租车这两者联系起来,把出租车市场几乎颠覆了。

滴滴出专车,很多交管局领导出来封堵说它非法,我用过这个专车,首都机场一下飞机叫一个专车已经门口停好,要么奥迪要么凯美瑞,中档车型,里面还提供水,非常人性化,这把原来商业模式颠覆了。

营销模式变革,对传统企业的最大摧毁在这里。传统企业基本是4个P模式,产品,价格,渠道和促销。所有企业在做产品生产,促销是依赖传统的这些方式。这些方式都不管用了。

举一个简单的例子,现在90后,00后不看报纸,不听电台,不看电视,都在社交网络上面活动,一个产品营销的时候根本到达不了他。

现在一个产品如果根本卖不到90后,卖不到00后,作为一个企业怎么生存?

现在要4个R的模式,口碑式营销。这4个R是通过产品的相关性,通过用户对产品的反应,通过你与用户建立联系,通过给用户带来价值回报来进行促销。整个商业模式,营销模式发生改变了。新的企业只能够朝着4个R模式做产品营销,才能够在新生代人群里面胜出,才能真正的竞争生存下去。

前面说的都是数据能够引发创新,现在具体说我想进一个行业创新怎么创新。

我们梳理出十个方法论,但这些都还不是很完善,我们如何到一个市场上面抢钱,需要如何衡量,假如我想创业,这一个创业的点子靠谱不靠谱,有十个方面的指标。基础指标,我不全部讲。

最简单一个价值密度,所谓的价值密度是在哪个行业钱最多,而且单位面积里面钱最多,我到那里抢钱,比如银行最有钱,到银行做创新抢钱;医疗,每个人每年花自己身上各种保健费用可能几千;教育,每个家长在孩子身上一年花费用都好几千,上万,这些就是我们抢钱的地方。

还有第二个比如基础约束度,刚才我讲医疗的例子,你去医院里面,比如医疗最有钱,抢医院钱,给医院做信息化系统,那完了,因为一定要去跟医管局,卫生局,医院、各种标准,管理条款打交道,加上刚才我说的信息系统都不能互联互通,进去之后可能摸爬滚打两年还不能挣钱,所以还要考虑这个行业门槛和基础约束度能不能让你很顺利的进去抢钱。

如果十个维度里面能够形成特别稳定的蜘蛛网的图,各个维度上面相比得分都比较高,就放心大胆冲进去抢钱、去创业,死的可能性比较小。如果是不稳定结构,有的维度打分很高有的打分非常低,你去创业有可能死半路上,被冲出来的竞争对手干倒。

很鲜明一个例子,我们原来四川一个合作伙伴,给房地产服务商做数据服务。整个全程楼盘信息,地皮信息,商业住所,社区人群信息收集起来,每家房地产商用他们的服务都收费几十万,一年挣一千多万,当时踌躇满志说全国扩展,后来一家竞争公司改变模式,直接找房管局合作成立一家公司,ppp模式,数据拿过来,那是最全最快最实时,前面这些公司是靠地推人员到各个小区楼盘搜集信息,新出来公司照他模式,几个月时间把前一家公司80%市场抢过来。

这里面存在一个行业门槛和技术约束,如果数据不是你的核心资源,被别人掌握,他拿出来数据你就死掉了,就这样一个道理。前面讲的数据驱动创新,是我们梳理的一些基本理论。

最后讲智慧民生方面,有的是别人案例有的是我们自己的案例,都讲一下。我们梳理出来智慧城市七层架构,很多人知道有四层架构,感知,传输,处理,应用,我们把数据层分离出来做核心一个层面。底下的数据汇聚有三层,上面的数据交互及应用有三层,中间是数据层,也是整个智慧城市核心。

基础层比如我们有数据中心,有云计算。传输层、采集层是数据入口。有了数据融合之后,我可以计算,应用,展示,像谷歌眼镜,可穿戴设备,甚至有可植入设备。

国外一些比较时髦的年轻人把胳膊里面,脖子后面植入一个芯片,走到哪儿自动可以被扫描被识别,叫做可植入设备。这是我们梳理的模型,为什么数据要放在最核心部分?因为数据才能产生智慧,如果没有数据这个智慧谈不上。

具体的大数据民生方面,首先讲大数据在电商里面所起到的作用,现在整个国家也在鼓励移动电商,跨境电商,是每个省市重点的行业,大数据在电商里面最核心价值我们梳理出来有下面几条。

最核心的我们叫用户画像,一个比较时髦的词,给一个用户建立一套比较完整的画像,性别,年龄,居住区域,每年消费的状况,职业,这是基本属性。还有行为属性,喜欢什么,刚买车了,最近刚结婚这些行为属性也建立起来。

有什么好处?

亚马逊总裁贝索斯,有人预测说乔布斯已经不在了,贝索斯可能能做一些创新。他有一个终极概念说未来如果我有一百万用户,我就要建立一百个亚马逊主页。为什么?如果是老年用户上去之后可能是医疗保健这些,你放一些其他东西他不感兴趣,这个页面浪费了,女性用户上去放一堆摩托车,跑车,这页面就浪费了,当然也有个例。

未来每个用户根据画像,所有页面展示是为你定制,最符合你的兴趣爱好。未来可以做到每个人都有一个淘宝页面或者一个亚马逊购物页面。

另一个作用是优化营销策略,企业营销要根据用户来定制你的营销策略。还有预测消费者行为,亚马逊都能够预测到你未来想购买什么物品,提前可以给你下单甚至送你家门口,你决定要还是不要,能够达到这个程度。

再就是个性化营销,现在互联网跟个性化紧密不分开的,未来所有行业,所有服务都是个性化的。比如你去坐飞机,我坐飞机喜欢坐走道那个位置,有人喜欢坐窗户,有人喜欢坐中间,每次值机时个性化,一刷身份证都办好,喜欢前排靠窗还是后排靠中,都知道你的喜好不用你再选择。最后是广告精准投放,在当时的页面进行投放。

我在微软工作时,看到谷歌这个投放引擎也有缺陷,前几年的技术,当时美联航出一起空难事故,读空难新闻时旁边还打美联航广告,起到了负面作用。因为刚出一个事故还打广告,反倒引起用户憎恨。如果美联航出事儿旁边打西南航空广告这起好效果,一下子西南航空销售就上去了。

ZARA是一个服装快销模式,从新品上线到最后人到门店里面能买,基本就两周时间。因为时装潮流非常快,一眨眼可能就变成新的潮流,如果跟不上这个库存一积压,想做时装就很难生存。

再下来智慧社区,这跟我们的生活是紧密相关的。智慧社区分四个层面,有居室,有小区,五百米生活圈跟两公里生活圈。做社区O2O的非常多,电商,旅游医疗,教育APP,各种各样的APP。谷歌花了32亿美金收购智能温控公司NEST,为什么花这么多钱?

我认为最核心的就是前面嘉宾讲到的,原来这些设备、手机是控制它,要主动操作。现在新的设备是感知和适应,不需要做任何工作,温度可以感知你的最喜好的舒适程度,感知空气温度,帮你自动做调整,不用你做任何的事情,这就是所谓的智慧家居、智慧小区它的终极概念。环境和设备是自动适应人的,不需要你操作和控制,也是个性化的核心概念。

下面是我们一个合作伙伴,他在整个城市铺设免费看视频、电视的一个平台,对智慧民生非常有帮助,比如医院,机场,办公楼,小区,随时可以看到免费视频,可以把各种精准广告还有应用,游戏,彩票都可以嫁接上面形成一个新的门户。

还有移动医疗行业,最近热门的春雨医生、大姨吗、丁香园都拿到了千万美元的投资。但西医App模式的短板是没有体检化验没法诊断、开处方。

这家公司做的中医APP,注重中医健康养生,中医本来就是问诊模式,你上去问我有一点头疼,中医会问你家族病史,你的生活习惯,饮食习惯,给你开一个健康调养方案,未来对每个用户就可以形成个性化的养生、治疗方案,所以能够在这个移动医疗领域进行创新,移动领域也能够逐渐颠覆传统的模式。

最后讲一下清华大数据处理中心,我们孵化的新公司是做中小学,个性化的评测和辅导平台。

传统教育市场,在线教育创业的人太多了,但都是网上课件或者把老师和学生对接一下这样的平台。没有起到关键作用,教育最关键是什么问题?

教师资源很紧缺,老师没有时间改卷子,孩子每天做题恨不得一天做二十套,书山题海里面不能自拔,家长掌握不了孩子情况,送培训班一小时七八百,不知道干什么,学什么东西。

K12教学的困境:根据统计,老师一对一对孩子教学不超过5%,老师没有时间进行个性化的教学,学生主要做题目,没有时间思考,思考时间只占他时间的1%。家长每天每年花的钱都是在好几千块,占一多半。这就是我们教育市场的现状。

如何解决这一个问题,美国IBM出了一个大数据产品,叫机器人医生,可以做癌症诊断。我们做的是机器人老师,可以自动判卷,对数学、物理、化学题目,主要是主观题,逐行阅卷找出问题,针对每个孩子的问题做个性化辅导,我们做的是这样的一个产品。

教师不用改卷子,现在成都七中老师周考还有家庭作业都是机器人改,老师可以有大量时间跟学生一对一辅导,解决每一个步骤里面的问题,还可以根据他的学习状况加餐,每个孩子学习过程都不一样。

对于家长来说对孩子每个状况和问题都会发到家长手机上面,可以精确了解孩子问题。对学校可以生成各种报表,做教育效果评估,综合全国中小学数据,教材选择都可以通过大数据提出指导意见。

后台技术像智能笔,公式识别,自然语言处理,机器学习,人工智能,云计算,大数据挖掘这些都结合起来,未来我们想做全国教育的一个名片,采用综合方法来处理中小学教育问题。

最后做一个小广告,我们中心,还有其他的作者,我们出版了一本书叫做《大数据革命-理论模式与技术创新》,去年9月份出版,里面有我讲的很多内容,包括数据科学理论,还有数据创新的一些知识写在里面,感兴趣可以在京东和当当上面购买这一本书。我的演讲到这里,谢谢大家。

本期编辑:卢苗苗

原文发布于微信公众号 - 数据派THU(DatapiTHU)

原文发表时间:2017-03-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习算法与Python学习

我到底是被如何骗上“人工智能”这条路?

今天幂次妹讲的是4个关于“人工智能”的故事,来看看那么多人为什么选择“人工智能”。

812
来自专栏AI科技大本营的专栏

观点 | 亚马逊物流启示录:谁说AI会增加失业?就业越来越多好吗

作者 |Tim O'Reilly 编译 | 圣迪 整理 | AI100(rgznai100) 近年来,关于AI和机器人行将取代人类的声音,总是不绝于耳。但我那...

3639
来自专栏轮子工厂

技术人员的发展之路

2012年的时候写过一篇叫《程序算法与人生选择》的文章,我用算法来类比如何做选择,说白了就是怎么去计算,但是并没有讲程序员可以发展的方向有哪些。 所以,就算是有...

814
来自专栏大数据文摘

吴军:机器智能时代,如何成为最先受益的2%?

2104
来自专栏腾讯大讲堂的专栏

腾讯携手人人都是产品经理,16位实战派专家汇聚中国硅谷 · 深圳,共话产品增长新趋势

1483
来自专栏新智元

2018全球创新公司Top 50最新出炉,苹果夺冠,腾讯跃升第4

来源:fastcompany 编译:Marvin、张乾、弗朗西斯 【新智元导读】2018年全球最具创新力公司Top 50榜单最新出炉:苹果公司当仁不让排名第一,...

45112
来自专栏大数据文摘

医疗保健大数据分析需要物联网

34512
来自专栏新智元

“公司为先”是硅谷神话,印象笔记创始人谈AI创投3大问题6大偏见

【新智元导读】前 Evernote 联合创始人兼 CEO Phil Libin 成立了 AI 产品孵化公司 All Turtles,他列举了 AI 创投领域的3...

3618
来自专栏罗超频道

美团大象、头条Lark,为什么小巨头都要做自己的IM?

最近一段时间,关于隐私的话题在不断地撩拨网友们的神经。李彦宏一句“多数情况下,中国人愿意用隐私交换便捷性”的大实话引发许多网友的抨击,苹果iCloud、Face...

7349
来自专栏新智元

【CES】IBM CEO 主旨演讲:Watson 将 AI 引入商务世界?

周三晚上,拉斯维加斯的威尼斯人酒店中,IBM首席执行官Ginni Rometty进行了一场消费者电子产品展览(CES)的主旨演讲。 消费者技术协会主席Gary ...

3827

扫码关注云+社区

领取腾讯云代金券