智慧足迹数据总经理李振军:位置大数据行业应用

<数据猿导读>

智慧足迹数据总经理李振军在2016年中国信息通信大数据大会上主要发表了以“位置大数据行业应用”为主题的演讲,主要围绕运营商做大数据,就如何把大数据做到产品化、专业化进行分享

数据猿报道,2016年4月20-21日,2016中国信息通信大数据大会在京召开。大会以“开放共享、转型创新”为主题,聚焦通信业大数据产业生态,邀请工信部、院士专家、三大运营商集团及省市大数据相关业务部门领导以及领先的大数据产业领军企业及应用单位代表出席,共同探讨通信业大数据发展带来的产业机遇和挑战。

本次大会主要针对前沿ICT技术与解决方案对运营商大数据能力建设的提升以及业务运营、架构的转型影响,通信业大数据的开放应用以及开放、共享、创新的产业生态等热点话题展开讨论,全景展现运营商大数据能力建设规划与开放应用策略。

本文由“135编辑器”提供技术支持

以下是数据猿现场独家直播“智慧足迹数据总经理李振军”的发言实录:

李振军:各位嘉宾,大家上午好!我是来自中国联通的李振军,今天整个分享基本都是围绕运营商大数据应用展开的。在昨天,我们联通的范总把整个联通大数据的情况做了一个介绍,刚才移动的段总也把中国移动的情况进行了介绍,我这里主要就从一个点出发,就是运营商做大数据,如何把大数据做到产品化、专业化。专注的去做,用匠人精神去做聚焦某一方面的事。

大家可以看到智慧足迹公司是中国联通和西班牙电信合资成立的一个大数据公司。这个公司就是做大数据专业的产品,该公司有三个特点:

1.它有中国联通集团的全国的数据接入以及外部数据的引入。

2.它有整个在国际上比较成熟的产品的引入。

3.我们有一支专业的团队来做专业的行业应用。

先说第一块,联通的数据有一个特点,如果说数据类型,数据内容,我想三大运营商差不多,联通的特点,昨天范总介绍过,把全国所有的手机数据进行了大集中,并且进行了能力开放,这是联通数据的特点。我们公司把所有联通数据和公司做了对接,同时也引入了很多外部的数据,这是数据这方面。虽然来自运营商,但是我们不能片面性,运营商的数据有优势,我承认,但是运营商的数据也有短板,毕竟三大运营商它是把用户群进行了纵分,BAT互联网公司数据是横分,应该是各有各的优势。

我们在做业务的时候,我既要用联通数据,也愿意跟其他友商合作,更愿意跟互联网公司合作,我们目前引入了一些互联网公司的数据。在数据层面,如果把它聚焦在联通用户的数据,昨天我记得袁总做了特别精彩的演讲,把整个运营商的数据做了非常独到的完整的前瞻性的分析。

按照我个人的观点,我想运营商的数据核心就是两个,一个是连续性,一个是完整性。同样是联通的用户,他每时每刻的数据我们都有。完整性,对于同样一个人,他上网的所有记录,他的CRM,用户属性,URL我们全知道,他有一个空间上的完整性,这是第一块,我们数据到底有什么特点和优势。

第二块就是专业的产品。在位置这一块,基本上政府行业关心的就是常用的问题,人们从哪里来,他们在哪里工作,多少人是住在五环以外,每天通行量如何,政府关心这些。企业关心这个店铺每天经过多少人,我投一个户外广告,每天经过多少人,他们是IT型的还是母婴型的。针对这些需求,两三年之内,几乎所有公司都在做类似的产品。客户需求来了,我们就去建模,去把基于现在的数据库里的数据抽出来,作出一个报告给客户。应该是从2004年开始,基本上一点一点就越做越多了。

我问一个问题,这些报告从字面到可视化了,准吗?这个数据是否是真实的,还原了真实的场景和人流,我们做的这个产品就是将所有基本的工作产品化、标准化,让数据说真话,能还原数据线性的本质。

我们怎么来做这个产品呢?都是行业专家,高手如云,我把我们产品的情况做一个简单介绍。既然做位置,一个人的位置无外乎两个事情,第一他的驻留,第二他的出行。我们把2.8亿的联通用户,每个人每天的驻行数据跑出来,我们把所有的驻留和出行进行纠错、优化的分析,从而把每个人驻留的POI和出行的GOI数据跑出来,这是产品最基本的一个特点。我们会形成各种洞察报告,满足用户运营方面的、决策方面或者营销方面的需求。

大家看到基于位置的报告,不论是运营商的数据还是互联网公司的数据,无外乎是这几个方面。某一点的人口数是多少,旅游也好还是公安也好还是城市管理也好,这个地方整个POI是什么情况,每个人的出行路线,开发商万达广场,每天这些人从什么地方来,呆了多长时间,又去了什么地方,在网上有什么偏好,如果基于位置做应用,主要的场景应用就是这几个方面,把我们联通产品的东西做一个简单报告。

比如人流,我开了一个店铺,或者我在这个地方投了一个户外广告,在北京西单或者国贸,一天到底经过多少人,传统方法是怎么做?就是基于运营商信令数据,都是基于运营商的基站来定位,这个地方相当于定点画圈数人头这种方式。这种方式有一个问题,比如在西单一个广告屏,他是朝东的,画一个圈,他是一个圈,西边的人也含进去,我们虚报了人流的统计。

对一个店铺也是,对一条路也是,城市管理部门想知道这条路每天经过多少人多少车,到底是左边这条路还是右边这条路,运营商没法区别出来。在交叉的地方,我们用频率推算他的场强,运营商的位置更精准就解决了一个很根本的问题,位置准是我们谈后面所有应用的前提。这是我们在定位,在人口流量方面的一个特点。

第二块就是POI点分析。POI就是一个人他的工作在什么地方,居住在什么地方,常去哪些地方,参加哪些活动,我们长期观察,一定要知道什么是驻留,驻留就是停留,传统方法怎么做呢?基于基站,我们会用什么方式去做呢?第一点,我们会把所有的基站做一个分析,将相关基站连在一起进行分析。第二点,会把时间拉长,设一个参数,比如三十分钟,只有超过三十分钟,我才认为他是一个驻留。第三点,每天驻留之后,按照时间拉长,到了月底再去优化POI,这样跑出来的工作地、居住地、兴趣点就会非常符合实际情况。

第三个方面就是出行路线。驻留、出行路线方面,路线我们做很多场景都需要路线,传统的方法怎么做呢?在A基站有个位置,B基站有个位置,我们知道OD了,他从O到D,但是中间如果有十字路口,如果有两条路,或者有曲折,他怎么走的?

可以坦白说,如果用传统的方法,无法计算出这个路径出来,只能得到A点到B点这个直线。我们怎么做的呢?我们是把这个人他的信令事件高频率的采集,每产生一个就采集出来,采集出来之后,我用地理信息系统路线去比对,从黑线挖掘出蓝线出来,而蓝线就是他实际的情况。比如政府研究过河过桥,过河之前有四条路,过桥之后又有五条路,到底怎么走的?如果把这个还原成路径,就可以把问题解决掉。

出行方式,到底选用什么样的交通方式?是公路、铁路?做一个简单的示意,还有常见的分析就是客源地分析,不管是旅游也好还是展会也好,用户从哪里来的,客源地分析的最大的特点就是数据一定要集中,如果不集中就是一个片面的分析。包括江主任也提到了中国电信统计的荷兰相关的情况,这样就把我们运营商数据集中的优势发挥到极致。

做一个简单的整理,我们用专业的公司做运营商的数据有六个特点:

第一个特点就是定位准,用了加权、降噪的方法。

第二个特点就是轨迹全,我把每个用户长期观察,还原出他真实的轨迹。

第三个特点,因为整个产品化,我们效率比较高,自动化批量,能节约90%的时间,处理全国的数据每天只需要几个小时,每个月只需要几天,就可以把所有的数据跑出来。跑出来马上有一个优点,沉淀,因为数据已经转化成了高价值的数据,我长期保存,它有什么价值呢?对城市管理部门他想知道四年前五年前这个城市有多少人,当时的交通情况如何,现在国内几乎找不到这个数据。如果我把这个数据长期保存,它就是一个永久的宝贵的资产。

最后一个特点,智能化。整个产品是机器学习,最后落脚在企业省成本上,比如我们在交通,我可以帮助政府和企业省75%左右的成本。

以上是整个产品基础的一个介绍,另外我们这几年一直在做大数据,最大的感触,大数据一定是要围着客户需求走。我们在做整个产品的时候都是用客户需求来推动产品,我们做了几个典型的领域:

第一个领域就是城市规划,在一个城市做城市规划的时候,传统的方法就是找调研公司去调查,所用的样本基本不到3%。如果用任何一家数据,基本上能够达到10%以上,这个数据量足够,而且运营商的数据是均匀的,可以说任何一家数据从大数据统计学上来说,都足以代表了整个人的特点和趋势。

三类,有的客户要的是数据集,我把一个时间段的多少人数告诉他;有的要的是报告;还有的我给他一个实时的平台,比如规划设计单位可以实时选两个点,人数马上出来。这些人的年龄段也马上出来,这是我们做的第一个主要的行业产品。

第二个产品就是交通路况监测,主要就是聚焦于高速公路、国道、省道。如果做市内的路况,高德、百度做的比我们好,如果做高速长期的数据,我们跟交通部达成了全国范围内的合作,目前大概已经在五六个省开始做交通监测工作了。我做的交通监测,我会把交通部的摄像头数据,感应线数据融合起来进行比对测算。如果我们做一个报告或者做一个系统,没有第三方的验证,这个数据基本是很难让大家来相信的。这是在交通领域。

第三个领域就是商圈,我们主要是聚焦选址。比如联通全国几万个营业厅的选址、优化包括合并,所有的我们公司统一来做,这有很专业的选址模型。其中核心的一块就是每个地点人流量,如果只是简单做人流量,回到了传统方法,我们会把这些经过营业厅的所有人,他的工作地、居住地也还原出来,这样的话,对运营商来说,可以更好地服务于他的用户。包括我们跟四大行,16个股份制银行合作,还有很多外资企业,比如星巴克,他们都有选址优化的需求。我们在这方面也有很多的案例和探索。

还有一块就是三大运营商都提到的金融服务,我们给银行、保险公司做信息验真、评级、反欺诈的产品。我们到网上贷款,银行要核你的身份证、姓名、手机号,是不是一个真实的人。第二你填的居住地是不是真实的地址,运营商我们有数据,银行授权,银行用户授权,这个时候我们做一个比对,我告诉他真还是假,这是验真。

反欺诈是什么情况?比如在座的人在会场开会,你的信用卡在浙江发生一笔交易,银行会做一个信息比对,他有理由认为这笔交易是一个盗刷。这个用户几分钟之前还在距离你交易点有几百公里以外,银行就会跟用户去核实,你是否发生了这次交易,如果没有,马上挂起,保护了银行用户的财产,是对社会做一件很有价值,很有公益性的一件事情。

再有就是所有人都会提的精准营销,在大数据方面最先出规模的就是精准营销。我们现在主要的立足点,是把客户的数据加上标签,通过我们的平台来投放物料,这样既给客户提供了服务,又能保证我们运营商用户自己个人的数据安全。

最后就是智慧旅游这一块,我们对位置有很强的洞悉产品化能力,在旅游这方面,我们做游中目的地营销,还可以做游后相关的报告服务,我们有实时人流的能力,我们在城市公共管理领域也在做一些行业应用推广。

最后回顾一下,应该说我们智慧足迹是中国联通成立的一个专业做大数据应用的公司。我们也特别想同在座的各位专家,各个行业的伙伴们一起合作,能够给客户提供更好的服务,如果大家对我们感兴趣,可以随时联系我们,我们一起做大数据更专业更博大的一些事。

谢谢大家!

来源:数据猿(www.datayuan.cn)

原文发布于微信公众号 - 数据猿(datayuancn)

原文发表时间:2016-04-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏镁客网

硬纪元AI峰会实录 | 陈建文:在国内大环境下,只做技术唯有死路一条

1624
来自专栏悦思悦读

破解性别歧视,助力职业发展

如果你说“我真的觉得没有、我没经历过、我觉得,从小到大似乎都是男女平等的”。那说明你生活在一个非常友好环境;有非常开明的父母给你营造了一个很好的成长空间;在学校...

1382
来自专栏Python中文社区

只会 Python,如何拿下科技企业的高薪 Offer?

大数据因为其背后蕴含的价值,被《经济学杂志》在2017年誉为“新的石油”,数据导向的工作也成为很多人的向往之一,特别是数据分析。

1032
来自专栏VRPinea

纽约电影学院新动向:为学生开设VR课程,提供完整的VR影视制作技能

2615
来自专栏AI科技评论

破局者|北理孔祥战:消费者脑子里还没有服务机器人这个品类

GAIR 今年夏天,雷锋网将在深圳举办一场盛况空前的“全球人工智能与机器人创新大会”(简称GAIR)。大会现场,谷歌,DeepMind,Uber,微软等巨头的人...

2917
来自专栏华章科技

薪酬、技术和未来——首份程序员技术增值报告

技术越好薪酬越高。近日,国内首份关于程序员的技术成长与薪酬报告在极客学院出炉。从技术小白到大牛有迹可循。管中窥豹,总能发现意想不到的 IT 大趋势。

712
来自专栏科技向令说

响铃:2号人事部类小米的生态模式,或是2B产品2C产业化的一个标本

这个认识源于响铃近期走访了十几家大大小小的SaaS企业。从2号人事部创始人焦学宁、订货无忧 CEO蒋波等项目创始人到金蝶、拉勾云人事等市场负责人,他们的共识是S...

1104
来自专栏Python中文社区

数据分析师:因为稀缺,所以高薪

大数据因为其背后蕴含的价值,被《经济学杂志》在2017年誉为“新的石油”,数据导向的工作也成为很多人的向往之一,特别是数据分析。

1823
来自专栏数据的力量

华为内部狂转好文,有关大数据,看这一篇就够了!

【导读】科技的进步在很多的时候总会超出我们的想象,试想如果未来我们一个人拥有的电脑设备超过现在全球现在计算能力的总和,一个人产生的数据量超过现在全球数据量的总和...

1382
来自专栏企鹅号快讯

结合AI和VR,这家公司要打造有感情的虚拟克隆人

(原标题:The brave new world of digital humans, designed to do our bidding) ? ObEN联合...

1847

扫码关注云+社区