专访DataStory副总裁唐新民博士:读懂大数据,释放企业数据价值

唐新民博士2018年2月正式加入国内领先的大数据服务公司DataStory,任职副总裁一职,开始负责公司整体解决方案的规划和设计,整合内外部资源完成售前支撑和项目交付,以及交付中心的日常管理和运营。

在唐博士加入前,DataStory的商业化发展已经走上快速发展的轨道。根据DataStory公司2017年报显示,2014年-2017年业绩增长41倍,在2016年-2017年里DAAS+SAAS产品营收持续增长。

DataStory创始人兼CEO徐亚波博士曾多次表示,为了给品牌企业提供更便捷、智能的服务,一直秉承独立的数据应用的开发,成功发布了以DAAS为基础,SAAS为核心的一站式产品体系:数说聚合-数说海纳-数说画像-数说立方-数说雷达-数说领客,构成了从数据采集处理到商业价值实现的完整服务生态链条,以数据驱动智能商业决策,让品牌企业得到更有价值的资讯、服务。如今有唐博士的加入在技术创新探索和商业应用方面一定会取得更丰硕的成果。

以下是对唐博士的访谈内容:

唐博士简介

唐新民博士 DataStory副总裁(VP)

中国香港中文大学计算机科学与工程博士、大数据科学家。主要研究方向为信息安全,大数据,机器学习及计算机视觉。曾在上市公司任子行网络技术股份有限公司负责大数据产品研发及管理工作多年,主持多项国家级及省市级科技项目并顺利结项,累计主导和参与申请了60项发明专利。同时,唐博士还是深圳市海外高层次人才、深圳市南山区领航人才。

唐博士,是什么促使您选择加入DataStory团队呢?

唐博士:首先,我和DataStory创始人徐亚波博士是多年的好友,我们早年也曾在中国香港中文大学共同求学过,可以说对彼此都非常了解。徐博士一路创业下来,始终保持坚韧不拔的态度及乐观进取的开拓精神,是我非常欣赏和认可的品质。他对业界趋势的判断非常具有前瞻性,对产品也有极好的洞察力,他的领导力和决断力都非常出色,拥有丰富的资源对接业务团队。

其次,DataStory有一支业内很强的大数据技术研发团队。经过多年的技术积累,在数据采集、多数据源归集及治理、数据画像分析、数据BI展示方面都拥有了自己的标准化产品,可以为企业提供一站式的大数据解决方案。在面对新的商业场景问题时,也可以快速的形成相应的技术解决方案。

再次,近3年业绩每年翻倍增长的表现,也让我更加确定DataStory定位于数据驱动智能商业决策方向是一个能够持续快速成长的领域,具有广阔的市场前景。

唐博士,您能跟我们谈谈您理解的商业应用场景下大数据产业现状吗?

唐博士:我认为整个大数据商业应用市场还处于早期阶段,主要体现在两个方面:

一是有价值的商业数据还处于缺失状态;二是大数据解决方案提供商的行业深度还不足够。

众所周知,距离行业需求越近的数据质量越高,能够得出的结论越准确,指导意义更强。目前看来,具有商业价值的数据仅在局部市场,以及特定的场景已经成熟,可以为客户创造很大的价值。我们会发现,在很多商业场景下,高质量的数据并不是能够直接获取到的。往往需要通过很多外部数据,或者有关联的数据通过仔细甄别,加工处理,几轮迭代之后近似得到。

即便如此,得到的数据大多不会100%契合行业的需求。这种数据缺失并不能依靠高明的算法,数学建模,或者人工智能来弥补。面对这一现实,只能尽可能立足现在的数据以及算法来帮助客户解决他们的实际问题。同时积极关注数据市场的进一步成熟。

现如今大部分大数据服务提供商集中在数据的加工处理层面,商业场景上还比较偏向外部,没有与行业的核心业务形成深度耦合。这一方面受到企业对自身数据隐私的考虑,及企业数据化战略思维的定位限制;另一方面也反映出大数据服务提供商的行业纵深度不够,还没有形成差异化的产品和解决方案。

您认为在当下中国市场,品牌企业的大数据应用最难的是什么?解决这些问题的关键是什么?

唐博士:我认为企业的首要问题是内部要建立从上至下的数据思维。数据思维绝不只是技术部门的事情,而是整体战略的问题。数据思维要渗透到每一个部门,每一个环节,用数据去辅助决策,让数据去重构业务流程,数据应用才能发挥其最大的价值。只有将数据思维贯彻到企业的每一个环节中,数据才能真正转化成生产力,数据的价值才能真正得以体现。

在建立了数据思维战略的基础上,不同的企业可以采用不同的大数据实施策略。前期由于资源和技术的局限,很多企业内部并没有一支现成的大数据技术团队。其实随着社会分工的细化,这样的投入没有绝对的必要,而且时代的发展也不允许企业有时间去慢慢消化、学习、和独立运营所有的大数据系统。可行的做法就是引入数据服务合作伙伴,整合双方的资源,而迅速地形成生产力。这样行业客户可以将注意力更好地聚焦在自己的主业上,而数据部分可以由数据合作伙伴来一起参与,共同经营。

您认为服务品牌企业大数据商业实施和传统IT项目最大的不同是什么?

唐博士:虽然加入DataStory才仅仅2个月时间,但我十分有幸接触到了不同行业的多家头部公司。这些企业的大数据战略负责人在行业理解的深度,及数据思维的高度都十分让我欣赏和敬佩,并值得我学习。

我认为大数据项目区别以往IT项目的最大不同之处是,双方并不是单纯的以甲乙方的形式存在,双方的关系已经超出了传统的建设和被建设的关系。取而代之的,是一个合作共赢,长期共存的伙伴关系。这一方面要求我们需要具备丰富的数据应用经验,及行业经验来解决客户的商业场景问题;同时也不能只是需求的接收和执行角色。要能够站在行业高度上和客户进行交流讨论,甚至在某些方面能够给予客户以数字化实施的咨询指导意见。

伴随着企业需求与大数据迅猛发展,近几年大数据企业的数量增势迅猛,相关报告显示,我国大数据企业整体呈现“金字塔”状的实力分布。您认为DataStory位于哪一段?

唐博士:DataStory未来必将是位于金字塔顶端的企业之一。依托多年大数据行业经验沉淀,DataStory 已积累社交、电商、视频、门户等 90%以上互联网数据持续采集及监控,基于不同的行业需求特征,成功构建以FMCG为核心的多个TB级行业库及行业标准,真正实现数据资源即取即用,为开展大数据场景化应用奠定扎实的基础,并长期致力于海量互联网数据的深耕与商业价值的挖掘。

从商业化和公司运营角度来看,您认为加入DataStory会给DataStory带来哪些提升?

唐博士:我觉得主要是在以下三个方面:

一是交付大项目的能力

大项目往往交付时间周期会较长,需要同企业客户建立非常紧密的合作关系,对交付团队的规划能力要求很高,同时在项目执行过程中需要和客户共同探索很多未知的问题。我以往的工作经历作为第一负责人承担了很多大项目的交付,相信在这方面可以更好帮助到数说做好项目落地执行。

二是对图像视频类数据的处理能力

我在攻读博士期间研究的课题就是人脸识别,十几年前我所在的实验室在Arm7开发板上通过嵌入式优化就做到了可控环境下的实时人脸识别技术。这些年我也在一直在跟踪图像及视频处理这个领域的技术发展,并具备较多的工程实践经验。

三是工程建模能力

对于很多技术问题,其实在学术研究界已经有了很多尝试和优秀的解决方案。但学术研究往往不太考虑实际应用时的实现代价,而过于追求精度和准确度,造成使用的模型过于复杂。由于我的学术研究背景,能够帮助我更好的找到合适的研究成果用于参考,并通过工程化的方法来实现,最终在技术问题解决的投入和产出上找到一个比较好的平衡点。

了解市场趋势,做规划不烧脑

“行业数据报告大礼包”送给大家

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180418A1EYO200?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券