专栏首页挖掘大数据普元CTO焦烈焱强调数字经济时代企业需要智能化大数据治理
原创

普元CTO焦烈焱强调数字经济时代企业需要智能化大数据治理

12月7日,2017中国大数据技术大会(BDTC)在北京盛大召开。普元CTO焦烈焱连续第3年受邀出席这一国内最具影响力、规模最大的大数据领域技术盛会,并发表主题演讲。在云集中科院、澳大利亚昆士兰大学等国内外知名专家学者的本届大会上,焦烈焱紧密贴合本届主题“大数据与智能”,进行了题为《数字经济时代的智能化大数据治理》的主题演讲,通过对数字经济时代的剖解与洞察,指出数字经济时代需要新一代大数据治理,并围绕如何实现智能化自服务大数据治理、智能化自服务大数据治理核心架构进行分享。

今天,很多企业里都在问大数据厂商,你们到底有什么数据,这些数据到底能帮我产生什么样的价值,大家都在问这个问题,就是最好的事情。大数据这十年发生了比较大的变化,最重要的一点,就是大数据这件事已经深入人心。从管理者到各方各面的人,大家都被普及了大数据的技术理念,也知道要用大数据的方式来解决自身问题。

大数据时代,企业如何转型?

焦烈焱表示,以前做IT,客户更多的是从内部管理的角度来解决问题;现在是数据化的时代,不仅仅是管理,合作伙伴、IOT物联网设备都会发挥巨大的作用。在这样一个大数据的时代,谁能够建立起数字化企业的这个技术的平台,谁就能够更好的支撑自己的业务的前景。

智能化大数据治理,实际上是数字化平台的一部分。企业只有把数据治理数据管理做好了,才可以让数据发挥更大的价值。现在,每家企业的数据特别多,拥有几百套系统,上千张报表的传统企业不在少数。他们的IT系统每天还增加着大量的数据,企业如何知道我有哪些数据,有了这个数据之后怎么拿得到,之后如何发挥价值,大数据治理就是要解决这方面的问题。

普元正在建设数字化企业云平台ThePlatform,通过数据治理的手段,让企业用户找到数据,合理利用数据。

“智能”的数据治理

笔者最初是在普元PWorld技术大会听到的大数据治理、元数据等概念,其实,CSDN作为技术社区在活动组织过程中也会遇到数据不标准的,需要清洗的问题。对此,焦烈焱解释,像CSDN这样一个单点来说,拿到一些数据后可能有一些脏数据,数据不准确,但通过人力总能把这个东西做好。但是,如果传统大型企业面临这种问题,企业系统多、体量大,很多企业就觉得吃不消了。传统的数据治理,更多的如何建立数据管理的流程、组织机构,但是这种方法的自动化、智能化的程度不高、投入大;普元讲的智能化治理,是用大数据的技术手段,把用户效率、自动化程度提升起来,从而建立数据标准、数据模型,并把数据和业务关联起来。

数据治理的理想与现实

针对大数据问题,企业大多不是用技术语言来索要的,都是通过业务的语言。焦烈焱首先举了一个金融行业的例子——账户余额。这个词大家好像都听得懂,但在银行的业务领域,账户余额其实有很多的类型和分类。但这是银行业务的定义,IT系统里存的账户余额数据从技术的角度如何划分,银行客户就不一定非常清楚了。不同业务的技术理解不同,银行很多的数据都是不一致的,这可能造成监管报送时数据无法匹配。“普元现在面临的主要困难,就是把这些数据合理的组织起来,然后让客户的业务和技术,能做相对准确的映射。”

再比如用户画像,它也是数据治理的一个成果。客户统计口径统一、描述维度的准确、信息项的清晰后,就可以通过画像把数据收集起来。后期,客户想要增加一个维度,普元就需要对这个维度进行改变,这些都是数据治理要解决的问题。

理想情况是建立一套数据标准,然后把数据标准跟现在的IP做一个映射,实际的情况一般都是先污染后治理。

现在,普元针对客户现有的数据架构进行梳理,从映射数据做标准化的转化和约束,清理出这个数据。焦烈焱表示,普元数据治理的最终目标,是把数据变成服务,提供给使用者,帮企业建立一个数据统一的工作环境。在这个环境里,客户能找到数据,要到数据,然后能使用数据,大幅简化传统数据治理的工作量。

大数据人才

对于大数据人才的挑选,焦烈焱比较关注两点。

第一,偏人工智能方向,希望寻找具备包括深度学习、传统的统计学、知识图谱,知识工程方面的综合型人才。“对我们来说没有必要去单独做算法研究,目前的算法对我们来说够用了,足够了”。普元会用现有的一些成熟算法,根据现有业务上遇到的问题,总结出一些新的模型出来。 第二,他比较关注人才在行业里业务是否熟悉,是否能用现有技术知识跟客户的需求对接起来。

最后,焦烈焱对CSDN的社区工作也提出了表扬,“现在CSDN的培训业做的很好,大家都在学大数据、统计学、算法的相关知识了,这是很重要的。把这些技术理念灌输到人们日常生活当中,是很重要的事情。希望未来普元能与CSDN一同将技术理念、实践经验输出到社区平台中,帮助到更多的开发人员积累技术知识。”

后记

大数据技术通过10年的时间,从概念落地到行业,让大家明白这个技术可以帮助人们在自身业务里做一些实际的事情。普元作为一线的IT服务商,从产业的角度给我们分享了大数据和方面的话题,这对致力于该领域学习、研究的工作人员来说,有很好的实践意义可以借鉴。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大数据应用:10大行业应用痛点及解决策略

    大数据已经成为这几年中大部分行业的追捧热点,随着大数据继续渗透到我们的日常生活中,围绕大数据的概念热点正在转向实际使用中的真正价值。

    挖掘大数据
  • 大数据平台的现实思考

    “目前我们正在规划我们新一代的智能数据平台;这几年以来,我们也一直在尝试做一个足够强大的数据平台来高效支持内外部的应用;我们也在不断调研全球最新的数据技术和产品...

    挖掘大数据
  • 2017大数据领域十大必读书籍

    历史大浪淘沙经过5次信息革命,终于迎来大数据时代,给信息领域灌入了强劲的血液,催生了很多新生力量,而各行各业谁也无法离开数据存活。尤其近几年来,全球范围内掀起了...

    挖掘大数据
  • 关于数据发现的一些实践经验

    为什么要做数据发现工具呢?原因很简单,随着团队发展,我们的数据平台接入的数据量、数据种类、数据来源和数据库类型越来越多;数据多了之后,原本很多只能停留在想一想的...

    哒呵呵
  • 【观点】大数据不是万能的,它不适合处理这10件事情

    许多企业领导人开始接纳大数据处理并期待神奇和奇迹,但却发现大数据带来新的复杂性——且从中获益所需要付出的努力要预计中的多得多。 ...

    小莹莹
  • 你真的需要那么多报表么?

    企业对于数据的重视程度越来越高,很多业务部门也深刻意识到了数据的重要性,希望通过数据挖掘出动态变化,复杂,跨域多渠道的,内外部集成的业务现象背后的逻辑,从而来指...

    凯哥
  • Pipeline大数据架构

    Pipeline大数据架构,面向大数据仓库和大数据处理平台。是基于lambda的大数据架构的变种,增加了企业级服务,而并非只是大数据组件的对切,是一种更落地的方...

    王小雷
  • 大数据专才:“走俏”变“紧缺”

    应对大数据时代的挑战,国内学术界最近动静不小。中科院院士马志明说,上月他每周都在见证一家全新的、和大数据相关的研究机构或研究平台诞生。从中科院系统内部培育的重...

    腾讯研究院
  • DàYé玩转数据战略Step By Step

    我们先看看工业革命的演进路径,从1.0的蒸汽机时代,到2.0的电力、流水线和大规模生产时代,再到3.0的计算机自动化时代,最后是4.0的智能化时代。

    曲水流觞
  • 一篇文章详解大数据技术和应用场景

    说起大数据,估计大家都觉得只听过概念,但是具体是什么东西,怎么定义,没有一个标准的东西,因为在我们的印象中好像很多公司都叫大数据公司,业务形态则有几百种,感觉不...

    民工哥

扫码关注云+社区

领取腾讯云代金券