【御数之旅-5】企业数据世界论坛结题篇:洞察行业趋势,倾听中国好声音

大数据文摘和御数坊合作,带给您“数据治理与管理领域”顶尖时讯。此活动由御数坊创始人刘晨,亲临美国企业数据世界EDW2015大会现场,为您报道大数据最不应却又最容易被忽略的内容,大数据文摘和御数坊同步为您传递...

御数坊简介

微信ID: DGWorkshop_CN 专注于数据治理与管理领域,致力于将全球最优质的数据治理与数据管理资源带给中国数据从业者,帮助中国各行各业企业客户夯实数据基础,提升数据质量,为数据资产价值的挖掘和创造保驾护航。

美国东部时间4月1日至4月3日上午,第19届企业数据世界EDW大会在华盛顿11街凯悦(Grand Hyatt)酒店呈现了精彩纷呈的两天半论坛议程。亮点和干货太多,我们却分身乏术、撰稿时间有限,只好合并报道、作为本次“御数之旅”的结题篇。

用数据看议题,洞察焦点和趋势

会议期间,我们一直忙于聆听演讲、更换会场、同行交流。正如第3期所说,当一大波数据大佬来袭的时候,观众的选择极其困难。因此,虽然我们收获了很多,但难免有些只见树叶不见森林,忽略了对行业发展的趋势观察。所以,让我们从具体内容跳出来、从整体上看看这次大会演讲议题的分布,看看有哪些趋势性的洞察。

官方对议题的统计和分析没有发布,下面的分析完全是御数坊根据官方日程安排独立完成,可能会有疏漏,但也基本能为大家展示此次会议的全貌。

这次会议共有演讲178个,官方将演讲主题共分为21类,每一个演讲可能属于多个类,因此各类演讲的数字之和是234。从主题分布来看,不难得到以下关键发现:

1.数据治理与管理制度仍然是企业开展数据工作最为关心的话题。数据与业务、数据与技术、数据与管理,这几方面的协调一致都需要基于企业实际情况去确定组织、职责、制度、流程、标准,而这部分内容也高度依赖于企业文化、人员意识、技能和习惯。御数坊认为,在可预见的未来,数据治理将始终是数据工作的核心关注,数据资产价值的发挥与创造,需要靠数据治理来保障。让我们再来回顾一下美联储的数据治理体系框架。可以看到,美联储谈的是广义的数据治理:将数据战略、治理、各项数据管理能力,统一纳入到治理框架中。

2.数据战略的关注程度前所未有。EDW大会的主办方是DAMA(Data Management Association),源于DBA、数据建模等IT技术工作,逐渐发展为主要关注数据管理,而对于数据在企业发展中的定位、价值创造等战略话题关注不多。一个例证是,在2009年出版的《DAMA数据管理知识体系指南》(DMBOK)中,数据战略的话题只出现过一次,是作为“数据治理”的活动之一进行阐述。御数坊认为,随着最近几年对数据资产价值的重视,继企业发展战略、信息化战略之后,数据战略已经成为企业又一重要的顶层设计,为企业数据工作制定蓝图与演进路线。让我们看看Equifax是怎样谈数据战略的。

首先,在Equifax内部,大家对数据战略还存在不完全一致的理解,这是由于公司目标(以及对数据的依赖和使用方式)的定义不一致。

其次,在Equifax,数据战略的核心焦点是:为获得深度洞察提供支持,从而应对客户当前和未来所面临的各种挑战。其主要功能有三:

  • 支持洞察:从大数据中洞察如何解决客户痛点。
  • 数据创新:主动从数据中发现价值和机会。
  • 数据评估:数据资产是获得数据洞察的基础,持续寻找可创造新价值的新数据资产。

3.大数据的新兴力量与传统数据管理互为补充。从数据中可以看到,如果将NoSQL,Big Data, Hadoop,Data Science等主题合并起来,新兴数据话题的数量已经远超Data Architecture,Data Modeling,Data Integration,Metadata, Master Data, DataQuality等话题。但是,御数坊认为,这并不代表传统数据管理领域已经过时。架构、元数据、主数据、数据集成、数据质量,这几个话题与大数据不是一个维度的主题。大数据的管理同样要围绕这几方面展开。这一点上,我们同意Robert Seiner的观点,不应谈Big Data Governance,而应该谈Data Governance of Big Data。

这里我们引用DAMA计划在2015年出版的DMBOK第二版的知识体系框架,可以看到,新版DMBOK并未将Big Data作为独立章节来体现,而是将大数据的管理融入各个职能中。

4.数据建模与敏捷开发中的数据管理:值得关注却似乎被国内忽视的主题。数据建模的主题在本次大会演讲数量中排名前五,但在国内会议中更倾向讨论系统级架构而非数据建模的细化方法。这次大会上讨论数据建模的内容,更多是围绕新兴数据库的,比如NoSQL对数据建模的影响、文档数据库如何建模、Cassandra如何建模等。企业数据模型直接反映了企业的业务需求和数据需求,是企业数据架构的核心,其重要性怎样强调都不为过。让我们看看EBAY如何看待NoSQL建模对企业数据架构的影响。

企业数据架构是将企业信息资产与核心业务战略协同的主蓝图,对信息产生和消费提供整合视图,是企业集成各方面的框架,在企业各项数据管理工作起到核心作用,如数据质量、数据管理职责、数据安全、数据治理、数据生命周期管理等。

大数据时代有众多NoSQL数据库,覆盖了在线、近线和离线数据存储。

NoSQL对企业数据架构产生的影响在于:基础思维方式的转变,包括获得更敏捷的开发能力,专注于物理模型设计获得更高性能的分布式查询,支持近实时的半结构化、非结构化大数据获取。保持不变的内容包括:基础软件工程实践,Just-In-Time的软件设计和开发方法,业务/数据/流程建模的技术工具。

敏捷开发相信在国内已有广泛实践,但是如何在敏捷开发中考虑数据管理、敏捷开发与元数据、数据质量、数据架构等如何有效结合,从而保障数据的质量?这类话题几乎还没有涉及。也许有人会说,敏捷强调的是快速交付和迭代,数据治理和管理会让开发“不敏捷”。确有其道理,但是应用交付后,数据如何保障?如果不能在开发过程中考虑数据,恐怕再敏捷的开发也可能要推到重来。这方面我们再来看看Robert Seiner的思考。

如何把敏捷开发推销给数据人?

如何把数据治理推销给敏捷开发人员?

数据治理与敏捷开发,可以共存吗?

来自中国参会者的声音

这次EDW大会上有两次中国好声音,首先由DAMA China主席胡本立先生探讨前瞻性半结构化数据模型。下图为胡本立先生在演讲:半结构化模型-广义数据建模缺失的一项工作 The Semi-StructuralModel – A Missing Effort of 'Data Modeling' in ItsBroader Sense。有来自EBAY,SAP等多家知名公司的专家在会上和会后留下交换意见,导致下一个session未能准时开始。

接下来,DAMA China资深会员、房地美首席架构师邓新华博士带来:基于企业逻辑数据模型和SOA架构进行企业数据集成。根据笔者经验,这对于国内众多已经实施了企业级数据模型却未能达到预期效果、对企业数据模型的价值尚存困惑的企业来说,有很好的参考借鉴作用

使用SOA架构+企业逻辑数据模型支撑企业数据集成,显著降低TCO,提高组件复用度,加快产品和服务对市场的响应,实现应用解耦。

基于企业逻辑数据模型实现企业数据机场标准、项目建设快速建模,从而提升数据质量、降低复杂度。

在项目建设过程中加强对数据架构和模型的管控,所有新开发项目必须使用企业数据模型,所有数据集成和移动必须遵从企业数据模型。

此外,部分中国同胞在会议期间安排了小聚,探讨中美数据管理发展、深度沟通工作和参会心得,纷纷表示回国后一定要保持联系,多多交流。下图是来自御数坊、房地美、世界银行、联想的中国参会者合影。

EDW2015大会让来自中国的参会者收获多多,让我们节选几位的感言:

“胡先生好!我们已经顺利回到北京了,非常感谢您邀请我参加这次的国际会议,收获真的是超预期,能亲身感受到世界各地的数据应用情况,能面对面交流,让我受益匪浅,似乎开阔眼界了,再次谢谢您,并期待您的中国行。” ——来自金融机构的参会者给胡本立先生发来消息 “…建议多对焦那些成功的实例,特别是大牌公司的企业规模的cases。他们的成功是用失败和教训沉淀而来的。这也正是EDW的宗旨。相信对国内的企业有参考价值。” ——来自房地美的邓新华博士为【御数之旅】提供建议 “信息是数据经过甄别和处理后的高级表现,信息比数据更具有业务意义和价值。“DT时代”的说法,并不是说明数据比信息更重要,反之,它说明随着人类各种生活行为被不断数字化而带来的不规则数据的几何量级的增长,由数据到信息的转换更加重要和复杂,现有的成熟的IT技术已经不能适应这种需要。从这个角度说,DT时代是下一代信息技术革命的前夜。”

结语:御数之旅,刚刚开始

大数据文摘ID:BigDataDigest

专注大数据,每日有分享

覆盖千万读者的WeMedia联盟成员之一

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2015-04-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SAP最佳业务实践

从SAP最佳业务实践看企业管理(10)-CRM

假如你是一个销售,你知道你和客户处于什么阶段吗? 客户生命周期描述了客户关系水平随时间变化的发展轨迹,它描述了客户关系从一种状态(一个阶段)向另一种状态(另一...

3016
来自专栏华章科技

如何成为大数据企业?献给不懂数据挖掘的你

一家中等规模的百货商场,通过视频监控记录下商场各个区域的客流人数,从而评估每天各个时段客流的在店时长,进而结合销售记录数据估算出客流中带有明确购买目标的“搜索型...

1012
来自专栏大数据文摘

数字驱动教育:未来的教室应该是什么样的

2185
来自专栏CDA数据分析师

不知道 AI 这三点优势,你可能真的要被淘汰!

我们正处于飞速发展的数字化转型时期,这是由巨大的市场转变驱动的——即人工智能和机器学习。

1082
来自专栏罗超频道

百度饮得知识图谱的头啖汤!会让大家跟着吃鸡吗?

2017年,知识经济日益火爆,分答、知乎、得到等知识平台可谓如日中天。眼下这种火爆已在从人类延展到机器。互联网巨头纷纷对知识变得饥渴起来,知识成为数据之后的又一...

3718
来自专栏数据猿

华院CEO唐岳岚:数论致远 精行未来--华院助力运营商大数据运营实践

<数据猿导读> 华院分析(上海)CEO唐岳岚在2016年中国信息通信大数据大会发表了以“数论致远 精行未来--华院助力运营商大数据运营实践”为主题的演讲。 ? ...

2586
来自专栏华章科技

大数据行业洞察:未来2-3年或迎数据时代的真正高潮

从2012年的“用户标签”到2014年的“用户画像”,从2015年的“大数据”到2017年的“人工智能”,大数据正在从神坛走向现实。“标签”到“画像”,代表着数...

571
来自专栏灯塔大数据

成为“大数据企业”,献给不懂数据挖掘的你

文|郭迅华:清华大学经济管理学院副教授 一家中等规模的百货商场,通过视频监控记录下商场各个区域的客流人数,从而评估每天各个时段客流的在店时长,进而结合销售记录数...

3467
来自专栏华章科技

做数据挖掘工作需要具备哪些思维原理?

大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是“数据”为核心的范式。非结构化数据及分析需求,将改变I...

581
来自专栏量子位

搜狗地图AI突围:激进冒险的策略背后,是与百度高德换道竞争

李根 发自 一路向南G71 量子位报道 | 公众号 QbitAI AI代表的新技术可能不光开拓新领域,也在冲击固有市场格局。 新技术+旧产品,这样的趋势变革正...

3566

扫码关注云+社区

领取腾讯云代金券