【经验】数据质量在商业智能中扮演的角色

对于增强数据资产准确度和价值而言,将数据质量规则与活动(探查、清洗和监测)和MDM流程相集成显得十分关键。在启动任何MDM项目之前,您都需要了解源数据的内容、质量和结构。在数据源进行的数据探查使数据管理员和数据仓库管理员能够在数据进入MDM系统之前,快速发现和分析跨所有数据源的所有数据异常。此流程可极大加快从MDM实施中获取价值。

由于数据清洗增强了数据的准确度,带来了数据完整性,并从源头增进了数据的可信度,因此数据清洗改善了MDM系统中的数据一致性。一旦源数据进入MDM系统,它将接受数据质量处理,其中包括验证、更正和标准化。MDM系统存储了在数据清洗前后的整个历史记录,从而开发人员不必再跟踪数据仓库中的数据沿袭。

最后,数据质量度量标准使数据仓库管理员能够更好地监控参考数据的质量,并确保可以长期持续使用高质量的数据。

因此,从技术角度看,实施MDM和Informatica Data Quality,作为数据仓库中主数据的确定来源,可以从提取、转换和加载(ETL)流程中简化数据集成。此方法可极大减低与数据仓库有关的整个开发和维护工作。通过建立数据质量度量标准和定义数据质量目标,数据仓库管理员和数据管理员能够更好地监控参考数据的质量,并确保随着时间的推移能够跨企业持续使用高质量的数据。MDM简化了对数据仓库维度更新的处理,因为用于确定更改内容的所有逻辑均封装在MDM系统中。

此外,MDM系统可以卸除大多数数据仓库的历史记录跟踪负担,使数据仓库仅管理它需要为进行聚合而应跟踪的变更。此系统可带来更小的数据仓库维度以及对负荷和查询性能的重大改进。运用MDM和Informatica Data Quality将最终降低数据集成的工作量,提高从商业智能和报表推导的洞察分析的质量,确保能够从为商业智能增效的数据仓库方案中获得预期的价值和投资回报。

数据质量水平与商业智能的关系

当无法通过商业智能系统和报告系统提供准确的数据时,业务总体上都会受到影响。以下是为创建报表的商业智能系统提供不可靠数据所造成的一些后果:

业务负责人:不准确的管理报告导致决策不够明智。

合规主管:合规性法案要求公司能为其财务和合规报表提供一定的透明度和可审计性。

业务分析师:如果业务分析师花费过多时间在多个商业智能系统间手动搜索和整理信息以更新和修正报表,则业务分析师的生产率会受到影响。此低效的工作会直接影响成本和营利能力。

这些业务问题的根源在于没有关于客户、产品、渠道合作伙伴和供应商的唯一真实版本。由于在处理每个业务流程的不同系统间收集、存储和管理这些数据(亦称之为参考数据或主数据),因此,需要正确地解析重叠和冲突的参考数据,以获得唯一真实版本,从而带来宝贵而可操作的洞察力。许多组织拥有数十或数百数据库,并且在这些数据库中有维护相同核心参考对象的数十个(有时为数百个)不同的应用程序,而这些核心参考对象还具有重叠的属性。

商业智能系统的用途是以中立的视角报告取自多个系统的现有数据。商业智能系统可以为维度分析进行一些累积工作,但是设计或配备商业智能系统并非为了创建唯一的真实版本。在取自应用程序孤岛的客户或产品数据中存在的不一致会对数据仓库中运行的分析可靠性产生消极的影响。

总而言之,企业的商业智能只会与企业的数据质量水平相当。

原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2014-07-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏灯塔大数据

一张图搞懂美国大数据产业(上)

? 数据科学早已不是新鲜事物了,不过对数据质量的需求却是这几年才激增起来的。这可不是一阵时尚或旧词新用,而是一场革命。大至总统选举,小至总部设在厨房餐桌的小创...

2836
来自专栏织云平台团队的专栏

运维的难题 : 800 万用户,救 or 不救?

本文主要从三个部分介绍了手机QQ运维团队在一次业务被动迁移过程中遇到的挑战,在面对挑战的时候团队是如何坚守一切以用户价值为依归的价值观。

7063
来自专栏SDNLAB

Arrcus为白盒数据中心基础架构构建网络操作系统

总部设在加利福尼亚州圣何塞的初创公司Arrcus从隐身中脱颖而出,本周一推出了ArcOS系统。这是一个独立的,与硬件无关的网络操作系统,适用于白盒系统,专门针对...

752
来自专栏云计算D1net

工信部电信研究院:云无信不立

主持人: 非常感谢朱总的演讲和演示,之前我们所做的云计算市场调研中发现,客户对于云安全的信任和认可将直接决定客户的接受度。接下来工信部电信研究院主任何宝宏将和我...

2894
来自专栏腾讯技术工程官方号的专栏

从有界到无界,腾讯新一代企业网引领安全创新

? 背景:2018年8月21-22日,由中央网信办、工信部和公安部指导,中国互联网协会联合阿里巴巴集团、蚂蚁金服和阿里云等主办的“2018网络安全生态峰会”在...

824
来自专栏云计算D1net

企业上云:可get这几种安全云网络服务

企业云部署已经很快地从小规模应用(如短期项目或测试与开发环境)发展为支持更为重要的工作负载的复杂的大规模应用。随着云服务变得越来越多样化,企业对于云模型的满意水...

3406
来自专栏CSDN技术头条

2017年SaaS、Relational和大数据连接趋势

译者注:作者揭示了近些年来出现了越来越多的数据源,如何将这些数据源进行连接是一个比较困扰的话题,本文就这个话题,根据调查的结果展开了描述。以下为译文。 第四届年...

18610
来自专栏SDNLAB

思科N3K交换机的芯路历程

作者简介:张渐修,任职于上海同悦信息科技有限公司担任市场分析高级工程师,从事交换机的市场推广工作。

702
来自专栏IT派

区块链技术将如何影响人工智能的发展?

区块链被吹捧为一种新兴技术,它有可能对每个行业造成影响。区块链的分布式系统与当今使用的固有集中式操作系统相对立,采用分布式数据库架构形式,某些操作的记录和身份验...

890
来自专栏FreeBuf

浅析金融大数据安全

*本文原创作者:mcvoodoo,本文属FreeBuf原创奖励计划,转载请联系help@freebuf.com 随着大数据的发展,从银行到P2P再到保险、证券等...

1716

扫描关注云+社区