首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

数据仓库与商业智能宝典第2版

作为数据仓库和商业智能(DW/BI)行业中有影响力的领军人物,RalphKimball、MargyRoss得到了世界范围内的认可和尊重,他们在《数据仓库与商业智能宝典(第1版)》中确立了行业标准。现在,在《数据仓库与商业智能宝典(第2版)成功设计、部署和维护DW/BI系统》中已经更新了65篇DesignTip和白皮书,从而汇集了DW/BI技术创新前沿的著作。   从项目规划和需求收集,到维度建模、ETL和BI应用,《数据仓库与商业智能宝典(第2版):成功设计、部署和维护DW/BI系统》涵盖了你在数据仓库和商业智能中将会遇到的所有内容。这些无与伦比的文章提供了成功地设计、部署和维护DW/BI系统的重要建议。   启动DW/BI项目和收集需求的注意事项   集成式企业数据仓库的必备要素,其中包括总线架构和矩阵   事实表的粒度性和三种基本类型   渐变维度技术   星型模式、外支架和桥接表   维度建模高级模式   提取、转换和加载(ETL)子系统与数据质量   BI应用实践   大数据注意事项   无论你正以何种身份参与数据仓库或商业智能项目,这本可轻易参考和最近更新的宝典可谓无价之宝。

03

Data Warehouse in Cloud

数据,对一个企业的重要性不言而喻。如何利用好企业内部数据,发挥数据的更大价值,对于企业管理者而言尤为重要。作为最传统的数据应用之一,数据仓库在企业内部扮演着重要的角色。构建并正确配置好数据仓库,对于数据分析工作至关重要。一个设计良好的数据仓库,可以让数据分析师们如鱼得水;否则是可能使企业陷入无休止的问题之后,并在未来的企业竞争中处于劣势。随着越来越多的基础设施往云端迁移,那么数据仓库是否也需要上云?上云后能解决常见的性能、成本、易用性、弹性等诸多问题嘛?如果考虑上云,都需要注意哪些方面?目前主流云厂商产品又有何特点呢?面对上述问题,本文尝试给出一些答案,供各位参考。本文部分内容参考了MIT大学教授David J.DeWitt的演讲材料。

04

系统架构师论文-财务数据仓库系统的设计与实现

近年来,数据仓库技术在信息系统的建设中得到了广泛应用,有效地为决策提供了支持。2004年6月,本人所在单位组织开发了财务管理决策系统,该系统主要是使高层领导掌握企业的经营状况及进、销、存情况,分析市场趋势。 本文通过对财务数据的分析,结合数据仓库开发原理,完成对财务数据仓库的数据组织,介绍了财务数据仓库的设计和实现方法方法。财务数据仓库的设计歩骤主要是逻循数据库设计的过程,为分概念模型的设计、逻辑模型设计、物理模型设计和数据仓库生成等几个阶段。 目前,该项目已顺利上线,领导反映良好。在该项目中,本人担任系统分析师职务,主要负责系统架构设计和数据仓库的设计工作。

01

【ETL技能】白话数据仓库 ETL 搭建全过程

经过多年来企业信息化建设,大部分都拥有了自己的财务,OA,CRM 等软件。这些系统都有自己的独立数据库,记录着企业运行情况某个方面的数据。但是单独看这些系统的报表,并不一定能对企业运行情况有全面客观的了解。就像只凭身高不能判断一个人是否健康,所以体检的时候我们需要化验许多指标,做各种检测,就是为了对身体情况有更全面的了解,作出更准确的判断。 同样对一个企业,不能仅根据出勤率就判断一个人的绩效高低,因为你不知道他的工作成果情况。仅根据财务报表输入支出也体现不了各部门的收益情况,这个部门有多少工作人员,完成了哪

010

维度模型数据仓库(四) —— 初始装载

(三)初始装载         在数据仓库可以使用前,需要装载历史数据。这些历史数据是导入进数据仓库的第一个数据集合。首次装载被称为初始装载,一般是一次性工作。由最终用户来决定有多少历史数据进入数据仓库。例如,数据仓库使用的开始时间是2015年3月1日,而用户希望装载两年的历史数据,那么应该初始装载2013年3月1日到2015年2月28日之间的源数据。在2015年3月2日装载2015年3月1日的数据,之后周期性地每天装载前一天的数据。在装载事实表前,必须先装载所有的维度表。因为事实表需要维度的代理键。这不仅针对初始装载,也针对定期装载。本篇说明执行初始装载的步骤,包括标识源数据、维度历史的处理、使用SQL和Kettle两种方法开发和测试初始装载过程。         设计开发初始装载步骤前需要识别数据仓库的每个事实表和每个维度表用到的并且是可用的源数据,并了解数据源的特性,例如文件类型、记录结构和可访问性等。表(三)- 1里显示的是本示例中销售订单数据仓库需要的源数据的关键信息,包括源数据表、对应的数据仓库目标表等属性。这类表格通常称作数据源对应图,因为它反应了每个从源数据到目标数据的对应关系。生成这个表格的过程叫做数据源映射。在本示例中,客户和产品的源数据直接与其数据仓库里的目标表,customer_dim和product_dim表相对应。另一方面,销售订单事务表是多个数据仓库表的源。

03
领券