商业智能的软件工具集合
1)终端用户查询和报告工具
专门用来支持初级用户的原始数据访问,不包括适应于专业人士的成品报告生成工具。
2)数据仓库(Data Warehouse)和数据集市(Data Mart)产品包括数据转换、管理和存取等方面的预配置软件,通常还包括一些业务模型,如财务分析模型。
3)数据挖掘(Data Mining)软件使用诸如神经网络、规则归纳等技术,用来发现数据之间的关系,做出基于数据的推断。
4)OLAP 工具
(1)OLAP 的概念
OLAP 的概念最早是由关系数据库之父E.E.Codd 于 1993年提出的,他同时提出了关于OLAP 的12条准则.OLAP 的提出引起了很大的反响,OLAP作为一类产品同 OLTP明显区分开来:OLTP属于传统的关系型数据库的一个主要应用,主要用于基本的、日常的事务处理,例如银行交易;OLAP 是数据仓库系统的一个主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。OLAP提供多维数据管理环境,其典型的应用是对商业问题的建模与商业数据分析。OLAP 也被称为多维分析。
(2)“维”的概念
OLAP 的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是“维”这个概念。
OLAP 工具是针对特定问题的联机数据访问与分析。它通过多维的方式对数据进行分析、查询和报表。“维”是人们观察数据的特定角度。通过把一个实体的多项重要的属性定义为多个维(dimension),使用户能对不同维上的数据进行比较。例如,一个企业在考虑产品的销售情况时,通常从时间、地区和产品的不同角度来深入观察产品的销售情况。这里的时间、地区和产品就是维。而这些维的不同组合和所考察的度量指标构成的多维数组则是OLAP 分析的基础,可形式化表示为(维1,维2,,维n,度量指标),如(地区,时间,产品,・,销售额)。多维分析是指对以多维形式组织起来的数据采取切片(slice)、切块(dice)、钻取(drill-down 和 roll-up)和旋转(pivot)等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息。因此 OLAP 也可以说是多维数据分析工具的集合。
OLAP 的基本多维分析操作有钴取、切片和切块以及旋转、drill across 和 drill through 等。钻取是改变维的层次,变换分析的粒度。它包括向上钻取和向下钻取。roll up 是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而drill down则相反,它从汇总数据深入到细节数据进行观察或增加新维。
切片和切块是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个,则是切块。
旋转是变换维的方向,即在表格中重新安排维的放置(例如行列互换)。
(3)OLAP 的实现方法
OLAP有多种实现方法,根据存储数据的方式不同可以分为ROLAP(Relational OLAP)、MOLAP(Multidimensional OLAP)和HOLAP(Hybrid OLAP)。
ROLAP表示基于关系数据库的OLAP 实现。以关系数据库为核心,以关系型结构进行多维数据的表示和存储。ROLAP 将多维数据库的多维结构划分为两类表:一类是事实表,用来存储数据和维关键字;另一类是维表,即对每个维至少使用一个表来存放维的层次、成员类别等维的描述信息。维表和事实表通过主关键字和外关键字联系在一起,形成了“星型模式”。对于层次复杂的维,为避免冗余数据占用过大的存储空间,可以使用多个表来描述,这种星型模式的扩展称为“雪花模式”MOLAP 表示基于多维数据组织的OLAP 实现。以多维数据组织方式为核心,也就是说,MOLAP 使用多维数组存储数据。多维数据在存储中将形成“立方块(Cube)”的结构,在 MOLAP 中对“立方块”的“旋转”、“切块”和“切片”是产生多维数据报表的主要技术。
HOLAP 表示基于混合数据组织的OLAP 实现。如低层是关系型的,高层是多维矩阵型的。这种方式具有更好的灵活性。
领取专属 10元无门槛券
私享最新 技术干货