一位客户问我“数据仓库”这个术语的真正含义是什么。
我想过ETL,数据模型的细节,与NoSQL,云,‘普通’数据库管理系统,主数据管理等的区别,但无法用几句话向他描述这个术语……(事实上,我做了一些谈话,没有照亮他。)
如何用1-3个(或更多)句子来描述“数据仓库”?
发布于 2010-06-23 07:42:03
对于非技术人员来说,最好的描述是“存储在专门的计算机系统中的海量数据。数据通常与某个特定的领域相关,整个系统被设计为快速和针对某些特殊任务进行优化。存储在数据仓库中的数据主要用于分析或决策过程。”
不确定这是否足够:)在互联网上有很多关于这个主题的引用,但是如果有人问我一个快速的定义,我会使用类似于我上面写的东西。
发布于 2010-06-23 07:39:16
来自wiki
数据仓库是组织以电子方式存储的数据的存储库,旨在促进报告和分析1。
数据仓库的这个定义侧重于数据存储。但是,检索和分析数据、提取、转换和加载数据以及管理数据字典的方法也被认为是数据仓库系统的基本组件。许多对数据仓库的引用都使用了这一更广泛的上下文。因此,数据仓库的扩展定义包括商业智能工具、用于提取、转换和加载数据到存储库的工具,以及用于管理和检索元数据的工具。
发布于 2010-06-23 07:51:29
至少在理论上,数据仓库的想法是提供来自各种现有系统的数据的合并视图,通常认为重写这些系统来直接合并数据是不切实际的。因此,数据仓库从这些现有系统收集数据,并提供(至少是假象)所有数据都在一个地方,因此可以通过一种方式对其进行查询。
主要目的(通常)是允许来自现有系统的数据之间的关联。例如,您可以比较您的销售人员与客户X在一起的时间(存储在一个系统中)与客户X购买了多少时间(存储在第二个系统中),以及客户X对他们收到的东西的满意度(当然,存储在第三个系统中)。
从实际的角度来看,这通常意味着客户的想法在定义模糊和完全疯狂之间。成本和进度几乎是不可能猜测的,可靠的估计显然是不可能的。提供他真正想要的东西几乎肯定是不可能的,找出有用的东西需要足够的时间和工作,你的第一步是让你正在做的事情听起来足够专业,这样当他对成本和/或时间表有了一点了解时,他就不会心脏病发作。
https://stackoverflow.com/questions/3097917
复制相似问题