首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

不用 SQL数据仓库

当前绝大部分数据仓库都会采用 SQLSQL 发展了几十年已经成为数据库界的标准语言,用户量巨大,所以支持 SQL 对于数据仓库来讲也是很正常的。...但是,在当代大数据背景下,业务复杂度节节攀升,在以计算为主要任务的数据仓库场景下,SQL 似乎越来越不够用了。...典型表现是一些数据仓库开始集成 Python 的能力,将 Python 这样的非 SQL 语言融入到数据仓库中。...我们这里要介绍一种非 SQL数据仓库 esProc,由于没有使用 SQL 作为查询语言(而是 SPL),可以暂且将其看成一种新型数据仓库。 为什么 esProc 不再使用 SQL 了呢?...接下来我们来看看非 SQL 数据仓库 esProc 的能力,会有哪些不同。 esProc SPL esProc 数据仓库的形式化语言是 SPL,并没有使用业界普遍采用的 SQL

16320

不用 SQL 的开源数据仓库

当前绝大部分数据仓库都会采用 SQLSQL 发展了几十年已经成为数据库界的标准语言,用户量巨大,所以支持 SQL 对于数据仓库来讲也是很正常的。...但是,在当代大数据背景下,业务复杂度节节攀升,在以计算为主要任务的数据仓库场景下,SQL 似乎越来越不够用了。...典型表现是一些数据仓库开始集成 Python 的能力,将 Python 这样的非 SQL 语言融入到数据仓库中。...我们这里要介绍一种非 SQL数据仓库 esProc,由于没有使用 SQL 作为查询语言(而是 SPL),可以暂且将其看成一种新型数据仓库。...接下来我们来看看非 SQL 数据仓库 esProc 的能力,会有哪些不同。 esProc SPL esProc 数据仓库的形式化语言是 SPL,并没有使用业界普遍采用的 SQL

16420
您找到你想要的搜索结果了吗?
是的
没有找到

数据仓库开发 SQL 使用技巧总结

作者:dcguo 使用 sql 做数仓开发有一段时间了,现做一下梳理复盘,主要内容包括 sql 语法、特性、函数、优化、特殊业务表实现等。...hive: sql 解析引擎,将 sql 转译成 map/reduce job 然后再 hadoop 执行,相当于 hadoop 的客户端工具。...sql\spark sql\其他场景 优化 列表优化 列表中涉及的业务信息表,用户信息表全部都是大表,列表性能很差,短期内想分表需要改的业务太多,急需提高整体合同列表的性能。...定时任务同时写多个相同类型的 sql,减少任务量,也可以把同类型任务归类。...主要包含三部分 sql 即可: 日子任务 周子任务 月子任务 如果不是每周一,则 sql 跳过周任务,如果不是每月一号,则 sql 跳过月任务。

3K30

SQL Server数据仓库的基础架构规划

问题 SQL Server数据仓库具有自己的特征和行为属性,有别去其他。从这个意义上说,数据仓库基础架构规划需要与标准SQL Server OLTP数据库系统的规划不同。...在本文中,我们将介绍在计划数据仓库时应该考虑的一些事项。 解决 SQL Server 数据仓库系统参数 数据仓库本身有自己的参数,因此每个数据仓库系统都有自己独特的特性。...负载类型 在分析数据仓库的容量之后,下一步是分析数据仓库的工作负载。数据仓库的典型工作负载是ETL、数据模型和报告。...例如,对于SQL Server SSAS多维数据集,SSAS 扁平数据集,同时对于Oracle, Hyperion数据集是可用的。在这个层中,数据将从数据仓库读取并处理到数据模型层。...此外,还有一些选项,如报表平台中的数据驱动订阅和标准订阅,特别是在SQL Server reporting Services (SSRS)的情况下。

1.8K10

关于数据仓库中复杂报表SQL语句的写法

数据仓库的基本报表制作过程中,通常会使用SQL作为数据源,可是普通的SQL实在不适合处理一些较为复杂的逻辑判断;一般而言,待查询的数据类型主要包括日期型、数字型、字符串这三类数据类型;在报表查询界面前段...当然是针对这些未输入的字段提供一些缺省值了,例如某个数字类型的字段未输入,则赋一个缺省值-1,某个字符串字段未输入,则赋一个缺省值为’ ‘,某个日期未输入,则赋一个缺省值为SYSDATE;这个时候只要在SQL...当然当更加复杂的查询逻辑实在不适合用SQL处理时,最好选择使用存储过程的方法了;其次过于复杂的SQL可能会带来数据库性能问题,因此这些基于SQL的报表最好不要在大型数据表上操作。

50420

SQL Server仓储物流公司visual studio发货数据仓库设计

在仓储物流系统上建立数据仓库,按照用于决策分析的主题对不同系统中数据进行重新组织,为数据分析和数据挖掘提供有效的数据来源。...解决方案 任务/目标 搭建物流数据仓库的目的是整合仓储物流系统中的数据,以统计图表的方式提交给决策部门和零售商客户,为实现高效的仓库管理和制定物流策略提供可靠的依据,帮助零售商客户改进商品设计和制定有效的营销策略...具体的星型结构图如下: 将原始csv文件导入SQL Server中,进行数据清洗,运用insert into ...select...from语句提取维度表。...数据仓库构建与部署 运用visual studio软件完成数据仓库的构建和部署如下图 完成数据仓库的层次结构设计、时间智能实现和kpi设计与实现。...时间规律性问题 数据仓库建立过程中运用维度建模时采用了时间维度,使得数据仓库建立完成后,可以在OLAP中通过选择时间为行标签,查看各个记录时间所发生的货运量,也可细分到各个记录时间各个不同货运方案、货品类型的货运情况

24700

数据仓库①:数据仓库概述

数据库的"分家" 随着关系数据库理论的提出,诞生了一系列经典的RDBMS,如Oracle,MySQL,SQL Server等。这些RDBMS被成功推向市场,并为社会信息化的发展做出的重大贡献。...~这就是关于数据仓库最贴切的定义了。事实上数据仓库不应让传统关系数据库来实现,因为关系数据库最少也要求满足第1范式,而数据仓库里的关系表可以不满足第1范式。...但由于大多数数据仓库内的表的统计分析还是用SQL,因此很多人把它和关系数据库搞混了。 知道了什么是数据仓库后,再来看看它有哪些特点吧。某种程度上来说,这也是分析型数据库的特点: ? 1....有了这些数据快照以后,用户便可将其汇总,生成各历史阶段的数据分析报告; 数据仓库组件 数据仓库的核心组件有四个:各源数据库,ETL,数据仓库,前端应用。如下图所示: ? 1....小结 在大数据时代,数据仓库的重要性更胜以往。Hadoop平台下的Hive,Spark平台下的Spark SQL都是各自生态圈内应用最热门的配套工具,而它们的本质就是开源分布式数据仓库

2.8K71

数据仓库】现代数据仓库坏了吗?

数据仓库是现代数据堆栈的基础,所以当我们看到 Convoy 数据负责人 Chad Sanderson 在 LinkedIn 上宣称“数据仓库坏了”时,它引起了我们的注意。...不可变数据仓库如何结合规模和可用性 乍得桑德森的观点 现代数据堆栈有许多排列,但数据仓库是一个基础组件。...当分析师的反应是直接进入仓库并编写一个脆弱的 600 行 SQL 查询以获得他们的答案时,就会出现第二个挑战。...另一种方法:引入不可变数据仓库 不可变数据仓库概念(也称为活动 ETL)认为,仓库应该是通过数据来表示现实世界,而不是乱七八糟的随机查询、损坏的管道和重复信息。...来自现实世界的事件构建在服务代码中,而不是 SQL 查询中。 CRUD 抽象 API:数据消费者不需要查看所有生产表,特别是当它们只是他们用来生成洞察力或权力决策的数据服务的实现细节时。

1.7K20

数据仓库

*了解数据仓库相关技术 *了解数据仓库设计过程建造,运行及维护 *了解OLAP及多维数据模型 决策支持系统及其演化 一般将数据分为:分析型数据与操作型数据 操作型数据:由企业的基本业务系统产生的数据...数据仓库的特性:面向主题性,集成性,不可更新和时间性。 集成:数据仓库最重要的特性,分为数据抽取转换,清理(过滤)和装载 不可更新:数据仓库中的数据以批量方式处理,不进行一般主义上的数据更新。...数据仓库的体系结构与环境 从数据层次角度的体系结构来看,典型的数据仓库的数据体系结构包括:操作型数据、操作型 数据存储、数据仓库、数据集市和个体层数据 从功能结构看,可分为数据处理、数据管理和数据应用三个层次...数据仓库的数据组织 数据仓库的数据单位中保存数据的细化程度或综合程度的级别。...细化程度越高,粒度越小 粒度影响到数据仓库的数据量及系统能回答的查询的类型 进行数据仓库的数据组织时,应根据当前应用的需求进行多粒度级设计。满足多角度,多层次数据查询要求。

1.8K40

数据仓库②-数据仓库与数据集市建模

本文将详细介绍数据仓库维度建模技术,并重点讨论三种基于ER建模/关系建模/维度建模的数据仓库总体建模体系:规范化数据仓库,维度建模数据仓库,以及独立数据集市。...但现在我们是为数据仓库建模,所以这样做是OK的。另外在分布式的数据仓库中,这个字段十分重要。因为事实表的数量级非常大,Hive或者Spark SQL这类分布式数据仓库工具都会对这些数据进行分区。...数据仓库建模体系之规范化数据仓库 所谓"数据仓库建模体系",指的是数据仓库从无到有的一整套建模方法。最常见的三种数据仓库建模体系分别为:规范化数据仓库,维度建模数据仓库,独立数据集市。...很多书将它们称为"数据仓库建模方法",但笔者认为数据仓库建模体系更能准确表达意思,请允许我自作主张一次吧:)。下面首先来介绍规范化数据仓库。...数据仓库建模体系之维度建模数据仓库 非维度建模数据仓库(dimensionally modeled data warehouse)是一种使用交错维度进行建模的数据仓库,其总体架构如下图所示: ?

5.1K72

OPPO数据中台之基石:基于Flink SQL构建实时数据仓库

我们把它分成了 4 个层次: 最下层是统一工具体系,涵盖了"接入 - 治理 - 开发 - 消费"全数据链路; 基于工具体系之上构建了数据仓库,划分成"原始层 - 明细层 - 汇总层 - 应用层",这也是经典的数仓架构...以上就是 OPPO 数据中台的整个体系,而数据仓库在其中处于非常基础与核心的位置。 1.3. 构建 OPPO 离线数仓 ? 过往 2、3 年,我们的重点聚焦在离线数仓的构建。...基于 Flink SQL 的扩展工作 2.1.Why Flink SQL 首先,为什么要用 Flink SQL?...左边的菜单是 Table 列表,右边是 SQL 编辑器,可以在上面直接写 SQL,然后提交执行。...这个 SQL 逻辑比较简单,无非是根据某些业务字段做筛选,插入到不同的业务表中去。它的特点是,多行 SQL 最终合并成一个 SQL 提交给 Flink 执行。

3.3K21

数据仓库架构

针对性强,主要应用于数据仓库构建和OLAP引擎低层数据模型。...总线架构 多维体系结构(总线架构) 数据仓库领域里,有一种构建数据仓库的架构,叫Multidimensional Architecture(MD),中文一般翻译为“多维体系结构”,也称为“总线架构”(Bus...前台还包括像查询管理、活动监控等为了提供数据仓库的性能和质量的服务。...一致性维度 在多维体系结构中,没有物理上的数据仓库,由物理上的数据集市组合成逻辑上的数据仓库。而且数据集市的建立是可以逐步完成的,最终组合在一起,成为一个数据仓库。...虽然在物理上是独立的,但在逻辑上由一致性维度使所有的数据集市是联系在一起,随时可以进行交叉探察等操作,也就组成了数据仓库

1.8K20

数据仓库入门

什么是数据仓库(Data Warehouse,DW)?...1991 年,数据仓库之父 Bill Inmon 在《Building the Data Warehouse》一书中,给出的定义: “数据仓库一个面向主题的、集成的、稳定的、随时间变化的数据的集合,以用于支持管理决策过程...建立数据仓库的目的是帮助企业高层系统地组织、理解和使用数据,以便进行战略决策。 数据仓库系统的体系结构 源数据层 源数据是数据仓库系统的基础,是整个系统的数据源泉。...数据存储与管理层 元数据 元数据是关于数据的数据,位于数据仓库的上层,用以描述数据仓库内数据的结构、位置和 建立方法。通过元数据进行数据仓库的管理和使用。...数据仓库 数据仓库中存放了企业的整体信息,而数据集市只存放了某个主题需要的的信息,其目的是 减少数据处理量。

1.8K20

数据仓库技术」怎么选择现代数据仓库

构建自己的数据仓库时要考虑的基本因素 ? 我们用过很多数据仓库。当我们的客户问我们,对于他们成长中的公司来说,最好的数据仓库是什么时,我们会根据他们的具体需求来考虑答案。...通常,他们需要几乎实时的数据,价格低廉,不需要维护数据仓库基础设施。在这种情况下,我们建议他们使用现代的数据仓库,如Redshift, BigQuery,或Snowflake。...大多数现代数据仓库解决方案都设计为使用原始数据。它允许动态地重新转换数据,而不需要重新摄取存储在仓库中的数据。 在这篇文章中,我们将深入探讨在选择数据仓库时需要考虑的因素。...您可以通过发出SQL命令开始使用它。 可伸缩性 当您开始使用数据库时,您希望它具有足够的可伸缩性来支持您的进一步发展。广义上说,数据库可伸缩性可以通过两种方式实现,水平的或垂直的。...也可以考虑使用Hadoop和Hive、Spark SQL或Impala作为解决方案,如果你有相关的专业知识,你可以分配专门的人力资源来支持它。

5K31
领券