mysql 日期维度表_mysql时间维度表_mysql 时间维度表 - 腾讯云开发者社区

Hadoop离线数据分析平台实战——230项目数据存储结构设计数据存储设计在本次项目中设计到数据存储的有三个地方：第一个就是将原始的日志数据按天保存到hdfs文件系统中；第二个就是将etl解析后的数据保存到hbase中；第三个就是将分析结果保存到mysql数据库中。其中存储到hbase和mysql的这两个过程需要设计具体的存储结构。 HBase表结构设计由于我们需要按天进行数据分析，所以我们的hbase的rowkey中必须包含时间戳或者我们一天的数据就建立一个表。这里我们采用在

011

通俗易懂讲数据仓库之【缓慢变化维】

本篇博客，博主为大家带来的是关于数据仓库中一个非常重要的知识点缓慢变化维的讲解!

您找到你想要的搜索结果了吗？

是的

没有找到

OushuDB入门（四）——数仓架构篇

OushuDB入门（五）——ETL篇

《用户画像：方法论与工程化解决方案》读书笔记第3章

在画像系统搭建的过程中，数据存储的技术选型是非常重要的一项内容，不同的存储方式适用于不同的应用场景。本章主要介绍使用Hive、MySQL、HBase、Elasticsearch存储画像相关数据的应用场景及对应的解决方案。

企业互联网+转型实战：如何进行PB级别数据的架构变迁

随着 DT 时代的来临，数据对于企业经营决策的价值日益凸显，而企业在进行互联网+转型的过程中，如何让数据架构平滑迁移到大数据平台，对于传统业务的转型升级至关重要。企业 IT 部门该如何进行 PB 级别大数据平台的迁移规划呢，请看云智慧运维总监张克琛带来的经验分享。提到 PB 级别的大数据解决方案市面上有很多，比较火的有 Hadoop、Spark、Kafka 等等，如果是一个新上线的系统，相信大家都能找到适合自己的方案。但“大数据”在 09 年才逐渐成为互联网信息技术的流行词汇，一个较老的系统如何平滑迁移到

类比MySQL，学习Tableau

主机：localhost，端口口：3306，用户名：root，密码：123456。

MySQL快速生成时间维度表

原文地址：http://blog.csdn.net/neweastsun/article/details/43866599

Greenplum 实时数据仓库实践（7）——维度表技术

前面章节中，我们实现了实时多维数据仓库的基本功能，如使用Canal和Kafka实现实时数据同步，定义Greenplum rule执行实时数据装载逻辑等。本篇将继续讨论常见的维度表技术。

维度模型数据仓库（九） —— 角色扮演维度

（五）进阶技术 4. 角色扮演维度当一个事实表多次引用一个维度表时会用到角色扮演维度。例如，一个销售订单有一个是订单日期，还有一个交货日期，这时就需要引用日期维度表两次。本篇将说明两类角色扮演维度的实现，分别是表别名和数据库视图。这两种都使用了MySQL的功能。表别名是在SQL语句里引用维度表多次，每次引用都赋予维度表一个别名。而数据库视图，则是按照事实表需要引用维度表的次数，建立相同数量的视图。修改数据库模式使用清单（五）-4-1里的SQL脚本修改数据库模式。分别给数据仓库里的事实表sales_order_fact和源数据库中订单销售表sales_order增加request_delivery_date_sk和request_delivery_date列。图（五）- 4-1 显示了修改后的模式。

什么是麒麟(kylin)？查数据贼快的哟

由于工作需要，前段时间对kylin简单入了个门，现在来写写笔记（我的文字或许能帮助到你入门kylin，至少看完这篇应该能知道kylin是干什么的）。

Doris数据模型

列可以分为两大类：Key 和 Value。从业务角度看，Key 和 Value 可以分别对应维度列和指标列。

【三歪教你些能装逼的】麒麟入门教程

由于工作需要，前段时间对kylin简单入了个门，现在来写写笔记（我的文字或许能帮助到你入门kylin，至少看完这篇应该能知道kylin是干什么的）。

基于Hadoop生态圈的数据仓库实践 —— ETL（二）

ClickHouse学习-建表和索引的优化点（一）

clickhouse 相对于mysql，除了在mysql在SQL和索引的优化空间比较大外，而其他的clickhouse的优化空间还是很大的，对于clickhouse他的服务端配置参数对于任务的影响还是很大的。现在我们来看看clickhouse都有哪些常规的优化点，今天主要学习一下创建表的时候需要注意的点

用户画像 | 标签数据存储之Elasticsearch真实应用

上一篇文章已经为大家介绍了 HBase 在用户画像的标签数据存储中的具体应用场景，本篇我们来谈谈 Elasticsearch 的使用！

基于Hadoop生态圈的数据仓库实践 —— 环境搭建（三）

一篇文章搞懂数据仓库：三种事实表（设计原则，设计方法、对比）

事实表作为数据仓库维度建模的核心，紧紧围绕着业务过程来设计，通过获取描述业务过程的度量来表达业务过程，包含了引用的维度和与业务过程有关的度量。

大数据开发：OLAP分析引擎Apache Kylin入门

在OLAP分析引擎领域，Apache Kylin可以说是一个重要的成员，相比于大规模并行处理指导思想下的Hive、Presto等组件，Apache Kylin采取了新的计算模式，提供不同的解决方案。今天的大数据开发分享，我们就主要来讲讲OLAP分析引擎Apache Kylin入门。

快速生成日期维度数据

HAWQ取代传统数仓实践（四）——定期ETL（Sqoop、HAWQ）

本文介绍了如何利用Rust语言和Cargo管理大型游戏服务器的程序架构，实现了游戏服务器的模块化设计，并利用Websocket通信机制实现了跨平台的游戏服务器通信。同时，本文还介绍了一些重要的基础概念和技术，包括Rust语言、Cargo、Websocket、游戏服务器、分布式系统、同步复制、负载均衡、Rust设计模式等。通过本文的学习，读者可以掌握利用Rust和Cargo开发高性能、可扩展、跨平台的游戏服务器的程序架构和技巧。

010

维度模型数据仓库（十七） —— 无事实的事实表

（五）进阶技术 12. 无事实的事实表本篇讨论一种技术，用来处理源数据中没有度量的需求。例如，产品源数据不包含产品数量信息，如果系统需要得到产品的数量，很显然不能简单地从数据仓库中直接得到。这时就要用到无事实的事实表技术。使用此技术可以通过持续跟踪产品的发布来计算产品的数量。可以创建一个只有产品（计什么数）和日期（什么时候计数）维度代理键的事实表。之所以叫做无事实的事实表是因为表本身并没有度量。产品发布的无事实事实表本节说明如何实现一个产品发布的无事实事实表，包括新增和初始装载product_count_fact表。图（五）- 12-1显示了跟踪产品发布数量的数据仓库模式（只显示与product_count_fact表有关的表）。

基于Hadoop生态圈的数据仓库实践 —— 进阶技术（二）

二、按需装载前面已经做了“初始装载”和“定期装载”。还有一种需要熟悉的装载类型，按需装载。所谓“按需装载”指的是，在正常调度之外，当源数据有效或者数据仓库需要时进行装载。例如，促销销售源数据只有在促销期内有效，而在其它时间是无效的，而对促销期数据就要进行按需装载。在“建立数据仓库示例模型”中讨论的日期维度数据生成可以看做是一种按需装载。数据仓库预先装载了日期，当日期用完时，需要再次运行预装载。本节的主题是按需装载，首先修改数据库模式，然后在DW数据库上执行按需装载，使用促销期场景进行说明。定期装载不适合促销期场景，因为促销期数据并不是按调度定期装载。下面是需要装载的促销期内容，存储在source.promo_schedule表中。

数据仓库体系建模实施及注意事项小总结

从字面上来看，数据仓库就是一个存放数据的仓库，它里面存放了各种各样的数据，而这些数据需要按照一些结构、规则来组织和存放。这里我们会遇到一个问题就是同样是存放数据的仓库，那数据库和数据仓库是一样的吗？

数据仓库体系建模&实施&注意事项小总结

Mysql合理建立索引,索引优化

在我们日常使用数据库的时候，肯定避免不了对数据库的优化。那么对数据库的优化又少了不索引的知识。

Mysql索引优化

在我们日常使用数据库的时候，肯定避免不了对数据库的优化。那么对数据库的优化又少了不索引的知识。

Mysql索引优化

在我们日常使用数据库的时候，肯定避免不了对数据库的优化。那么对数据库的优化又少了不索引的知识。

维度模型数据仓库（十五） —— 多重星型模式

（五）进阶技术 10. 多重星型模式从（五）进阶技术1. “增加列”开始，已经通过增加列和表扩展了数据仓库，在（五）进阶技术5. “快照”里增加了第二个事实表，month_end_sales_order_fact表。这之后数据仓库模式就有了两个事实表（第一个是在开始建立数据仓库时创建的sales_order_fact表）。有了这两个事实表的数据仓库就是一个正式的双星型模式。本篇将在现有的维度数据仓库上增加一个新的星型结构。与现有的与销售关联的星型结构不同，新的星型结构关注的是产品业务领域。新的星型结构有一个事实表和一个维度表，用于存储数据仓库中的产品数据。一个新的星型模式图（五）- 10-1 显示了扩展后的数据仓库模式。模式中有三个星型结构。sales_order_fact表是第一个星型结构的事实表，与其相关的维度表是customer_dim、product_dim、date_dim和sales_order_attribute_dim表。month_end_sales_order_fact表是第二个星型结构的事实表。product_dim和month_dim是其对应的维度表。第一个和第二个星型结构共享product_dim维度表。第二个星型结构的事实表和月份维度数据分别来自于第一个星型结构的事实表和date_dim维度表。它们不从源数据获得数据。第三个星型模式的事实表是新建的production_fact表。它的维度除了存储在已有的date_dim和product_dim表，还有一个新的factory_dim表。第三个星型结构的数据来自源数据。

MySQL 连续登录通用计算模型

某音某团某节面试时，经常会问到连续登录问题，这个问题看似简单，属于那种“一看就会，一做就懵”的问题，网上分享的一些解题思路，逻辑上比较复杂，今天笔者来分享一种简洁而通用的解题思路，应付此类问题变得游刃有余。

一文带你认清数据仓库【维度模型设计】与【分层架构】

本篇博客，博主为大家带来关于数仓项目中纬度模型设计与分层架构的一个说明。

Kettle构建Hadoop ETL实践（六）：数据转换与装载

本篇重点是针对销售订单示例创建并测试数据装载的Kettle作业和转换。在此之前，先简要介绍数据清洗的概念，并说明如何使用Kettle完成常见的数据清洗工作。由于本示例中Kettle在Hadoop上的ETL实现依赖于Hive，所以之后对Hive做一个概括的介绍，包括它的体系结构、工作流程和优化。最后用完整的的Kettle作业演示如何实现销售订单数据仓库的数据转换与装载。

数仓分层

数仓分层是数据仓库设计中十分重要的一个环节，优秀的分层设计能够让整个数据体系更容易理解和使用本文的大纲 001，介绍数据分层的作用 002，分层设计的原则以及介绍一种通用的数据分层设计 003，具体案例 004，落地实践意见 005，思考

数仓分层

数据分层是数据仓库设计中一个十分重要的环节，良好的分层设计能够让整个数据体系更容易被理解和使用。本文介绍的是如何理解数据仓库中各个分层的作用。

维度模型数据仓库（二十一） —— 分段维度

（五）进阶技术 16. 分段维度本篇说明分段维度的实现技术。分段维度包含连续值的分段。例如，年度销售订单分段维度可能包含有叫做“低”、“中”、“高”的三档；各档定义分别为0.01到15000、15000.01到30000.00、30000.01到99999999.99。如果一个客户的年度销售订单金额为10000，则被归为“低”档。分段维度可以存储多个分段集合。例如，可能有一个用于促销分析的分段集合，另一个用于市场细分，可能还有一个用于销售区域计划。分段一般由用户定义，而且很少能从交易源数据直接获得。本篇要使用（五）进阶技术 10. 多重星型模式的开发经验实现分段维度。年度销售订单星型模式本节说明如何实现一个年度订单分段维度。你需要两个新的星型模式，如图（五）- 16-1所示。星型模式的事实表使用（关联到）已有的customer_dim和一个新的year_dim表。年维度是日期维度的子集。annual_customer_segment_fact是唯一用到annual_order_segment_dim表的表。annual_order_segement_dim是分段维度。

用户画像 | 标签数据存储之Hive真实应用

小伙伴们大家好呀，趁着年假的几天时间，我写了一篇 Elacticsearch 从0到1的“长篇大作”，现在还在排版，相信很快就会与大家见面了！关于系统学习用户画像，之前已经分享过2篇文章了，分别是《超硬核 | 一文带你入门用户画像》和《用户画像 | 开发性能调优》，收到的读者反馈还不错！本期文章，我借《用户画像方法论》一书，为大家分享在用户画像系统搭建的过程中，数据存储技术基于不同场景的使用。考虑到篇幅的文章，我会用4篇文章分别介绍使用 Hive、MySQL、HBase、Elasticsearch 存储画像相关数据的应用场景及对应的解决方案。本期介绍的是 Hive，如果对您有所帮助，记得三连支持一下！

数据仓库分层架构深度讲解

我们在数仓项目的时候往往是需要将它分层的，但是为什么分层你真正的了解过吗，那它分层的好处又是什么呢。好我们今天就针对这个话题进行讲解。如果你还不了解数仓中的模型可以去看这篇（数仓模型设计详细讲解）,编写不易请给个一键三连。

tableau入门简介和常用操作

1、tableau的介绍 1）tableau的优势 2）维度和指标 3）展现形式 4）设计形式 5）设计流程 2、数据导入、数据浏览 3、调整tableau中表格样式的常用四大按钮 1）田字格按钮的作用：分别对单元格、区、标题，进行线条颜色、线条粗细的设置 2）填充格按钮的作用：为整张表的标题、区、单元格设置填充色 3）A按钮的作用：专门针对表中的文本进行字体颜色、字体大小、字体格式、是否斜体等操作 4）对齐按钮的作用：专门设置表中文本，是左对齐，还是右对齐，还是居中对齐这些操作 4、tableau保存操作文本的两种格式说明 1）“.twbx”格式和“.twbx”格式 2）将tableau导出为任意版本的tableau文件

大数据技术栈之-离线数仓构建

上一篇说了实时数仓并写了一个简单的例子，这些主要来说离线数仓，数据到达kafka后，走了实时和离线两条路，离线条路线的主要流程是采集kafka的数据HDFS中，然后使用Hive进行数仓的建设，因为我们数据来源可能是第三方API，IOT还有其他一些渠道，还有直接从数据库同步过来，那么数据库的数据我们离线这边可能直接使用DataX这种工具同步到HDFS了，就不经过Kafka了，而其他的数据才经过kafka,然后再使用采集程序将数据采集到HDFS。

Kylin在用户行为轨迹分析中的应用实践与优化

2015年12月8日，Apache Kylin 从 Apache 孵化器项目毕业，正式升级为顶级项目，也是第一个由中国团队完整贡献到 Apache 的顶级项目。kylin的诞生，为大数据高效的olap查询提供解决方案，主要由以下特点：

用户画像

开发画像后的标签数据，如果只是“躺在”数据仓库中，并不能发挥更大的业务价值。只有将画像数据产品化后才能更便于业务方使用。在本文中，Web端展示的数据都读取自MySQL这类的关系型数据库，MySQL中存储的数据源自Hive加工后，通过Sqoop同步的结果集。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐