开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

在星型架构日期表中查找缺少的日期

，需要先了解星型架构和日期表的概念。

星型架构是一种常见的数据仓库设计模式，其中一个中心事实表与多个维度表通过连接关系相互关联。日期表是星型架构中的一种维度表，用于记录时间相关的信息，如年、月、日、周等。

在查找缺少的日期时，可以按照以下步骤进行：

确定日期表的起止日期范围：根据业务需求或数据仓库设计，确定日期表的起止日期范围，例如从2010年1月1日到2022年12月31日。
生成完整日期列表：使用编程语言或数据库查询语言，根据起止日期范围生成一个完整的日期列表。例如，使用Python中的datetime库生成从起始日期到结束日期的日期列表。
查询缺失日期：通过比对完整日期列表和实际存在于事实表中的日期，找出缺失的日期。可以通过遍历完整日期列表，对比事实表中是否存在对应日期的数据，如果不存在，则该日期为缺失日期。
分析缺失日期的原因：对于找出的缺失日期，可以进一步分析其原因。可能是数据采集或导入过程中的问题，也可能是业务操作或数据更新的原因导致的缺失。
提供解决方案和建议：针对缺失日期的原因，提供相应的解决方案和建议。例如，如果是数据采集导致的缺失，可以优化数据采集流程或增加数据校验机制；如果是业务操作导致的缺失，可以提供培训或提示业务操作人员注意。

在腾讯云的产品中，可以使用云原生数据库TDSQL来存储和管理星型架构日期表的数据。TDSQL是一种支持分布式架构和高性能的关系型数据库，适用于大规模数据存储和查询场景。您可以在腾讯云官网的TDSQL产品介绍页面（链接地址：https://cloud.tencent.com/product/tdsql）了解更多信息和使用指南。

总结：在星型架构日期表中查找缺少的日期，需要生成完整日期列表并与实际数据进行对比，分析缺失日期的原因并提供相应的解决方案和建议。腾讯云的云原生数据库TDSQL可以作为存储和管理日期表数据的解决方案。

相关搜索:mongoDB查找日期范围数组中的日期 MS Excel -在充满日期的列中查找两个日期之间缺少的日期值 SQL -在比较两个日期范围表时查找不重叠的日期从表darby apache db的日期列中获取缺少的日期使用sql stmt从日期表中查找最近的未来或等于日期向BigQuery表添加缺少的日期行在Crystal Reports中查找日期的公式在Google Sheets中查找最大日期-1日期在informatica中查找给定范围内缺少的日期在python中查找最大日期之前的日期

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Extreme DAX-第 2 章模型设计

设计优良的分析模型是 DAX 高效运行的前提。在本章中，我们将讨论许多与建模有关的主题，这些主题对于理解性能强劲的模型设计非常重要。

01

数据仓库架构

数据仓库的核心是展现层和提供优质的服务。ETL 及其规范、分层等所做的一切都是为了一个更清晰易用的展现层。

02

简单谈谈OLTP,OLAP和列存储的概念

在商业数据处理的早期阶段，写入数据库通常对应于商业的交易场景，如: 销售,订单等涉及金钱交易的场景，交易的英文为transaction，也就是事务一词的来源，在计算机领域代表一个逻辑单元的一组读写操作。

03

ETL和数据建模

ETL是数据抽取（Extract）、转换（Transform）、加载（Load ）的简写，它是将OLTP系统中的数据经过抽取，并将不同数据源的数据进行转换、整合，得出一致性的数据，然后加载到数据仓库中。简而言之ETL是完成从 OLTP系统到OLAP系统的过程。

02

万字长文带你了解ETL和数据建模～

ETL是数据抽取（Extract）、转换（Transform）、加载（Load ）的简写，它是将OLTP系统中的数据经过抽取，并将不同数据源的数据进行转换、整合，得出一致性的数据，然后加载到数据仓库中。简而言之ETL是完成从 OLTP系统到OLAP系统的过程

01

ETL工具算法构建企业级数据仓库五步法

ETL是数据抽取（Extract）、转换（Transform）、加载（Load ）的简写，它是将OLTP系统中的数据经过抽取，并将不同数据源的数据进行转换、整合，得出一致性的数据，然后加载到数据仓库中。简而言之ETL是完成从 OLTP系统到OLAP系统的过程。

01

【读书笔记】《 Hadoop构建数据仓库实践》第2章

一个列或者列集，唯一标识表中的一条记录。超键可能包含用于唯一标识记录所不必要的额外的列，我们通常只对仅包含能够唯一标识记录的最小数量的列感兴趣。

02

一篇文章搞懂数据仓库：总线架构、一致性维度、一致性事实

在Kimball的维度建模的数据仓库中，关于多维体系结构（MD）有三个关键性概念：总线架构（Bus Architecture），一致性维度（Conformed Dimension）和一致性事实（Conformed Fact）。

01

大厂的OLAP架构啥样的？

数据流程简单，数据处理流程简单，数据包括日志、DB log等，经Sqoop批量或Kafka实时接入大数据平台HDFS里，在大数据平台进行ETL后，通过大数据调度系统Ooize，每天定时写入到关系型数据库MySQL，再以MySQL中数据为基础产出各种报表。

00

数据仓库系列之维度建模

上一篇文章我已经简单介绍了数据分析中为啥要建立数据仓库，从本周开始我们开始一起学习数据仓库。学习数据仓库，你一定会了解到两个人：数据仓库之父比尔·恩门（Bill Inmon）和数据仓库权威专家Ralph Kimball。Inmon和Kimball两种DW架构支撑了数据仓库以及商业智能近二十年的发展，其中Inmon主张自上而下的架构，不同的OLTP数据集中到面向主题、集成的、不易失的和时间变化的结构中，用于以后的分析;且数据可以通过下钻到最细层，或者上卷到汇总层;数据集市应该是数据仓库的子集;每个数据集市是针对独立部门特殊设计的。而Kimball正好与Inmon相反，Kimball架构是一种自下而上的架构，它认为数据仓库是一系列数据集市的集合。企业可以通过一系列维数相同的数据集市递增地构建数据仓库，通过使用一致的维度，能够共同看到不同数据集市中的信息，这表示它们拥有公共定义的元素。

03

数据仓库体系建模&实施&注意事项小总结

从字面上来看，数据仓库就是一个存放数据的仓库，它里面存放了各种各样的数据，而这些数据需要按照一些结构、规则来组织和存放。这里我们会遇到一个问题就是同样是存放数据的仓库，那数据库和数据仓库是一样的吗？

02

数据仓库体系建模实施及注意事项小总结

从字面上来看，数据仓库就是一个存放数据的仓库，它里面存放了各种各样的数据，而这些数据需要按照一些结构、规则来组织和存放。这里我们会遇到一个问题就是同样是存放数据的仓库，那数据库和数据仓库是一样的吗？

01

一文带你认清数据仓库【维度模型设计】与【分层架构】

本篇博客，博主为大家带来关于数仓项目中纬度模型设计与分层架构的一个说明。

04

Data Vault 简介

Data Vault 2.0 不仅是建模技术，也提供了一整套数据仓库项目的方法论。它能提供一套非常可行的方案来满足数据仓库项目中对于历史轨迹和审核两个方面的需求。

02

一文读懂如何处理缓慢变化的维度(SCD)

长期以来，Kimball方法一直是维度数据建模技术的标准。根据Kimball的说法，“时间概念渗透到数据仓库的每个角落”。这在数据分析的背景下意味着什么？在较高的层面上，现代分析可以被视为随着时间的推移不断变化的数据的聚合。问题在于，不断变化的数据不仅包括新的添加，还包括对先前数据集的更改。

02

数据仓库建模方法详解视频_三维建模流程步骤

范式建模法其实是我们在构建数据模型常用的一个方法，该方法的主要由Inmon所提倡，主要解决关系型数据库得数据存储，利用的一种技术层面上的方法，主要用于业务系统，所以范式建模主要是利用关系型数据库进行数仓建设

02

CDH迁移 | CDH/HDP迁移之路

Cloudera(Cloudera 和Hortonworks 合并后)所有产品不再提供社区版，用户无法获取新的功能。

03

BI/数据仓库/数据分析基础入门：一些常见概念解释

Preface：本文将会讲述 BI/DW/DA 领域的一些常见概念，如：事实表、维度表、建模、多维分析、cube 等，但不涉及具体实例分析。 1、维（Dimension）维是用于从不同角度描述事物特

数据建模方法/模型/规范/工具全解

由于在变化快速的商业世界里，业务形态多种多样，为了能够更有针对性的进行数据建模，经过长时间的摸索，业界逐步形成了数据建模的四部曲：业务建模->领域建模->逻辑建模->物理建模。

04

8000字，详解数据建模的方法、模型、规范和工具！

由于在变化快速的商业世界里，业务形态多种多样，为了能够更有针对性的进行数据建模，经过长时间的摸索，业界逐步形成了数据建模的四部曲：业务建模->领域建模->逻辑建模->物理建模。

01

破解数据孤岛难题，企业需要什么样的大数据平台？| Q推荐

随着数字经济加速发展，企业数字化转型正向更深层次推进。基于数字技术，企业通过数据驱动，有望实现创新产品服务、变革运营方式和迭代资源组织模式。而这一切都是建立在企业 IT 基础设施之上。

01

「数据仓库架构」数据仓库的三种模式建模技术

在为数据仓库设计的模式模型中，有多种安排模式对象的方法。一个数据仓库模式模型是星型模式。示例模式（本书中大多数示例的基础）使用星型模式。但是，还有其他模式模型通常用于数据仓库。这些模式模型中最流行的是第三范式（3NF）模式。另外，一些数据仓库模式既不是星型模式也不是3NF模式，而是共享这两种模式的特性；这些模式被称为混合模式模型。

05

维度模型数据仓库（十五） —— 多重星型模式

（五）进阶技术 10. 多重星型模式从（五）进阶技术1. “增加列”开始，已经通过增加列和表扩展了数据仓库，在（五）进阶技术5. “快照”里增加了第二个事实表，month_end_sales_order_fact表。这之后数据仓库模式就有了两个事实表（第一个是在开始建立数据仓库时创建的sales_order_fact表）。有了这两个事实表的数据仓库就是一个正式的双星型模式。本篇将在现有的维度数据仓库上增加一个新的星型结构。与现有的与销售关联的星型结构不同，新的星型结构关注的是产品业务领域。新的星型结构有一个事实表和一个维度表，用于存储数据仓库中的产品数据。一个新的星型模式图（五）- 10-1 显示了扩展后的数据仓库模式。模式中有三个星型结构。sales_order_fact表是第一个星型结构的事实表，与其相关的维度表是customer_dim、product_dim、date_dim和sales_order_attribute_dim表。month_end_sales_order_fact表是第二个星型结构的事实表。product_dim和month_dim是其对应的维度表。第一个和第二个星型结构共享product_dim维度表。第二个星型结构的事实表和月份维度数据分别来自于第一个星型结构的事实表和date_dim维度表。它们不从源数据获得数据。第三个星型模式的事实表是新建的production_fact表。它的维度除了存储在已有的date_dim和product_dim表，还有一个新的factory_dim表。第三个星型结构的数据来自源数据。

02

漫谈数仓五重奏

从传统数仓到互联网数仓，有很多相似点也有很多不同点，互联网数仓的发展比较有代表性的就是阿里爸爸了，以下是《阿里大数据之路》中的数据体系架构图。

03

❤️ 爆肝三万字《数据仓库体系》轻松拿下字节offer ❤️【建议收藏】

🍅 作者主页：不吃西红柿 🍅 简介：CSDN博客专家🏆、信息技术智库公号作者✌ 华为云享专家、HDZ核心组成员。简历模板、PPT模板、学习资料、面试题库、技术互助。目录 🍅 信息技术智库 🍅 ---- 文章很长，前言一定要看拥有本篇文章，意味着你拥有一本完善的书籍，本篇文章整理了数据仓库领域，几乎所有的知识点，文章内容主要来源于以下几个方面：源于「数据仓库交流群」资深数据仓库工程师的交流讨论，如《sql行转列的千种写法》。源于群友面试大厂遇到的面试真题，整理投稿给我，形成《面试题库》。源于笔

02

数据仓库常见建模方法与建模实例演示[通俗易懂]

为什么要进行数据仓库建模？大数据的数仓建模是通过建模的方法更好的组织、存储数据，以便在性能、成本、效率和数据质量之间找到最佳平衡点。一般主要从下面四点考虑

01

耗时n年，38页《数据仓库知识体系.pdf》（数据岗位必备）

数据仓库最早的概念可以追溯到20世纪70年代MIT的一项研究，该研究致力于开发一种优化的技术架构并提出这些架构的指导性意见。

01

【万字长文】数仓最全知识点整理（建议收藏）

数据仓库 Data Warehouse，是为企业所决策制定过程，提供所有支持类型的数据集合。用于分析性报告和决策支持。数仓是一个面向主题、集成的、相对稳定、反映历史变化的数据集合，随着大数据技术的发展，其作用不再局限于决策分析、还可以为业务应用、审计、追踪溯源等多方面提供数据支撑，帮助企业完成数字化转型。

07

SAP HCM 权限分析工具篇

一直以来都想写一篇权限相关的文档，但是权限比较复杂，没有找到很好的切入点，也没有找到SAP标准的权限检查工具，但是上个月遇到 Personnel number skipped by thedatabase driver问题，这个问题折腾很多次，所以想用这个case作为切入点，彻底整理下HCM的权限概念。

01

一文探究数据仓库体系(2.7万字建议收藏)

数据仓库，英文名称为Data Warehouse，可简写为DW或DWH。数据仓库，是为企业所有级别的决策制定过程，提供所有类型数据支持的战略集合。它出于分析性报告和决策支持目的而创建。

03

印尼医疗龙头企业Halodoc的数据平台转型之路：基于Apache Hudi的数据平台V2.0

数据平台已经彻底改变了公司存储、分析和使用数据的方式——但为了更有效地使用它们，它们需要可靠、高性能和透明。数据在制定业务决策和评估产品或 Halodoc 功能的性能方面发挥着重要作用。作为印度尼西亚最大的在线医疗保健公司的数据工程师，我们面临的主要挑战之一是在整个组织内实现数据民主化。Halodoc 的数据工程 (DE) 团队自成立以来一直使用现有的工具和服务来维护和处理大量且多样的数据，但随着业务的增长，我们的数据量也呈指数级增长，需要更多的处理资源。由于现代数据平台从不同的、多样化的系统中收集数据，很容易出现重复记录、错过更新等数据收集问题。为了解决这些问题，我们对数据平台进行了重新评估，并意识到架构债务随着时间的推移积累会导致大多数数据问题。我们数据平台的所有主要功能——提取、转换和存储都存在问题，导致整个数据平台存在质量问题。现有数据平台印尼医疗龙头企业Halodoc的数据平台转型之路：数据平台V1.0 在过去几年中为我们提供了很好的服务，但它的扩展性满足不了不断增长的业务需求。

02

数据开发/数仓工程师上手指南(二)数仓构建分层概念

在了解了数仓的基本架构之后，我们还需要掌握数仓构建方法，也就是了解数仓是如何建模的，有什么规则和通用方法。我们应该如何去构建一个性能良好、稳定高效、契合业务的数据仓库。

03

内存数据库如何发挥内存优势？

与以磁盘存储为主的普通数据库相比，内存数据库的数据访问速度可以高出几个数量级，能大幅提高运算性能，更适合高并发、低延时的业务场景。

01

Apache kylin 入门

本篇文章就概念、工作机制、数据备份、优势与不足4个方面详细介绍了Apache Kylin。

01

百度、阿里、腾讯平台架构都熟悉，小米大数据平台架构OLAP架构演进是否了解

分析型系统进行联机数据分析，一般的数据来源是数据仓库，而数据仓库的数据来源为可操作型系统，可操作型系统的数据来源于业务数据库中，那么我们常用的数据仓库的组成和架构一般如下图所示

01

【云原生】内存数据库如何发挥内存优势

LogiKM(改名KnowStreaming) 是滴滴开源的Kafka运维管控平台, 有兴趣一起参与参与开发的同学,但是怕自己能力不够的同学,可以联系我,当你导师带你参与开源！。

05

【Techo Day腾讯技术开放日】数据仓库总结

数据库（Database）是按照一定格式和数据结构在计算机保存数据的软件，属于物理层。

01

系列 | 漫谈数仓第二篇NO.2 数据模型（维度建模）

model对于数仓是最核心的东西，数据模型是数据组织和存储方法，模型的好坏，决定了数仓能支撑企业业务多久。

04

系列 | 漫谈数仓第二篇NO.2 数据模型（维度建模）

model对于数仓是最核心的东西，数据模型是数据组织和存储方法，模型的好坏，决定了数仓能支撑企业业务多久。

02

50000字，数仓建设保姆级教程，离线和实时一网打尽(理论+实战) 上

我们在谈数仓之前，为了让大家有直观的认识，先来谈数仓架构，“架构”是什么？这个问题从来就没有一个准确的答案。这里我们引用一段话：在软件行业，一种被普遍接受的架构定义是指系统的一个或多个结构。结构中包括软件的构建（构建是指软件的设计与实现），构建的外部可以看到属性以及它们之间的相互关系。

07

Apache kylin概览

Apache kylin 能提供低延迟（sub-second latency）的秘诀就是预计算，即针对一个星型拓扑结构的数据立方体，预计算多个维度组合的度量，然后将结果保存在hbase中，对外暴露JDBC、ODBC、Rest API的查询接口，即可实现实时查询。

01

数据仓库基础介绍

本文将会讲述 BI/DW/DA 领域的一些常见概念，如：事实表、维度表、建模、多维分析、cube 等，但不涉及具体实例分析。

04

数据仓库常见建模方法与大数据领域建模实例综述

随着从IT时代到DT时代的跨越，数据开始出现爆发式的增长，这当中产生的价值也是不言而喻。如何将这些数据进行有序、有结构地分类组织存储，是我们所有数据从业者都要面临的一个挑战。

02

Greenplum 实时数据仓库实践（2）——数据仓库设计基础

本篇首先介绍关系数据模型、多维数据模型和Data Vault模型这三种常见的数据仓库模型和与之相关的设计方法，然后讨论数据集市的设计问题，最后说明一个数据仓库项目的实施步骤。规划实施过程是整个数据仓库设计的重要组成部分。

03

关于构建数据仓库的几个问题

数据仓库（Data Warehouse）是一个面向主题的（Subject Oriented）、集成的（Integrated）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策(Decision Making Support)。近年来，随着大数据的应用不断深入，构建企业级数据仓库成为了企业进行精细化运营的一种趋势。

02

【数据蒋堂】索引的本质是排序

来源：润乾软件作者：蒋步星本文长度为2600字，建议阅读5分钟本文为你分析索引清理背后的技术原理。索引是经常用到的技术，但有些程序员对索引的原理了解不深，发现数据查询性能有问题立刻就想起建索引，但效果常常也不尽人意。那么到底什么时候该用索引以及该怎么用？我们来分析索引清理背后的技术原理就知道了。基本原理索引技术的初衷是为了快速从一个大数据集中找出某个字段等于确定值（比如按身份证号找出某个人）的记录。一个规模（行数）为N的数据集，用遍历查找则需要比较N次，而如果数据是按该字段值（在索引中称

08

BigData-数据仓库学习

二者对比对比属性 OLTP OLAP 读特性每次查询只返回少量记录对大量记录进行汇总写特性随机、低延时写入用户的输入批量导入使用场景用户，Java EE项目内部分析师，为决策提供支持数据表征最新数据状态随时间变化的历史状态数据规模 GB TB到PB

02

MIMIC-IV-ED数据集介绍

MIMIC-IV-ED 是一个大型的免费数据库，记录了2011年至2019年间急诊部门(ED)贝斯以色列女执事医疗中心的入院情况。该数据库包含约425,000个 ED 停留。生命体征，分类信息，药物协调，药物管理和出院诊断是可用的。所有数据都被确定为符合健康信息便携性和责任法(HIPAA)安全港条款。MIMIC-IV-ED 旨在支持各种各样的教育倡议和研究。

01

数仓模型设计详细讲解

今天给大家分享下数仓中的模型设计，一个好的数仓项目首先看一下它的架构以及他所用到的模型，它们使用的模型也都是非常巧妙的，好了，我们话不说到直接开始。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭