首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签数据湖计算 DLC

#数据湖计算 DLC

数据湖分析服务

Calcite系列(十二):可插拔性&JDBC驱动

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

为了实现动态数据源管理框架的目标,Calcite提供了丰富的可插拔能力和扩展性。用户可以根据使用场景进行自定义扩展。相关可插拔扩展的组件包括:

1910

Calcite系列(十一):物化视图

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

物化视图(Materialized View):是一种特殊的物理表,本质是预计算,是多个计算过程之间的联系建立。从数据组织层面优化数据访问效率,即把某些耗时的操...

9360

Calcite系列(十):执行流程-计划树执行

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

计划树执行是SQL处理的第五步,也称为Implementor执行实现。Calcite主要提供两种Implementor实现方式:RelImplemntor 和 ...

10170

Calcite系列(九):执行流程-优化器优化

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

优化器优化是SQL处理的第四步,也是最核心的一步,优化器优化本质是基于优化规则实现关系代数等价转换。

23160

Calcite系列(八):执行流程-计划树构建

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

计划树构建是SQL处理的第三步,构建出可关系代数优化的逻辑计划树RelNode,是优化器执行优化的前提。

17760

Calcite系列(七):执行流程-合法性校验

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

合法性校验是SQL处理的第二步,在计算执行前,提前验证SQL正确性。该验证操作是非线性的,需要基于语法树处理各种嵌套的复杂情况。Calcite合法性校验基于Sq...

12530

Calcite系列(六):执行流程-语法解析

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

目前广泛使用的语法解析框架主要包括ANTLR、JavaCC和Yacc等。在大数据领域中,很多计算引擎都是基于ANTLR进行语法解析,例如 Hive、Spark和...

28870

Calcite系列(五):执行流程-概览

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

SQL执行流程有一套通用的步骤,尽管具体的实现可能会因数据库系统的不同而有所差异,但流程相对固定。以下是通用的SQL处理流程:

19360

Calcite系列(四):核心概念-Adapter

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

Calcite作为SQL中间件,为提供扩展性并适配不同数据源,提供了Adapter(适配器)方式对接数据源并根据数据源特性进行查询优化。

21350

Calcite系列(三):核心概念-Convention

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

Convention:Calcite设计的核心概念,代表一类特定的数据源或执行引擎,基于Convention可生成与具体数据源或者引擎相关的执行计划。Calci...

17740

Calcite系列(二):核心概念-关系代数

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

关系模型是一种用于数据库管理的理论框架,其基础建立在数学的集合论之上。该模型由Edgar F. Codd 于1970年提出,旨在以一种严格且理论化的方式来描述数...

23970

Calcite系列(一):背景介绍

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

Apache Calcite是一款开源的动态数据管理框架,提供了标准的 SQL 语言、查询优化和连接各种数据源的能力,但不包括数据存储、处理数据的算法和存储元数...

27891

【天穹OS】虚拟表:支持极速查询的下一代湖仓一体新范式

jhonye

腾讯 · 开发工程师 (已认证)

湖仓一体(Lakehouse)是近年来比较火的大数据概念,它将数据湖(Data Lake)和数据仓库(Data Warehouse)的优势结合起来,为企业提供了...

1.5K210

腾讯云DLC(数据湖计算)重磅支持Apache Hudi

ApacheHudi

数据湖计算 DLC 通过类 SaaS 化的服务设计,为客户提供云原生企业级敏捷智能数据湖解决方案,具备以下特点:

1.2K30

湖仓一体电商项目(二十四):合并Iceberg小文件

Lansonli

Iceberg表每次commit都会生成一个parquet数据文件,有可能一张Iceberg表对应的数据文件非常多,那么我们通过Java Api 方式对Iceb...

1.7K101

湖仓一体电商项目(二十三):离线业务统计每天用户商品浏览所获积分

Lansonli

使用Iceberg构建湖仓一体架构进行数据仓库分层,通过Flink操作各层数据同步到Iceberg中做到的离线与实时数据一致,当项目中有一些离线临时性的需求时,...

29040

湖仓一体电商项目(二十二):实时任务执行流程

Lansonli

这里默认HDFS、Hive、HBase、Kafka环境已经准备,启动maxwell组件监控mysql业务库数据:

320100

湖仓一体电商项目(二十一):数据发布接口和数据可视化

Lansonli

通过Flink实时把结果数据写入Clickhouse-DM层中后,我们需要编写数据发布接口方便数据使用方调用数据结果进行可视化,数据发布接口项目为SpringB...

30690

湖仓一体电商项目(二十):业务实现之编写写入DM层业务代码

Lansonli

DM层主要是报表数据,针对实时业务将DM层设置在Clickhouse中,在此业务中DM层主要存储的是通过Flink读取Kafka “KAFKA-DWS-BROW...

30550

湖仓一体电商项目(十九):业务实现之编写写入DWS层业务代码

Lansonli

DWS层主要是存放大宽表数据,此业务中主要是针对Kafka topic “KAFKA-DWD-BROWSE-LOG-TOPIC”中用户浏览商品日志数据关联HBa...

33130
领券