首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签数据开发治理平台 WeData

#数据开发治理平台 WeData

云端的一站式数据协作开发平台

Hive CBO优化剖析

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

Hive是较早的SQL on Hadoop系统,对大数据SQL执行有广泛和深远的影响。它最初由Facebook开发,后来成为Apache软件基金会的一个开源项目...

9050

Calcite系列(十二):可插拔性&JDBC驱动

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

为了实现动态数据源管理框架的目标,Calcite提供了丰富的可插拔能力和扩展性。用户可以根据使用场景进行自定义扩展。相关可插拔扩展的组件包括:

9630

Calcite系列(十一):物化视图

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

物化视图(Materialized View):是一种特殊的物理表,本质是预计算,是多个计算过程之间的联系建立。从数据组织层面优化数据访问效率,即把某些耗时的操...

26690

Calcite系列(十):执行流程-计划树执行

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

计划树执行是SQL处理的第五步,也称为Implementor执行实现。Calcite主要提供两种Implementor实现方式:RelImplemntor 和 ...

14870

Calcite系列(九):执行流程-优化器优化

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

优化器优化是SQL处理的第四步,也是最核心的一步,优化器优化本质是基于优化规则实现关系代数等价转换。

23260

Calcite系列(八):执行流程-计划树构建

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

计划树构建是SQL处理的第三步,构建出可关系代数优化的逻辑计划树RelNode,是优化器执行优化的前提。

18560

Calcite系列(七):执行流程-合法性校验

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

合法性校验是SQL处理的第二步,在计算执行前,提前验证SQL正确性。该验证操作是非线性的,需要基于语法树处理各种嵌套的复杂情况。Calcite合法性校验基于Sq...

12930

Calcite系列(六):执行流程-语法解析

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

目前广泛使用的语法解析框架主要包括ANTLR、JavaCC和Yacc等。在大数据领域中,很多计算引擎都是基于ANTLR进行语法解析,例如 Hive、Spark和...

29170

Calcite系列(五):执行流程-概览

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

SQL执行流程有一套通用的步骤,尽管具体的实现可能会因数据库系统的不同而有所差异,但流程相对固定。以下是通用的SQL处理流程:

19960

Calcite系列(四):核心概念-Adapter

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

Calcite作为SQL中间件,为提供扩展性并适配不同数据源,提供了Adapter(适配器)方式对接数据源并根据数据源特性进行查询优化。

21450

Calcite系列(三):核心概念-Convention

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

Convention:Calcite设计的核心概念,代表一类特定的数据源或执行引擎,基于Convention可生成与具体数据源或者引擎相关的执行计划。Calci...

17940

Calcite系列(二):核心概念-关系代数

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

关系模型是一种用于数据库管理的理论框架,其基础建立在数学的集合论之上。该模型由Edgar F. Codd 于1970年提出,旨在以一种严格且理论化的方式来描述数...

24470

Calcite系列(一):背景介绍

Yiwenwu

腾讯 · 后台开发工程师 (已认证)

Apache Calcite是一款开源的动态数据管理框架,提供了标准的 SQL 语言、查询优化和连接各种数据源的能力,但不包括数据存储、处理数据的算法和存储元数...

28491

Wedata数据治理产品应用

研究僧

腾讯科技深圳有限公司 · 高级工程师 (已认证)

数据开发治理平台 WeData(以下简称 WeData)是位于云端的一站式数据开发治理平台,融合了包含数据集成、数据开发、任务运维的全链路 DataOps 数据...

34540

数据仓库(12)数据治理之数仓数据管理实践心得

张飞的猪大数据分享

当然,想要做数据治理,想要学习了解,一下数据治理的范围,理论等,最好可以看看别人怎么做的,了解数据治理可以参考:数据仓库(11)什么是大数据治理,数据治理的范围...

17020

2023爱分析·数据开发与管理平台市场厂商评估报告:炎凰数据

爱分析ifenxi

利用多种数据智能技术实现数据驱动的分析与决策,已经成为当前企业数字化转型最重要的目标之一。随着数据来源日益丰富、数据体量快速增长,企业对数据的依赖和挖掘愈发深入...

22520

人工智能在计算机视觉及网络领域中的应用

用户9882025

这些年人工智能技术已经全面深入到人们日常生活中去,为人们日常生活提供了各种便利条件。计算机应用,人工智能现象, 已经成为当前计算机市场的常态。本篇文章主要分析计...

64430

数据开发治理平台Wedata之数仓建设实践

张志刚

本案例基于腾讯云一站式开发治理平台Wedata、私有网络VPC、云数据库Mysql和弹性Mapreduce构建了全流程的离线数仓建设流程。通过模拟业务数据的导入...

2.5K50

Tuxera NTFS2022MacOS X系统读写工具

用户7442547

Tuxera NTFS for Mac2022是一款Mac完全读写软件,具备丰富的磁盘管理功能,实现苹果Mac OS X系统读写Microsoft Window...

62600

离线同步方案

单核

Apache Sqoop是一种用于在Apache Hadoop和结构化数据存储(如关系数据库)之间高效传输批量数据的工具。http://sqoop.apache...

1.7K30
领券