数据开发治理平台 WeData DLC SQL-操作指南-文档中心-腾讯云

注意：
需要绑定 DLC 引擎。目前支持 Spark SQL、Spark 作业、Presto 三种引擎。引擎内核详见 DLC 引擎内核版本。
1. 当前用户需要用对应 DLC 计算资源和库表的权限
2. 已经在 DLC 中创建对应的库表。
功能说明
向 WeData 的工作流调度平台提交一个 DLC SQL 任务执行。选 DLC 数据源类型时，提供“高级设置”，支持配置 Presto 和 Sparksql 参数。
﻿
使用 Spark 作业引擎时，可以配置作业资源规格和参数，资源的配置不能超过计算资源本身的限制。
﻿
配置说明：
配置项
描述
资源配置方式
分为集群默认配置与自定义配置两种方式：
1. 使用集群默认配置
使用当前任务计算资源集群配置
2. 自定义
用户自定义 Executor、Driver 配置
Executor 资源
填写需要的资源数，1cu 基本等同于1核 CPU，4G 内存。
1. Small（小型）：单个计算单位 (1cu)
2. Medium（中型）：两个计算单位 (2cu)
3. Large（大型）：四个计算单位 (4cu)
4. Xlarge（超大型）：八个计算单位 (8cu)
Executor 个数
Executor 负责执行任务和处理计算工作的计算节点或计算实例，每个 Executor 使用的资源为配置的资源数。
driver 资源
填写需要的Driver资源数，1cu 基本等同于1核 CPU，4G内存。
1. Small（小型）：单个计算单位 (1cu)
2. Medium（中型）：两个计算单位 (2cu)
3. Large（大型）：四个计算单位 (4cu)。
4. Xlarge（超大型）：八个计算单位 (8cu)。
示例代码
  -- 创建一个用户信息表
create table if not exists wedata_demo_db.user_info (
user_id string COMMENT '用户ID',
user_name string COMMENT '用户名称',
user_age int COMMENT '年龄',
city string  COMMENT '城市'
) COMMENT '用户信息表';
﻿
-- 向用户信息表中插入数据
insert into wedata_demo_db.user_info values ('001', '张三', 28, 'beijing');
insert into wedata_demo_db.user_info values ('002', '李四', 35, 'shanghai');
insert into wedata_demo_db.user_info values ('003', '王五', 22, 'shenzhen');
insert into wedata_demo_db.user_info values ('004', '赵六', 45, 'guangzhou');
insert into wedata_demo_db.user_info values ('005', '小明', 20, 'beijing');
insert into wedata_demo_db.user_info values ('006', '小红', 30, 'shanghai');
insert into wedata_demo_db.user_info values ('007', '小刚', 25, 'shenzhen');
insert into wedata_demo_db.user_info values ('008', '小李', 40, 'guangzhou');
insert into wedata_demo_db.user_info values ('009', '小张', 23, 'beijing');
insert into wedata_demo_db.user_info values ('010', '小王', 50, 'shanghai');
﻿
select  * from  wedata_demo_db.user_info;
注意：
使用 Iceberg 外部表时，SQL 语法与 Iceberg 原生表存在差异，详情见 DLC Iceberg 外部表与原生表语法差异。
Presto 引擎示例代码：
适用表类型：原生 Iceberg 表、外部 Iceberg 表。
  CREATE TABLE `cpt_demo`.`dempts` (
    id bigint COMMENT 'id number',
    num int,
    eno float,
    dno double,
    cno decimal(9,3),
    flag boolean,
    data string,
    ts_year timestamp,
    date_month date,
    bno binary,
    point struct<x: double, y: double>,
    points array<struct<x: double, y: double>>,
    pointmaps map<struct<x: int>, struct<a: int>>
)
COMMENT 'table documentation'
PARTITIONED BY (bucket(16, id), years(ts_year), months(date_month), identity(bno), bucket(3, num), truncate(10, data));
SparkSQL 引擎示例代码
适用表类型：原生 Iceberg 表、外部 Iceberg 表。
CREATE TABLE `cpt_demo`.`dempts` (
    id bigint COMMENT 'id number',
    num int,
    eno float,
    dno double,
    cno decimal(9,3),
    flag boolean,
    data string,
    ts_year timestamp,
    date_month date,
    bno binary,
    point struct<x: double, y: double>,
    points array<struct<x: double, y: double>>,
    pointmaps map<struct<x: int>, struct<a: int>>
)
COMMENT 'table documentation'
PARTITIONED BY (bucket(16, id), years(ts_year), months(date_month), identity(bno), bucket(3, num), truncate(10, data));
SparkSQL 作业引擎示例代码
适用表类型：原生 Iceberg 表、外部 Iceberg 表。
CREATE TABLE `cpt_demo`.`dempts` (
    id bigint COMMENT 'id number',
    num int,
    eno float,
    dno double,
    cno decimal(9,3),
    flag boolean,
    data string,
    ts_year timestamp,
    date_month date,
    bno binary,
    point struct<x: double, y: double>,
    points array<struct<x: double, y: double>>,
    pointmaps map<struct<x: int>, struct<a: int>>
)
COMMENT 'table documentation'
PARTITIONED BY (id, ts_year, date_month);
说明：
更多 DLC 语法参考：数据湖计算 DLC SQL 语法概览。
﻿

配置项	描述
资源配置方式	分为集群默认配置与自定义配置两种方式： 1. 使用集群默认配置使用当前任务计算资源集群配置 2. 自定义用户自定义 Executor、Driver 配置
Executor 资源	填写需要的资源数，1cu 基本等同于1核 CPU，4G 内存。 1. Small（小型）：单个计算单位 (1cu) 2. Medium（中型）：两个计算单位 (2cu) 3. Large（大型）：四个计算单位 (4cu) 4. Xlarge（超大型）：八个计算单位 (8cu)
Executor 个数	Executor 负责执行任务和处理计算工作的计算节点或计算实例，每个 Executor 使用的资源为配置的资源数。
driver 资源	填写需要的Driver资源数，1cu 基本等同于1核 CPU，4G内存。 1. Small（小型）：单个计算单位 (1cu) 2. Medium（中型）：两个计算单位 (2cu) 3. Large（大型）：四个计算单位 (4cu)。 4. Xlarge（超大型）：八个计算单位 (8cu)。

DLC SQL

本页目录：

功能说明

示例代码

Presto 引擎示例代码：

SparkSQL 引擎示例代码

SparkSQL 作业引擎示例代码