StarRocks 数据源

最近更新时间:2025-12-02 15:52:12

我的收藏
数据集成提供了 StarRocks 的实时写入能力,本文为您介绍 StarRocks 实时数据同步当前能力支持情况。

支持版本

目前数据集成支持 StarRocks 整库级实时写入,使用实时写入能力需遵循以下版本限制:
类型
版本
StarRocks
2.5.3、3.1.2、3.1.12

使用限制

StarRocks 支持多种数据模型,详情请参见StarRocks 数据模型。若需以 Upsert 方式写入 StarRocks,需要确保数据模型为 UNIQUE KEY。
来源表有主键时自动创建的 StarRocks 目标表为 UNIQUE KEY;来源表无主键时自动创建的 StarRocks 目标表为 DUPLICATE KEY。
当来源表无主键自动建表为 DUPLICATE KEY 时,默认将来源表的所有字段都设置为Key列,从而提升 StarRocks 表的查询和存储性能。

实时整库同步写入配置


参数
说明
数据去向
选择需要同步的目标数据源。
库/表匹配策略
StarRocks 中数据库以及数据表对象的名称匹配规则:
默认与来源库/来源表同名。
自定义:支持使用内置参数和字符串组合生成目标库表名称。
说明:
示例:如来源表名称为 table1,映射规则为 ${table_name_di_src}_inlong,则 table1 的数据将被最终映射写入至 table1_inlong 中。

实时单表同步写入配置

参数
说明
数据去向
需要写入的 StarRocks 数据源。
支持选择或者手动输入需写入的库名称。
默认将数据源绑定的数据库作为默认库,其他数据库需手动输入库名称。
当数据源网络不连通导致无法直接拉取库信息时,可手动输入数据库名称。在数据集成网络连通的情况下,仍可进行数据同步。
支持选择或者手动输入需写入的表名称。
当数据源网络不连通导致无法直接拉取表信息时,可手动输入表名称。在数据集成网络连通的情况下,仍可进行数据同步。
主键
Upsert 写入依赖主键。
高级设置(可选)
可根据业务需求配置参数。要求如下:
1. 一个参数一行;若需配合使用的参数写在一行内。
2. 每个参数带默认值。

支持的字段类型

Flink data type
StarRocks data type
BOOLEAN
BOOLEAN
TINYINT
TINYINT
SMALLINT
SMALLINT
INTEGER
INTEGER
BIGINT
BIGINT
FLOAT
FLOAT
DOUBLE
DOUBLE
DECIMAL
DECIMAL
BINARY
INT
CHAR
STRING
VARCHAR
STRING
STRING
STRING
DATE
DATE
TIMESTAMP_WITHOUT_TIME_ZONE(N)
DATETIME
TIMESTAMP_WITH_LOCAL_TIME_ZONE(N)
DATETIME
ARRAY<T>
ARRAY<T>
MAP<KT,VT>
JSON STRING
ROW<arg T...>
JSON STRING