加速 ETL 回写

最近更新时间:2026-06-30 16:45:32

我的收藏
TDSQL Boundless 提供加速 ETL 回写功能,可通过列存只读分析实例加速 INSERT ... SELECT ... 语句中 SELECT 子句的查询效率,再将查询结果通过内部网络回写到读写实例的目标表中,从而显著提升复杂查询场景下的 ETL 效率。

技术原理


如上图所示,您可以将 INSERT ... SELECT ... 语句路由到列存只读分析实例执行,其中 SELECT 部分由列存只读分析实例加速执行,查询结果直接回写到读写实例中,从而提升整体执行效率。

使用场景

推荐在以下场景中使用本功能:查询条件复杂、SQL 语句执行时间较长,但查询结果集数据量较小。在该场景下,列存只读分析实例能显著加速 SELECT 查询的执行效率,进而提升整体 ETL 性能。
本功能并非在所有场景下都能带来性能收益,在以下场景下性能可能下降:
INSERT ... SELECT ... 语句中的 SELECT 查询较为简单时,从列存只读分析实例读取数据并回写到读写实例会带来额外的网络开销,相比直接从读写实例读取数据的优势不明显。
INSERT ... SELECT ... 语句中的 SELECT 查询结果集数据量较大时,主要性能瓶颈在于结果集通过网络传输并写入读写实例的过程,本功能无法优化该场景下的性能。
注意:
列存只读分析实例采用异步复制模式,存在同步延迟时,查询结果与读写实例之间会存在一定时差。本功能仅适用于对数据延迟不敏感的场景。