有奖捉虫:办公协同&微信生态&物联网文档专题 HOT
腾讯云数据仓库 TCHouse-D 基于业内领先的 OLAP 数据库 Apache Doris 内核构建,兼容 MySQL 协议,融合云上大数据生态,提供丰富的集群管控能力及完善的巡检告警体系,为客户提供简单易用、轻松运维的云上全托管服务,助力客户快速进行实时 OLAP 数据分析。

产品功能特点

MySQL 协议兼容

提供兼容 MySQL 协议的连接接口,用户不必再单独部署新的客户端库或者工具,可以直接使用 MySQL 的相关库或者工具。

大查询高吞吐

利用 MPP 架构的优势,使得查询能够分布式的在多个节点并行执行,充分利用集群整体计算资源,提高大查询的吞吐能力。

高并发小查询

通过使用分区裁剪、预聚合、谓词下推、向量化执行和异步 RPC 等技术,腾讯云数据仓库 TCHouse-D 可以支持高并发点查询场景,100台集群可达10万 QPS。

支持数据更新和删除

支持按主键删除和更新数据。能够方便的从 MySQL 等事务数据库中同步实时更新的数据。

高可用和高可靠

数据和元数据都默认使用3副本存储。在少数节点宕机的情况下,依然可以保证数据的可靠性。腾讯云数据仓库 TCHouse-D 会自动检查和修复损坏的数据,并将请求自动路由到健康的节点,7 * 24小时保证数据的可用性。

水平扩展和数据均衡

FE 节点和 BE 节点都可以进行横向扩展。用户可以根据计算和存储需要,灵活的对节点进行扩展。其中 BE 节点在扩展后,腾讯云数据仓库 TCHouse-D 会自动根据节点间的负载情况,进行数据分片的自动均衡,无需人工干预。

物化视图和预聚合引擎

支持通过物化视图或上卷表的形式对数据预聚合计算后的结果进行存储,从而加速部分聚合类场景的查询效率。腾讯云数据仓库 TCHouse-D 能够保证物化视图和基础表间的数据一致性,使得物化视图的查询和导入完全透明。此外,腾讯云数据仓库 TCHouse-D 内部会自动根据用户的查询语句,选择合适的物化视图进行数据摄取。

丰富的数据导入功能和导入事务保证

支持多种导入方式。不仅支持实时的流式导入,也支持大批量的数据导入。同时还可以直接订阅和消费 Kafka 中的数据。提供导入事务支持,配合导入 Label 机制,可以保证导入数据的不重不丢和原子一致性。

高效的列式存储引擎和一级二级索引

采用自研的列式存储格式,通过字典、RLE 等多种编码方式,配合列式存储的特点,提供了非常高的数据压缩比,帮助用户节省存储空间。同时,存储格式上提供包括 Min/Max 智能索引、稀疏索引、布隆过滤器、Bitmap 倒排索引等多种查询加速技术,进一步提升了查询效率。

在线表结构修改能力

支持在已导入数据的情况下修改表结构,包括增加列、删除列、修改列类型和改变列顺序等操作。变更操作不会影响当前数据库的查询和写入操作。

生态支持和周边组件的兼容能力

可以方便地导入存储在对象存储、HDFS 或 Kafka 中的数据,也可以通过 Flink、Spark 直接将 ETL 后的数据写入腾讯云数据仓库 TCHouse-D 中。用户也可以直接通过 Spark 查询腾讯云数据仓库 TCHouse-D 中存储的数据。腾讯云数据仓库 TCHouse-D 也可以通过 JDBC 读取包括 MySQL、PostgreSQL、SQLServer、Oracle 等外部数据源的数据。此外,腾讯云数据仓库 TCHouse-D 也可读取 Elasticsearch 中存储的数据,为 Elasticsearch 提供强大的分布式 SQL 查询层。