产品优势

多模态数据融合

融合结构化数据、AI领域的非结构化数据源、模型的多模态数据统一入湖及管理

批流一体表格式

全托管存储的批流一体 TCIceberg 表格式,兼容 Iceberg同时拓展流式湖仓场景

统一数据目录

内置统一管理多模态数据的元数据服务,同时支持多种外部数据源接入

统一权限

基于 RBAC 的统一权限模型,封装标准化接入层,构建覆盖数据全生命周期的权限管控体系

智能数据服务

内置智能化的小文件合并、快照清理、数据生命周期管理

开放生态

开放上层引擎接入,包括腾讯云 EMR、DLC、TCHouse 等生态、及 Spark、Flink 等开源生态

应用场景

  • 构建 Lakehouse 湖仓一体
  • 多模态数据湖构建
  • 大数据&机器学习一体化

简介

基于统一数据湖构建多场景应用,如基于 Spark 的批处理、基于 Flink 实时链路、基于 TCHouse 的高性能分析等,解决传统架构下离线、实时、交互分析多套数据体系割裂问题。同时通过统一元数据整合 LakeHouse 数据资产、提供智能数据优化、加速等服务,可大幅提升客户数据维护及使用效率。

特性介绍

  • 批流一体表格式 TCIceberg
  • 统一数据目录
  • 多引擎对接

常见问题

什么是多模态智能数据湖 TCLake 服务?

多模态智能数据湖服务 TCLake 是腾讯云推出的开放、智能、融合的新一代AI数据湖底座,提供覆盖结构化+非结构化数据的统一管理,内置多模态统一数据目录、批流一体表格式、智能数据管理、数据加速服务,上层无缝对接腾讯云及主流开源Data+AI生态引擎,助力企业高效构建AI时代统一、低成本的数据湖基础架构。

不同数据目录有何差异?

目前支持那些外部数据源?

如何获得多模态智能数据湖 TCLake 服务的产品内测资格?

我们致力于为您提供个性化的售前购买咨询服务,以及全面的技术售后服务。