首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯云大数据产品概要

腾讯云大数据产品概要

原创
作者头像
IT资讯研究所
发布2026-05-30 02:18:37
发布2026-05-30 02:18:37
1550
举报

一、 产品定位与核心亮点

腾讯云大数据是打造“轻快易用”的智能大数据平台体系。其核心技术定位为基于云原生技术和泛 Hadoop 生态的企业级数据底座,具备开源开放、存算分离、极致弹性的技术特征。

商业差异化卖点:

  • 成本优化: 通过深化云原生能力,提供弹性灵活的架构,显著减少整体投入成本 50%-80%
  • 性能卓越: 基于内外部海量业务实践验证,提供领先业界的高性能计算能力。
  • 全场景覆盖: 提供从数据引擎(公有云/私有化)到开发治理工具(WeData)再到应用层(BI)的全链路产品矩阵。
  • 信创合规: 针对金融、政务等关键领域,提供全链路信创支持(芯片、操作系统、国密算法),TBDS 平台支持 X86、ARM 架构混部。

二、 产品应用场景

目标受众

业务场景

痛点描述

互联网/游戏企业

实时推荐、用户画像、A/B实验

需对海量用户行为数据进行亚秒级分析,支撑高并发查询及模型验证。

金融机构

实时风控、反洗钱、监管报送

对数据时效性、稳定性要求极高,需支持 PB 级数据的秒级分析与合规审计。

零售/消费电子

供应链优化、精准营销、门店选址

需整合多源异构数据,打通数据孤岛,实现经营分析的实时化和智能化。

教育/泛互企业

数据湖仓建设、离线/实时计算

自建 IDC 运维成本高、资源无法弹性伸缩,面临技术栈复杂和人力不足挑战。

政务机构

一网统管、税务大数据平台

需构建统一数据汇聚区,支撑亿级数据的高效查询与跨部门数据共享。

企业IT部门

系统集成、API 管理

系统间数据孤岛严重,需低代码方式连接内外部系统,实现业务流程自动化。

三、 应用框架和功能介绍

1. 产品矩阵与功能框架

产品名称

技术内核/定义

部署形态

核心功能定位

弹性 MapReduce (EMR)

云原生 + 泛 Hadoop 生态

公有云

提供 Hive/Spark/Flink 等开源组件,构建企业级数据湖。

腾讯云数据仓库 TCHouse

ClickHouse (TCHouse-C) / Doris (TCHouse-D) / PostgreSQL (TCHouse-P)

公有云 / 私有化

全托管实时数仓,支持 OLAP 分析、高并发点查、湖仓联动。

流计算 Oceanus

Apache Flink

公有云

企业级实时大数据分析,支持亚秒级延时处理。

数据湖计算 DLC

Spark / Presto / Iceberg

公有云

云原生 Serverless 湖仓分析,存算分离,开箱即用。

Elasticsearch Service

ES + 自研内核 + X-Pack

公有云

全托管检索分析,支持文本搜索、日志分析、向量检索(RAG)。

数据开发平台 WeData

DataOps 一体化

公有云 / 私有化 / 混合云

覆盖数据集成、开发、治理、资产管理的全链路平台。

腾讯大数据处理套件 TBDS

云原生 + 泛 Hadoop

公有云 / 私有化 / 混合云

企业级大数据底座,主打信创替代、湖仓一体、数据中台。

腾讯云 BI

敏捷自助式 + ChatBI

公有云 / 私有化

全流程可视化分析,支持大模型智能助手对话式分析。

腾讯轻联 iPaaS

低代码集成

公有云 / 私有化

应用集成与 API 全生命周期管理,预置 400+ 连接器。

2. 硬核指标

  • 处理规模: TBDS 内部验证支持 100,000+ 节点,日增量数据 100PB;TCHouse-C 支持 PB 级日志数据秒级分析。
  • 响应延迟: TCHouse 系列产品在数亿记录大宽表查询可达亚秒级;ES 支持十亿级向量检索毫秒级响应,百万级 QPS。
  • 性能提升: 腾讯云大数据在 Sort Benchmark 中以 98.8秒 完成 100TB 数据排序(2016年世界纪录);相比传统数仓,TCHouse-C 查询效率数倍领先。
  • 资源消耗: TCHouse-D 支持存算分离,TCHouse-P 基于 MPP 架构处理 PB 级数据。

3. 产品优势(全量提取)

  • EMR: 开源稳定、组件增强、高效运维、资源弹性、安全可靠、综合降本、分钟级集群构建、原生支持 COS/CHDFS 存算分离。
  • TCHouse-C: 简单易用、极致性能、弹性伸缩、安全可靠、成本更低、高效运维、支持 PB 级秒级自定义分析。
  • TCHouse-D: 云上托管、极简架构、MySQL 及 Hadoop 兼容、一键湖仓联动、企业级高可用、亚秒级响应、高并发特性。
  • TCHouse-P: 弹性伸缩、简单易用、无缝集成、性能卓越、安全可靠、兼容 PostgreSQL、支持直接对 COS 数据 SQL 分析。
  • 流计算 Oceanus: 一站开发、无缝连接、亚秒延时、低廉成本、安全稳定、专家服务、支持 Flink CEP 复杂事件处理。
  • 数据湖计算 DLC: 下一代 LakeHouse 湖仓融合、存算分离极致弹性降本、极速稳定内核性能增强、安全加固、Serverless 服务敏捷易用、支持 Python 作业及 AI 预处理。
  • Elasticsearch Service: 易于部署和管理、费用低廉、强劲自研内核、Elasticsearch 高级特性(X-Pack)、高可用、安全加固、支持 Serverless 模式、向量与文本混合搜索、支持 RAG 一站式服务。
  • WeData: 开箱即用多团队数据协同、基于开源开放平台支持用户业务共建、全链路 DataOps 能力敏捷易用、一体化数据资产运营和管理、体系化大数据安全保障。
  • TBDS: 开源开放(社区特性最快合入)、安全可控(全链路信创、X86/ARM 混部)、内部经验(腾讯百万节点验证)、智能运维(TBDS-Brain 综合分析业内第一)、技术先进(云原生湖仓、计算弹性、存储无限扩展)、CDH 迁移最丝滑。
  • 腾讯云 BI: 多种数据源对接、自助式数据建模、自助式数据分析、企业级权限管控、移动协同应用、大模型分析提效(ChatBI)。
  • 腾讯轻联 iPaaS: 图形化编排、可视化运维监控、连接器开箱即用(400+个)、灵活部署、高可用、API 全生命周期管理。

4. 荣誉背书

  • 权威报告(来源:Forrester, IDC, 赛迪顾问, 沙利文):
    • Forrester Wave 云数仓 (Q2 2023): 强势迈入全球竞争者行列。
    • Forrester 中国数据管理 (Q4 2022): 位列第一梯队。
    • IDC MarketScape 中国实时湖仓 (2024): 位居领导者象限
    • 赛迪顾问: 连续三年稳居领导者行列。
    • IDC 中国数据治理市场份额 (2023): 位居国内前二
  • 技术认证与奖项:
    • 2016年: Sort Benchmark 全球排序竞赛冠军(98.8秒完成100TB排序)。
    • 2017年: 中国计算机学会科学技术奖科技进步卓越奖。
    • 2020年: 工信部信息技术应用创新解决方案;ES 团队内核贡献亚太第一,2人入选 Elastic 全球贡献 Top100。
    • 2022年: 中国电子学会“数字大脑”优秀产品;IT168 年度技术卓越奖;通过 CSA STAR 云安全认证(金牌)。
    • 2023年: 信通院数据平台整体解决方案 2 级认证。
    • 2024年: 首个通过信通院《检索增强生成(RAG)技术要求》标准专项测试;核心参编《搜索型数据库白皮书》。

四、 典型案例

1. 微信读书(公有云 - 内部战略)

  • 背景: 2.1亿用户,日活超200w。面临10亿级向量规模导致存储成本高(原需400台64G机器)、需运维四套系统、且在线业务稳定性要求5个9以上。
  • 解决方案: 采用腾讯云 ES,利用机器学习节点进行知识向量化,实现全文与向量混合搜索,结合 Kibana 调试与大模型集成。
  • 成效:
    • 成本: 机器从 400台降至30台,大幅降低硬件成本。
    • 性能: 数亿量级索引召回平均耗时在 100ms以下
    • 运维: 从跨4套系统调优变为“所见即所得”一站式 RAG 方案。

2. 极光(AURORA)(公有云 - SaaS)

  • 背景: 头部消息推送服务商,IDC 千台节点,面临计算无法弹性(波峰波谷明显)、架构不稳定(NameNode 压力大)、数据时效低(T+1甚至T+2)。
  • 解决方案: 基于 EMR+TCHouse-D 构建企业级平台。采用离在线混合部署、HDFS RBF 联邦架构及实时湖仓方案。
  • 成效:
    • 成本: 利用 TKE 闲时资源,提升闲时利用率 50%,整体成本下降 30%+
    • 稳定性: NameNode RPC 请求压力降低 60%,大表 Shuffle 数据量降低 50%
    • 时效: 数据分钟级入湖,workflow 整体计算时长降低 9个小时

3. 荣耀(HONOR)(公有云 - 消费电子)

  • 背景: 从友商云迁移,面临物理机扩容周期长(数周)、权限管理割裂、服务支持链路长等问题。
  • 解决方案: 采用 EMR/TCHouse-P 存算分离架构,基于 Ranger 实现统一权限管理,利用标签调度实现资源隔离。
  • 成效:
    • 效率: 集群扩容周期提升至分钟级,运维效率提升 15%+
    • 稳定性: 业务离线任务 SLA 满足率达 100%

4. 百果园(公有云 - 泛互)

  • 背景: 上市零售企业,需整合多业务维度数据,对水果鲜度管理要求极高,需快速运营数据洞察。
  • 解决方案: 基于腾讯云大数据整体解决方案构建云上数据平台,覆盖经营决策、店长管理、店铺选址及供应链管理。
  • 成效:
    • 资产化: 打通数据孤岛,构建核心数据资产管理体系。
    • 降本: 基于云原生分钟级弹性扩缩容,显著降低综合成本。
    • 业务: 服务超千家门店,支撑全链路数据决策。

5. 富途证券(公有云 - 金融)

  • 背景: 用户数超2000万,原 MySQL 无法支撑海量数据计算,需满足金融风控、用户画像、内容推荐等实时计算需求。
  • 解决方案: 组合使用 EMR(BI报表、风控、社区挖掘)、ES(用户画像、搜索)、ClickHouse(实时特征计算)。
  • 成效:
    • 效率: 集群交付效率提升 10倍以上,运维人力成本降低 20%
    • 稳定性: 相比自建集群,稳定性大幅提升。

6. 作业帮(公有云 - 教育)

  • 背景: 超百条核心业务线,面临夜间资源争抢、IT 资源利用率低(在线夜间闲、大数据夜间忙)、权限管理割裂。
  • 解决方案: 采用腾讯云 EMR 弹性计算与算力融合(调度任务至业务集群),统一权限体系,智能运维。
  • 成效:
    • 资源: 企业 IT 资源利用率提升 25%,成本降低 20%,任务性能提升 20%
    • 效率: 业务数据产出效率提升 60%,服务器资源利用率提升 5倍,集群 CPU 累计和降低 58%

7. 火花思维(公有云 - 教育)

  • 背景: 以 Hive 为主架构查询延迟长达数十分钟,固定资源分配导致成本浪费。
  • 解决方案: 采用 腾讯云 DLC,利用高性能计算引擎(内核增强)和智能弹性引擎。
  • 成效:
    • 时效: 核心数据产出提前 2小时
    • 成本: 存算分离+云原生引擎,成本降低 30%

8. 完美世界(公有云 - 游戏)

  • 背景: 原基于 CDP 自建,面临 License 续费成本高、存算一体架构不灵活、数据分层能力有限。
  • 解决方案: 基于 EMR 采用半存算分离架构(热数据本地 SSD,温冷数据转 COS),配合动态弹性伸缩。
  • 成效:
    • 成本: 综合成本优化 20%,运维精力投入降低 30%

9. 中国银行(私有化 - 金融)

  • 背景: 构建全集团数据湖(UDP-DLake),需接入外部数据及分行特色系统,消除数据孤岛。
  • 解决方案: 基于 TBDS 整合全行数据,建立集约化数据中台,通过 HDFS 联邦+统一元数据实现跨集群计算。
  • 成效:
    • 规模: 累计部署 4000+ 节点,存储超 40PB,调度 10万+ 任务,对接 300+ 业务系统。
    • 业务: 支撑手机银行、反洗钱、监管报送等核心业务,替代原有 EDP/BDP 系统。

10. 某寿险头部公司(私有化 - 金融/融合创新)

  • 背景: 规划全公司级统一数据平台,需支撑湖仓一体、流批一体及信创国产化。
  • 解决方案: 通过 TBDS + StarRocks 构建湖仓一体平台,结合 WeData 实现一站式开发治理。
  • 成效:
    • 时效: 报表数据产出从小时级加速至 5分钟
    • 管理: 实现全公司数据研发运营一体化,打破协作壁垒。

11. 长城人寿(私有化 - 金融/融合创新)

  • 背景: 原有平台链路松散,需构建公司级统一数据中台支持多业务。
  • 解决方案: 腾讯提供大数据全家桶能力,包括 TBDS、TCHouse 和 WeData
  • 成效: 落实 DataOps 理念,实现统一数据管理和标准,盘活数据资产,助力保险业务上线。

12. 某头部城商行(私有化 - 金融)

  • 背景: 构建全行级湖仓一体平台,需融合结构化与非结构化数据,提升数据服务响应效率。
  • 解决方案: 采用 TBDS 湖仓底座 + WeData 开发平台,全信创落地。
  • 成效:
    • 技术: 接入 2w+ 批量任务,100+ 实时任务,计算资源利用率提升 20%,数据搬迁时间减少 1-2小时
    • 业务: 形成统一数据资产,通过数据服务市场快速变现价值。

13. 鹏华基金(私有化 - 金融/融合创新)

  • 背景: 原 CDH 平台,需实现降本增效、自主可控,降低清算风险。
  • 解决方案: 通过 TBDS 平滑迁移 CDH,架构采用 HDFS + YARN + Spark/Presto + ES。
  • 成效:
    • 性能: 大数据 TA 清算耗时快了近 1小时;营销数据中心跑批耗时从 6小时缩短至 3.5小时(性能提升 71%)。
    • 存储: 总数据存储量较旧系统节约 48%

14. 河北省税务局(私有化 - 政务)

  • 背景: 税智撑平台与税收大数据平台扩容,需兼容国产 C86 资源,替换原有 GBase 数据库。
  • 解决方案: 采用 TCHouse 搭建 MPP 集群,利旧现有资源,通过并行化、向量化、列存技术升级。
  • 成效:
    • 规模: 总数据量近 150TB,近 80节点,共享数据表 9450 张。
    • 业务: 完成省级平台融合共建,支撑数字账户、发票风险服务等重要应用。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、 产品定位与核心亮点
  • 二、 产品应用场景
  • 三、 应用框架和功能介绍
    • 1. 产品矩阵与功能框架
    • 2. 硬核指标
    • 3. 产品优势(全量提取)
    • 4. 荣誉背书
  • 四、 典型案例
    • 1. 微信读书(公有云 - 内部战略)
    • 2. 极光(AURORA)(公有云 - SaaS)
    • 3. 荣耀(HONOR)(公有云 - 消费电子)
    • 4. 百果园(公有云 - 泛互)
    • 5. 富途证券(公有云 - 金融)
    • 6. 作业帮(公有云 - 教育)
    • 7. 火花思维(公有云 - 教育)
    • 8. 完美世界(公有云 - 游戏)
    • 9. 中国银行(私有化 - 金融)
    • 10. 某寿险头部公司(私有化 - 金融/融合创新)
    • 11. 长城人寿(私有化 - 金融/融合创新)
    • 12. 某头部城商行(私有化 - 金融)
    • 13. 鹏华基金(私有化 - 金融/融合创新)
    • 14. 河北省税务局(私有化 - 政务)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档