
在电商、金融、工业等数字化程度高的行业,企业对数据时效性要求日益严苛。传统Lambda架构存在数据孤岛、计算逻辑重复开发、Update场景支持不足等固有缺陷,导致系统灵活性低、运维成本高,无法满足实时报表、实时推荐、实时风控等业务对秒级响应的需求。
腾讯云自研的Streaming Iceberg方案,底层采用LSM Tree存储引擎,实现对单行数据的部分列更新,并生成完整的changelog供下游Flink作业进行增量处理。该方案通过统一存储打破数据孤岛,兼容Iceberg生态,支持Spark SQL、Trino/Presto等多种查询引擎,简化了数据架构。
在数据同步优化方面,通过At-least-once同步模式与目标端upsert能力,CDC(变更数据捕获)存量同步阶段性能提升10倍以上。方案支持自动小文件合并、压缩编码与分区优化,保障了数据写入速度与查询性能。
某电商平台采用流式湖仓处理实时订单交易数据:ODS层基于Streaming Iceberg的changelog能力进行流式聚合;DWD/DWS层通过Doris外表进行OLAP分析,或通过DLC/EMR的Spark/Presto引擎进行离线报表计算,实现数据复用,避免了传统架构中的重复计算。
针对实时业务资源波动大的特点,Oceanus推出首创的弹性包年包月方案,该方案支持作业级自动扩缩容与资源池弹性伸缩,配合0.25CU起的细粒度资源规格,相比传统计费模式节省约20%资源成本。同时支持混合部署,避免多集群管理带来的运维负担。
平台提供算子级资源配置(CPU、内存、并行度、状态TTL)和Flink专家团队代码优化服务,平均降低约20%资源消耗。内置70+项监控指标与AI动态阈值告警,支持一键诊断、日志检索与快照回滚,实现0成本运维,大幅降低专业运维人力投入。
来源:2024腾讯全球数字生态大会,腾讯云流计算Oceanus产品团队 李哲。方案基于Apache Flink构建,获腾讯自研服务器技术支撑。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。