开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

数据湖构建的成本和收益

数据湖是一种大规模、可扩展的数据存储和分析解决方案，它可以存储来自不同来源的结构化、半结构化和非结构化数据。数据湖的构建涉及到多个步骤，包括数据摄取、数据存储、数据处理、数据分析和数据可视化等。

在数据湖的构建过程中，需要考虑以下成本和收益：

成本：

数据摄取成本：数据摄取是数据湖构建过程中的关键步骤，需要从不同来源抽取数据并将其存储到数据湖中。数据摄取成本包括硬件成本、软件成本、人工成本等。
数据存储成本：数据湖需要存储大量的数据，因此数据存储成本是数据湖构建过程中的重要成本。数据存储成本包括存储设备的硬件成本、存储服务的订阅成本等。
数据处理成本：数据湖中的数据需要进行清洗、转换、聚合等处理，以便于进行数据分析。数据处理成本包括计算资源的硬件成本、计算服务的订阅成本等。

收益：

数据分析收益：数据湖可以支持大规模的数据分析，包括报表生成、数据挖掘、机器学习等。通过对数据湖中的数据进行分析，可以帮助企业做出更好的决策，提高企业的竞争力。
数据挖掘收益：数据湖中的数据可以通过数据挖掘技术进行深入分析，发现数据中的隐藏信息和潜在规律。这些信息和规律可以帮助企业优化业务流程、提高产品质量、降低成本等。
数据可视化收益：数据湖可以支持数据的可视化，帮助企业更直观地了解数据的分布和趋势。数据可视化可以帮助企业更好地理解数据，发现数据中的问题和机会，提高企业的决策效率。

推荐的腾讯云相关产品：

腾讯云数据湖：腾讯云数据湖是一种大规模、可扩展的数据存储和分析解决方案，可以存储来自不同来源的结构化、半结构化和非结构化数据。腾讯云数据湖支持数据摄取、数据存储、数据处理、数据分析和数据可视化等多个功能，可以帮助企业构建数据湖。
腾讯云数据仓库：腾讯云数据仓库是一种大规模、高性能的数据存储和分析解决方案，可以存储来自不同来源的结构化数据。腾讯云数据仓库支持数据摄取、数据存储、数据处理、数据分析和数据可视化等多个功能，可以帮助企业构建数据仓库。
腾讯云云数据库：腾讯云云数据库是一种高可用、高可扩展的数据库服务，可以存储来自不同来源的结构化数据。腾讯云云数据库支持多种数据库类型，包括关系型数据库、NoSQL数据库等。

推荐的产品介绍链接地址：

腾讯云数据湖：https://cloud.tencent.com/product/datalake
腾讯云数据仓库：https://cloud.tencent.com/product/dw
腾讯云云数据库：https://cloud.tencent.com/product/cdb

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Apache Hudi在华米科技的应用-湖仓一体化改造

华米科技是一家基于云的健康服务提供商，拥有全球领先的智能可穿戴技术。在华米科技，数据建设主要围绕两类数据：设备数据和APP数据，这些数据存在延迟上传、更新频率高且广、可删除等特性，基于这些特性，前期数仓ETL主要采取历史全量+增量模式来每日更新数据。随着业务的持续发展，现有数仓基础架构已经难以较好适应数据量的不断增长，带来的显著问题就是成本的不断增长和产出效率的降低。

01

数据资产为王，如何解析企业数字化转型与数据资产管理的关系？

随着企业数字化转型的深入，数据体量爆炸式增长，如何控制数据生产成本、发现有价值的数据，提高数据 ROI，成了企业数字化转型中后期的关键任务，这也是数据资产管理的终极目标。

02

数据资产为王，如何解析企业数字化转型与数据资产管理的关系？

随着企业数字化转型的深入，数据体量爆炸式增长，如何控制数据生产成本、发现有价值的数据，提高数据ROI，成了企业数字化转型中后期的关键任务，这也是数据资产管理的终极目标。

04

腾讯云原生数据湖存储服务能力再上新，三级加速体系助力企业用数赋智

2022 导语随着数据价值被越来越多企业认可，数据湖存储已成为企业级存储的首选和新一代提升生产力的服务。12月1日，在2022腾讯数字生态大会存储专场，腾讯云升级了云原生数据湖产品能力，并详细阐释了其设计理念，对其在多个行业的应用进行了案例分享，为更多企业提供降低存储成本、提升存储性能的实践参考。当下，数据的生产、存储和消费模式日新月异，随着数据的爆发式增长，在数据存储和处理方面的降本增效成为企业亟待解决的问题。腾讯云存储高级产品经理林楠认为，“市场需要一个更大、更快、更全能、更低成本的存储服务。数据

01

直播预告| Lakehouse 湖仓一体化架构论坛

在大模型时代，企业将如何进行湖仓一体化架构选型？下一代Lakehouse架构方向又在哪里？未来面临着怎么样的挑战？让我们在6月15日举办的以「大模型时代的 OLAP 技术演进」为主题的第58届DataFunSummit：OLAP 线上峰会中，「Lakehouse 湖仓一体化架构」论坛上看头部企业如何做！

01

字节跳动基于 Apache Hudi 的湖仓一体方案及应用实践

目前主流的数仓架构—— Lambda 架构，能够通过实时和离线两套链路、两套代码同时兼容实时数据与离线数据，做到通过批处理提供全面及准确的数据、通过流处理提供低延迟的数据，达到平衡延迟、吞吐量和容错性的目的。在实际应用中，为满足下游的即席查询，批处理和流处理的结果会进行合并。

05

数据湖与湖仓一体架构实践

数据湖是保存大量原始格式数据的中心位置。与以文件或文件夹形式存储数据的分层数据仓库相比，数据湖采用扁平化架构和对象存储方式来存储数据。‍对象存储具有元数据标签和唯一标识符，便于跨区域定位和检索数据，提高性能。通过利用廉价的对象存储和开放格式，数据湖使许多应用程序能够利用数据。

03

基于湖仓一体构建数据中台架构

数据仓库存储结构化的数据，适用于快速的BI和决策支撑，而数据湖可以存储任何格式的数据，往往通过挖掘能够发挥出数据的更大作为，因此在一些场景上二者的并存可以给企业带来更多收益。湖仓一体，又被称为Lake House，其出发点是通过数据仓库和数据湖的打通和融合，让数据流动起来，减少重复建设。Lake House架构最重要的一点，是实现数据仓库和数据湖的数据/元数据无缝打通和自由流动。湖里的“显性价值”数据可以流到仓里，甚至可以直接被数仓使用；而仓里的“隐性价值”数据，也可以流到湖里，低成本长久保存，供未来的数据挖掘使用。

01

字节跳动基于 Apache Hudi 的湖仓一体方案及应用实践

目前主流的数仓架构—— Lambda 架构，能够通过实时和离线两套链路、两套代码同时兼容实时数据与离线数据，做到通过批处理提供全面及准确的数据、通过流处理提供低延迟的数据，达到平衡延迟、吞吐量和容错性的目的。在实际应用中，为满足下游的即席查询，批处理和流处理的结果会进行合并。

03

重新定义OLAP！新型多维分析架构全揭秘！

2022年6月11日，DataFun将举办第二届线上DataFunSummit2022：多维分析架构峰会。本次峰会共设置9大主题论坛，并邀请目前工作在大数据多维分析领域的负责人、架构师、数据工程师和开源多维分析项目的核心成员分享，内容既涵盖了开源多维分析、新一代MPP数据库架构、数据湖分析型架构、实时多维分析等核心技术，也包含金融、互联网、交通、物流、工业、画像、营销等多个应用场景的实践经验。非常期待这次峰会的到来，同时也希望各位能从中收获更多的知识，结识更多的朋友，让大数据的多维分析能力达到新的高度！ ▌

01

Flink Forward Asia 2021 实时数据湖合集

Building The Real-time Datalake at ByteDance （00:00:00-00:22:47）

03

提升数据分析效率：Amazon S3 Express One Zone数据湖实战教程

（声明：本篇文章授权活动官方亚马逊云科技文章转发、改写权，包括不限于在亚马逊云科技开发者社区、知乎、自媒体平台、第三方开发者媒体等亚马逊云科技官方渠道）

01

实现成本最优的一体化管理，新一代数据平台的建设方式

1.当前，企业在大数据和数据中台建设上取得成果，但数据开发管理仍具挑战性（成本、效率、复杂度）。

01

大数据架构前沿实践分享

12月19日，9：00-12：40，由来自腾讯数据湖研发负责人邵赛赛老师出品的DataFunTalk年终大会——大数据架构论坛，将邀请来自腾讯、Tubi、车好多、T3出行、滴滴出行等公司的6位嘉宾，就大数据架构相关主题进行分享。本次会议全程直播，详细信息如下： 01 专题论坛及日程论坛名称大数据架构论坛论坛时间 12月19日，09:00-12:40论坛出品邵赛赛腾讯数据湖研发负责人分享时间分享内容09:00-09:40如何让Ozone成为HDFS的下一代分布式存储系统腾讯高级工程师毛宝龙09

03

女朋友问小灰：什么是数据仓库？什么是数据湖？什么是智能湖仓？

作为程序员，我们写的大多数商业项目，往往都需要用到大量的数据。计算机的内存，可以实现数据的快速存储和访问。

03

数据湖在快手的应用实践

快手业务发展迅速，对数据精细化运营的要求越来越高。随之而来，数仓的数据模型持续快速增长。这带来了两个主要问题：

01

直播｜分析型湖仓论坛

随着湖仓技术的持续演进，数据仓库和数据湖方案在快速演进和弥补自身缺陷的同时，二者之间的边界也逐渐淡化，湖上建仓、仓中数据降冷到湖、物化视图、冷热融合查询等方案也越来越多的成为各个公司的标配，各大厂商也陆续提出了自己的湖仓融合方案，通过湖仓融合技术来提升业务使用体验的同时也降低了业务的使用成本。

02

现在是采用湖仓一体的好时机吗？

近日，大数据独角兽 Databricks 官宣 H 轮融资，经过这一轮 16 亿美元融资，其估值已经飙升至 380 亿美元。Databricks 联合创始人兼首席执行官 Ali Ghodsi 在媒体采访中表示，这笔资金将主要用于加速构建在 lakehouse（湖仓一体）赛道的布局。

02

引入一项新技术前，我们该想清楚什么？

很多小伙伴在工作遇到一定瓶颈的时候，都希望引入一些新技术来解决问题，比如最近经常在群里看到大家聊：

01

大数据金融反欺诈将一步步破碎羊毛党的黄粱美梦

在直接的金融收益驱动下，券商收入利润的来源和重心势将逐渐转向财富管理、资产管理、投资顾问和融资融券等业务。当前的垂直分工体系将逐渐被以横向分工体系的轻资产基础架构所替代。当然，智能终端技术在带来便捷服务的同时也面临信息安全风险，亟待监管机构建立配套的防控机制。技术的创新和改进从来都是经济增长的源泉。在今天，技术的创新和改进尤其促进了金融行业提高专业化水平与运营效率。用美国机器人革命和人工智能专家马丁·福特的话来说，信息技术是一种前所未有的破坏力量，它的触角日益延伸至各个企业和整个经济之中，改变了人们

Arctic 自动优化湖仓原理解析

Arctic 是一个开放式架构下的湖仓管理系统，在开放的 lceberg 数据湖格式之上，提供更多面向流和更新场景的优化，以及一套可插拔的数据自优化机制和管理服务。

02

大数据计算加速论坛

背景介绍 4月23日09:00-12:45，在DataFunSummit2022：大数据计算架构峰会上，由腾讯云大数据资深高级工程师熊训德出品的大数据计算加速论坛，将邀请来自腾讯、阿里巴巴、矩阵起源、喜马拉雅的5位技术专家，就相关主题进行深度分享，欢迎大家一起探讨交流。具体日程详细介绍出品人：熊训德腾讯云大数据资深高级工程师个人介绍：四川大学硕士毕业后加入腾讯，在腾讯云大数据从事 hadoop 生态相关的云存储和计算等后台开发，专注于研究大数据、虚拟化和人工智能等相关技术。嘉宾介绍：

02

「数据战略」数据驱动企业和DataOps :数据仓库与数据湖：入门

第1章和第2章介绍了数据驱动组织的概念，并在大数据计划的背景下定义了数据操作的概念。现在，是时候退一步，探索一些其他基本但重要的概念了。在这一点上，我们最重要的任务之一是清楚地描述数据仓库和数据湖之间的区别。

03

Apache Ozone和密集型数据节点

该帖子也是由两名思科员工共同撰写的：Karthik Krishna，Silesh Bijjahalli

01

Flink 十周年专访莫问：存算分离 2.0 架构的探索与展望

Flink 从 2014 年诞生之后，已经发展了将近 10 年，尤其是最近这些年得到了飞速发展。在全球范围内，Flink 已经成为了实时流计算的事实标准，成为大数据技术栈中不可或缺的一部分。在 2023 年终盘点之际，InfoQ 有幸采访了 Apache Flink 中文社区发起人、阿里云开源大数据平台负责人王峰（莫问），了解他对大数据技术栈的看法，以及 Flink 的进展和未来规划。

01

滴普科技冯森：FastData DLink实时湖仓引擎架构设计与落地实践

本文根据冯森在【第十三届中国数据库技术大会（DTCC2022）】线上演讲内容整理而成。

03

Data Mesh，数据架构的下一个变革！

自 2010 年左右兴起到现在，微服务（Microservices）已经成为事实上的软件架构范式，被企业广泛采用，并引发了围绕面向领域设计模式优缺点的激烈讨论。如今，这股浪潮开始席卷数据领域。

02

数据中台与湖仓一体能碰出怎样的火花？网易数帆实时数据湖Arctic的新探索

数据从离线到实时是当前一个很大的趋势，但要建设实时数据、应用实时数据还面临两个难题。首先是实时和离线的技术栈不统一，导致系统和研发重复投入，在这之上的数据模型、代码也不能统一；其次是缺少数据治理，实时数据通常没有纳入数据中台管理，没有建模规范、数据质量差。针对这两个问题，网易数帆近日推出了实时数据湖引擎 Arctic。据介绍，Arctic 具备实时数据更新和导入的能力，能够无缝对接数据中台，将数据治理带入实时领域，同时支持批量查询和增量消费，可以做到流表和批表的一体。

02

B站基于Hudi+Flink打造流式数据湖的落地实践

上图展示了当前B站实时数仓的一个简略架构，大致可以分为采集传输层、数据处理层，以及最终的AI和BI应用层。为保证稳定性，数据处理层是由以实时为主，以离线兜底的两条链路组成，即我们熟知的批流双链路。

05

国内顶级汽车制造厂的创新实践：如何利用实时数据湖为更多业务提供新鲜数据？

使用 TapData，化繁为简，摆脱手动搭建、维护数据管道的诸多烦扰，轻量代替 OGG、DSG 等同步工具，「CDC + 流处理 + 数据集成」组合拳，加速仓内数据流转，帮助企业将真正具有业务价值的数据作用到实处，将“实时数仓”方法论落进现实。 TapData 持续迭代产品能力，优化用户体验的同时，也在不断探索各行各业数据需求的底层逻辑，力求为行业用户提供更加简洁、更具针对性的解题思路。本期内容便是我们在汽车制造行业做出的实践以及展望。

01

听说，难于上青天的云原生数据湖能开箱即用了？

导语 | 云原生数据湖架构以低成本优势推动客户上云，同时云上客户得以低成本撬动更多结构化和非结构化数据的价值，是一场云厂商的自我革命。本文由腾讯大数据专家工程师于华丽在 Techo TVP开发者峰会「数据的冰与火之歌——从在线数据库技术，到海量数据分析技术」的《云原生数据湖新一代数据架构》演讲分享整理而成，为大家详尽介绍云原生数据湖的价值和背景，云原生数据湖架构原则和挑战，同时分析腾讯云数据湖产品，展望腾讯云数据湖解决方案。点击可观看精彩演讲视频一、云原生数据湖架构的价值今天分四个阶段来为大家

04

云原生数据湖101

导语 | 云原生数据湖致力于扩大公有云市场总量：一方面以低成本优势推动客户上云，另一方面云上客户得以低成本撬动更多结构化和非结构化数据的价值，是一场云厂商的自我革命，本文将为大家洞悉云原生数据湖的神秘面纱，并且首次推出腾讯云的云原生数据湖产品。文章作者：于华丽，腾讯TEG数据平台部研发工程师。一、云上架构大数据平台的挑战和机遇选择 Cloud 还是 Local 的诸多讨论和实践中，成本一直是绕不开的话题。“公有云太贵了，一年机器就够托管三五年了”，这基本上是刚开始接触公有云的企业，在进行了详细价格

01

通用数据湖仓一体架构正当时

这篇博文中提出的建议并不新鲜。事实上许多组织已经投入了数年时间和昂贵的数据工程团队的工作，以慢慢构建这种架构的某个版本。我知道这一点，因为我以前在Uber和LinkedIn做过这样的工程师。我还与数百个组织合作，在开源社区中构建它并朝着类似的目标迈进。

01

Apache Iceberg技术调研&在各大公司的实践应用大总结

作者在实际工作中调研了Iceberg的一些优缺点和在各大厂的应用，总结在下面。希望能给大家带来一些启示。

02

【数据编制架构】Data Fabric 架构：优点和缺点

数字化转型不仅仅是将工作流（workflows ）和流程（process）数字化的问题。这也是改造遗留系统和专有系统以及其他孤立数据源的问题，以参与连接系统、应用程序和服务的生态系统。从本质上讲，这是一个促进支撑企业基本工作流程和流程的所有资源之间的数据交换的问题。

01

数据中台选型必读！透过Data Fabric看懂数据管理的未来

数智化汹涌而来，前驱者已初尝甜头：据《福布斯》披露，《财富》500强公司数据可访问性增加10%，便可带来6,500万美元的额外净收入——“依靠智能算法及敏捷数据准备在数据海洋中提炼‘石油’，让决策更科学”已成为众多企业的共识。

03

今日Qcon热门分享｜腾讯K8s大规模离在线混部与内核隔离实践

2021年5月29-31日Qcon软件大会在北京国家会议中心举行。自2007年3月份开始举办以来，已经有超万名有多年从业经验的技术人员参加过QCon大会。QCon 内容源于实践并面向社区，演讲嘉宾依据热点话题，面向5年以上工作经验的技术团队负责人、架构师、工程总监、开发人员分享技术创新和实践。云计算平台带来 IT 基础设施巨大变革，每一次 IT 基础设施的变革都会激发开发人员去思考能够充分发挥新平台优势的软件设计和开发方法。“云原生”就是一种充分利用云计算模式的优点来构建和运行应用的方法。无论是构建

04

构建企业现代化数据平台，从“智能湖仓”开始｜Q推荐

2021 年初，在 InfoQ 全年技术趋势展望中，数据湖与数据仓库的融合，成为大数据领域的趋势重点。直至年末，关于二者的讨论依然热烈，行业内的主要分歧点在于数据湖、数据仓库对存储系统访问、权限管理等方面的把控；行业内的主要共识点则是二者结合必能降低大数据分析的成本，提高易用性。

03

万字详解大数据架构新概念

来源：五分钟学大数据本文约10000+字，建议阅读10+分钟本文将从历史的角度对数据湖和数据仓库的来龙去脉进行深入剖析。随着近几年数据湖概念的兴起，业界对于数据仓库和数据湖的对比甚至争论就一直不断。有人说数据湖是下一代大数据平台，各大云厂商也在纷纷的提出自己的数据湖解决方案，一些云数仓产品也增加了和数据湖联动的特性。但是数据仓库和数据湖的区别到底是什么，是技术路线之争？是数据管理方式之争？二者是水火不容还是其实可以和谐共存，甚至互为补充？本文作者来自阿里巴巴计算平台部门，深度参与阿里巴巴大数据/数

02

从本地到云端：豆瓣如何使用 JuiceFS 实现统一的数据存储

豆瓣成立于 2005 年，是中国最早的社交网站之一。在 2009 到 2019 的十年间，豆瓣数据平台经历了几轮变迁，形成了 DPark + Mesos + MooseFS 的架构。

01

云端数智新引擎，腾讯云原生数据湖计算重磅发布

2010年 Pentaho 公司的创始人兼首席技术官詹姆斯·狄克逊（James Dixon）首次提出数据湖的概念。把数据湖中的数据比作原生态的水——它是未经处理的，原汁原味的。数据湖中的水从源头流入湖中，各种用户都可以来湖里获取、蒸馏提纯这些水（数据）。此时，大家对于数据湖的理解主要是当作一个集中式的存储系统，允许存储任意规模的结构化和非结构化数据。

02

数据湖VS数据仓库？湖仓一体了解一下

导读：随着近几年数据湖概念的兴起，业界对于数据仓库和数据湖的对比甚至争论就一直不断。有人说数据湖是下一代大数据平台，各大云厂商也在纷纷的提出自己的数据湖解决方案，一些云数仓产品也增加了和数据湖联动的特性。

01

OPPO数仓与数据湖融合架构升级的实践与思考

作者｜蔡芳芳过去几年，数据仓库和数据湖方案在快速演进和弥补自身缺陷的同时，二者之间的边界也逐渐淡化。云原生的新一代数据架构不再遵循数据湖或数据仓库的单一经典架构，而是在一定程度上结合二者的优势重新构建。在云厂商和开源技术方案的共同推动之下，2021 年我们将会看到更多“湖仓一体”的实际落地案例。InfoQ 希望通过选题的方式对数据湖和数仓融合架构在不同企业的落地情况、实践过程、改进优化方案等内容进行呈现。本文，InfoQ 采访了 OPPO 云数架构部部长鲍永成，请他与我们分享 OPPO 引入数据湖和数

02

云端数智新引擎，腾讯云原生数据湖计算重磅发布

引言是否遇到过，一个简单的业务统计需求却让数据工程师们抓耳挠腮？是否遇到过，业务峰值周期明显，要么资源大量闲置，要么线上疯狂告警？是否遇到过，大数据集群运维复杂，需要投入大量技术工程师？针对以上痛点，腾讯云发布云原生数据湖计算服务，协同腾讯云端数据湖体系，帮助企业高效构建云端数据湖架构、降低数据计算成本，提升数据分析敏捷性、激发数据应用价值，助力企业数字化决策。本文作者：ericshhxie 一、数据湖的前世今生 2010年 Pentaho 公司的创始人兼首席技术官詹姆斯·狄克逊（Jame

03

云端数智新引擎，腾讯云原生数据湖计算重磅发布

引言是否遇到过，一个简单的业务统计需求却让数据工程师们抓耳挠腮？是否遇到过，业务峰值周期明显，要么资源大量闲置，要么线上疯狂告警？是否遇到过，大数据集群运维复杂，需要投入大量技术工程师？针对以上痛点，腾讯云发布云原生数据湖计算服务，协同腾讯云端数据湖体系，帮助企业高效构建云端数据湖架构、降低数据计算成本，提升数据分析敏捷性、激发数据应用价值，助力企业数字化决策。本文作者：ericshhxie 一、数据湖的前世今生 2010年 Pentaho 公司的创始人兼首席技术官詹姆斯·狄克逊（James

02

云端数智新引擎，腾讯云原生数据湖计算重磅发布

针对以上痛点，腾讯云发布云原生数据湖计算服务，协同腾讯云端数据湖体系，帮助企业高效构建云端数据湖架构、降低数据计算成本，提升数据分析敏捷性、激发数据应用价值，助力企业数字化决策。

02

云端数智新引擎，腾讯云原生数据湖计算重磅发布

针对以上痛点，腾讯云发布云原生数据湖计算服务，协同腾讯云端数据湖体系，帮助企业高效构建云端数据湖架构、降低数据计算成本，提升数据分析敏捷性、激发数据应用价值，助力企业数字化决策。

05

7000字，详解仓湖一体架构！

沃尔玛拥有世界上最大的数据仓库系统，它利用数据挖掘方法对交易数据进行分析后发现"跟尿布一起购买最多的商品竟是啤酒！后来经过大量实际调查和分析，发现在美国，一些年轻的父亲下班后经常要到超市去买婴儿尿布，而他们中有30%～40%的人同时也为自己买一些啤酒，这是因为美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布，而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。

03

雁栖学堂—湖存储专题直播第七期回顾

上周举行的腾讯云知识分享，雁栖学堂第七期 GooseFS 数据湖存储数据成本管理能力篇已经圆满结束了。

02

湖仓才是数据智能的未来？那你必须了解下国产唯一开源湖仓了

机器之心发布机器之心编辑部国产唯一的开源数据湖存储框架 LakeSoul 近期发布了 2.0 升级版本，让数据智能触手可及。湖仓一体作为新一代大数据技术架构，将逐渐取代单一数据湖和数仓架构，成为大数据架构的演进方向。当前已有 DeltaLake、Iceberg、Hudi 等国外开源的数据湖存储框架。LakeSoul 是数元灵科技研发的，国产唯一的开源数据湖存储框架，并于近期发布了 2.0 升级版本。本文将结合大数据架构的演变历史及业务需求，深度剖析国产唯一开源湖仓一体框架 LakeSoul 带来的现

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭