前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据架构:现代数据架构选型篇(Data Fabric、Data Mesh)

数据架构:现代数据架构选型篇(Data Fabric、Data Mesh)

作者头像
Freedom123
发布2024-03-29 13:03:41
970
发布2024-03-29 13:03:41
举报
文章被收录于专栏:DevOpsDevOps

数据架构总是在更新迭代的路上,以使其快速适应变化的数据环境,更为敏捷和规模化地给业务部门交付数据。在传统的数据架构中,存在数据复杂度高、缺乏敏捷性、不便于协作、数据和一致性可解释性低下等问题。这些挑战阻碍了企业迈向数据驱动型企业的道路,也难以实现快速响应业务需求。

在寻求最佳数据架构的过程中,Data Fabric 和 Data Mesh 常常被关注到,这两者乍一看很相似,但是这两种方法存在着根本差异。

Data Fabric 是一种设计概念和架构方法,旨在解决数据管理的复杂性,最大限度地减少对数据使用者的干扰,确保任何位置、任何平台上的任何数据都可以被有效触达使用。Data Fabric 本质上是一种元数据驱动的方式,兼有 AL/ML 驱动的增强,和包含云原生、微服务、API 驱动等在内的强大的基础设施,用于链接不同的数据工具集。在日益异构化的环境中,Data Fabric 的出现显得至关重要。因为此时此刻,数据多样性的问题在变得更加严重。

Data Mesh 在解决的问题和 Data Fabric 十分相似,也就是在异构数据环境中管理数据的难题。但二者的不同之处在于,Data Mesh 允许分布式团队在遵守共同的治理规定的前提下按照自己的方式管理数据,而 Data Fabric 是在分布式数据之上构建单个的虚拟管理层。Data Mesh 希望能纠正数据湖和数据仓库之间的不一致性。

再往上一层总结,Data Mesh 则侧重于组织变革,它关注人员和流程,而不是架构,而 Data Fabric 以技术为中心,它是一种架构方法,它以一种智能的方式处理数据和元数据的复杂性,并且可以很好地协同工作。二者并不冲突,甚至可以有效协作,你可以将它们当作框架而不是架构。

前面提到数据湖和数据仓库,其实在目前,如何为数据分析需求提供最佳数据存储一直是一个火热的话题,相关产品竞争激烈。数据仓库和数据湖一直是使用最广泛的大数据存储架构,近几年横空出世的湖仓一体,号称结合了数据湖的灵活性和数据仓库的数据管理便捷性,但截至目前,行业内的最佳实践偏少,营销众多。

数据湖 vs 数据仓库 vs 湖仓一体的讨论在很长一段时间内都会持续下去,选择哪一种架构,取决于你正在处理的数据类型、数据源以及数据使用方式。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2024-03-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据保险箱
数据保险箱(Cloud Data Coffer Service,CDCS)为您提供更高安全系数的企业核心数据存储服务。您可以通过自定义过期天数的方法删除数据,避免误删带来的损害,还可以将数据跨地域存储,防止一些不可抗因素导致的数据丢失。数据保险箱支持通过控制台、API 等多样化方式快速简单接入,实现海量数据的存储管理。您可以使用数据保险箱对文件数据进行上传、下载,最终实现数据的安全存储和提取。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档