数据管理和数据集成是任何组织数字化转型战略的关键组成部分。在当今的全渠道业务环境中,组织必须实时访问和分析来自各种来源的大规模数据。然而,传统的数据管理方法对于这些要求来说常常太慢。数据编织架构可以帮助克服这些问题。
对于寻求数字加速的组织来说,数据编织非常有益。由于这是一个相对较新的概念,许多企业领导者可能并不了解。在本文中,我们将探讨数据编织、其用例及其优势。
1.什么是数据编织?
数据编织是一个单一且一致的数据管理框架,可帮助组织管理其数据。数据编织的目的是减少数据管理的复杂性。它通过消除低效的手动数据集成流程来帮助组织解决复杂的数据问题,并提供用于分析的业务就绪数据。它使用户能够无缝访问和共享数据,无论数据存储在何处。
Data Fabric 软件架构汇集并连接来自不同来源的企业数据,例如:
数据编织还可以让组织自动执行以下任务:
1.1什么是数据编织架构?
数据编织架构是指整体数据编织设计和结构。它包括数据编织组件、技术和原理,以及它们的集成和配置,以支持:
1.2数据编织架构和数据编织如何结合在一起?
数据编织为组织提供了一个统一、灵活且可扩展的平台,用于管理结构化和非结构化数据,他们可以使用这些数据来实时访问和分析。组织可以通过实施数据编织架构来创建数据编织。该架构使组织能够使用该平台有效地访问和分析数据。
2.为什么数据编织现在很重要?
缺乏数据访问(即需要数据的用户可以访问数据)和数据集成的复杂性等挑战阻碍了组织最大限度地发挥数据的价值并充分利用其数据。传统的数据集成已不足以满足通用转换、实时连接等业务需求。将组织数据与多个来源的数据集成、处理和转换是许多组织面临的挑战。
Data Fabric 为用户提供全面的实时数据访问;无论用户位于何处,它都可以可视化。用户可以使用数据编织来简化多云数据环境中的数据治理和管理。
3.公司如何从数据编织中受益?
4.数据编织由哪些组件组成?
数据编织不仅仅是一个网络。通常,数据编织由以下主要组件组成:
4.1数据管理层
数据管理层负责跨众多存储资源的数据组织和管理。它可以具有数据管理功能,例如:
4.2数据保护层
数据保护层的工作是确保数据始终安全且可访问。它可以包括数据管理功能,例如:
此外;它可以包括数据加密等安全功能,以保护您的数据免遭未经授权的访问或破坏。
4.3数据访问层
数据访问层允许应用程序访问和检索来自云环境和数据湖等不同来源的数据。该层可以统一数据访问,而不管数据源如何。它可以提供应用程序编程接口(API)和接口:
4.4数据消费层
消费层负责控制应用程序和系统如何使用数据。它通常由接口和API组成,允许程序和系统根据需要访问和使用数据。
消费层可以整合多个数据源的数据消费。该层提供以下功能:
5.用于运营工作负载的数据编织、数据湖与数据库
由于“数据编织”、“数据湖”和“数据库”都存储和管理数据,因此可能会混淆。但是,它们的用例和功能可能有所不同:
5.1数据编织、数据湖与数据数据库比较表
在表 1 中,您可以找到数据编织、数据湖和数据库之间的一些相似点和差异的摘要。
点击图片可查看完整电子表格
表 1:数据编织、数据湖、数据库。
6.为什么使用数据编织?Data Fabric 架构的关键数据管理优势
数据编织可以使组织能够管理数据,无论数据存储在何处。数据编织可以提供以下数据管理优势:
6.1数据可访问性
数据编织允许组织以统一一致的方式访问和管理来自不同来源的数据,包括:
6.2数据治理
数据编织使组织能够在其数据管道中实施治理策略。有关政策:
6.3数据整合
数据编织可以自动将来自不同来源的结构化和非结构化数据组合成一个统一的视图。
6.4数据敏捷性
数据编织解决方案可以让组织轻松地根据需求的变化快速更改其数据架构。这可以帮助企业适应商业世界的变化并保持竞争力。
例如,假设组织需要添加新的数据源,例如物联网设备或社交媒体。在这种情况下,数据编织可以将其数据集成到现有架构中。
6.5数据可扩展性
数据编织解决方案可以让组织扩展其数据基础设施以满足以下需求:
例如,组织可以将客户数据存储在多个数据库和文件系统中。数据编织可以将所有这些数据汇集在一起并用于分析。
6.6云集成
数据编织技术可以让组织跨以下位置移动和管理数据:
这可以提供灵活性并减少供应商锁定。
7.数据编织不需要收集和分析所有形式的元数据
数据编织帮助公司管理和整合多个来源的数据。然而,它不需要收集和分析每一条信息。数据编织对于收集和分析元数据的有用程度取决于组织的用例和需求。例如,元数据在数据编织中很有用:
7.1数据治理
组织可以通过收集和分析元数据来改善非结构化和结构化数据源的治理和合规性。元数据可以追踪数据沿袭、所有权和适当的使用。
7.2安全性
元数据在存储(静态)和传输(动态)时都可以在安全方面发挥重要作用。元数据可以加密数据、实施访问限制并监控数据活动。例如,元数据可用于跟踪谁查看了特定文件以及何时查看,以及检测敏感数据和应用数据屏蔽。
7.3数据分析
元数据可用于分析不同的数据源并从中学习。元数据可以帮助理解数据模式、组合来自不同来源的数据并实时分析流数据。
8.数据编织、数据虚拟化、数据联邦
数据编织、数据虚拟化和数据联邦有时会被混淆。在本节中,我们将解释这些术语。
8.1数据编织和数据虚拟化有什么区别?
数据编织是一个与数据虚拟化相混淆的概念。两者都是用于管理组织数据的数据架构。数据虚拟化是集成用于转换数据源以获得实时洞察的解决方案的最快方法。另一方面,数据编织是一种管理架构,可为物联网分析、数据科学和客户 360 等更广泛的用例提供全面的管理。数据虚拟化有助于数据编织架构更好地工作。
8.2数据虚拟化
图 2:虚拟化将数据源连接到分析。(1)
数据虚拟化是一种允许企业访问和使用数据的方法,就像数据存储在单个位置一样,即使数据分布在多个数据源中。这是通过在底层数据源之上构建虚拟层来实现的,该虚拟层提供了一致且统一的数据表示。
8.3数据联邦
图 3:数据联邦将数据库中的数据连接到商业智能。(2)
数据联邦与数据虚拟化类似,因为它提供了单一、一致的数据视图,但其实现方式有所不同。
8.3.1数据联邦连接器
在数据联邦中,数据保留在其原始位置,并通过一组中间件或连接器进行访问。这些连接器使应用程序和系统可以访问和使用来自不同数据源的数据,但数据仍保留在其来源处。连接器负责将来自不同来源的数据转换为通用格式,并每次都以相同的方式显示。
8.3.2数据虚拟化与数据联邦
相比之下,虚拟化创建了一个位于底层数据源之上的虚拟层,并提供统一且一致的数据视图。数据通常被移动或复制到虚拟层并从那里访问和使用。
8.4数据编织、数据虚拟化与数据联邦比较表。
表 2 总结了数据编织、虚拟化和数据联邦之间的差异。
点击图片可查看完整电子表格
表 2:数据编织、虚拟化和数据联邦。
9.Data Fabric 如何与 AI/ML 配合使用?
人工智能 (AI) 和机器学习 (ML) 可以通过多种方式处理数据。这里有一些例子:
10.现实世界的数据编织可以执行即时复杂的查询
数据编织可以通过分区、索引、缓存和物化视图来加速查询处理。此外,数据编织可以使用分布式处理和并行性来处理大数据。这里有些例子:
原文链接:https://research.aimultiple.com/data-fabric/