新一代大数据架构 MPP(Massively Parallel Processing)是更加全面、高效、可靠和智能的大数据处理架构。它采用了分布式数据库的设计理念,使各个节点之间共同协作,实现数据的并行处理。新一代 MPP 支持更多的数据类型和计算任务,提供更高效的数据存储和查询能力。主要特性包括:
打破传统系统对冷热数据的定义,所有数据支持即时查询能力,支持对 PB 级大数据集的快速交互式查询和分析。
存算分离部署模式下,系统无需数据备份即可提供高可用性;在存算一体部署模式下,系统提供实时备份功能。
存储和计算分离,可以实现大规模数据存储和计算的分布式处理,满足不同应用场景的高并发、高扩展性等需求。如计算资源支持硬件服务器、虚拟机、容器;存储支持本地磁盘、对象存储等。
同时支持行存储和列存储,以适应数据处理和分析任务的多样性。
具备弹性扩展的能力,可以根据业务需求自动扩展计算和存储资源。
提供更细粒度的数据访问控制和保护机制,以确保数据的安全性和可靠性。
产品提供一站式数据接入、采集、处理、存储、智能分析、检索和可视化 BI。确保产品的使用体验简单、易懂、方便,让用户可以快速上手,从而提高用户的满意度和产品的易用性。如:
SQL 支持:零基础使用,所见即所得,完全兼容标准 SQL 语法。
SPL 支持:高阶分析、无缝迁移,SPL 完全兼容 Splunk 语法。
自定义仪表板。
自定义图表。
自定义报表。
无索引、列存、基于代价的优化,带来高性能。高性能实现如:
避免索引带来的成本开销。
列中重复数据越多,压缩率越高。
不同数据类型采用不同压缩算法,进一步提升压缩性能。
在存算分离部署模式下无需备份,进一步节约成本。