自Gartner发布数据库行业报告((Other Vendors to Consider for Operational DBMSs 2017))以来,第一次收录了来自中国的数据库厂商,分别是阿里云Alibaba Cloud、SequoiaDB巨杉数据库以及南大通用Gbase,标志着中国数据库产业发展已经迈出了一大步。
数据库技术发展方向
Gartner今年的多分报告中认为数据库未来需要在几个方面进行创新:
一、分布式架构
二、Multimodel多模数据管理
三、混合访问HTAP
四、云架构整合
五、数据安全
特别是Multimodel多模数据管理,是近年来数据库发展的重要新要求。
一、分布式架构
分布式架构是数据库发展的大势所趋。分布式架构显著提升大容量数据存储和管理能力,既保障面对大量用户的高并发需求,又保障了面对业务变化的弹性增长能力。分布式数据库的使用成本,也远低于传统数据库。
对于数据库来说,分布式架构的优势十分明显:
1、弹性扩容提升性能:
需要弹性地扩容以应对PB级别以上的数据管理,这种弹性容量调整可以实现让所有数据保持在线。同时满足高并发业务操作需求,实现海量数据高性能读写以及实时访问查询。
2、高可用与数据安全:
分布式架构数据高可用保障。除了经典的主-从架构,数据库和存储方面还有类似Ceph的纠删码google spanner的原子钟分布式算法等等方式。
3、简化开发运维节约成本:
随着应用的增多,更需要分布式架构支持,进行数据分区管理,实现业务有效隔离。同时,保持系统的弹性、兼容性,大大简化运维开发。
二、Multi-Model 多模数据与非结构化数据
随着应用和业务的多样化,系统对于多类型数据的管理能力提出了新的要求。Multi-Model多模是指在单个数据库平台中支持非结构化结构化数据在内的多种数据类型。
特别对于非结构化数据,当前企业管理的结构化数据只占信息总量的15%,而剩下85%的信息是非结构化数据,对于非结构化数据,企业需要实现数据的统一管理,并实现数据共享和数据流转;需要应对数据总量的飞速增长;同时还需要应对数据激增带来了管理成本和使用成本的快速增长。如金融企业在互联网金融等等新需求下,随着银行远程开户、柜面无纸化、面部识别等系统的建立和升级正在面临大量不同类型的非结构化数据(如图片,视频和文件)带来的挑战。
数据库层面的Multi-Model和非结构化数据管理,将能实现结构化、半结构化和非结构化数据的统一管理,实现非结构化数据的实时访问,大大降低了运维和应用的成本。
三、云架构整合能力
云架构整合对于数据库未来发展也是一个比较重要的特性,虽然分布式架构下是原生支持云架构的,但是对于数据库云DBaaS来说,仍有许多新的要求。
对于数据库云服务的定义,是具有一定程度自助服务的可伸缩的,弹性的多租户订阅服务。它由云服务提供商(CSP)本身或是基于了CSP的基础架构的第三方软件供应商提供的产品或是服务。同时数据库云服务,是不允许直接访问后台底层的系统服务如操作系统和存储软件的。这一领域上,Gartner也有意将DBaaS划分在 PaaS的层面,与IaaS或者IaaS+区分开。
对于DBaaS,除了基础的数据库功能,云架构下需要具备的能力还包括基础设施的管理,自主管理监控,多租户管理,快速扩容,在线升级等等。
四、HTAP混合事务/分析处理模式
新的业务需求下,数据库除了应对操作型业务,还会在业务实时数据监控,数据报告和决策辅助方面有许多数据实时应用的场景。传统架构中OLTP和OLAP两类业务是完全分离的。两者的隔离导致整个系统在数据一致性,数据平台管理上带来了巨大的阻碍。此前, RDBMS和大数据(Hadoop)分别成为数据处理的两个方面,一旦一种架构选择了一种场景,就不得不放弃另一种场景。
因此,HTAP混合事务/分析处理模式成为数据库发展的一个新要求。
五、数据安全
伴随着在企业内部价值的不断提升,数据已经成为了金融企业的生命线与核心资产。作为承载着企业关键数据的数据库,其安全性、可靠性、稳定性一直是金融级数据库的核心价值。
但是,在分布式架构中完美实现高可用与容灾面临着诸多技术挑战。一般来说,以统计分析为目标的分布式数据库相对弱化了该部分的功能,而面向在线与交易业务的分布式数据库则对数据安全保持了高标准的严格要求。
高可用性是所有现在新的数据架构必备特性之一。高可用对于银行这样的企业级用户更是重要,中国银行业监督管理委员会要求所有银行数据中心必须进行高可用备份,包括数据中心的“两地三中心”能力,也就是银行数据存储管理整体架构的分布式架构转型成为了标准要求。这其中,数据库的分布式转型就将成为数据管理现代化的首要任务。