数据存储和数据管理原本就是两码事,何来“第二存储”?

重要通知:冬瓜哥新作《大话计算机》(从入门到出家,高中生,文科生,都能看懂),预计明年2月出版。在排版审校期间,冬瓜哥决定增加第12章,内容先不透露!出版日期无影响,很快写完。

看来外部存储领域真是没什么技术可创新的了。鄙人8年前规划的那套智能感知存储,在当时看来,如果能够推出,有可能会重新定义外置存储系统,让它不再是个傻盒子,它与应用是一体的,或许到如今都有可能发展出一套API,形成新的生态。只可惜,这世上并非所有事情都如意。但是我能够想象的一点是,存储系统这8年来,毫无新技术出炉,凡是出来的,都是在炒作概念,无一例外,至少到目前。

因为最近花在技术研究以及写作上的时间比较多,所以对存储领域新炒作出来的概念关注的比较少了。昨天有人和我提及了一个第二存储的概念,所以便翻来看看。看过之后,第一个感觉就是,又一个无脑概念出来了。这就像当年有人说“共享文件系统”,有人说“集群文件系统”,有人说“并行文件系统”一样,其实,集群文件系统可以分为:共享式对称式并行文件系统、分布式非对称式并行文件系统。共享和分布、对称和非对称、并行和串行,可以两两组合成各种架构和产品。但是如果都给梳理清楚了,大家都没有故事可讲,浑水摸不了鱼,更骗不来热腾腾的钱。

而如今这个套路又在重演。在线存储、近线存储、离线存储、归档存储,这是一套概念体系;或者一线厂商、二线厂商、三线厂商;亦或是传统第一梯队存储厂商,新兴分布式存储厂商。这些概念看得太明白,让人一看就知道就懂了,但是偏偏有人不想让人看懂,看得懂怎么忽悠呢?于是只好再起个名字,第二存储。什么叫第二存储?我也不知道,谁定义的?不知道。但是谁炒作的一目了然。而且用于炒作的名词的逼格越来越低,什么Server SAN,第二存储之流,简直,毫无情怀和艺术气息,看来屌丝逆袭已经是一种泛化趋势了。记得之前还有人炒作过一个概念,好像叫做什么第三存储,甚至我都忘了,只记得炒作不到一周,就没动静了。这些背后炒作者简直让人无语,亦或是国内的媒体们随便从外网扒了个名词就来炒作?看来实在是没得可写了。

有人把备份一体机,超融合之类都划分为第二存储,我不明白这种划分的意义何在。存储就是存储,备份容灾就是备份容灾,一个是数据存储和在线访问,另一个数据管理领域的技术,这两项技术其实八竿子打不着,你存你的,我管我的。不知道为何要把备份容灾和存储混为一谈。不过值得一提的是:

备份软件+服务器+本地盘=备份一体机

备份软件+存储软件+服务器+JBOD=备份一体机

备份软件+分布式存储软件+多台服务器=备份一体机

备份一体机只是把备份容灾管理系统与存储二合一了,但是如果把它完全归类为一种存储系统,那就有点不合适了。

其实,第二存储也好,第三存储也好,这些无外乎是一些文字游戏,在这些游戏的背后,我们更应该看到的是灾备行业正在发生的变化。传统的灾备,大家都会和备份关联在一起,而备份又总是和存储连在一起,强调备份容量,备份效率。可以说灾备离不开存储,但它已经不再是存储的范畴,存储的意义更倾向于数据的安全性,及数据的可靠性放在第一位,依靠硬件的性能、数据的副本技术、以及N个9来实现数据的可靠性。

灾备更多的应该专注于数据的可用性,依靠数据的快速索引、数据一致性来保证数据的随时可拉起。随着业务进一步发展,对数据的要求不再是单纯的存储,而是需要对数据进行分析、测试、查询等多种数据调用,消除数据孤岛。在这样的行业及业务背景下,统一数据管理则成为一种生产性刚需。

引用IDC的数据,2018年全球的数据复制存储市场规模就已经超过了500亿美金,其中,45%-60%的总存储容量是专门用于存放复制数据的,这是一个尚未被完全开发的蓝海市场。

因此,越来越多的人将灾备企业开始强调备份数据的热处理,强调备端数据的可用性。以近几年势头比较猛的英方为例,区别于传统的数据备份,数据复制是英方这类灾备厂商所擅长的,字节级数据复制可以通过序列化数据传输技术,之前也介绍过,能够保证备端数据的完整性及一致性,实现数据灾备以及业务的高可用切换,以及数据库语言级复制技术,完成数据库双活或者多活场景下的实时复制,可以实现与不同数据库、不同存储、不同数据库之间的快速兼容,实现用户整体数据管理的scale-out(横向扩展),以及云端的无缝和扩展。

近期,看到英方发布了i2UP统一数据管理平台,通过更为融合、更为统一的管理平台,实现用户数据与业务的全面管理。

其列出来的具体核心功能:

  • 各类数据安全保护,包括物理,虚拟和云计算环境的持续数据保护与恢复管理
  • 各类业务系统的高可用保护,快速切换和业务连续性管理
  • 数据库数据抽取,转化,变形,查询,实现结构化数据容灾双活管理
  • 异构数据库及大数据平台之间的快速数据同步、转换等管理
  • 操作系统级别物理、虚拟、云平台之间的迁移,容灾,高可用保护管理
  • 云端数据管理能力,统一管理本地与云端数据资源
  • 可视化的Web端管理界面,实现数据的全局可见与可控。
  • 通过将产品嵌入到服务目录和编排工具中,实现服务交付自动化和集成管理。

这样的统一数据管理平台应该是大有作为的,提供了灾备领域的“超融合”服务。

前段时间刚好看到网上有篇关于某个行业的数据分类索引文章,明确表示数据分类,是建立统一、准确、完善的数据架构的基础,是实现集中化、专业化、标准化数据管理的基础。因此,统一数据管理已成为行业的必然要求和趋势。从整个行业来看,数据管理将成为各个行业的基本配置。

从用户的角度来说, 由于不同的场景对数据以及数据存储形式的要求不尽相同,传统的存储架构需要多个不同的数据仓库来满足分析、测试、查询等多个场景的数据调用,久而久之,这些无法实现共享的数据仓库都将有可能成为数据孤岛。 在线数据和近线数据之间必须有个桥梁地带,能否在两者之间相互导入导出数据,并提供多个恢复点和历史时刻点,从而为后端的大数据处理平台提供近线数据支撑。

在备份容灾管理领域,之前也有新的概念被提出,比如CDM,Copy Data Management。其实人们利用快照、CDP来做数据挖掘和二次使用已经是很久的事情了。这样的概念分类只是存储形态上的细分。现在所谓的第二存储也是一次经验的观察总结,只是现阶段的所涵盖的内容已经超出了存储的范畴,未来应该是包括对数据的监控、灾备、迁移、同步、分发、共享,集成、治理、归档等多维度的统一管理,而不再受到存储的限制。

冬瓜哥新作《大话计算机》(从入门到出家,高中生,文科生,都能看懂),预计明年2月出版。

原文发布于微信公众号 - 大话存储(dahuacunchu)

原文发表时间:2018-11-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券