前言
作者是国内研究超融合相当早的专家,有非常强的理论基础和实战经验,以下是超融合分析系列前面几篇,已经阅读过的同学可以跳过。
超融合分析系列:
非常深入的超融合分析系列,希望大家会喜欢,另外文章最后附有作者的微信,有兴趣的同学可以加作者做更深入的交流。下面是本系列第4篇正文:
整体方案
深信服的超融合一体机以及超融合方案目前在各个地方都推的比较猛,从官网看,他们的客户也有不少了。今天我们一起来分析一下深信服超融合方案:
深信服超融合的整个方案中包含了aSV、aNET、aSAN三个核心组成部分。当然,既然是超融合方案,虚拟化是基础,而分布式存储则是超融合的核心。所以今天我们以aSAN以及超融合一体机来分析超融合方案:aSAN 是深信服在充分掌握了用户对虚拟化环境存储方面的需求基础上,推出以aSAN 分布式存储软件为核心的解决方案, aSAN 是基于分布式文件系统Glusterfs,进行深度的优化改进,开发的面对存储虚拟化的一套软件定义存储解决方案, 并作为超融合架构中的重要组成部分,为云计算环境而设计,融合了分布式缓存、SSD 读写缓存加速、多副本机制保障、故障自动重构机制等诸多存储技术,能够满足关键业务的存储需求,保证客户业务高效稳定可靠的运行。
上面这段话是我从深信服超融合技术白皮书中摘录的。从这段话,我们不难得出,aSAN是基于开源的GlusterFS优化的。最近大名鼎鼎的开源软件服务供应商Redhat也推出了自己的超融合基础架构RHHI,恰好RHHI的方案几乎完全和深信服一致:虚拟化采用KVM,分布式存储选择了Gluster,没有选择同属于Redhat旗下的分布式存储软件Ceph。这让国内一批选择了KVM+Ceph的超融合厂家情何以堪啊。这里我们不展开讨论Gluster和Ceph的两个分布式存储的优劣。还是继续回到前面的话题,深信服超融合方案的分析讨论。
深度分析
先介绍一下几个特别的地方:
1
第一个是支持2个节点起步:
这个比较好理解,GlusterFS是支持2节点HA部署的。
2
第二个是热备盘方案:
针对热备盘的技术解释,我们直接参考下面的技术白皮书原文:
如果在磁盘故障后,超过了设置的超时时间依然没有人工介入处理,aSAN 将会自动进行数据重建,以保证数据副本数完备,确保数据可靠性。同时采用了热备盘的保障机制。aSAN 在初始化阶段会自动配置至少把集群里副本数个磁盘作为热备盘。
在aSAN 自动使用热备盘替换故障磁盘后,UI 上依然会显示原来的故障磁盘损坏,可以进行更换磁盘。这时新替换的硬盘会作为新热备盘使用,不需要执行数据回迁。这一点与前文没有热备盘会做数据回迁是不一样的。
从上面可以理解:超融合方案中至少要按副本数配置热备盘,而当热备盘替换故障盘后。使用热备盘,实际上是传统存储的一个可靠性技术,缺点明显:单独的热备盘在做数据回迁时,存在数据写入的瓶颈。相比其它超融合方案,数据在一个Group内部的数据盘或者整个资源池数据盘上完全打散,在单盘故障时,不会存在单盘写入的瓶颈(从多个盘读,往一个盘上写)。如果数据盘比较大,比如现在3.5寸SATA盘主流已经是8TB,10TB已经有规模商用时,继续采用热备单盘技术,就很容易导致可靠性问题:一个大盘故障,无法在短时间内完成数据的重建,这个时候,再故障一个盘或者节点,整个集群业务就会有风险,尤其是在电子产品生命周期末期,可靠性问题将被放大。
3
第三个是网络需求:
在深信服官网http://wiki.sangfor.com.cn/index.php/超融合:最佳实践,我找到了对网络的一个要求:
我们继续分析一下上述要求:
4
第四点:扩容要求
深信服的超融合在扩容时,每次添加的主机数,要与虚拟存储副本数一致,或者是它的倍数。
如2副本环境,一次扩容扩2台、4台主机。(避免扩容单台主机时需要大量的旧数据搬迁)。这点也和其它超融合不同。其它大部分超融合在没有特殊的限制,不过本身也支持单节点扩容,只是扩容时会迁移数据,也谈不上约束,本身就是最佳实践。
5
第五点:谈谈系统盘。
从百度上找到的《深信服超融合方案产品概要》文档,可以看到深信服超融合一体机的配置中,对系统盘描述就是一个128G的系统盘。参考我前面分析nutanix的方案,单个系统盘,对可靠性是有很严重的影响。从《sangfor_asv_深信服超融合服务器硬件选型指导书》我找到了描述,该128G系统盘采用是主板板载SSD SATADOM 盘,这个方案不仅可靠性有风险,也明显降低可维护性。
6
第六点:谈谈SSD缓存盘的选型:
从《sangfor_asv_深信服超融合服务器硬件选型指导书》我找到了一个典型方案的描述:
在另外一个深信服的官网PPT中,也看到类似的宣传,采用的是S3510系列磁盘做cache。
大家注意,我这里仅仅是对SSD的选型有自己的担忧:在cache和主
存比例不到5%的情况下,采用Intel S3510系列磁盘做cache,我个人觉得等同于自杀。为什么,我们一起看看S3510系列的说明:Intel官网明确分类,S35系列属于读取密集型磁盘。
S3510 240G容量的寿命是140 TBW, 480G的寿命也只有275 TBW我们来做一个数学题,140*1024/240=597,SSD内部是按page组织,往往修改一个page的部分数据,需要整个page做一次完成一次擦写,相关的材料网上非常多,我这就赘述。通过上面的数据题的答案,我们知道如果按每天写一次全量(240GB),那么只能有597天的寿命,不到2年。如果按三倍容量写入,寿命不到100天。当然不同的业务模型,有不同的寿命。能大胆采用S35系列做cache,我暂时还没有发现第二家。大名鼎鼎的VSAN明确写明240G/480G的S3520系列只能做全闪存的容量盘,寿命比S3510系列更好。
总结展望
这次深信服的方案聊的有点多。
最后结尾谈点感想:深信服作为安全领域的国产大厂,顺应IT时代发展,切入超融合领域,超融合方案中最大的亮点是支持虚拟化防火墙、应用防火墙WAF等,而这么简单的虚拟化功能,还不需要复杂的SDN方案来支撑。而且完整的超融合方案在推出的短短2年多时间已经取得了不小的成绩,给nutanix、华为等超融合大玩家有力的冲击。因深信服本身缺少服务器硬件平台,所以超融合方案的另外一个亮点是支持其它厂家的服务器,尤其是利旧服务器,这点对客户来说有一定的吸引力。硬币有正反两面,深信服尽可能的放大了自己的集成优势、安全领域的优势,通过异构等尽量规避了硬件平台少的劣势。希望深信服能走的更远。
以上分析,完全来自官网材料,如果有错误,请大家指正,谢谢。