超融合方案分析系列(2):VSAN的超融合方案分析

超融合分析系列:

超融合概述

超融合产品分析系列(1):nutanix方案

VSAN今年已经是6.6版本了。熟悉VSAN的朋友肯定知道VSAN历史,VSAN在这么短的时间发展这么迅猛,除了强大的投入外,最重要是有一个好的平台(老爹)VMware虚拟化,我们这边也简单回顾一下:

VSAN是VMware SDS战略的核心组件,2013年发布试用板。接下来商用版本的时间表如下:

版本

平台版本

发布时间

关键特性

VSAN1.0

vSphere5.5

2014年3月

最大集群支持32个节点支持2-4个副本SSD做cache基于VM的策略管理

VSAN6.0

vSphere6.0

2015年3月

支持全闪存最大支持64个节点支持柜机安全支持JBOD快照和克隆

VSAN6.1

vSphere6.1

2015年9月

支持Oracle RAC和WSFC集群支持硬件数据校验和加密支持2节点的分支机构ROBO支持NVMe和UltraDIMM支持容灾PRO>=5min

VSAN6.2

vSphere6.2

2016年3月

支持IPv6软件Checksum支持去重压缩(仅用在全闪存场景)支持ErasureCode(仅用在全闪存场景)存储QoS

VSAN6.5

vSphere6.5

2016年11月

支持ISCSI接物理节点节点直连方案支持512e

VSAN6.6

vSphere6.5u

2017年4月

支持单播支持数据加密保护慢盘检测与处理基于大数据的VSAN使用优化指南

  • 最大集群支持32个节点
  • 支持2-4个副本
  • SSD做cache
  • 基于VM的策略管理

VSAN6.0vSphere6.02015年3月

  • 支持全闪存
  • 最大支持64个节点
  • 支持柜机安全
  • 支持JBOD
  • 快照和克隆

VSAN6.1vSphere6.12015年9月

  • 支持Oracle RAC和WSFC集群
  • 支持硬件数据校验和加密
  • 支持2节点的分支机构ROBO
  • 支持NVMe和UltraDIMM
  • 支持容灾PRO>=5min

VSAN6.2vSphere6.22016年3月

  • 支持IPv6
  • 软件Checksum
  • 支持去重压缩(仅用在全闪存场景)
  • 支持ErasureCode(仅用在全闪存场景)
  • 存储QoS

VSAN6.5vSphere6.52016年11月

  • 支持ISCSI接物理节点
  • 节点直连方案
  • 支持512e

VSAN6.6vSphere6.5u2017年4月

  • 支持单播
  • 支持数据加密保护
  • 慢盘检测与处理
  • 基于大数据的VSAN使用优化指南

VSAN经过这短短的3年,可谓是飞速发展,我今天要谈的是VSAN的方案,重点还是在硬件上。

VSAN本身是VMware软件,它自己不提供超融合方案,对外是通过硬件合作伙伴来推出VSAN ready node或者VSAN灵活解决方案。

这两种方案的区别是前者是经过整机认证,有完整的性能与兼容性测试,风险较低,而第二种,是部件测试,具体点说,整机经过了VMware 虚拟化ESXi的认证后,如果要灵活部署VSAN,那么需要IO控制器(Raid卡)、SSD、HDD 这三个部件均经过严格兼容性测试。同时官方提供最佳实践指南给大家。

考虑VSAN的灵活方案在经过整机满足ESXi认证、部件满足VSAN认证的基础上,除了更多的CPU和内存外,还有以下几个方面需要考虑:

1、 SSD和HDD的配比关系(最大1:1,最小1:7,容量至少为虚拟机占用容量的10%)

2、 OS启动介质方案:单SD卡、双SD卡(主板组raid1)、单SATADOM、单SSD盘或者HDD盘。这几种方案都是在VSAN ready node中可以查到。

3、 磁盘控制器方案:每个Group配置一个raid卡(推荐),多个相同的Group配置在一个raid卡上(raid卡不支持SASexpender模式)

关于第一点不再展开,大量VSAN资料都有介绍,如果后面有机会我再详细介绍下第三条,我这里重点谈的是第二点:

为什么会推荐OS采用单盘模式导致可靠性差或者采用SD卡组raid1这种可维护性差的方案,原因是VSAN本身的限制:

在https://kb.vmware/com/kb/2135390这篇文档中有如下限制:

也就是说,如果2个OS盘组raid1后和至少一组数据盘放在一个raid卡上,那么最坏情况下降导致数据丢失。最关键是VMware官方已经不支持这种方案。本来采用SD卡方案是一个低成本方案,较低容量的SD卡相比普通的磁盘,价格还是要低不少,最关键是省掉了一张物理raid卡,整体方案的价格也相比来说更低一些。这种方案用在小规模数据中心也未尝不可。

但是我们可以想象以下,在一个大型的金融数据中心,100台上,1000台服务器,均是这种SD卡的方案,在SD卡故障后,需要迁移VM、下电节点、拆开机箱、更换SD、重新部署ESXi、再加入集群,这个过程将不可想象,尤其是在电子产品的生命周期末期,根据盆浴曲线理论,故障率几乎直线上升,减掉一个节点,带来的是集群的可靠性的降低,在短时间无法快速恢复,将导致集群的故障。这种方案是不可接受的。

所幸的是硬件合作伙伴又牛逼了一把,支持多个raid卡方案,原来是1个的,改支持2个,把OS盘独立放在一个raid卡上。顺利的解决了这个问题。带来就是成本的上升和硬件方案的调整,当然VSAN目前的市场地位,完全能让硬件厂家为了VSAN软件的约束来做硬件的重新设计,也能让客户心甘情愿为这个多余的raid卡掏钱。

VSAN的资料可能是市面上超融合产品种最多的一个,对raid卡问题也有很多资料提到过。我在做VSAN方案时多次遇到raid卡问题,客户不理解、销售也不理解,这里重新解读一下,也算一吐出来为快,希望VSAN能早日解决这个问题,如果有错误,请大家指正,谢谢。

原文发布于微信公众号 - 大数据和云计算技术(jiezhu2007)

原文发表时间:2017-07-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏程序猿

如何高效率的学习和工作?

我们做不到那样,也不一定非得按照上面做,人类的繁殖活动还是要继续的。引经据典,让我们来思考一下,心无旁骛的学东西,对于以后的“成功”是多么重要。

772
来自专栏AI科技大本营的专栏

一直不明白,程序员为何老加班!

今天说好的需求这样做,亲自找到他跟他确认,然后过几天,他又反悔了。说自己从没说过,要另外的实现方式。

933
来自专栏达观数据

通过苹果APP Store站内搜索故障 来告诉你站内搜索水有多深

苹果站内搜索故障已修复 5月5日下午,发生了一件你不可错过的大事!苹果APP Store站内搜索故障犹如洪水猛兽,来势汹汹,多款应用疑似下架,但一家欢喜一家愁...

33010
来自专栏互联网杂技

中枪了没有!聊聊移动应用界面设计7宗罪

则就是用来打破的?这完全取决于规则本身。在移动应用界面设计(后续简称:移动设计)的世界里,大家对美学、手势和动效的看法略有不同。有时一个简单的功能性应用比华丽的...

2516
来自专栏java思维导图

程序员的创业陷阱:接私活

http://blog.newsleopard.com/2015/05/31/軟體工程師的創業陷阱-接案/

1163
来自专栏企鹅号快讯

又涨了!PostgreSQL 这是要赶超 MySQL 的节奏?

DB-Engines 发布了 2017 年 12 月份的数据库排名。排前 20 名的数据库中,Oracle 稳居第一,排名在第 9 名的 Cassandra 赶...

2195
来自专栏梦里茶室

【转载】淘宝架构框架发展史

转自 http://www.361way.com/taobao-architecture/1948.html 出处《淘宝技术这十年》      一、个人网站  ...

3485
来自专栏玄魂工作室

近几年前端技术盘点以及 2016 年技术发展方向

Web 发展了几十个春秋,风起云涌,千变万化。我很庆幸自己没有完整地经历过这些年头,而是站在前人的肩膀上行走。Web 技术发展的速度让人感觉那几乎不是继承式的迭...

2853
来自专栏顶级程序员

体验了150个小程序以及我的思考

【高频使用】 美团外卖+ 纯点餐没有叽叽歪歪的各种活动让你不知道吃什么,自动定位功能比较准,第一次登陆要绑定下手机号,大多数人的好评小程序。 滴滴公交查询 基...

4799
来自专栏极乐技术社区

小程序 · 一周报

针对部分小游戏违规道具内购的现象,小游戏团队强调“小游戏开发者需要向用户提供官方认可的购买支付方式。同时,官方也将加强对支付方式的管理,以及对小游戏的风险关注。...

790

扫描关注云+社区