我有一个带有ESXi 5和iSCSI附加网络存储的服务器(4x1TbRAID-Z在freenas上)。这两台机器用千兆以太网互相连接,中间有一个交换开关。
过了一段时间,如果我有许多(4-5或更多)的vms运行,他们就会变得反应迟钝(在任何事情发生之前都会有很长的延迟)。我们试图找出背后的原因。
今天,我们研究了esxtop,发现iSCSI LUN的DAVG保持在70-80。我读到+30是关键!
是什么导致了如此高的响应时间?
发布于 2012-05-07 14:07:50
您可能已经知道,DAVG指的是磁盘延迟,当然,大于30毫秒通常会显著降低性能和响应能力。延迟可能由许多问题引起,但首先,您的磁盘必须能够处理抛出的IO负载。
IO加载不仅指IO的每秒(IOPS)的#,还指的是模式。随机(模式) I/O与您对虚拟化服务器的期望基本一致,因此您的磁盘配置需要从随机I/O的角度做得很好。不幸的是,RAID-Z不符合要求。根据甲骨文的说法:
随机输入的情况是在考虑RAID-Z时需要特别注意的情况.实际上,作为第一个近似,N磁盘RAID-Z组在交付的随机输入IOPS方面将表现为一个单一的设备。因此,一个10磁盘的设备组,每个设备能够达到200-IOPS,将在全球范围内充当一个200-IOPS的RAID-Z组.这是在没有与镜像相关的2X块开销的情况下实现适当数据保护所要付出的代价。
Oracle在这里说,RAID-Z集可以处理与集合中的单个磁盘大约相同数量的随机IOPS。一个7.2k磁盘可以执行大约80 IOPS (这可能是一个慷慨的数字,取决于您要求的是谁),因此这意味着在RAID-Z中,您的整个数组只能执行80个随机IOPS。在那几个IOPS上运行5-7服务器是糟糕性能的秘诀。
如果你在RAID-10中配置了你的4个驱动器,你会看到更好的性能。如果您需要超过2TB的原始容量(这是您在RAID-10中得到的),请执行RAID-5。在这种情况下,这两种方法都会给出比RAID-Z更好的随机I/O性能。
https://serverfault.com/questions/373227
复制相似问题