基于KVM的H3C云计算平台CAS的一些运维经验

前言

在写本文时,CAS版本为3.0 (E0306H23),虚拟机操作系统主要以CentOS Linux 7.2.1511Minimal为主,有少部分Windows Server 2008 R2(包括标准版和企业版)、Windows Server 2003(包括标准版和企业版)、CentOS7.3、CentOS7.4、CentOS6.X。

一、资源调整

(一)CPU

1.虚拟机在运行时,CPU的核数是不能进行调整的,只能调整CPU的个数。并且,个数只能增加不能减少。大部分虚拟机支持CPU个数热添加,有少部分虚拟增加CPU资源之后机需要重启。CentOS7.2-1511系统CPU资源在线添加之后立即生效。

2.CPU核心总数=CPU个数*每个CPU的核心数,CAS的CPU核心数是指每个CPU的核心数。

3.CAS平台的CPU是可以超额分配的。一般情况下,不需要绑定物理CPU。

(二)内存

1.在修改内存时我们会看到:"若虚拟机处于运行或者暂停状态,修改内存预留后,必须重启虚拟机才能生效,且修改后的内存值必须大于原内存大小"。实际在操作过程中是这样的,对于在线的虚拟机,增加虚拟机内存后是实时生效的,不能在线减少内存。如需减少内存资源配置,那就需要关闭虚拟机修改数值之后,再次启动。

2.虚拟机一般情况下内存不设预留值。

3.CAS的内存不能超配。如果CAS系统开启了系统预留内存,那么就必须保证至少剩余宿主机总内存的10%左右的预留值。主机内存预留值不足的情况下虚拟机是无法正常启动的,遇到紧急情况,可以暂时关闭CAS系统的主机内存预留,一小段时间后,启动虚拟机之后再开启主机内存预留。

(三)磁盘

1.关于磁盘的修改,系统提示:若虚拟机处于运行或者暂停状态,修改缓存方式、存储大小(对于支持Virtio磁盘在线扩容的虚拟机操作系统,Virtio磁盘在线扩容后无需重启虚拟机)、限制I/O速率(读/写)、限制IOPS(读/写)后,必须重启虚拟机才能生效 。由于新建虚拟机时一般都采用高速智能硬盘,因此是可以在线增加磁盘容量,无需重启系统的。

2.磁盘容量只能增加,不能减少,每次操作的时候需要谨慎考虑,不要过分浪费资源。

3.对于一些P2V、V2V迁移过来的虚拟机,有些硬盘接口需要特别考虑。

4.在CAS平台增加磁盘资源后,需要回到虚拟机操作系统对新分配的磁盘资源进行分区、挂载、LVM操作。目前一般使用LVM对磁盘进行管理,如遇特殊情况还需特别处理。

(四)网络

1.虚拟机创建时就要注意选择正确的虚拟交换机、网络策略模板。

2.一些特殊的网卡设备,还需对应型号进行设置。

3.如果是克隆过来的虚拟机,那么需要特别注意MAC地址。MAC地址出现冲突时,关闭虚拟机,更新MAC地址后再次启动虚拟机操作系统,系统启动后检查其他网络配置。其他网络配置无误,网络依然不通,则需要找出多余的网卡网络配置,删除或者更新配置文件内容,偶尔还需要手动更新MAC地址。此部分可以使用NetworkManager来进行操作。

4.虽然NetworkManager已经厂商设置开机启动,但是该工具并不能正常开机启动,使用NetworkManager时,必须先启动再使用。这一部分最常用的的命令为:mntui,网络配置、主机名修改等都非常有用。

二、运维要点

1、如果CVM进行过更改,那么更改完成之后第一件最重要的事是要检查CVM上的NTP服务,查看配置文件,时钟源配置是否正确,同步是否正常。CVM的DNS也是必须配置的项目,配置完成以后务必检查是否生效。CVM的状态、NTP服务、CVM的DNS解析是日常重点监控的对象,需要格外注意!

2.把CAS的CVM设置成主NTP。

3.虚拟机创建完成后,第一件事是卸载虚拟机自带的NTP软件,CentOS7.2无需操作,CentOS7.4自带了chrony的NTP服务软件,需要卸载,卸载完成安装CAStools后开启时间同步。由于CentOS7.3是奇数版本,日常较少使用,此处需要综合CentOS7.2和CentOS7.4进行考虑。Windows系统同样,关闭NTP同步,安装CAStools,开启时间同步。

4.对于新安装的CVK主机,安装完之后第一件事是对系统进行升级,必须保持版本与CVM一致,升级完毕之后才能将CVK主机增加到CAS平台被CVM管理。

5.为了降低物理主机宕机、重启造成的影响,需要在虚拟机上设置"主机启动后,自动启动虚拟机",具体操作步骤为:修改虚拟机->更多->引导设备-自动启动-是。

6.CVK、CVM的安装过程中,需要主要的是,磁盘分区选择整块硬盘LVM管理,以便后期扩展磁盘空间。

7.CAS平台的虚拟机迁移不支持无中断业务迁移模式,在线迁移会造成虚拟机状态暂停,迁移完成之后部分服务可能需要重启。迁移都会造成业务中断,需要特别注意。但是可以采取克隆、切换业务的方式来减低业务中断带来的风险,需要具体情况具体分析。

8.CentOS7.4自带了firewalld防火墙,并且厂商预置状态为开机自动启动,很多时候端口不通的原因就来源于此,日常运维中注意即可。

9.Windows Server 2008 R2标准版增加内存需要关闭主机。常规的在虚拟机操作系统内关机的方式并未结束CVK上的相关虚拟机的进程,需要使用系统的关机菜单进行关机之后,修改内存重启,这样,新增的内存才能被系统正常使用。具体流程为:关闭(CAS主控制面板)->修改内存->启动虚拟机,企业版则不需要如此操作,增加后直接生效。

三、总结

1.本文是在本人运维H3C的CAS平台半年以后总结出来的经验,本着对自己或读者负责的态度,在写作本文时又进行了再次验证,但疏漏之处无法避免,希望诸位发现问题后第一时间告知本人,本人会在第一时间内完成验证并更正。

2.由于截图太浪费时间,本文无截图,敬请谅解。因为我是这样觉得的:能点进此文来的朋友应该都比较熟悉CAS云计算平台,很多地方只需点到为止即可,希望也给读者朋友带来思考质疑的空间,这样利于大家一起进步。

3.由于时间仓促,暂且写到此处,以后发现新内容再次更新。能力有限,疏漏之处,万望指出,感谢!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180515A1DPYI00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券