基于KVM的H3C云计算平台CAS的一些运维经验

版权声明:本文为耕耘实录原创文章,各大自媒体平台同步更新。欢迎转载,转载请注明出处,谢谢

前言

在写本文时,CAS版本为3.0 (E0306H23),虚拟机操作系统主要以CentOS Linux 7.2.1511Minimal为主,有少部分Windows Server 2008 R2(包括标准版和企业版)、Windows Server 2003(包括标准版和企业版)、CentOS7.3、CentOS7.4、CentOS6.X。

一、资源调整

(一)CPU

1.虚拟机在运行时,CPU的核数是不能进行调整的,只能调整CPU的个数。并且,个数只能增加不能减少。大部分虚拟机支持CPU个数热添加,有少部分虚拟增加CPU资源之后机需要重启。CentOS7.2-1511系统CPU资源在线添加之后立即生效。

2.CPU核心总数=CPU个数*每个CPU的核心数,CAS的CPU核心数是指每个CPU的核心数。

3.CAS平台的CPU是可以超额分配的。一般情况下,不需要绑定物理CPU。

(二)内存

1.在修改内存时我们会看到:“若虚拟机处于运行或者暂停状态,修改内存预留后,必须重启虚拟机才能生效,且修改后的内存值必须大于原内存大小”。实际在操作过程中是这样的,对于在线的虚拟机,增加虚拟机内存后是实时生效的,不能在线减少内存。如需减少内存资源配置,那就需要关闭虚拟机修改数值之后,再次启动。

2.虚拟机一般情况下内存不设预留值。

3.CAS的内存不能超配。如果CAS系统开启了系统预留内存,那么就必须保证至少剩余宿主机总内存的10%左右的预留值。主机内存预留值不足的情况下虚拟机是无法正常启动的,遇到紧急情况,可以暂时关闭CAS系统的主机内存预留,一小段时间后,启动虚拟机之后再开启主机内存预留。

(三)磁盘

1.关于磁盘的修改,系统提示:若虚拟机处于运行或者暂停状态,修改缓存方式、存储大小(对于支持Virtio磁盘在线扩容的虚拟机操作系统,Virtio磁盘在线扩容后无需重启虚拟机)、限制I/O速率(读/写)、限制IOPS(读/写)后,必须重启虚拟机才能生效 。由于新建虚拟机时一般都采用高速智能硬盘,因此是可以在线增加磁盘容量,无需重启系统的。

2.磁盘容量只能增加,不能减少,每次操作的时候需要谨慎考虑,不要过分浪费资源。

3.对于一些P2V、V2V迁移过来的虚拟机,有些硬盘接口需要特别考虑。

4.在CAS平台增加磁盘资源后,需要回到虚拟机操作系统对新分配的磁盘资源进行分区、挂载、LVM操作。目前一般使用LVM对磁盘进行管理,如遇特殊情况还需特别处理。

(四)网络

1.虚拟机创建时就要注意选择正确的虚拟交换机、网络策略模板。

2.一些特殊的网卡设备,还需对应型号进行设置。

3.如果是克隆过来的虚拟机,那么需要特别注意MAC地址。MAC地址出现冲突时,关闭虚拟机,更新MAC地址后再次启动虚拟机操作系统,系统启动后检查其他网络配置。其他网络配置无误,网络依然不通,则需要找出多余的网卡网络配置,删除或者更新配置文件内容,偶尔还需要手动更新MAC地址。此部分可以使用NetworkManager来进行操作。

4.虽然NetworkManager已经厂商设置开机启动,但是该工具并不能正常开机启动,使用NetworkManager时,必须先启动再使用。这一部分最常用的的命令为:mntui,网络配置、主机名修改等都非常有用。

二、运维要点

1、如果CVM进行过更改,那么更改完成之后第一件最重要的事是要检查CVM上的NTP服务,查看配置文件,时钟源配置是否正确,同步是否正常。CVM的DNS也是必须配置的项目,配置完成以后务必检查是否生效。CVM的状态、NTP服务、CVM的DNS解析是日常重点监控的对象,需要格外注意!

2.把CAS的CVM设置成主NTP。

3.虚拟机创建完成后,第一件事是卸载虚拟机自带的NTP软件,CentOS7.2无需操作,CentOS7.4自带了chrony的NTP服务软件,需要卸载,卸载完成安装CAStools后开启时间同步。由于CentOS7.3是奇数版本,日常较少使用,此处需要综合CentOS7.2和CentOS7.4进行考虑。Windows系统同样,关闭NTP同步,安装CAStools,开启时间同步。

4.对于新安装的CVK主机,安装完之后第一件事是对系统进行升级,必须保持版本与CVM一致,升级完毕之后才能将CVK主机增加到CAS平台被CVM管理。

5.为了降低物理主机宕机、重启造成的影响,需要在虚拟机上设置“主机启动后,自动启动虚拟机”,具体操作步骤为:修改虚拟机->更多->引导设备-自动启动-是。

6.CVK、CVM的安装过程中,需要主要的是,磁盘分区选择整块硬盘LVM管理,以便后期扩展磁盘空间。

7.CAS平台的虚拟机迁移不支持无中断业务迁移模式,在线迁移会造成虚拟机状态暂停,迁移完成之后部分服务可能需要重启。迁移都会造成业务中断,需要特别注意。但是可以采取克隆、切换业务的方式来减低业务中断带来的风险,需要具体情况具体分析。

8.CentOS7.4自带了firewalld防火墙,并且厂商预置状态为开机自动启动,很多时候端口不通的原因就来源于此,日常运维中注意即可。

9.Windows Server 2008 R2标准版增加内存需要关闭主机。常规的在虚拟机操作系统内关机的方式并未结束CVK上的相关虚拟机的进程,需要使用系统的关机菜单进行关机之后,修改内存重启,这样,新增的内存才能被系统正常使用。具体流程为:关闭(CAS主控制面板)->修改内存->启动虚拟机,企业版则不需要如此操作,增加后直接生效。

10.CVM配置文件的备份。这是一个很重要的操作,原则上每周至少备份一次,并且需要注意保持异机备份。每次版本升级之前必须进行备份,并且将备份文件保存到CAS系统以外的存储上。养成每次版本升级后系统确认无误后第一时间备份配置文件的习惯。

11.在虚拟机迁移之前需要在目标主机配置好虚拟交换机网络配置。如果使用网卡聚合功能,则需要提前在对应的网卡上进行相关的网络配置操作。

三、总结

1.本文是在本人运维H3C的CAS平台半年以后总结出来的经验,本着对自己或读者负责的态度,在写作本文时又进行了再次验证,但疏漏之处无法避免,希望诸位发现问题后第一时间告知本人,本人会在第一时间内完成验证并更正。

2.由于截图太浪费时间,本文无截图,敬请谅解。因为我是这样觉得的:能点进此文来的朋友应该都比较熟悉CAS云计算平台,很多地方只需点到为止即可,希望也给读者朋友带来思考质疑的空间,这样利于大家一起进步。

3.由于时间仓促,暂且写到此处,以后发现新内容再次更新。能力有限,疏漏之处,万望指出,感谢!

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏北京马哥教育

超清晰的 DNS 原理入门指南

来源:阮一峰的网络日志 作者:阮一峰 链接:http://www.ruanyifeng.com/blog/2016/06/dns.html DNS 是互联网核...

37060
来自专栏菩提树下的杨过

基于spring-boot的rest微服务框架

周末在家研究spring-boot,参考github上的一些开源项目,整了一个rest微服务框架,取之于民,用之于民,在github上开源了,地址如下:

17610
来自专栏林德熙的博客

关于Host(主机) 关于Resord Type(记录类型)

要指向空间商提供的 IP 地址,选择「类型 A」,要指向一个域名,选择「类型 CNAME」

12310
来自专栏PHP实战技术

一个查看框架源码,一个查找错误的小工具,你用了吗?

日常开发中还在一直var_dump?exit()?,是不是很不便捷,很不方便?今天小梦就给大家讲讲在PHP开发中(划重点:PHP开发,当然其他语言开发也是有类似...

15740
来自专栏惨绿少年

企业架构规划及服务器优化参数

第1章 企业架构规划 1.1 架构图 ? 1.1.1 用户访问网站组成 类型 作用 实现方式 顾客-用户 访问网站的人员 ...

34000
来自专栏即时通讯技术

新手入门:史上最全Web端即时通讯技术原理详解前言 学习交流 更多资料一、传统Web的通信原理二、传统通信方式实现IM应用需要解决的问题三、全双工低延迟的解决办法 五、WebSocket结束语

浏览器本身作为一个瘦客户端,不具备直接通过系统调用来达到和处于异地的另外一个客户端浏览器通信的功能。这和我们桌面应用的工作方式是不同的,通常桌面应用通过sock...

10330
来自专栏苦逼的码农

Linux达人养成3--使用远程工具操作Linux

今天,我们讲讲用远程工具来管理我们的Linux,以及一些常用的网络命令。如果没还没学过基本的Linux命令以及网络配置,可以看我前两篇文章哦。

11620
来自专栏极客慕白的成长之路

HTTP协议原理及实践

HTTP是在应用层,基于传输层 0x1 低三层 物理层主要作用是定义物理设备如何传输数据 数据链路层在通信的实体间建立数据链路连接 网络层为数据在结...

13030
来自专栏极客慕白的成长之路

HTTP协议原理及实践

HTTP是在应用层,基于传输层 0x1 低三层 物理层主要作用是定义物理设备如何传输数据 数据链路层在通信的实体间建立数据链路连接 网络层为数据在结...

11430
来自专栏跟着阿笨一起玩NET

win7组件服务COM+应用程序编录错误解决办法

一般情况下,我们遇到过的COM+应用程序编录错误共有两个:(1)第一个是打开COM+应用程序时出现“编录错误,执行最后操作发生错误,错误代码8007042C-依...

28210

扫码关注云+社区

领取腾讯云代金券