首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

​[linux][memory]cgroup回收内存对虚拟机的影响分析

前言: 在虚拟化场景下,libvirt会为每个qemu进程,也就是一台虚拟机,创建对应的cgroup,用来限制这台虚拟机的资源使用。这章讨论一下cgroup对内存的限制、回收能力对虚拟机的影响。 Centos7使用Linux 3.10。Ubuntu1604使用Linux 4.4。这章主要分析这两个版本的kernel的能力对比。 分析: 1,使用场景 在内存复用的场景下,会使用到cgroup的内存限制能力。举例来说,Host上有内存32G,每台Guest分配4G,那么可以启动8台Guest。如果内存超分配25%,那么大约有40G内存,则可以创建10台Guest。每台Guest的物理内存用cgroup现在3.2G左右。当Guest使用的内存超过3.2G的时候,这台Guest之前使用的不活跃的内存会被swap,或者有一部分内存被KSM/UKSM合并掉。实际上,在复用比例不是很高的情况下,性能几乎没太多影响。当然,极端情况下,就会看到系统抖动了,影响就会比较大了。 那么,内存复用的结果就是降低了物理硬件成本。 2,memory.limit_in_bytes 找到对应的Guest的cgroup。例如/sys/fs/cgroup/memory/machine/qemu-3-ubuntu.libvirt-qemu/memory.limit_in_bytes。 这个数值就是限制Guest的物理内存的最大使用量的。 对于增加这个数值的情况,那么只需要改大就行了。 对于减少这个数值的情况,在linux 3.10和4.4上就有了不同的逻辑。 3,linux 3.10 linux-3.10/mm/memcontrol.c中,mem_cgroup_resize_limit函数:

res_counter_set_limit的返回值决定了是否可以正确执行,继续分析res_counter_set_limit函数: 如果当前的使用量大于limit,那么就会返回-EBUSY。 没错,如果在修改limit_in_bytes的时候,返回了-EBUSY,那么就是这个地方的逻辑没有走通导致的! 4,linux 4.4 linux-4.4/mm/memcontrol.c中,mem_cgroup_resize_limit函数:

改小limit的逻辑中,会尽量尝试回收内存。当然,是有retry的次数限制的。 return前的语句也是重点,回收失败就意味着OOM了~ 5,cgroup reclaiming VS kswapd reclaiming 总体来看,Linux也是在进步的。在虚拟化这种场景下,使用cgroup reclaiming明显更好一些。 如果想减小Guest的cgroup限制,在Linux 3.10上需要做很复杂的工作。有一种简单的方案就是:想办法让Guest中的很多page变的不活跃,就会在kswapd回收的时候回收掉,就会降低当前的cgroup的物理内存使用量,那么赶紧把limit_in_bytes改小,一点一点的往复修改到预期的值。那么如何让Guest中的部分page变的不活跃呢?答案是memory balloon。使用memory balloon,让Guest OS来shrink自己的内存使用量,Guest OS长时间不使用的那些page(对应的就是qemu进程很长时间都没有访问一部分page),就会被kswapd回收。前提是Guest OS支持memory balloon,并且为Guest配置了memory balloon设备。 后记: 我讲的意思,不是我要钦点cgroup,你问我支持不支持?我说支持,我就明确告诉你,你们呀,我感觉你们用户态程序也要学习,你们非常熟悉修limit_in_bytes一套的,你们毕竟是Too Young,明白这意思吗?

下一篇
举报
领券