专栏首页皮振伟的专栏[virt][clock]steal time技术分析

[virt][clock]steal time技术分析

前言: 在《clocksource的管理和虚拟化》中,大概分析了kvm clock,tsc,hpet等clock source。其中尤其是kvm clock计算尤其复杂。其目的就在于让Guest中的clock更加准确。但是问题还没有完,Guest只是在Host中的一个进程,还是会发生时钟跳变。下文具体分析。 分析: 1,analysis 当前Host的墙上时间是HWT1,此时Guest中的墙上时间GWT1,如果是同一个时区的话,此时HWT1和GWT1是相等的。 如果此时Host中发生了调度,Guest所在的qemu进程不执行了,那么HWT1将继续增长,GWT1是否应该增长呢? 如果GWT1不增长,那么等到Guest继续执行的时候,就会继续在原来的GWT1基础上增长,那么HWT2到HWT1之间的时间就发生了丢失;现象就是Guest中的时间变慢了。 如果GWT1同时增长,那么就会在Guest进程切回来继续执行的时候,Guest中的时间会瞬间增大了HWT2减掉HWT1的差值。现象就是Guest的墙上时间是对的了。可是新的问题又来了:在Guest的quemu进程被Host切换之前,Guest中刚刚切换走redis,开始执行Nginx;等到Guest继续执行的时候,因为Guest中的时钟跳变增大了很多,Guest会认为Nginx执行了大量的CPU时间。如果Guest中是Linux采用cfs调度算法的话,那么Nginx下次被调度会隔比较长的时间。可是实际呢,Nginx根本没有得到执行!!! 2,steal time 为了解决上述的Guest中的调度问题,就引入了steal time。 Steal time的原理就是:告诉Guest,哪些时间被Host给steal了,调度的时候,忽略这部分时间,就可以正确调度了。 所以,基本就是两个部分:在Host中通知Guest具体的steal time是多少;在Guest中处理这些时间,修正因时间跳变引起的调度错误。 3,guest register steal time linux-4.0.4/arch/x86/kernel/kvm.c

原理和kvm clock一样:通过写MSR,把per_cpu变量steal_time的物理地址(Guest Physical Address)告诉Host。 4,host steal time linux-4.0.4/include/linux/sched.h中:

注意看run_delay,如注释,就是task等待的时间,也就是没有执行的时间(例子中Guest的qemu被切换走的时间)。具体的计算逻辑在linux-4.0.4/kernel/sched目录下的文件中,不具体分析。

在Host中,用run_delay计算出来Guest的steal time,并通过kvm_write_guest_cached告诉Guest(前文中Guest向Host注册的地址,Host直接修改)。 这样,在Guest恢复执行的时候,就可以知道steal time的具体大小了。 5,guest steal time linux-4.0.4/kernel/sched目录下的调度源代码中,计算steal time。 如果Guest的编译选项中打开了CONFIG_PARAVIRT_TIME_ACCOUNTING了,就可以在/proc/stat中的第八项看到steal time。 后记: clocksource虚拟化,再加上steal time机制,基本可以保证Guest中的时间同步问题了。 当然,在Guest中启用ntp服务也是可以的。。 如果Guest的linux版本比较低,或者windows,前后两次gettimeofday得到的时间差别很大,可以怀疑这里。 Good Luck~

本文分享自微信公众号 - AlwaysGeek(gh_d0972b1eeb60),作者:AlwaysGeek

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-02-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • [virt][qemu]clocksource的管理和虚拟化

    前言: kvm-clock,tsc,hpet,acpi_pm,pit,rtc。。。这些词看着都晕了@@ 虚拟化场景下,容作者在这里一一道来。 分析: 1,L...

    皮振伟
  • ​[linux][memory]cgroup回收内存对虚拟机的影响分析

    前言: 在虚拟化场景下,libvirt会为每个qemu进程,也就是一台虚拟机,创建对应的cgroup,用来限制这台虚拟机的资源使用。这章讨论一下cgroup对内...

    皮振伟
  • [linux][nginx]nginx的graceful shutdown和worker shutdown timeout

    前言: 某大佬问作者,nginx做proxy的时候,重新加载配置的时候,会不会影响已有的连接? 作者基于too young too simple的认知:clie...

    皮振伟
  • CIO如何才能保障移动安全

    根据某国内前著名安全厂商的报告指出,2013年全年中中国网民被病毒感染11.45亿人次,超过2300万台电脑遭受攻击,平均每个人每7天会受到一次攻击。而导致...

    静一
  • 同源政策与跨域请求

    1995年,同源政策由 Netscape(网景) 公司引入浏览器。目前,所有浏览器都实行这个政策。

    章鱼喵
  • 周立功:写给学单片机的年轻人

    周立功,男,1964年3月出生,毕业于东华大学自动化及计算机系,高级工程师,中国单片机协会理事,中国海洋大学讲座教授,硕士生导师,主要研究方向为嵌入式系统与现...

    黑泽君
  • IT国产化:马拉松长跑者

    2013年,美国前安全局管理员斯诺登曝光了PRISM(棱镜计划),美国政府买通了微软、雅虎、谷歌、苹果、Facebook、PalTalk、YouTube、Sky...

    云盒子哦
  • Nginx限流

    在当今流量徒增的互联网时代,很多业务场景都会涉及到高并发。这个时候接口进行限流是非常有必要的,而限流是Nginx最有用的特性之一,而且也是最容易被错误配置的特...

    逆月翎
  • 【LeetCode 409】 关关的刷题日记31Longest Palindrome

    关关的刷题日记31 – Leetcode 409. Longest Palindrome 题目 Given a string which consists o...

    WZEARW
  • 【OCP最新题库解析(052)--题40】Your database is open in ARCHIVELOG mode

    注:OCP-052最新题库完整详细解答版请联系小麦苗私聊。解题不易,请大家尊重原创。

    小麦苗DBA宝典

扫码关注云+社区

领取腾讯云代金券