如何通过criu checkpoint/restore应用

criu是linux平台在用户空间实现checkpoint/restore功能的工具软件。通过该工具,可以冻结正在运行的应用程序或者其中的一部分,并将应用程序的执行状态以文件形式保存在磁盘上,然后通过这些快照文件,可以将应用程序从冻结的时间点恢复回来继续运行。借助该软件,可以实现应用的实时迁移、应用快照和远程调试等功能。criu最显著的特点是在用户空间实现checkpoint/restore,不需要修改应用程序或者操作系统,并且也是内核中功能最丰富和最活跃的。

本文主要介绍如何在centos7安装criu,并通过criu checkpoint冻结应用,然后restore恢复应用。

1 安装criu

运行yum install -y criu命令即可安装criu。

2 设置应用的checkpoint

示例程序是一个不断打印数字的c程序,checkpoint_demo.c代码如下:

编译代码后,示例程序运行效果如下:

将示例程序复制到/root/chkpnt_dir目录。

可以看到,在/root/chkpnt_dir目录下只有一个文件checkpoint_demo,运行示例程序:

打开一个新终端,查找示例程序的进程号,通过criu设置应用的checkpoint。

通过criu的dump命令,-D选项指定应用的快照文件保存目录,-j表示该应用是一个通过shell启动的作业,通过-t指定需要checkpoint的应用pid。当对应用设置checkpoint后,应用会自动退出,如果希望应用继续执行,需指定-R或—leave-running选项。由示例中可以看到,当设置进程15748的checkpoint后,再查找该进程,发现进程不存在,即进程已经退出。查看快照文件目录,生成很多img文件,这些文件主要用于恢复应用。这时候查看运行示例程序的终端,会发现程序已经终止运行,如下:

即示例程序在输出26后,由于设置checkpoint被kill掉了。

3 恢复应用

通过criu的restore命令,-D选项指定应用的快照文件保存目录,checkpoint时指定的应用程序是由shell启动,所以restore时需要指定相应的-j选项。由示例中可以看到,恢复后的程序从设置checkpoint的时间点继续运行,程序在输出26时被kill掉,恢复后继续输出27,恢复后查找进程15748,发现进程使用原来的进程号继续运行。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180529G1XW4X00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券