Docker存储

前言

上一篇文章中简单总结了一下docke的基础使用方法,这次我来总结一下有关docker存储方面的相关知识。本文同样建立在CloudMan的系列教程之上,有兴趣的可以直接移步。

有些人可能觉得这个很简单,存储就是硬盘嘛,docker容器既然也是操作系统,那就直接存在他的容器的文件系统里就好了。看似没错,但问题在于docker的容器是无状态的,当容器重启的时候里面的数据会全部清除,如果是一些静态的数据,我们可以在build镜像的时候直接写死,但是对于数据库、日志等数据实时变化的镜像我们就不能通过这种方式来保存数据。所以本文来谈谈不同的存储方式。

一、Docker的两种存储资源

根据上述分析可以知道,Docker为容器起码提供了两种存放数据的资源,确实如此,分别是:

  1. 由storage driver管理的镜像层和容器层,即镜像内文件系统。
  2. Data Volume,宿主机文件系统。

1.1 storage driver

对于某些容器,直接将数据放在由storage driver维护的层中是很好的选择,比如那些无状态的应用。无状态意味着容器没有需要持久化的数据,随时可以从镜像直接创建。比如busybox,它是一个工具箱,我们启动busybox是为了执行诸如wget,ping之类的命令,不需要保存数据供以后使用,使用完直接退出,容器删除时存放在容器层中的工作数据也一起被删除,下次再启动新容器时又是一个干净如初的内部文件系统。

通过上一篇文章可以知道使用Dockerfile build镜像的时候,可以通过COPY或ADD命令来向镜像中添加数据。如下:

COPY将文件从宿主机复制到镜像。

COPY支持两种形式:

  1. COPY src dest
  2. COPY ["src", "dest"]

注意:src只能指定宿主机中的文件或目录。

ADDCOPY类似,从宿主机复制文件到镜像。不同的是,如果src是归档文件(tar,zip,tgz,xz等),文件会被自动解压到dest。

1.2 data vloume

有些容器需要保存状态,如数据库容器等,这些就需要使用Data Volume,即将内部数据映射到外部宿主机的文件系统上。

Data Volume 有以下特点:

  1. Data Volume是目录或文件,而非没有格式化的磁盘(块设备)。
  2. 容器可以读写volume中的数据。
  3. volume数据可以被永久的保存,即使使用它的容器已经销毁。

1.2.1 bind mount

bind mount的意思是挂载宿主机中固定目录,启动容器的时候执行:

docker run -d -p 80:80 -v src:dst httpd

-v的格式为:。在此镜像中为/usr/local/apache2/htdocs,此目录是httpd镜像中apache server存放静态文件的地方。由于/usr/local/apache2/htdocs已经存在,但是其中数据会被隐藏起来,取而代之的是宿主机中的数据,这与 linux mount 命令的行为是一致的,即将宿主机中的目录挂载到镜像中的目录。

1.2.2 docker managed volume

docker managed volume的意思是由docker自动映射目录。启动容器的时候执行:

docker run -d -p 80:80 -v dst httpd

此处-v的格式为,即只有镜像中路径。

它与bind mount的区别在于,managed volume不需要指定宿主机上的mount目录,docker会自动在宿主机/var/lib/docker/volumes下为其生成一个随机目录。

docker managed volume的创建过程:

  1. 容器启动时,简单的告诉docker:我需要一个volume存放数据,帮我mount到目录/abc(镜像内目录)。
  2. docker在宿主机/var/lib/docker/volumes中生成一个随机目录作为mount源。
  3. 如果/abc已经存在,则将数据复制到 mount源。
  4. 将volume(宿主机)mount到/abc(镜像)。

1.2.3 两种方式对比

类型

bind mount

docker managed volume

volume 位置

可任意指定

/var/lib/docker/volumes/...

对已有mount point 影响

隐藏并替换为 volume

原有数据复制到 volume

是否支持单个文件

支持

不支持,只能是目录

权限控制

可设置为只读,默认为读写权限

无控制,均为读写权限

移植性

移植性弱,与host path绑定

移植性强,无需指定host目录

二、容器与宿主机之间以及容器之间数据共享

由于docker的设计目的就是为了互相不干扰,相互独立,但是有时候我们又不得不在容器与宿主机之间或者容器之间共享数据,以实现某些功能。

2.1 容器与host共享数据

  1. 使用docker cp命令可以在容器和host之间拷贝数据,与scp相似。
  2. 将镜像的某一目录挂载到host path也是一种共享方式。

2.2 容器之间共享数据

2.2.1 共享host目录

只需要将同一个host目录挂载到不同的容器即可。

2.2.2 用volume container共享数据

volume container是专门为其他容器提供volume的容器。它提供的卷的类型可以是bind mount,也可以是docker managed volume。通过下面的命令创建一个volume container:

docker create --name vc_data -v ~/htdocs:/usr/local/apache2/htdocs -v /other/useful/tools busybox

此处只需要create即可,不需要run,因为其他容器只需获取到他的这个挂载点,并不需要他的数据。

其他容器启动的时候可以通过--volumes-from参数使用vc_data这个volume container容器的挂载点,命令如下:

docker run --name web1 -d -p 80 --volumes-from vc_data httpd
docker run --name web2 -d -p 80 --volumes-from vc_data httpd

这样web1、web2就有了相同的挂载点。

volume container 的特点:

  1. 与 bind mount 相比,不必为每一个容器指定host path,所有path都在 volume container中定义好了,容器只需与volume container关联。实现了容器与host的解耦。
  2. 使用volume container的容器其mount point是一致的,有利于配置的规范和标准化,但也带来一定的局限,使用时需要综合考虑。

2.2.3 data-packed volume container

这种场景是将数据先放到镜像中,build此镜像,然后create此镜像,其他容器的--volumes-from设置为此容器。这样run出来的容器都会共享同一份数据。

我们用下面的 Dockfile 构建镜像:

FROM busybox
ADD htdocs /usr/local/apache2/htdocs
VOLUME /usr/local/apache2/htdocs

ADD命令将静态文件添加到容器目录/usr/local/apache2/htdocs。

VOLUME 的作用与-v等效,用来创建docker managed volume,mount point 为usr/local/apache2/htdocs,因为这个目录就是ADD添加的目录,所以会将已有数据拷贝到volume中。用下面的命令build词镜像:

docker build -t datapacked .

创建此镜像的容器:

docker create --name vc_data datapacked

此处不再需要-v,因为datapacked的镜像VLOUME已经实现了。

启动其他容器:

docker run --name web2 -d -p 80 --volumes-from vc_data httpd

这样也可实现容器之间共享数据,而且此数据保存在datapacked中。这种方式适合只使用静态文件共享场景。并且datapacked中包含了共享数据,可移植性非常强。

三、volume管理

docker volume ls查看宿主机上所有vloume

docker inspect <container>查看某一容器具体的信息

dcoker vloume rm <iamgeid>删除某一个volume

如果想批量删除孤儿 volume,可以执行:

docker volume rm $(docker volume ls -q)

四、总结

本文简单总结了docker存储方面的相关知识和用法,包含两种数据存储方式、容器与host之间、容器之间共享数据以及volume管理等知识。下一篇总结以下docker网络的相关知识和用法。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏你不就像风一样

史上最全面的Docker构建工具使用教程

Docker 是一个开源的应用容器引擎,基于 Go 语言] 并遵从Apache2.0协议开源。Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可...

1902
来自专栏IT派

Docker 完全指南

下面的图片比较了 Docker 和传统虚拟化方式的不同之处,可见容器是在操作系统层面上实现虚拟化,直接复用本地主机的操作系统,而传统方式则是在硬件层面实现。

772
来自专栏人工智能

发现Docker的IP地址

我们使用Eclipse Che在Docker上编写了很多实用程序。它们占用空间小,便于携带,可以在许多不同的操作系统上运行,而无需用户安装额外的软件。

2880
来自专栏IT笔记

Docker学习之搭建MySql容器服务

MySQL 5.6 SQL数据库服务器Docker镜像,此容器映像包含用于OpenShift的MySQL 5.6 SQL数据库服务器和一般用法。用户可以选择RH...

4546
来自专栏王小雷

实例解析Docker数据卷+数据卷容器+flocker数据共享+DockerHub操作

Docker内部数据管理和Docker之间的数据共享为数据卷和数据卷容器,实例解析1.将本地的文件作为容器的数据卷,2.数据卷flocker插件实现容器集群(或...

4396
来自专栏北京马哥教育

Docker常用命令汇总

一、查看docker信息 1、查看docker版本 docker version 2、显示docker系统的信息 docker info 二、对image的...

3639
来自专栏测试驿栈

Docker基础操作

   Docker是一个虚拟环境容器,可以将你的环境、代码、配置文件等一并打包到这个容器中,并发布和应用到任意平台中。比如,你在本地部署了git,jenkins...

1493
来自专栏技术之路

Docker实践--部署Nodejs应用

  这个例子的目标是为了向大家展示如何在Docker的container里运行Node.js程序。我会先创建一个简单的Node.js web app,来构建一个...

3428
来自专栏编程坑太多

『中级篇』构建自己的Docker镜像(16)

1575
来自专栏JMCui

Docker 系列三(容器管理).

    指明了 -d 运行镜像,会返回容器的 id;如果不指明 -d 运行镜像,会打印出 catalina.out 的 日志,在 [crtl +c] 后,容器即...

1093

扫码关注云+社区

领取腾讯云代金券