文章/答案/技术大牛

发布

一文读懂Dockerfile：新手进阶必备指南

文章来源：企鹅号 - 大山运维

一、Dockerfile示例

在容器化的世界里，Dockerfile 可是个相当关键的角色。简单来说，Dockerfile 是一个文本文件，包含了一系列的指令，这些指令用于自动化构建 Docker 镜像。

构建python3.10 docker镜像示例：

# 使用官方的Python 3.10基础镜像FROM python:3.10# 设置工作目录WORKDIR /app# 将当前目录下的所有文件复制到容器中的/app目录COPY . /app# 安装项目所需的Python依赖包# 假设项目有一个requirements.txt文件列出了所有依赖RUN pip install --no-cache-dir -r requirements.txt# 指定容器启动时默认执行的命令# 这里假设项目的入口文件是main.pyCMD ["python", "main.py"]

main.py是你的Python项目的入口文件，requirements.txt列出了项目所需的所有Python依赖包。

构建Docker镜像。

docker build -t my-python310-app:1.0

构建完成后，你可以使用

docker run -d -p 5000:5000 my-python310-app:1.0

二、Dockerfile 指令详解

（一）FROM：指定基础镜像

FROM指令是 Dockerfile 的基础，用于指定构建新镜像的基础镜像。其语法格式为：

FROM [--platform=<platform>] <image>[:<tag>] [AS <name>]

其中，<image>是基础镜像的名称，<tag>是镜像的标签，用于指定镜像的版本，若不指定<tag>，默认使用latest标签，即最新版本。--platform参数用于指定镜像的平台，如linux/amd64、linux/arm64等，适用于多平台构建的场景。AS <name>用于为构建阶段指定一个名称，方便后续在多阶段构建中引用。

在实际应用中，选择合适的基础镜像至关重要。比如，当构建一个 Python 应用的镜像时，若追求镜像的轻量化，可选择python:3.10-slim作为基础镜像，它仅包含运行 Python 应用所需的最小依赖，大大减小了镜像体积。而若应用依赖大量的系统库和工具，可能更适合使用python:3.10完整版本的基础镜像，以确保所有依赖都能顺利安装。

（二）RUN：执行命令

RUN指令是在构建镜像过程中执行命令的关键，它有两种执行格式：Shell 格式和 Exec 格式。

Shell 格式

RUN <command> ，命令会在默认的 Shell 中执行，比如/bin/sh -c 。例如：

RUN apt-get update && apt-get install -y nginx

在这个例子中，先更新软件包列表，然后安装 Nginx 服务器。Shell 格式的优点是书写简洁，符合日常使用 Shell 命令的习惯，并且可以方便地使用 Shell 的各种特性，如管道（|）、逻辑运算符（&&、||）等。

Exec 格式

RUN ["executable", "param1", "param2"] ，这是一种 JSON 数组的形式，会直接执行指定的可执行文件及其参数，不会经过 Shell 解析。例如：

RUN ["apt-get", "update"]

Exec 格式的好处是执行过程更加明确，避免了 Shell 中可能出现的一些意外解释问题，比如环境变量的扩展、特殊字符的处理等。同时，在需要精确控制命令执行环境和参数传递时，Exec 格式更为可靠。

在镜像构建过程中，RUN指令常用于安装软件包、配置环境等操作。比如，构建一个 Java 应用的镜像时，可能会使用RUN指令安装 Java 运行时环境（JRE）和 Maven 构建工具：

RUN apt-get update && apt-get install -y openjdk-11-jre-headless maven

然而，在使用RUN指令时，也需要注意一些常见问题。由于每个RUN指令都会在镜像中创建一个新的层，过多的RUN指令会导致镜像层数过多，从而增加镜像的体积和构建时间。为了避免这种情况，应尽量将多个相关命令合并在一个RUN指令中，用&&连接。例如，不要写成：

RUN apt-get update

RUN apt-get install -y nginx

RUN apt-get install -y php-fpm

而应该合并为：

RUN apt-get update && apt-get install -y nginx php-fpm

此外，在安装软件包时，要注意清理缓存。例如，在使用apt-get安装完软件包后，及时运行apt-get clean命令删除下载的软件包和缓存文件，以减小镜像体积：

RUN apt-get update && apt-get install -y nginx && apt-get clean

（三）COPY 和 ADD：复制文件

COPY和ADD指令都用于将文件或目录复制到镜像中，但它们在功能上存在一些区别。

COPY 指令

功能相对简单，主要用于将本地文件或目录复制到镜像中。其语法格式为：

COPY <src>... <dest>

其中，<src>是源文件或目录的路径，可以是相对路径（相对于 Dockerfile 所在目录）或绝对路径；<dest>是目标路径，即文件或目录在镜像中的存放位置，必须是镜像内的绝对路径。例如：

COPY. /app

这表示将当前目录下的所有文件和目录复制到镜像的/app目录中。COPY 指令只能复制本地文件，不会自动解压文件，并且不会对文件进行任何额外的处理，操作简单直接，适用于一般的文件拷贝场景。

ADD 指令

功能更为强大，除了可以复制本地文件或目录外，还具有一些额外的特性。语法格式与COPY类似：

ADD <src>... <dest>

ADD 指令的独特之处在于：

它可以自动解压本地的 tar 文件。例如，若有一个software.tar.gz文件，使用ADD software.tar.gz /tmp/指令，会将文件复制到/tmp目录并自动解压。

支持从 URL 下载文件并复制到镜像中。

通过下面的示例可以更清楚地看到两者的区别：

# 使用COPY指令复制文件

COPY myfile.txt /data/

# 使用ADD指令复制并解压文件

ADD myarchive.tar.gz /data/

# 使用ADD指令从URL下载文件

ADD http://www.rhihi.com/download/file.txt /data/

在实际使用中，若只是简单地复制本地文件，建议使用COPY指令，因为它的行为更加明确，不会带来额外的解压或下载操作，使镜像构建过程更易于理解和维护。而当需要复制并解压本地 tar 文件，或者从 URL 下载文件时，ADD指令则能提供更便捷的功能。但由于ADD指令的功能复杂性，在某些情况下可能会导致意想不到的结果，所以使用时需谨慎，特别是在处理复杂的文件复制需求时，要充分考虑其特性和可能带来的影响。

（四）WORKDIR：设置工作目录

WORKDIR指令用于设置镜像构建和容器运行时的工作目录，类似于在命令行中使用cd命令切换目录。其语法格式为：

WORKDIR /path/to/workdir

其中，/path/to/workdir必须是镜像内的绝对路径。例如：

WORKDIR /app

这就将工作目录设置为/app，后续的RUN、CMD、ENTRYPOINT、ADD、COPY等指令都会在该目录下执行。如果指定的工作目录不存在，WORKDIR会自动创建。

设置工作目录有诸多好处。一方面，它可以使后续的指令执行更加清晰和有条理。另一方面，在容器运行时，工作目录的设置也能确保应用程序在预期的环境中运行，避免因路径问题导致的错误。

此外，WORKDIR指令可以在 Dockerfile 中多次使用，后续的指令会相对于最近一次设置的工作目录执行。例如：

WORKDIR /a

WORKDIR b

WORKDIR c

最终的工作目录将是/a/b/c 。这种灵活性使得在处理复杂的项目结构时，可以根据需要灵活切换工作目录，满足不同阶段的操作需求。

（五）ENV：设置环境变量

ENV指令用于在镜像构建过程中设置环境变量，这些环境变量在后续的指令以及容器运行时都可以使用。其语法格式有两种：

ENV <key>=<value> ，例如：

ENV JAVA_HOME=/usr/local/jdk1.8.0_291

这就设置了一个名为JAVA_HOME的环境变量，其值为/usr/local/jdk1.8.0_291 。

ENV <key> <value> ，这种格式适用于设置多个单词组成的值，例如：

ENV PATH=/usr/local/node/bin:$PATH

这里将/usr/local/node/bin添加到了PATH环境变量中。

在镜像构建过程中，ENV指令常用于配置应用程序的运行环境。比如，构建一个基于 Python 的 Django 应用镜像时，可以使用ENV指令设置 Django 的配置文件路径和数据库连接信息：

ENV DJANGO_SETTINGS_MODULE=myproject.settings

ENV DATABASE_URL=postgres://user:password@db:5432/mydb

这些环境变量可以在后续的RUN指令中被使用，比如执行RUN python manage.py migrate进行数据库迁移时，Django 就会读取这些环境变量来配置数据库连接。

（六）EXPOSE：暴露端口

EXPOSE指令用于声明容器要暴露的端口，其语法格式为：

EXPOSE <port> [<port>/<protocol>...]

其中，<port>是要暴露的端口号，<protocol>是协议类型，可选TCP（默认）或UDP 。例如：

EXPOSE 8080

这表示容器将暴露 8080 端口，通常用于 Web 应用的对外访问。

需要注意的是，EXPOSE指令只是声明了容器内部的端口，并不会自动将这些端口映射到主机上。

EXPOSE指令的主要作用是为了让其他容器或用户了解该容器需要对外提供服务的端口。

（七）CMD 和 ENTRYPOINT：容器启动命令

CMD和ENTRYPOINT指令都用于指定容器启动时执行的命令，但它们在使用方式和功能上存在一些区别，并且常常配合使用以实现更灵活的容器启动配置。

CMD 指令

用于定义容器启动时的默认命令。一个 Dockerfile 中只能有一个CMD指令，如果有多个，只有最后一个生效。它有三种格式：

CMD ["executable","param1","param2"] ，这是推荐的 Exec 格式，以这种格式执行的命令不会经过 Shell 解析，直接执行可执行文件及其参数，例如CMD ["python", "app.py"] ，表示容器启动时默认运行python app.py命令。

CMD ["param1","param2"] ，这种格式通常作为ENTRYPOINT的默认参数，只有在ENTRYPOINT指令存在且为 Exec 格式时才有效。

CMD command param1 param2 ，这是 Shell 格式，命令会在/bin/sh -c中执行，例如CMD echo "Hello, World!" 。

当使用docker run启动容器时，如果没有指定其他命令，就会执行CMD中定义的命令；若指定了其他命令，则会覆盖CMD的默认命令。例如，对于一个包含CMD ["python", "app.py"]的 Dockerfile，使用docker run myimage启动容器时，会运行python app.py。

ENTRYPOINT 指令

用于配置容器启动时始终执行的命令，无论docker run命令中是否指定了其他命令。docker run命令中指定的参数会被追加到ENTRYPOINT命令后面作为参数传递。它也有两种格式：

ENTRYPOINT ["executable", "param1", "param2"] ，这是推荐的 Exec 格式，例如ENTRYPOINT ["nginx", "-g", "daemon off;"] ，确保容器启动时始终运行 Nginx 服务器。

ENTRYPOINT command param1 param2 ，这是 Shell 格式，命令会在/bin/sh -c中执行。

发表于: 2025-02-252025-02-25 08:26:00
原文链接：https://page.om.qq.com/page/O1_Jc7sAsGR_rTcXE-jlVn8A0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

一文读懂Dockerfile：新手进阶必备指南

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐