如何贡献代码

导语

在使用指南的最后一部分,我们汇总了使用PaddlePaddle过程中的常见问题,本部分推文目录如下:

2.22:【FAQ】模型配置相关问题汇总

2.23:【FAQ】参数设置相关问题汇总

2.24:【FAQ】本地训练与预测相关问题汇总

2.25:【FAQ】集群训练与预测相关问题汇总

2.26:如何贡献代码

2.27:如何贡献文档

如何贡献代码

我们真诚地感谢您的贡献,欢迎通过 GitHub 的 fork 和 pull request 流程来提交代码。

【代码要求】

1、代码注释请遵守 Doxygen (http://www.stack.nl/~dimitri/doxygen/)的样式。

2、确保编译器选项WITH_STYLE_CHECK已打开,并且编译能通过代码样式检查。

3、所有代码必须具有单元测试。

4、通过所有单元测试。

5、请遵守提交代码的一些约定。

【提交代码的一些约定】

为了使评审人在评审代码时更好地专注于代码本身,请您每次提交代码时,遵守以下约定:

1、请保证Travis-CI 中单元测试能顺利通过。如果没过,说明提交的代码存在问题,评审人一般不做评审。

2、提交PUll Request前: 请注意commit的数量。如果仅仅修改一个文件但提交了十几个commit,每个commit只做了少量的修改,这会给评审人带来很大困扰。评审人需要逐一查看每个commit才能知道做了哪些修改,且不排除commit之间的修改存在相互覆盖的情况。每次提交时,保持尽量少的commit,可以通过git commit --amend补充上次的commit。对已经Push到远程仓库的多个commit,可以参考squash commits after push。每个commit的名称应能反映当前commit的内容,不能太随意。

3、如果解决了某个Issue的问题,请在该PUll Request的第一个评论框中加上:fix #issue_number,这样当该PUll Request被合并后,会自动关闭对应的Issue。关键词包括:close, closes, closed, fix, fixes, fixed, resolve, resolves, resolved,请选择合适的词汇。

此外,在回复评审人意见时,请您遵守以下约定:

1、评审人的每个意见都必须回复(这是开源社区的基本礼貌,别人帮了忙,应该说谢谢): - 对评审意见同意且按其修改完的,给个简单的Done即可; - 对评审意见不同意的,请给出您自己的反驳理由。

2、如果评审意见比较多: - 请给出总体的修改情况。 - 请采用start a review进行回复,而非直接回复的方式。原因是每个回复都会发送一封邮件,会造成邮件灾难。

以下教程将指导您提交代码:

1

Fork

跳转到PaddlePaddle GitHub首页(链接:https://github.com/PaddlePaddle/Paddle),然后单击Fork按钮,生成自己目录下的仓库。

2

克隆(Clone)

将远程仓库 clone 到本地:

gitclonehttps://github.com/USERNAME/Paddle

cdPaddle

3

创建本地分支

Paddle 目前使用Git流分支模型进行开发,测试,发行和维护,具体请参考 Paddle 分支规范。所有的 feature 和 bug fix 的开发工作都应该在一个新的分支上完成,一般从develop分支上创建新分支。使用git checkout -b创建并切换到新分支。

git checkout -b my-cool-stuff

值得注意的是,在 checkout 之前,需要保持当前分支目录 clean,否则会把 untracked 的文件也带到新分支上,这可以通过git status查看。

4

使用pre-commit钩子

Paddle 开发人员使用 pre-commit 工具来管理 Git 预提交钩子。 它可以帮助我们格式化源代码(C++,Python),在提交(commit)前自动检查一些基本事宜(如每个文件只有一个 EOL,Git 中不要添加大文件等)。

pre-commit测试是 Travis-CI 中单元测试的一部分,不满足钩子的 PR 不能被提交到 Paddle,首先安装并在当前目录运行它:

pip install pre-commit

pre-commit install

Paddle 使用clang-format来调整 C/C++ 源代码格式,请确保clang-format版本在 3.8 以上。

5

开始开发

在本例中,我删除了 README.md 中的一行,并创建了一个新文件。

通过git status查看当前状态,这会提示当前目录的一些变化,同时也可以通过git diff查看文件具体被修改的内容。

git status

On branchtest

Changes not stagedforcommit:

(use"git add ..."to update what will be committed)

(use"git checkout -- ..."to discard changesinworking directory)

modified: README.md

Untracked files:

(use"git add ..."to includeinwhat will be committed)

test

no changes added to commit (use"git add"and/or"git commit -a")

6

构建和测试

编译 PaddlePaddle 的源码以及生成文档需要多种开发工具。为了方便大家,我们的标准开发流程是把这些工具都装进一个Docker image,称为开发镜像,通常名字是paddle:latest-dev或者paddle:[version tag]-dev如paddle:0.11.0-dev。然后所有用cmake && make的地方(比如IDE配置里)都用docker run paddle:latest-dev来代替。

如要build这个开发镜像,在源码目录树的根目录中运行:

docker build -t paddle:latest-dev .

随后可以用这个开发镜像开始build PaddlePaddle的源码。比如如果要build一个不依赖GPU,但是支持AVX指令集,并且包括unit tests的PaddlePaddle,可以:

docker run -v $(pwd):/paddle -e"WITH_GPU=OFF"-e"WITH_AVX=ON"-e"WITH_TESTING=ON"paddle:latest-dev

这个过程除了编译PaddlePaddle为./build/libpaddle.so,并且输出一个./build/paddle.deb文件之外,还会输出一个build/Dockerfile。我们只需要运行下面命令把编译好的PaddlePaddle打包成一个生产镜像(paddle:prod):

docker build -t paddle:prod -f build/Dockerfile .

如果要运行所有的单元测试,可以用如下命令:

docker run -it -v $(pwd):/paddle paddle:latest-dev bash -c"cd /paddle/build && ctest"

7

提交(commit)

接下来我们取消对 README.md 文件的改变,然后提交新添加的 test 文件。

git checkout -- README.md

git status

On branchtest

Untracked files:

(use"git add ..."to includeinwhat will be committed)

test

nothing added to commit but untracked files present (use"git add"to track)

git addtest

Git 每次提交代码,都需要写提交说明,这可以让其他人知道这次提交做了哪些改变,这可以通过git commit 完成。

git commit

CRLF end-lines remover..........(no files to check)Skipped

yapf...........(no files to check)Skipped

Checkforadded large files...........Passed

Checkformerge conflicts.............Passed

Checkforbroken symlinks...... .....Passed

Detect Private Key.........(no files to check)Skipped

Fix End of Files...............(no files to check)Skipped

clang-formater............(no files to check)Skipped

[my-cool-stuff c703c041] addtestfile

1 file changed, 0 insertions(+), 0 deletions(-)

create mode 100644 233

8

保持本地仓库最新

在准备发起 Pull Request 之前,需要同步原仓库(https://github.com/PaddlePaddle/Paddle)最新的代码。

首先通过git remote查看当前远程仓库的名字。

git remote

origin

git remote -v

origin https://github.com/USERNAME/Paddle (fetch)

origin https://github.com/USERNAME/Paddle (push)

这里 origin 是我们 clone 的远程仓库的名字,也就是自己用户名下的 Paddle,接下来我们创建一个原始 Paddle 仓库的远程主机,命名为 upstream。

git remote add upstream https://github.com/PaddlePaddle/Paddle

git remote

origin

upstream

获取 upstream 的最新代码并更新当前分支。

git fetch upstream

git pull upstream develop

9

Push 到远程仓库

将本地的修改推送到 GitHub 上,也就是 https://github.com/USERNAME/Paddle。

# 推送到远程仓库 origin 的 my-cool-stuff 分支上

git push origin my-cool-stuff

10

建立 Issue 并完成 Pull Request

建立一个 Issue 描述问题,并记录它的编号。

切换到所建分支,然后点击New pull request。

选择目标分支:

在 PR 的描述说明中,填写resolve #Issue编号可以在这个 PR 被 merge 后,自动关闭对应的 Issue,具体请见 https://help.github.com/articles/closing-issues-via-commit-messages/。

接下来等待 review,如果有需要修改的地方,参照上述步骤更新 origin 中的对应分支即可。

11

删除远程分支

在 PR 被 merge 进主仓库后,我们可以在 PR 的页面删除远程仓库的分支。

也可以使用git push origin :分支名删除远程分支,如:

git push origin :my-cool-stuff

12

删除本地分支

最后,删除本地分支。

# 切换到 develop 分支

git checkout develop

# 删除 my-cool-stuff 分支

git branch -D my-cool-stuff

至此,我们就完成了一次代码贡献的过程。

end

*原创贴,版权所有,未经许可,禁止转载

*值班小Paddle:wangp

*欢迎在留言区分享您的观点

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180226G0V9S300?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券