AIphaCode 并不能取代程序员，而是开发者的工具

AI科技大本营

发布于 2022-04-05 09:43:35

2750

发布于 2022-04-05 09:43:35

文章被收录于专栏：AI科技大本营的专栏AI科技大本营的专栏

编译 | 禾木木

出品 | AI科技大本营（ID:rgznai100）

DeepMind 是 AI 研究实验室，它引入了一种深度学习模型，可以生成具有显著效果的软件源代码。该模型名为 AIphaCode，是基于 Transformers，OpenAI 在其代码生成模型中使用的架构相同。

编程是深度学习和大型语言模型的有前景的应用之一。对编程人才日益增长的需求刺激了创造工具的竞赛，这些工具可以提高开发人员的工作效率，并为非开发人员提供工具来创建软件。

而在这方面，AIphaCode 确实给人留下了深刻的印象。它成功地解决了复杂的编程挑战，这些挑战通常需要数小时的规划、编码和测试。它可能会成为将问题描述转化为工作代码的好工具。

但它不等同于任何级别的人类程序员。这是一种完全不同的软件创建方法，如果没有人类的思考和直觉，这种方法是不完整的。

编码竞赛

编码挑战描述的示例。图片来自 DeepMind

AIphaCode 并不是唯一的，但它完成了一项非常复杂的任务。其他类似的系统专注于生成简短的代码片段，例如执行小任务的函数或代码块（例如，设置 Web 服务器，从 API 系统中提取信息）。虽然令人印象深刻，但当语言模型暴露于足够大的源代码语料库时，这些任务就变得微不足道。

另一方面，AIphaCode 旨在解决竞争性编程问题。编码挑战的参与者必须阅读挑战描述，理解问题，将其转化为算法解决方案，以通用语言实现，并针对一组有限的测试用例进行评估。最后，他们的结果是根据在实施过程中不可用的隐藏测试的性能进行评估的。编码挑战也可以有其他条件，例如时间和内存限制。

基本上，参与编码挑战的机器学习模型必须生成一个完整的程序，用来解决它前所未有的问题。

编码挑战解决方案的示例。图片来自 DeepMind

Transformer 和大型语言模型的力量

AlphaCode 是大型语言模型在解决复杂问题方面取得进展的又一个例子。AlphaCode 是大型语言模型在解决复杂问题方面取得进展的又一个例子。这种深度学习系统通常被称为序列到序列模型 (Seq2seq)。Seq2seq 算法将一系列值（字母、像素、数字等）作为输入，并生成另一个值序列。这是机器翻译、文本生成和语音识别等许多自然语言任务中使用的方法。

根据 DeepMind 的论文，AlphaCode 使用了一种编码器-解码器 Transformer 架构。近年来，Transformer 变得特别流行，因为它们可以处理大量数据序列，并且比其前身循环神经网络 (RNN) 和长短期记忆网络 (LSTM) 所需的内存和计算需求少得多。

Transformer 网络的结构

AlphaCode 的编码器部分为问题的自然语言描述创建了一个数字表示。解码器部分获取编码器产生的嵌入向量，并尝试生成解决方案的源代码。

事实证明，Transformer 模型擅长此类任务，尤其是在为它们提供足够的训练数据和计算能力的情况下。但在研究者看来，AlphaCode 的真正出色之处不仅仅是将原始数据投入到超大型神经网络中的强大功能，更多地在于 DeepMind 的科学家们在设计训练过程以及生成和过滤它的算法方面的独创性有关。

无监督和监督学习

为了创建 AlphaCode，DeepMind 的科学家结合了无监督预训练和监督微调。通常被称为自我监督学习，这种方法在没有足够标记数据或数据注释昂贵且耗时的应用程序中变得流行。

在预训练阶段，AlphaCode 对从 GitHub 提取的 715GB 数据进行了无监督学习。通过尝试预测语言或代码片段的缺失部分来训练模型。这种方法的优点是它不需要任何类型的注释，并且通过接触越来越多的样本，ML 模型在为文本和源代码的结构创建数字表示方面变得更好。

训练和应用AlphaCode的算法。图片来自 DeepMind

然后在 CodeContests（DeepMind 团队创建的带注释数据集）上对预训练模型进行微调。该数据集包含问题陈述、正确和错误的提交以及从各种来源收集的测试用例，包括 Codeforces、Description2Code 和 IBM 的 CodeNet。该模型经过训练，可以将挑战的文本描述转换为生成的源代码。它的结果通过测试用例进行评估，并与正确的提交进行比较。

在创建数据集时，研究人员特别注意避免训练、验证和测试集之间的历史重叠。这确保了 ML 模型在面临编码挑战时不会产生记忆结果。