专栏首页机器之心看看函数名和注释,AI就能自动生成代码,程序员:这不真实,我要失业

看看函数名和注释,AI就能自动生成代码,程序员:这不真实,我要失业

机器之心报道

参与:张倩、Racoon X、Jamin

你有没有想过,有一天,码农是不需要写代码的。你只需要提供函数签名和注释,代码就能自己在屏幕上打出来。「搬砖码农可以都辞退了,留下项目经理提需求即可,大雾!」

上面这段 demo 是不是看着很爽?这就是 OpenAI CEO Sam Altman 刚刚介绍的最新研究成果——根据函数签名和注释,利用语言模型自动生成 Python 代码。这个语言模型用到了和 OpenAI 的 GPT 模型相同的无监督技术。

为了让模型学会「写代码」,研究人员在微软的超级计算机上,借助数千个开源 GitHub 库里的代码对该模型进行了微调。

先来看一下生成效果。

研究人员首先展示了一个较为简单、使用 Python 编写回文检测的例子。回文指的是「正读反读都能读通的句子」,例如:「anna」、「level」等。下面是使用该模型自动生成的代码:

可以看到,在你输入了函数签名和注释之后,模型正确地生成了回文检测的代码。当然,对于回文检测,我们也可以用如下更「秀」的递归方法来实现:

看到这里,也许大家并没有对该模型的效果感到很惊艳,毕竟像回文检测这类基础任务的代码网上一抓一大把,模型大可以直接从训练集中复制过来即可。

先别着急,咱们继续往下看。

接下来,研究人员要求模型生成从一个列表中查找长度不少于 7 个字符的代码,而且该任务并没有在训练集中。我们来看看在这样的情况下,模型表现如何:

还是出色地完成了任务!

从这个例子我们可以确定,模型不是简单地复制网上的现成代码,而是依据函数名及相关注释产生了对应的解决方案,它甚至还使用了之前生成的代码。

试过了单一函数的例子,研究者还展示了其在类中的运行效果。

这次的任务是计算商品的总价格,并对名称是回文的商品打折。我们来看一看该模型生成的代码:

模型自动地为我们生成了计算商品总价方法的注释及对应代码。然而这并不是我们想要的结果,我们只想要对名字是回文的商品打折,而不是对所有商品都打八折。研究人员之后修改了该方法的注释,详细描述了想要实现的功能。修改注释后,该模型生成的代码如下:

可以看到模型几乎生成了我们想要的结果。这里仅有一个小问题,我们想要对回文名称的商品打八折,而不是打二折,简单修改一下即可。

最后研究者展示了让模型生成购物收据的结果:

OpenAI 的介绍视频

OpenAI 放出的 demo 的确惊艳,甚至是革命性的。如果照这个思路走下去,以后简单的「搬砖工」似乎都不需要了。但问题也出在这儿:效果未免太惊艳了,让人不禁怀疑是否存在造假或精心挑选……

不过也有人说,「这可是 OpenAI!他们的口袋里有的是好玩意儿。」

那么,如果这是真的,对程序员来说意味着什么?

程序员的未来何去何从?

在 AI 领域,每种新鲜技术的出现似乎都会掀起一番「XX 从业者是否会被 AI 取代」的讨论,这次也不例外。

首先,这种工具的出现所带来的效率提升是毋庸置疑的。我们假设这个 demo 是没有掺水的,那么公司可能会出于成本的考虑裁掉一些初级码农,用一个码农来充当「审码员」,完成原来十个码农的工作。

也有人认为,就目前这个模型来讨论程序员是否会被取代未免有点超前。首先,这还只是一个语言模型,即使在非常简单的函数中也可能出错,更别说遇到比较难以理解的自然语言注释语句了。这时候,还是需要人来介入。

其次,这一流程中用到的「注释」还不是需要人来写吗?

但也有人认为,这些都可以通过时间和技术来解决:总有一天,模型犯的错误会越来越少,甚至少于检查代码的那个人类。

或者你再训练一个模型来写单元测试,然后不断对其进行改进,直到它可以给出大部分时候合理的解决方案。

当然,这些都是一些非常超前的假设,现在的技术还很难做到,真正应用起来也会有各种各样的问题。但回想起 19 世纪初期大批纺织工人的命运,这种讨论还是很有意义的。

本文分享自微信公众号 - 机器之心(almosthuman2014)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-05-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 进入社交领域?GitHub推出官方手机APP;北极代码存储计划浮出水面

    在最近的 GitHub Universe 大会上,GitHub 官方宣布,他们即将推出移动端 App。目前 iOS 用户已经可以在页面上申请 Beta 版本的试...

    机器之心
  • 深度学习助力前端开发:自动生成GUI图代码(附试用地址)

    选自arXiv 机器之心编译 参与:Jane W、蒋思源 哥本哈根的一家初创公司 UIzard Technologies 训练了一个神经网络,能够把图形用户界...

    机器之心
  • 从工具选择到团队沟通,看ML工程师一步步打造生产级机器学习

    这些年,随着数据和计算技术的发展,「机器学习」和「深度学习」已经变成了热门研究领域。对公司来说,虽然使用机器学习很时髦,但首先还是需要评估一下自己的业务能否从中...

    机器之心
  • 进入社交领域?GitHub推出官方手机APP;北极代码存储计划浮出水面

    在最近的 GitHub Universe 大会上,GitHub 官方宣布,他们即将推出移动端 App。目前 iOS 用户已经可以在页面上申请 Beta 版本的试...

    机器之心
  • 测试左移之代码评审

    最近两年,品质中心极力推动测试工作左移,以期能提前发现产品的问题,降低成本。笔者自认代码基础能力还不错,就想通过代码 Review 来提前发现一些Bug。

    腾讯移动品质中心TMQ
  • 高效编程所需要做的那点事

    聊聊如果才能高效编程 计划(Plan) 所谓Plan,其实就是对应于编程中的设计阶段,当然,这里的Plan并不像设计那样重量级。它要求我们程序员在正式...

    码神联盟
  • 哈哈哈,这个教人写出烂代码的项目在 GitHub 上火了...

    如果说到什么是好代码,我们肯定都能说出一堆规则,例如使用一致的格式和缩进、使用清晰的变量名和方法名、在必要时提供文档与注释、不要过度精简代码等等。

    GitHubDaily
  • 10 个省时间的 PyCharm 技巧,提升工作效率,杠杠滴!

    写 Python 代码时,你会严格遵守 pep8 规范么?还是要遵守的,不然代码传到 github 或者知乎上被人怼就不好了。但是如果靠肉眼去检查和注意的话,太...

    昱良
  • 干货 | 如何利用Xcode实现线上代码覆盖率的检查

    携程技术
  • 为什么开源可以提高程序员的编程技能?

    我已经写了很多年的软件。最近我意识到,我越涉及(致力于,结合于等)开源技术,我写出来的代码就更好。这不由地让我疑惑起来:难道里面有什么相关性或因果关系吗? ? ...

    用户1667431

扫码关注云+社区

领取腾讯云代金券