前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >全球首个AI程序员来了!超越GPT-4震撼硅谷!

全球首个AI程序员来了!超越GPT-4震撼硅谷!

作者头像
朱晓霞
发布2024-03-15 15:07:35
1460
发布2024-03-15 15:07:35
举报

比肩真人!初创公司Cognition推出全球首位AI软件工程师

首个AI软件工程师一亮相,直接引爆整个科技圈。只需一句指令,它可端到端地处理整个开发项目。

查看效果:https://www.bilibili.com/video/BV1MH4y1s7CD/

初创公司 Cognition AI ,2 个月前才刚成立,一夜之间在 X 卷起了风暴,就因为他们一条浏览量上千万的推文:

今天,我们很高兴地向大家介绍,第一位 AI 软件工程师 Devin。

Cognition AI 团队藏龙卧虎,基本都是国际信息学奥林匹克竞赛金牌选手。Cognition AI 对于 Devin 的定义是:世界上第一位完全自主的 AI 软件工程师。

在SWE-bench基准测试中,它无需人类帮助,可解决13.86%的问题。相比之下,GPT-4只能处理1.74%的问题,且都需要人类提示告知处理哪些文件。可以说,它远远超过了此前所有AI大模型。

Devin解决的不只是代码,还包括与之相关的整个工作流

  1. 在长程推理和规划上面下了很大功夫,可以规划和执行需要数千个决策才能完成的复杂软件工程任务。
  2. Perplexity AI CEO给出了高度肯定:这应该是任何Agent的第一个演示。

从零构建网站、自主查找并修复Bug、甚至是训练和微调自己的AI模型通通都不在话下~也可为一些成熟的代码库做贡献。

一些不熟悉的技术,给它看一篇博客文章。它也能立马搞定。

首个AI软件工程师亮相

Devin被介绍为世界首个完全自主的AI软件工程师。它在长程推理和规划上面下了很大功夫,可以规划和执行需要数千个决策才能完成的复杂软件工程任务。最终的Devin,让人类只需要发号施令,其他什么也不用做。

其主要能力有六个:

演示视频见:

1、不熟的技术,现学现卖

2、端到端构建和部署程序

3、自主查找并修复bug

4、训练和微调自己的AI模型

5、修复开源库

6、成熟的生产库也能做贡献

在评估Devin的表现时,团队没有使用常见的HumanEval,而是用了更具挑战性的SWE-bench。这个数据集是由GitHub中的实际问题组成的,Devin不借助任何辅助,就取得了13.86%的最高解决率。而同样在无辅助的条件下,GPT-4的问题解决率为零,此前的最佳水平是1.96%,加入辅助也才4.8%。

公司人均一块IOI金牌

公司目前已有10个IOI金牌得主。在SWE-bench上,Devin的表现远远超过Claude 2、Llama、GPT-4等选手。报道称,该AI程序员已经通过了一家AI公司面试,并在Upwork上完成了实际工作。

但这种“名不见经传”背后,实际是一个10人员工的编程天才团队,IOI金牌就有10块…人均一块。

Devin背后公司名为Cognition AI,总部设在纽约和旧金山,定位是一家专注于推理的应用AI实验室。目前该团队规模仅有10人,但共揽获了10枚IOI金牌,创始成员均曾在Cursor、Scale AI、Lunchclub、Modal、Google DeepMind、Waymo、Nuro等从事AI前沿工作。

参考链接:

[1]https://twitter.com/account/access

[2]https://www.cognition-labs.com/blog

[3]https://tech.ifeng.com/c/8XvOfJuFRue

[4]https://new.qq.com/rain/a/20240313A080GM00

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-03-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 目标检测和深度学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 首个AI软件工程师亮相
    • 1、不熟的技术,现学现卖
      • 2、端到端构建和部署程序
        • 3、自主查找并修复bug
          • 4、训练和微调自己的AI模型
            • 5、修复开源库
              • 6、成熟的生产库也能做贡献
              • 公司人均一块IOI金牌
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档