前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >本周最火AutoGPT!GitHub3.6万+标星,解决复杂任务全程无须人类插手

本周最火AutoGPT!GitHub3.6万+标星,解决复杂任务全程无须人类插手

作者头像
博文视点Broadview
发布2023-04-19 12:10:39
4010
发布2023-04-19 12:10:39
举报
文章被收录于专栏:博文视点Broadview

👆点击“博文视点Broadview”,获取更多书讯

金磊 丰色 发自 凹非寺 量子位 | 公众号 QbitAI

本周AI圈”最红炸子鸡“诞生——AutoGPT

不仅如此,这款软件系统的横空出世,一举将AI进程推向了新高度——

自主人工智能。

顾名思义,它所具备的能力主打的就是一个“自主”,完全不用人类插手的那种!

例如一位网友就要求AutoGPT开发一个网站,结果不到3分钟,AI自己就用React和Tailwind CSS“唰唰唰”地搞定了。

AI自己上网、自己使用第三方工具、自己思考、自己操作你的电脑。

这一套打法,算得上是把“行动→观察结果→思考→决定下一步行动”这条路子给打通并循环了起来。

就连前特斯拉AI总监Andrej Karpathy对此都评价道:

AutoGPT是提示工程的下一个前沿。

而且不只是AutoGPT,最近还陆陆续续地衍生出了各种自主人工智能工具,例如AgentGPTBabyAGI等等。

然后网友们面对此景也坐不住了,惊叹于AI发展的日新月异:

这俩月,一睁眼就出新东西,太累了。

无需人类插手的AutoGPT们

那么这个当红的AutoGPT,和之前ChatGPT那波AI又有何区别?

微博博主“木遥”便下场亲测了一下。

图源:微博博主“木遥”

他测试所用的题目是“给我解释LangChain怎么用”(LangChain是大型语言模型的一种应用框架)。

这个问题若是交给传统的GPT,由于LangChain这个概念太新,AI就会出现不知道怎么回答的情况。

若是交给“GPT+插件”这个组合来回答,那结果就会有点像Bing或者Bard。

但AutoGPT上手就不一样了,来欣赏一下它的执行过程

  • 首先试着直接去LangChain官网爬信息。
  • 被官网拒绝了,可能因为有屏蔽。
  • 发现失败了之后想了想,说要不Google一下?
  • Google出了很多结果。
  • 读了半天这些结果,说「现在我们已经搜集了不少有用的信息了,接下来让我们安装它玩一下」
  • 然后就开始动手在我的电脑上安装LangChain……

而博主“木遥”在这整个过程中所做的事情就是“坐在屏幕前看着这一切自动在我眼前发生”……

图源:微博博主“木遥”

然后这位博主不禁发出了感慨:

我要是有它这个行动力,三个PhD都念完了。

有类似自主能力的AI,还有最近同样火爆的AgentGPT

也是只需要给个任务,剩下的都交给它来完成:

用100美元的资金创建一个新的创业公司。

AgentGPT在接到这项任务之后,便开始了他的展示:

  • 思考中……
  • 添加任务:研究需要最少资金的低成本商业模式。
  • 添加任务:确定潜在的目标市场及其需求。
  • 添加任务:开发一个精简的MVP(最小可行产品),并在目标市场进行测试以验证需求。
  • 思考中……

然后AgentGPT先是输出执行“研究需要最少资金的低成本商业模式”的结果:

根据我的研究,一些需要最少资金的低成本商业模式包括: 1、Dropshipping:通过Dropshipping,你可以在网上销售产品而无须持有库存。您只需通过第三方供应商完成订单,第三方供应商将产品直接运送给您的客户。你可以从50美元开始支付网站托管和域名注册费。 2、 社交媒体营销:如果你有社交媒体营销的天赋,你可以通过帮助企业接触他们的目标受众来创办自己的代理公司。你所需要的只是一台电脑,互联网连接,以及一些社交媒体营销的经验和技能,而你的起价只有50美元或更少。 3、活动策划:如果你对组织活动有热情,你可以开始自己的活动策划业务。你可以从策划一些小活动开始,比如生日派对、婚礼等等。你可以从100美元开始,创建一个简单的网站,名片,并通过社交媒体营销自己。 4、自由写作:如果你有写作天赋,你可以开始自己的自由写作事业。你可以通过在线平台,如Upwork、Fiver和其他求职网站找到客户。只需50美元,你就可以创建一个投资组合网站,并通过社交媒体营销自己。 这些只是一些低成本的商业模式,你只需要100美元的资金就可以考虑。选择一个符合你的技能和兴趣的商业模式是很重要的。

到这还没有完,AgentGPT会继续开始它的工作:

  • 思考中……
  • 添加任务:针对每种已确定的低成本商业模式,对潜在的产品或服务想法进行头脑风暴。
  • 添加任务:评估每个想法的潜在盈利能力和可扩展性。
  • 添加任务:选择最有希望的想法,并开发精益MVP,用于目标市场的测试。

而后便是继续地再思考、执行。

再如BabyAGI,也只需给个目标和任务迭代次数,AI“唰唰唰”地便自己搞了起来:

而且已经有博主开始把AutoGPT当作自己的生产力工具了——做视频!

不少网友在看到AI们的如此表现之后,表示整个人都通透了:

怎么玩?

这么强的工具,真的不想亲自玩一下?

操作一点也不麻烦。

首先,准备好OpenAI API和PINECONE API的密钥(后者是专为AI长期内存开发的一个数据库,使用前者则会消耗你OpenAI帐户中的余额,免费版本送18美元)。

Python要求3.8版本及以上。

如果你需要语音输出,你也可以准备一个ElevenLabs API的。

Ps. 获取地址都放在文末链接中了。

接下来, 打开你的CLI工具下载AutoGPT项目:

git clone https://github.com/Torantulino/Auto-GPT.git

然后:

cd ‘Auto-GPT’ pip install -r requirements.txt

接着找到AutoGPT的根文件夹,将“.env.template”重命名为“.env”并打开。

再将密钥都替换为你准备好的那些。

最后,在终端运行:

python scripts/main.py

如果要使用语音模式,运行:

python scripts/main.py —speak

如果不能访问GPT-4,开启“gpt3only”模式:

python scripts/main.py —gpt3only

现在,你就可以开始搞你自己的AutoGPT项目了。

记住在AutoGPT的每个操作之后,输入“NEXT COMMAND”授权程序继续。

尽管项目也提供了不用这么麻烦的“连续模式”,最开始运行时用这个命令:

python scripts/main.py —continuous

但作者强烈不推荐!!因为它可能会导致你的AI一直运行下去或执行你正常根本不会授权的操作。

如果你非要试试,风险自负……

以及默认情况下,AutoGPT用DALL-e生成图像,要换Stable Diffusion的话,需要一个HuggingFace API的令牌。

本质是“套娃”

简单介绍一下AutoGPT的原理。

AutoGPT由于扩大了自己的应用范围,包括执行文件操作、网页浏览和数据检索等,有别于我们之前见过的所有AI(GitHub上已揽获3.6万+标星)。

如Mila研究所前AI研究员@Lior分析:

AutoGPT相当于给了基于GPT的模型一个内存和一个主体(body)。

具体来说:

AutoGPT的架构基于GPT-4和GPT-3.5,靠API连接;

AutoGPT可以进行自主迭代,即通过自我批判性审查来改进输出、在先前工作的基础上进行构建,并为了获得更准确的结果集成prompt历史记录;

AutoGPT具有内存管理,集成了Pinecone数据库,因此它可进行长期内存存储,保存上下文并基于此进行决策改进。

而在推特博主Jay Hack看来,AutoGPT等类似工具的出现,其实证明了智能的本质是“套娃”这件事儿

因为不论是AutoGPT还是BabyAGI,它们都是用LLM来递归地调用自己

这在AI领域最近可谓是个大趋势:

专业一点的话来说,这叫模型堆叠,即模型“一路向下”,去套用别的模型来拆解并解决任务。

用咱大白话来说,这就是“套娃”。

除了AutoGPT、BabyAGI这些,还有ViperGPT、SayCan和ToolKit等最新工具,以及前面微软发布的VisualGPT和HugginGPT,都差不多是这个思想。

再往前一些,初代DALL·E其实就是CLIP套VAE。

有意思的是,Jay Hack指出,有着“人工智能元老”之称的马文·明斯基早在1986年就把人类智能描述成有许多相互作用子系统的组织。

最后,Jay Hack也表示,正是因为“套娃”这种操作,我们的AI现在才得以拿下更为复杂的任务。而这,也就离通用人工智能更近一步。

确实,有不少网友都赞同:

AutoGPT可能就是AI领域中的下一大趋势。

面对如此强大的“套娃”工具们,一些人则开始哀嚎了:

参考链接:

[1]https://twitter.com/AlphaSignalAI/status/1645847165066006529 [2]https://twitter.com/karpathy/status/1642598890573819905 [3]https://weibo.com/1644684112/MBK3WCt8o [4]https://twitter.com/DataChaz/status/1645152577258962944

密钥获取地址:

https: //platform.openai.com/account/api-keys https://www.pinecone.io/ https://elevenlabs.io

—  —

想要进一步了解更多AIGC产品

就来看看这本书吧

▊《一本书读懂AIGC:ChatGPT、AI绘画、智能文明与生产力变革》

a15a 著

贾雪丽,0xAres,张炯 编

  • ChatGPT会让我们失业吗?这些AIGC工具能给我们的工作和生活带来什么变化?让你系统地了解什么是人们热议的AIGC!

本书以通俗易懂的方式从各个层面介绍了AIGC的基础知识,并辅以大量案例引领读者了解AIGC的应用实践,让读者可以更快速地利用AIGC改善工作和生活。

第1章从AI发展历史到资本市场近况阐述了AIGC产业的概况,第2章介绍了AIGC相关技术,第3章介绍了文本类AIGC技术的发展及其在传媒、教育、办公等场景中的应用,第4章介绍了声音类AIGC技术的发展及其在音乐、仿真等领域中的应用,第5章介绍了图片类AIGC技术的发展及其在图片生成、图片处理、图片识别等领域中的应用,第6章介绍了视频类AIGC技术的发展及其在视频生成、数字人等领域中的应用,第7章介绍了AIGC上下游产业链(包括芯片、VR等相关设备、元宇宙建模)的概况,第8章提出了AIGC对人类文明发展产生的影响,并对普通人如何应对AIGC带来的“生产力爆炸”提出方法论。

(粉丝专享5折,快快扫码抢购吧!)

ChatGPT相关图书请戳👇

书单 | 深扒ChatGPT核心技术,在AI浪潮中狂飙!

代码语言:javascript
复制
发布:刘恩惠审核:陈歆懿


如果喜欢本文欢迎 在看丨留言丨分享至朋友圈 三连
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-04-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 博文视点Broadview 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 金磊 丰色 发自 凹非寺 量子位 | 公众号 QbitAI
相关产品与服务
图片处理
图片处理(Image Processing,IP)是由腾讯云数据万象提供的丰富的图片处理服务,广泛应用于腾讯内部各产品。支持对腾讯云对象存储 COS 或第三方源的图片进行处理,提供基础处理能力(图片裁剪、转格式、缩放、打水印等)、图片瘦身能力(Guetzli 压缩、AVIF 转码压缩)、盲水印版权保护能力,同时支持先进的图像 AI 功能(图像增强、图像标签、图像评分、图像修复、商品抠图等),满足多种业务场景下的图片处理需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档