Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >看过智谱现场演示,我觉得AI要开始卷“动手能力”了

看过智谱现场演示,我觉得AI要开始卷“动手能力”了

原创
作者头像
Alter聊科技
发布于 2025-03-31 10:37:21
发布于 2025-03-31 10:37:21
970
举报

2025年最热门的科技话题,大概率是AI Agent。

仅仅是几个KOL的评测文章,Manus就被捧上了神坛,邀请码被炒到上万元,淋漓尽致的诠释了用户对AI Agent的热忱。

产业界也出现了“2025年是AI Agent元年”的说法,认为AI将从被动响应走向主动规划和执行,乃至跨场景的复杂任务。

但对大多数人来说,在听到“AI Agent”的名词后,脑海中浮现出来问题的依然是:到底什么是AI Agent?

3月31日的智谱OpenDay上,智谱发布了最新的Agent产品——AutoGLM沉思。作为全球首个集深度研究与实际操作能力于一体的Agent,AutoGLM沉思能够像人一样深度研究和反思、像人一样感知世界、像人一样使用工具。

而且发布即上线,不需要邀请码即可使用,为无数用户打开了体验AI Agent“神奇能力”的大门。

01 现场接单写稿,AI Agent的“魔力”变现了

按照惯例,先来看下智谱官方给AutoGLM沉思的定义:“AutoGLM沉思是一个能探究开放式问题,并根据结果执行操作的自主智能体(AI Agent)。它能够模拟人类的思维过程,完成从数据检索、分析到生成报告。”

如果还是似懂非懂,别急,智谱还在发布会上进行了现场演示。

指令很简单:“帮我在网上赚点钱”。没有指定去什么平台,也没有说是什么方式,完全是一个开放问题。

然后,奇迹发生了。

AutoGLM沉思在网上搜索了相关信息,譬如问卷调研、有奖征稿以及一些赚佣金的网站,接下来思考自己擅长的能力,最终找到了《读者》的征稿需求,自动撰写了一篇题为《城市角落的温暖》的稿件,并将稿件以邮件的形式发送给了征稿指定的邮箱。

每一步都是AI通过连续、多步推理实现模型自主规划,并通过反思实现动态调整,不需要提前设计工作流。

坐在台下的我们心情比较复杂:惊讶的是,AutoGLM沉思居然可以流畅执行这种复杂的任务,而且是现场演示,压根没有作假的可能;兴奋的是,既然AI已经学会自己接单赚钱了,让我们看到了打造被动收入的机会;忐忑的是,AI的能力已经这么强了,猛然间有种深深的职业危机。

Manus走红的时候,外界的情绪也曾被点燃,更多的是因为网站上的demo视频,后续有不少真实评测出来,效果比预期中差了很多。智谱的现场演示,直接给出了更有说服力的“实战”案例。

没等到发布会结束,我们就赶紧下载了智谱清言PC客户端,打开“AutoGLM沉思”输入了需求:

帮我做一份苏州两日游攻略,要求:1、适合父母和孩子游玩,行程不能太累;2、推荐当地的美食和景点,最好去小红书上看下评论。

收到指令后,AutoGLM沉思先进行了深度思考,理解了问题里的需求,然后打开小红书输入关键词,逐一阅读了几篇热门内容,最后根据小红书上的信息,输出了一份3000多字的两日游攻略。

内容包含酒店推荐、景点介绍、推荐餐厅、交通信息等等,每个推荐的景点都提供了门票价格、开放时间、游玩时长、周边特色美食和游览建议,甚至还给出了亲子游的注意事项,比如行程安排要适中、哪些要准备的装备、景点要提前预约等,可以说既贴心又实用。

过程中无需操作,可以直接智谱清言的浏览器窗口最小化,就像是一个“活生生的助理”,也让我们对AI Agent有了更深刻的理解,用一句话来形容:AI有了动手执行的能力,可以一边想、一边干。

其中“动手执行”能力是AutoGLM沉思和Deep Research等产品最大的区别,能够像人类一样思考解答步骤,像人类一样打开并浏览网页,完成从数据检索、分析到生成报告,例如查看小红书、公众号、京东、知网、巨潮资讯等不对外开放API的优质信源。

需要说明的是,本次上线的是AutoGLM沉思的preview版本,场景集中在research相关,智谱将在两周内增加更多的Agent执行能力,包括推出“虚拟机”版本,进一步增强AI Agent的实际落地能力。

02 发布即上线,一场技术硬实力的较量

印象深刻的,还有智谱的“现货交付”。不像Manus需要邀请码才能体验,也不像Open AI的Deep Research需要付费,AutoGLM沉思发布即上线,人人都可以免费使用,并且不限制使用次数。

原因并不难解释。

首先是技术的自主性,直接关系到产品的研发模式和成本控制。

让市场“狂热”的Manus,被曝出整合了Deep Research、Artifacts和Operator的能力。争议点不在于是否有“套壳”的嫌疑,而是整合不同产品能力带来的成本提升,“单任务成本约2美元”。

AutoGLM沉思的不同在于:基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air、沉思模型GLM-Z1-Rumination、智能体框架,每一个环节都是智谱自主研发的,可以根据需求对模型进行强化训练,成本上也更加可控。

比如推理模型GLM-Z1-Air,是智谱基于扩展强化学习技术训练的新一代推理模型,面对复杂、开放问题,能够进行推理和反思,为Agent提供了强大的推理、规划与反思能力。性能比肩DeepSeek-R1,在速度提升最高8倍的同时,价格仅需DeepSeek-R1的1/30。

32B的基座模型GLM-4-Air-0414,在预训练阶段加入了更多的代码类、推理类数据,并在对齐阶段针对智能体能力进行了优化,模型在工具调用、联网搜索、代码等智能体任务上的能力得到大大加强。

在GLM-Z1-Air基础上通过强化学习训练的沉思模型GLM-Z1-Rumination,提升了模型结合工具使用完成长程推理的能力,打破了传统AI单纯依赖内部知识推理的局限,创新性地结合实时联网搜索、动态工具调用、深度分析和自我验证,能够在复杂任务中不断优化推理、反复验证与修正假设。

可以说,智谱技术自主的实力,撑起了AutoGLM沉思免费开放的底气。

其次是创新的连续性,创新不能被计划,也不会无缘无故爆发。

以往复盘Agent的进化历程时,外界习惯性以海外产品为标杆。

2023年7月问世的Code Interpreter,被视为工具使用的第一步;2024年6月底的Claude Artifacts,实现了从生成代码到图表的进化;2024年10月22日的Computer Use,代表了AI能像人类一样“看见”屏幕并操作计算机……

其实还有另外一个视角,即智谱的Agent布局。

第一阶段是工具使用和代码编写,标志性动作是智谱清言的Function Call能力;第二阶段是工具流编排,可以追溯到智谱清言在2024年初上线的GLMs;第三个阶段是设备操控和自主智能体,即2024年11月的智谱Agent OpenDay上推出的AutoGLM。

刚刚发布的AutoGLM沉思,正是基于智谱自研的推理模型GLM-Z1-Air训练的,融入了AutoGLM的动手操作能力,让AI Agent再次向前迈了一步:不仅能够思考,还能主动行动,实现“边想边干”的目标。

正是“一步一个脚印”的连续创新,才有了比较成熟的AutoGLM沉思,给深度思考赋予了动手操作的能力,复杂问题也能轻松回答,进而带来了更好、更快、更便宜的AI Agent体验。

技术世界的真相往往藏在热闹喧嚣之下,AI Agent不存在捷径,终归还是一场技术硬实力的较量。

03 AI Agent元年,从口号渐渐成为现实

点燃AI Agent革命,可能只需要一个爆款产品;AI Agent在产业端星火燎原,则离不开协同进化的生态体系。

在智谱清言PC客户端上,“AutoGLM沉思”已经展示了不少使用用例,包括学术、新闻、金融资讯、旅游、穿搭、提醒等等,用一句话来概括:“你只需要把任务交给AI,它就能自己完成工作,AI真的能帮人类做事了。”

从只能输出答案的Chatbot,到自主决策、使用工具的Agent,对用户价值的提升是指数级的,“动手能力”将成为AI分水岭。

特别是测试了AutoGLM沉思在更多场景下的表现后,我们更加确信:所谓的“AI Agent元年”绝非是一句口号,正渐渐成现实。

之所以给出这样的判断,不单单是AutoGLM沉思的出色表现,还在于一个和开源有关的计划:基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air、沉思模型GLM-Z1-Rumination等,都将在4月14日正式开源,并且相关模型会在两周内陆续上线Maas平台(bigmodel.cn)。

DeepSeek的开源,加速了深度推理的产业落地,智谱自研Agent模型矩阵的开源开放,势必会催生AI Agent的应用浪潮。

一方面,开源打通了千行万业通向AI Agent的路。

以往开发者构建一款智能体,需要从不同来源拼凑各种底层API,不仅耗时耗力,任何一个环节出错都可能让应用崩盘。智谱的全栈开源,直接简化了AI Agent的逻辑、编排和交互,想要打造AI Agent的开发者,可以直接调用智谱的基座模型、推理模型和沉思模型,使用现成的智能体框架低成本打造Agent应用。

另一方面,AI Agent的商业化可行性已经被验证。

影响新技术产业进程的因素,可以归结为能力、成本和可控性。就实际体验效果来看,智谱的Agent能力无需赘述;相较于国外动辄十几元的单次任务成本,智谱给出了超高性价比的选项,甚至可以跑在消费级显卡上;至于可控性,智谱的全栈自研、全面开源以及国产算力可用,几乎满足了“自主可控”的所用硬性要求。

可以佐证的是,智谱已经进阶为Agentic平台和生态级玩家,一边持续探索“自主智能体”的下一个阶段,一边帮助生态伙伴打造基于行业、地域和场景的智能体应用,目前已经开始携手金融、教育、医疗、政务、企服等领域的合作伙伴,共同推进Agentic LLM的落地应用,并相继与北京、杭州、上海、成都、珠海等城市达成合作,与当地龙头企业携手推动当地大模型应用生态的建设。

做一个预判的话:2025年或将是千行万业的Agentic LLM时刻,机器人、汽车、PC、智能眼镜、银行、政务等都将积极拥抱AI Agent。

比如方兴未艾的人形机器人赛道,比拼的将不单单是跳舞、后空翻等运动控制能力,能否在AI Agent的赋能下,帮助用户解决实际问题,产生实实在在的生产力,将是人形机器人行业的下一个胜负手。

04 写在最后

2025年以前,AI行业卷的是思考能力,赛点是谁能打造出更强大的模型、更复杂的聊天机器人;2025年以后,AI行业开始卷“动手能力”,赛点转移到了推理、多模态、记忆、工具等全栈技术。

智谱AutoGLM沉思的“出场”,不单单刷新了AI Agent体验的上限,还通过开源抹平了千行万业走向AI Agent的技术鸿沟,改写了AI产业的技术路径,让我们看到了AGI跃迁而生的第一道曙光。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
我们来看一个非常经典的案例:只需要输出你想讨论的话题,AI 就能自动去小红书、知乎等平台上深度查询、总结完整报告,并转化为面向大众的传播内容。短短 14 天里,AI 孵化出了一个 5000 多个粉丝的小红书账号,还接到了商单。
机器之心
2025/04/01
1990
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
比 R1 快 8 倍、价格仅 3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有 Scaling Law
刚刚,智谱推出最新的 AutoGLM 沉思模型,不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator)。并且,这个会“边想边干”的智能体还能自己接单赚到钱。
深度学习与Python
2025/04/05
1310
比 R1 快 8 倍、价格仅 3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有 Scaling Law
AutoGLM沉思:像人一样的深度思考+动手执行,让复杂问题迎刃而解,而且全免费
如果你是一个自媒体博主,你是否遇到这样的情况,因为白天上班工作忙,晚上下班还要勤勤恳恳的去运营自己的账号,一天的劳累已经让你冒火星子?
AIGC新知
2025/04/01
2890
AutoGLM沉思:像人一样的深度思考+动手执行,让复杂问题迎刃而解,而且全免费
智谱 GLM 新成员开源:高性能、推理快,体验入口“z.ai”免费开放
继智谱在上个月发布了他们的AutoGLM沉思全新智能体,在AI圈子引起广泛的反向,很多人纷纷使用AutoGLM沉思去完成自己工作中的一些任务,如写研究报告、行业调研等等。
AIGC新知
2025/04/16
2300
智谱 GLM 新成员开源:高性能、推理快,体验入口“z.ai”免费开放
智谱发布AutoGLM沉思版,国产DeepResearch来了,人人皆免费。
说真的,即使玩过了这么多的DeepResearch产品,我也没想到,他们能扔出个这么个有趣的玩意。
数字生命卡兹克
2025/04/14
1680
智谱发布AutoGLM沉思版,国产DeepResearch来了,人人皆免费。
考研数学得126分、还能编写小游戏,智谱首个推理模型来了,人人免费用
2024 年的最后一天,智谱 GLM 模型家族迎来了一位新成员——GLM-Zero 的初代版本 GLM-Zero-Preview,主打深度思考与推理。
机器之心
2025/02/03
1210
考研数学得126分、还能编写小游戏,智谱首个推理模型来了,人人免费用
又一AI利器!智谱发布全新推理大模型,速度快8倍,价格比DeepSeek-R1更低~
现在的大模型多如牛毛,LLaMA、Qwen、Bert等等,根本学不过来,甚至有的卷王还看Transform源码,这对于一般人来说学习曲线太长了。
派大星的数据屋
2025/04/18
840
又一AI利器!智谱发布全新推理大模型,速度快8倍,价格比DeepSeek-R1更低~
AI现场发了2万红包,打开了大模型Act时代
最近一段时间,大模型领域正在经历智能体(AI Agent)引发的革命。Anthropic 推出的升级版 Claude 3.5 Sonnet,一经推出即引爆了 AI 圈。
机器之心
2025/02/14
930
AI现场发了2万红包,打开了大模型Act时代
智谱Agent抢跑OpenAI,GLM-PC一句话搞定一切!网友:有AGI那味了
想象这样一个场景:微信上给xxx发送祝福语,再给他发送一个新春图片和一个新春祝贺视频。
新智元
2025/02/15
680
智谱Agent抢跑OpenAI,GLM-PC一句话搞定一切!网友:有AGI那味了
智谱AI全新发布Agent家族,用AI操控一切不再是梦了。
甚至,还抢到了AI给大家发出的200元红包,只能说,谢谢AutoGLM,谢谢老板。
数字生命卡兹克
2025/04/14
850
智谱AI全新发布Agent家族,用AI操控一切不再是梦了。
智谱AI深夜上线全新Agent GLM-PC,再见仍是巅峰。
2024年10月25日,智谱在CNCC发布了第一款手机自主人工智能,AutoGLM,直接在行业内和金融市场上掀起了风暴。
数字生命卡兹克
2025/04/14
650
智谱AI深夜上线全新Agent GLM-PC,再见仍是巅峰。
AutoGLM的一小步,人机交互进化的一大步
55年前,左脚刚刚踏上月球的阿姆斯特朗,说了一句简单的话:“这是个人的一小步,却是人类的一大步。”
Alter聊科技
2024/11/29
1680
AutoGLM的一小步,人机交互进化的一大步
智谱AI推出GLM-4,性能逼近ChatGPT-4
随着人工智能技术的持续发展,神经网络的参数数量已经从Alexnet的6000万个增长到OpenAI GPT-3的1750亿个,人工智能已进入大模型时代。ChatGPT、GLM-4、Claude3等大模型不断涌现,本文将详细介绍智谱AI所推出的GLM-4大模型,分析其背景、性能、应用等。
存内计算开发者
2024/06/14
6851
智谱AI推出GLM-4,性能逼近ChatGPT-4
智谱开源AI绘图CogView4,曾经的开源之光回来了。
上周DeepSeek连续5天开源硬核技术,阿里开源万相2.1,Qwen的推理模型推出预览版,但是肯定马上也要开源。
数字生命卡兹克
2025/04/14
800
智谱开源AI绘图CogView4,曾经的开源之光回来了。
智谱AI:国产全自研大模型商业化落地新解法
放眼当下的科技浪潮,AI大模型无疑是一年多来持续引人注目的焦点。基于大模型的算法推理,30秒即可生成完美可用的Word、PPT文档,工作时长不必再以小时计算;真人对话一般输入简短文字,就能在30秒内得到想要的图画、代码、文本、视频……大模型让科幻小说中的场景,走进了千行百业、千家万户的现实生活。
大数据文摘
2024/03/21
8610
智谱AI:国产全自研大模型商业化落地新解法
跟大厂拼价格到底!智谱 AI 宣布模型全面降价,刘慈欣、AI 老罗线上“整活儿
“大模型的 Scaling Law 并未失效,AI 技术的增长进入了一个全新的阶段。也就是说大模型技术的创新依旧是突飞猛进的进行时,甚至还有速度越来越快的迹象。”智谱 AI CEO 张鹏在 6 月 5 日的 Open Day 上说道。
深度学习与Python
2024/06/17
2110
跟大厂拼价格到底!智谱 AI 宣布模型全面降价,刘慈欣、AI 老罗线上“整活儿
【AGI-Eval行业动态 NO.7】一文读懂Agent,或是AI下一程主角?
最近一段时间,Agent 可以说是毫无争议的 AI 领域顶流话题,在搜索平台随便输入 Agent,满眼都是 “爆火”“刷屏”“重磅” 这样的字眼。2025年初以来,从阿里发布的 Qwen-Agent 框架,到OpenAI 发布的 AI 智能体 Operator ,再到 Manus 的出圈,无一不让人感受到 Agent 发展的迅猛势头。
AGI-Eval评测社区
2025/04/01
870
【AGI-Eval行业动态 NO.7】一文读懂Agent,或是AI下一程主角?
用行动回应“实体清单”,智谱发布了一系列新模型
1月15日晚间,美国商务部工业和安全局(BIS)修订了《出口管制条例》(EAR),以安全为由在实体清单中分两批增加了25个中国实体。
Alter聊科技
2025/01/16
1570
用行动回应“实体清单”,智谱发布了一系列新模型
智谱AI悄悄发布AutoGLM,这一次,贾维斯真的要成现实了。
他们发了一个AGI进程图,最好玩的还是用了《银河系漫游指南》里面那个终极答案42当了一个梗,而这个AGI进程图其实就是对标的人脑,而AutoGLM,就是AI,使用工具的能力。
数字生命卡兹克
2025/04/14
660
智谱AI悄悄发布AutoGLM,这一次,贾维斯真的要成现实了。
推理模型的“年终考试”,谁是国内目前最好的“o1”?
思考是文明存在的根本,是人类探索未知的永恒追求,现在也成了大模型技术演进的一个重要方向。
Alter聊科技
2024/12/31
1410
推荐阅读
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
1990
比 R1 快 8 倍、价格仅 3%,智谱新推理模型来袭,能让免费智能体自己赚钱!张鹏:Agent 也有 Scaling Law
1310
AutoGLM沉思:像人一样的深度思考+动手执行,让复杂问题迎刃而解,而且全免费
2890
智谱 GLM 新成员开源:高性能、推理快,体验入口“z.ai”免费开放
2300
智谱发布AutoGLM沉思版,国产DeepResearch来了,人人皆免费。
1680
考研数学得126分、还能编写小游戏,智谱首个推理模型来了,人人免费用
1210
又一AI利器!智谱发布全新推理大模型,速度快8倍,价格比DeepSeek-R1更低~
840
AI现场发了2万红包,打开了大模型Act时代
930
智谱Agent抢跑OpenAI,GLM-PC一句话搞定一切!网友:有AGI那味了
680
智谱AI全新发布Agent家族,用AI操控一切不再是梦了。
850
智谱AI深夜上线全新Agent GLM-PC,再见仍是巅峰。
650
AutoGLM的一小步,人机交互进化的一大步
1680
智谱AI推出GLM-4,性能逼近ChatGPT-4
6851
智谱开源AI绘图CogView4,曾经的开源之光回来了。
800
智谱AI:国产全自研大模型商业化落地新解法
8610
跟大厂拼价格到底!智谱 AI 宣布模型全面降价,刘慈欣、AI 老罗线上“整活儿
2110
【AGI-Eval行业动态 NO.7】一文读懂Agent,或是AI下一程主角?
870
用行动回应“实体清单”,智谱发布了一系列新模型
1570
智谱AI悄悄发布AutoGLM,这一次,贾维斯真的要成现实了。
660
推理模型的“年终考试”,谁是国内目前最好的“o1”?
1410
相关推荐
第一个免费可用的智能Agent产品全量上线,中国公司智谱打造,推理模型比肩R1
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档