通用智能体,真的能干活了。
跟对话式的大模型比,能干活指的是:能分析、拆解任务,并逐步完成,按照你的要求输出。
扣子空间是字节推出的通用大模型,我给它布置了一个任务:生成类案检索报告,看看它完成的怎么样?
01准备一个明确、详细的任务
我让DeepSeek帮我设计一个类案检索的任务,直接把它复制给了扣子空间。
记住,一定要选规划模式,这样执行更加细致,当然工作时间也更长。
02规划
它会主动拆解任务,并规划执行步骤,形成计划。你觉得计划有纰漏,还可以直接改。
它将任务分解成4大步骤,8小步骤。
03
执行
接下来你就不用管了,该干啥干啥。扣子空间开始吭哧吭哧干活了。
这是它工作过程的展示:
工作过程中,形成的文件,也都能下载:
说实话,看它的执行过程,还挺爽的。就像别人在帮你干活,你躺在边上边喝茶边看着,妥妥包工头...
04
结果
大约执行了15分钟后,任务完成了,说实话这个效率还是很高的。
它按要求,给我生成了报告和表格,还额外生成了网页版的报告,部分展示如下:
这个效果很好,但是原本要求它产出的文件和表格,它做得如何呢?
报告本身是markdown格式的,内容和上面网页版的内容一样,比较丰富。但没有主动生成word格式,略显遗憾,有点偷懒。不过下次可以严格要求它生成word格式试试。
不过,最拉胯的还是没有按照我的要求生成表格,直接给了个空表格就完事了。
大家觉得它做得怎么样呢?