“人工智能代理”一词在下半年成为一个流行词。人工智能代理是一个程序或系统,可以感知其环境、推理、将给定任务分解为一组步骤、做出决策并采取行动。像人类一样自主地完成这些特定任务的行动。
语言理解的终极意味着人类可以通过自然语言界面与人工智能程序进行对话、指导和互动。但人工智能程序除了帮助和回答与信息任务相关的问题(例如搜索、提取或生成代码和/或图像)之外还能做更多的事情吗?
人工智能代理能否扩大当今需要更多人工干预的任务自动化领域以及需要高层次思考、推理和解决问题的认知任务?例如,执行市场分析、风险评估和投资组合优化等任务。或者,执行迄今为止由于复杂性或成本而不太可能自动化的复杂任务。当今人工智能代理/技术承担显着提高业务生产力和人机界面的任务的能力主要因为有经济价所值驱动。
早期的研究尝试围绕数学相关活动、思想链/图和基于LLM的多步骤推理框架来展示自动化复杂任务的能力。这些早期的预言远未达到构建完全自主的信息代理应用程序所需的目标,但它们展示了可能性的潜力。
下显示了一种架构,该架构提供了一种通用范式,该范式结合了推理和行动的进步以及围绕该范式的早期工作,例如“思想链”,以解决各种语言推理和决策任务。这种推理和行动与语言模型的耦合使这些程序能够执行决策任务。这种范式被称为“ReAct”。
人工智能代理可以协助数据任务的自动化,例如数据分析、BI 仪表板开发、流程优化、数据输入、调度或基本客户支持。他们还可以自动化整个工作流程,例如供应链优化和库存管理。下面描述人工智能代理所采取的步骤,使用户能够通过动态创建想法/计划并调整行动计划来动态执行推理任务,同时还可以与外部交互将附加信息合并到推理中。
该流程的第一步是选择一个任务,并提示LLM将一个问题分解为一堆想法(子提示)。
步骤2、3、4,进一步使LLM能够打破这些一堆想法,并思考和推理出这些子想法。
第 5 步到第 8 步使 LLM 能够进行外部交互,例如根据完成想法/任务所需的信息提取信息。
自由形式的思想/行动集成用于实现不同的任务,例如分解问题、提取信息、执行常识/算术推理、指导搜索制定和综合最终答案。
人工智能信息代理是一种趋势,这可能会持续多年;预计 2024 年将在代理基础设施/工具以及早期采用方面取得重大进展。需要指出的是,我们如何理解当前人工智能架构承担更复杂任务的潜力,很大程度上仍然取决于潜力,而且还有很多未解决的问题。
尽管如此,企业必须以一种实用的方法来构建代理应用程序,并期望在某种程度上,与当前人工智能技术的差距将呈现出越来越复杂的自动化,而且这种差距可能会逐年缩小。它还必须考虑未来 12 个月内各个用例可能实现的自动化程度。此类项目的进化路径/旅程可能会通过此类努力取得更好的成功。
领取专属 10元无门槛券
私享最新 技术干货