当地时间1月23日,OpenAI推出自主智能体“Operator”的研究预览版。
据OpenAI介绍,Operator具备像人类一样使用按钮、浏览菜单和填写网页表格的能力,并能自动完成预订旅行住宿、餐厅和在线购物等任务。
该智能体的核心是其新研发的“计算机使用智能体”(CUA)模型,该模型结合了GPT-4o的视觉能力和强化学习的高级推理能力。CUA经过训练后,可以像人类一样与图形用户界面(GUI)进行交互,包括按钮、菜单和文本框,使其能够灵活执行各种数字任务,无需依赖特定操作系统或网页API。
目前,这一功能仅在美国向OpenAI每月200美元的ChatGPT Pro级别订阅用户开放。OpenAI计划未来将此功能推广给Plus、Team和Enterprise级别的更多用户。
OpenAI还与Instacart、Uber、eBay、Priceline、OpenTable和Etsy等科技公司合作,使用户能更方便地在Operator主页上访问这些公司的网页。
尽管AI智能体具有巨大的潜力,但其易用性仍面临挑战。目前市场上已发布的智能体虽然承诺能够节省时间和提高效率,但尚未被大多数人广泛使用。
例如,苹果去年在iPhone操作系统中推出了人工智能助手Apple Intelligence,但这一工具目前尚未在日常事务中得到广泛应用。同样,大多数企业也仅将AI智能体用于测试或以有限的方式使用,以避免泄露公司机密数据或引发网络安全风险。
领取专属 10元无门槛券
私享最新 技术干货