首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ChatGPT新版本来了,引入图像和语音,更强的多模态交互能力

9月25日,OpenAI发布了新版本的ChatGPT,允许用户通过语音、图像的方式,与ChatGPT进行互动。

OpenAI展示了一个例子。

用户给它发送了一张自行车照片,问它「如何调整座椅高度」,ChatGPT给出了相关的操作步骤,提到要找到对应的快拆杆,需要什么工具等等;然后用户又发送了一张自行车座椅局部的照片,问图中的零件是快拆杆吗?ChatGPT回答不是,然后告诉用户使用什么样的工具,如何操作这个零件,调整座椅高度。

更厉害的来了,用户给ChatGPT发送了自己工具箱的照片,询问ChatGPT,工具箱里有他所需的工具吗?ChatGPT看了一眼照片回答道,用户所需的工具就在工具箱的什么什么位置。

毫不夸张的说,这样多模态的分析、交互能力已经超越了很多AI工具,进一步扩大了ChatGPT的应用范围。

另外在语音方面,像很多儿童陪伴机器人一样,ChatGPT可以给孩子讲睡前故事,了但不同的是,他可以根据故事内容,回答孩子提出的问题,交互能力、理解能力会更强,而且OpenAI为此请来了五名专业配音人士,提供了五种不同的声音选择。

未来两周,这些能力会提供给ChatGPT的付费用户。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OVw2JfTrMFRqrzMEmsKhPI5Q0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券