首页
学习
活动
专区
圈层
工具
发布

ChatGPT o3 图像识别领域的福尔摩斯!

今天OpenAI上线了两款模型:o3 和 o4-mini,关于二者的区别直接看 o3 给的答案。

论可玩性感觉还是o3更好玩,会显示非常详细的推理步骤,集成了工具调用的能力还会思考,可以搜索、写代码来直接处理问题,再玩根据图片猜位置的游戏中,真的可以称得上图像识别领域的福尔摩斯。

o3的能力其实应该还可以很多值得探索的地方,先分享一个自己感觉有意思的应用——给出拍照建议,可以先给出一个全景的图片,然后让 o3 给出更好的拍摄建议。

下面就是分享的根据图片猜位置的详细案例,带着思考过程。知名景点基本可以非常准确的给出答案,对18线不知名的景点他也会调用各种工具尽力尝试,很多时候看着他的思考过程感觉到他确实是真的尽力了,有时候你稍微给他点提示他真的就能猜出来了。

另外提一句,今天豆包也更新了深度思考模式,同样具备多模态的推理能力,只可惜没有集成调用工具的能力,就差了点意思,对知名景点可以通过搜索比对给出答案,稍微偏门点就无能为力了,不过再搜索处理问题方面还是非常值得尝试的!

好了,就写这么多了,下面可以欣赏下o3的推理过程吧。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OC0V_N3ZzrZwrPkxKqDle3OQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券