今天OpenAI上线了两款模型:o3 和 o4-mini,关于二者的区别直接看 o3 给的答案。
论可玩性感觉还是o3更好玩,会显示非常详细的推理步骤,集成了工具调用的能力还会思考,可以搜索、写代码来直接处理问题,再玩根据图片猜位置的游戏中,真的可以称得上图像识别领域的福尔摩斯。
o3的能力其实应该还可以很多值得探索的地方,先分享一个自己感觉有意思的应用——给出拍照建议,可以先给出一个全景的图片,然后让 o3 给出更好的拍摄建议。
下面就是分享的根据图片猜位置的详细案例,带着思考过程。知名景点基本可以非常准确的给出答案,对18线不知名的景点他也会调用各种工具尽力尝试,很多时候看着他的思考过程感觉到他确实是真的尽力了,有时候你稍微给他点提示他真的就能猜出来了。
另外提一句,今天豆包也更新了深度思考模式,同样具备多模态的推理能力,只可惜没有集成调用工具的能力,就差了点意思,对知名景点可以通过搜索比对给出答案,稍微偏门点就无能为力了,不过再搜索处理问题方面还是非常值得尝试的!
好了,就写这么多了,下面可以欣赏下o3的推理过程吧。