首先插播“本台刚刚收到的消息”:通义万相刚刚宣布开源2.1版本的首尾帧生视频模型!(开源!)
photo by DALL·E3
今天OpenAI上线了两款全新模型:o3和o4-mini,分别对应顶级推理能力与轻量级高效部署,代表了AI模型在“理解、决策、协作”方向的又一次重大飞跃。从各项表现来看,这两位“新成员”再次刷新了AI的天花板。
🧩更聪明的 o3:不仅是AI,更像是你的专家搭档
o3不只是更强,它还更“会思考”。在Codeforces、SWE-bench、MMMU等硬核测试中拿下新纪录,尤其在编程、商业咨询、创意生成方面表现惊艳。它能处理复杂图像推理任务(比如分析图表、草图、照片),甚至能像人一样提出创新假设,评估解决路径,已经具备部分“专家系统”的能力。
而且对话风格更自然,首次引入“记忆引用”机制,让回答更贴合上下文,实现个性化、连贯的交互体验。
🪶更轻快的 o4-mini:小体积,大能量
相比之下,o4-mini走的是“高性价比”路线。在数学竞赛 AIME 2025 中,用 Python工具辅助后得分高达99.5%。它虽然是轻量模型,但在非STEM类任务(语言处理、运营分析、教育客服等)表现甚至超过了之前的 o3-mini,特别适合高频调用场景。
AI进入“主动思考”阶段,我们离“AI搭档”越来越近了。如果说 GPT-4 是“听话”的助手,那 o3 已经开始像个有想法的“合伙人”——它不光执行,还会思考、判断、选择最优解法。随着记忆、工具调用、推理能力的持续进化,我们正逐步迎来“AI搭档”的新时代:它不仅能帮你做事,还能和你一起思考。
photo by DALL·E3
本文写于2025年4月17日
连续日更的第381天,第406篇
⬆️关注我,一起在AI前沿探索⬆️
领取专属 10元无门槛券
私享最新 技术干货