OpenAI 再次展现其技术实力,推出了全新的 GPT-4o mini 模型。这款模型不仅性能卓越,还将取代 GPT-3.5 成为 ChatGPT 的免费版本。GPT-4o mini 在多项测试中表现出色,尤其在 MMLU 测试中得分高达 82%,远超其他同级别小模型。
在定价方面,GPT-4o mini 十分亲民,每百万 Token 的输入和输出价格分别为 0.15 美元和 0.6 美元,比 GPT-3.5 Turbo 便宜超过 60%。这一定价策略使其成为更经济实惠的选择。
GPT-4o mini 具有 128K token 的大上下文窗口,非常适合进行检索增强生成(RAG)任务。目前,该模型在 API 中支持文本和图片输入,未来还将扩展至支持文本、图像、视频和音频的输入输出。
在各项性能测试中,GPT-4o mini 都展现出了优异的表现。在数学推理任务 MGSM 中得分 87.0%,在编码性能测试 HumanEval 中得分 87.2%,均大幅领先于 Gemini Flash 和 Claude Haiku 等竞品模型。此外,在多模态推理任务 MMMU 中,GPT-4o mini 也以 59.4% 的得分位居前列。
OpenAI CEO 奥特曼指出,大模型的价格在短短两年内暴跌了99%。他强调,如今的 GPT-4o mini 不仅性能远超两年前的顶级模型 GPT-3(text-davinci-003版本),价格更是只有当时的百分之一。
GPT-4o mini 不仅在性能上超越了 GPT-4,而且速度更快、价格更低,对于开发者来说又有很多应用可以做了。目前看起来,GPT-4o mini 也会成为构建 Agent 工作流的唯一选择。
博主宝玉用 GPT-4o mini 测试了一下 gptpdf,33 页 PDF 只花了 0.14 美元,相比其他多模态模型真的便宜太多了。相比之下,GPT-4o mini 的指令跟随要弱一些,有些地方应该直接显示图片,但是模型使用 OCR 生成了文本。
另外还测试了使用 GPT-4o mini 进行翻译,从翻译结果来看,这个效果非常好,直接用在生产环境丝毫没有问题。
如果你对如何动手做大模型应用感兴趣,可以了解一下 Agent 方向,推荐这本《大模型应用开发》一起动手做 AI Agent 应用。
动手从 0 到 1 做 AI Agent,包括 7 个实例,从自动化办公到多功能选择的引擎,从实现自动定价到智能调度库存,技术路线非常全面,代码清晰完整。
这本书豆瓣评分 7.8,适合对Agent技术感兴趣或致力于投身该领域的研究人员、开发人员、企业负责人,以及高等院校相关专业师生。
领取专属 10元无门槛券
私享最新 技术干货