首页
学习
活动
专区
圈层
工具
发布

谷歌发布Gemini 3 数学能力堪称全球最强

站长之家(ChinaZ.com)11月19日 消息:谷歌正式推出其最新一代推理模型Gemini3.0Pro,并在Google AI Studio同步上线预览版,开放API接口,该模型还将陆续登陆谷歌旗下各类产品。

Gemini3.0Pro一经发布便在各大评测榜单上大放异彩。在LMArena大模型竞技场中,它以1501的Elo得分强势登顶榜首。在数学能力方面,谷歌公布的测试数据显示,Gemini3.0Pro堪称全球最强。在被称为“地狱难度”的数学竞赛基准MathArena中,当GPT -5.1等其他大模型成绩还在1%左右徘徊时,Gemini3.0Pro一举达到23.4%,优势显著。

编程能力上,Gemini3.0Pro虽在SWE - Bench上未取得SOTA成绩,但稳居第一梯队。在Live Code Bench中,其Elo得分突破2400分,在工具调用与终端操作基准测试中也排名第一。视觉理解能力更是令人惊叹,对屏幕截图的理解准确率高达72.7%,达到现有最先进水平的两倍,有望彻底重塑AI操作计算机的交互模式,让AI Agent不再是“视觉障碍者”。

谷歌还同期发布了自家的Agentic编程平台Google Antigravity,为技术发展再添助力。根据Model Card披露,Gemini3.0Pro在推理、多模态、Agent工具使用等关键基准测试中全面领先。

硬件层面,Gemini3.0Pro基于谷歌自研的张量处理单元(TPU)训练。TPU在处理大语言模型所需的大规模计算时速度比CPU更快,配备的大容量高带宽内存使其能够高效运行超大模型与批量数据。

在实际应用方面,最新发布的Gemini Agent实验功能已能自主执行多步骤复杂流程。例如,用户提出“整理一下我的收件箱”,它就能自动优先安排待办事项,并起草邮件回复供用户确认。

目前,Gemini3预览版正逐步开放。所有用户可通过Gemini应用使用;Google AI Pro与Ultra订阅用户可在搜索的AI模式中体验;开发者可通过Gemini API、Google Antigravity及Gemini CLI访问;企业用户则通过Vertex AI与Gemini Enterprise获取服务。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O61hrNWpXEhZjHqT4hE0qabw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券