首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAi 与Gemini 算法模型谁更厉害?

OpenAi 与Gemini 算法模型谁更厉害?

其实很难简单地说OpenAI与Gemini算法模型谁更厉害,从我们能了解到的几个方面的具体数据和表现来看:

推理能力

OpenAI O3:在AIME2024数学竞赛中,O3拿到了96.7%的正确率,比O1高出了13.4%;在软件工程SWE-benchverified基准测试中,代码性能从O1的48.9%涨到了71.7%;在ARC-AGI基准测试中,O3的得分接近人类水平。

Gemini 2.0:目前没有Gemini 2.0在这些数学和软件工程基准测试中的对应数据,但Gemini 2.0 Flash在Chatbotarena评估里拿到第一,显示出其强大的综合推理实力。

多模态能力

OpenAI:GPT-4引入了视觉输入能力,能处理和基于视觉信息生成响应,但整体多模态功能的广度和深度可能不如Gemini。

Gemini:Gemini从一开始就是多模态模型,可归纳并流畅地理解、操作以及组合文本、代码、音频、图像和视频等不同类型的信息。在新的大规模多学科多模态理解(MMMU)基准测试中,Gemini Ultra取得了59.4%的成绩,而GPT-4V在该测试中为56.8%。

语言理解与生成

OpenAI:ChatGPT在自然语言处理方面表现出色,如在认知 reflection test中,能给出正确答案且解释清晰,在自然语言理解和处理复杂语言方面有优势。

Gemini:Gemini Ultra在大规模多任务语言理解(MMLU)测试中得分率高达90.0%,是第一个超过人类专家的模型,在语言理解上展现了强大实力。

编程能力

OpenAI O3:在软件工程的代码性能上有较大提升,从O1的48.9%涨到了71.7%,在编程辅助场景中能帮助开发者快速理解和完成代码编写、解决逻辑错误。

Gemini:Gemini Ultra在多个编码基准测试中表现出色,包括HumanEval和Natural2Code等,还能作为更高级编码系统AlphaCode 2的引擎,解决需要复杂数学和理论计算机科学知识的竞赛性编程问题。

只能说各有千秋,不过选择OpenAI可能更加稳,不管是目前得到的信息,还是个人的使用体验。openai作为标杆的大模型的公司,这个模型能力不会差到哪里去。至少从目前我们知道的信息还是处于领先的地位。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OBq0FWJdSeGrnhC1Qolfs6nQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券