谷歌最新多模态大模型 Gemini刷爆朋友圈,Gemini 和 GPT 4到底谁更强大?
今天一早朋友圈集体刷屏,谷歌CEO在官网联合发布,推出号称最大、最强的AI大模型Gemini,推出了三个版本:
Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务
Gemini Pro:可扩展至各种任务的Gemini模型
Gemini Nano:适用于端侧设备的高效Gemini版本
并且配上了测试的视频,
它可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。感觉人类即将进入另外一个纪元,正如谷歌官网所述:欢迎来到Gemini 时代!
Gemini 测试
Gemini环境理解能力怎么样?下面是中文测试
Gemini还可以把轻松的图片变成代码,下面是具体测试
其实官网还放了一个示例,就是它可以根据不同类型的输入生成适合的代码,这对我们技术人来说可是太赞了!
这个示例展示的是一个视频,操作者要求Gemini根据这个视频来生成demo,Gemini回复说根据这个视频展示生成了集群模拟程序,并附上了代码和代码生成的模拟demo
后面还有一个识别音乐谱的示例,Gemini甚至可以根据一部分乐谱图来推理使用的是什么音符,音乐的风格、演奏时的注意事项
谷歌官方给出了很多数据,说明Gemini到底多强大,这里我只引用官方的一个结论:
Gemini Ultra 的得分率为 90.0%,是第一个在 MMLU(大规模多任务语言理解)测试中超过人类专家的模型,MMLU 综合使用了数学、物理、历史、法律、医学和伦理等 57 个科目,用于测试世界知识和解决问题的能力。
可以说,AI的理解、逻辑推理学习能力已经接近并即将超过人类,一个新的AI时代就在眼前!
Gemini vs. GPT 4
Gemini 和 ChatGPT 4到底谁更强大?
我看了一些大佬的分析和测试,结论大致如下,供参考:
Gemini ultra 版本性能最强,应该略强于 GPT 4。但是还没发布,现在正在做安全检测保证其安全,大约会在明年早些时间开放,届时Google Bard会融合进去,变成Bard Advanced
Gemini Pro是这次发布的版本,水平和ChatGPT 3.5差不多。从今天起,谷歌的聊天机器人Bard将由Gemini Pro微调版本驱动。
Gemini nano性能递减,主要针对端侧设备做适配,将会在Google pixel手机上率先使用。Pixel 8 Pro将是第一款运行Gemini Nano的智能手机(果然最终还是要带动手机销量啊)。
结论
昨晚直播我刚刚和大家分享要拥抱新技术,拥抱大模型,“大模型趋势已定:接受它、使用它、爱上它”,这么快就应验了,没啥说了,just do it!
领取专属 10元无门槛券
私享最新 技术干货