研究了下,看到技术进步很震撼,对比差距很忧伤~
6号,谷歌官宣发布大模型Gemini。
根据谷歌博客,Gemini Ultra在LLM的32个广泛使用的评测基准的30个中,性能超过了当前最先进的结果,在多项基准中超越GPT-4。另外,在 MMLU(大规模多任务语言理解数据集)中的得分率高达 90.0%,首次超越了人类专家。
而且注意,Gemini是原生多模态大模型。
什么意思?Gemini可以泛化并无缝地理解、操作和组合不同类型的信息,比如文字、图片、视频、代码等,GPT-4目前还不支持视频输入。并且,无缝组合意味着,你可以用任何的方式去输入,然后要求任何方式的回答都可以。
比如,你输入一段文字或图片,要求生成一段视频。或者根据视频生成文字或图片,直接吊打市面上所有大模型!
为什么这么强呢?
Gemini 在设计时就支持多模态,从一开始便在不同模态上进行了预训练,就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习。内部人士称Gemini 有万亿参数,训练动用的算力是 GPT-4 的五倍。所以,它的能力在几乎每个领域都是最强的。
这相当于出生就赢在起跑线上了。
根据介绍,Gemini 包括三种量级:能力最强的Gemini Ultra,适用于多任务的Gemini Pro ,以及适用于特定任务和端侧的Gemini Nano。
现在应用最快的就是nano.
Gemini Nano已集成到谷歌最新的Pixel手机中。Pixel 8 Pro是目前唯一一款兼容Nano模型的手机,
什么场景呢(工号不凡价投2022)
一是,手机上的两项功能将由Gemini Nano支持,录音机应用中的自动摘要功能和Gboard键盘上的智能回复功能。这两项功能都可以离线运行。
二是,谷歌也在想办法将Nano模型整合到整个安卓系统中:谷歌推出了一项名为AICore的新系统服务,开发者可以利用这项服务将Gemini支持的功能引入自己的应用程序中。
安卓的护城河更宽了!未来硬件竞争将卷大模型能力了!
而且,在接下来的几个月中,Gemini 将陆续出现在谷歌更多的产品和服务中,包括搜索、广告、浏览器、办公软件等等。
对比起来,国内大模型一言难尽!
到现在发布了20多款大模型,头部的我几乎都体验过。说实话,说是能力对标ChatGPT3.5的,体验起来,更像是刷了测试题库,实际应用效果差太多。
随着人工智能的升级,未来商业靠线上打线下、低价打高价,可能能诞生巨头企业,但很难诞生微软、苹果这种划时代的企业了。
我们任重道远!
领取专属 10元无门槛券
私享最新 技术干货