碾压ChatGPT，谷歌大模型发布！

文章来源：企鹅号 - 李不凡投资笔记

研究了下，看到技术进步很震撼，对比差距很忧伤~

6号，谷歌官宣发布大模型Gemini。

根据谷歌博客，Gemini Ultra在LLM的32个广泛使用的评测基准的30个中，性能超过了当前最先进的结果，在多项基准中超越GPT-4。另外，在 MMLU（大规模多任务语言理解数据集）中的得分率高达 90.0%，首次超越了人类专家。

而且注意，Gemini是原生多模态大模型。

什么意思？Gemini可以泛化并无缝地理解、操作和组合不同类型的信息，比如文字、图片、视频、代码等，GPT-4目前还不支持视频输入。并且，无缝组合意味着，你可以用任何的方式去输入，然后要求任何方式的回答都可以。

比如，你输入一段文字或图片，要求生成一段视频。或者根据视频生成文字或图片，直接吊打市面上所有大模型！

为什么这么强呢？

Gemini 在设计时就支持多模态，从一开始便在不同模态上进行了预训练，就像人一样，它不仅从文本中学习，还能通过视频、音频和代码进行学习。内部人士称Gemini 有万亿参数，训练动用的算力是 GPT-4 的五倍。所以，它的能力在几乎每个领域都是最强的。

这相当于出生就赢在起跑线上了。

根据介绍，Gemini 包括三种量级：能力最强的Gemini Ultra，适用于多任务的Gemini Pro ，以及适用于特定任务和端侧的Gemini Nano。

现在应用最快的就是nano.

Gemini Nano已集成到谷歌最新的Pixel手机中。Pixel 8 Pro是目前唯一一款兼容Nano模型的手机，

什么场景呢（工号不凡价投2022）

一是，手机上的两项功能将由Gemini Nano支持，录音机应用中的自动摘要功能和Gboard键盘上的智能回复功能。这两项功能都可以离线运行。

二是，谷歌也在想办法将Nano模型整合到整个安卓系统中：谷歌推出了一项名为AICore的新系统服务，开发者可以利用这项服务将Gemini支持的功能引入自己的应用程序中。

安卓的护城河更宽了！未来硬件竞争将卷大模型能力了！

而且，在接下来的几个月中，Gemini 将陆续出现在谷歌更多的产品和服务中，包括搜索、广告、浏览器、办公软件等等。

对比起来，国内大模型一言难尽！

到现在发布了20多款大模型，头部的我几乎都体验过。说实话，说是能力对标ChatGPT3.5的，体验起来，更像是刷了测试题库，实际应用效果差太多。

随着人工智能的升级，未来商业靠线上打线下、低价打高价，可能能诞生巨头企业，但很难诞生微软、苹果这种划时代的企业了。

我们任重道远！

相关快讯