Meta (原Facebook公司)花了 2000万美元训练出来的大模型,直接开源还可以商用,比 OpenAI Open多了,能力上也是直逼GPT-3.5,算不算王者?
https://ai.meta.com/llama/
在一众封闭的大模型中(ChatGPT、Claude、Bard等),Llama是个另类,本来Facebook在老板的带领下“All in 无宇宙”,谁知道元宇宙没折腾出来个东西,反倒开源的LLaMa犹如一记响雷,在AI界炸开了花,在开源界打响了名号。如果不是LLaMa的出现,AI迭代速度可能会慢很多。
为什么国外的团队搞了很久的AI大模型,国内创业几个月的团队就可以对外公测自己的大模型,难道他们是卷神?有开源底座做支撑,当然有这个底气。看一看这个列表,LLaMa 2的发布,不知道几家欢乐几家愁,或者是都在发愁?
图片来源于网络
上个月我看过一次也仅70多家,这次再看,已经突破百家,这研发速度真是快,直接备注自己是基于Llama的多达10几家。
Llama 2 同样是基于 Transformer 架构的语言模型,与 GPT-3.5 相比,Llama 2 家族包含多个模型规模,包括 70 亿、130 亿等多个版本,覆盖了不同的应用场景需求。Meta 公司(原名Facebook)表示,他们发布 Llama 2 的目的是为了推动 AI 技术的发展和普及,让更多的人可以使用和受益于这一技术。如若真的没有开源模型,当下的百模大战估计无从谈起,毕竟这个入场券不是人人都可以搞得到的!
即便你不懂技术参数,光看数字也能目测个一二。(B代表billion,十亿;Trillion,一万亿),相比 LLaMa1代有了显著的提升。
Llama2 在Huggingface AI社区部署了一个线上试用版,可以登陆来看看Llama2的效果,远比LLaMa强大,响应时间很快,关键是可以商用。不得不说这是一个巨大的进步,这又为多少企业或团队提供了强大的技术根基,不管有钱没钱,直接拉平了底层技能能力。
https://huggingface.co/chat
还配置了联网查询功能(并不是总凑效),但中文交互上差点意思,跟Claude早期类似,喜欢多语言夹杂着来说。
Llama 2 这块巨石被投入到湖中央,相信马上就会激起涟漪,甚至是波浪,一众模型升级至Llama 2已经在发生。大模型训练成本极高,开源可商用后,极大地降低了应用团队的研发投入,关键是产品能力很强劲,随着技术的迭代,到Llama 3时,很难想象将达到一个什么级别(超过 GPT-3.5 或者接近GPT-4 )。或者类似于其它开源产品,基本版开源可商用,高级版商用付费也说不准,也不排除Meta对标Google,将Llama打造成Android一样开源产品,风靡世界。
总之,你我都有了一个强劲的技术底座,不管大团队小团队,我们的技术能力又被拉到一个水平线了,至于这朵花开得有多艳,全凭自己发挥。
—扩 展 阅 读—