前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >马斯克的"还不错",让Meta的Llama 3 AI成为焦点

马斯克的"还不错",让Meta的Llama 3 AI成为焦点

作者头像
程序员吾真本
发布2024-04-20 09:11:48
1310
发布2024-04-20 09:11:48
举报
文章被收录于专栏:程序员吾真本程序员吾真本

前两天,科技新闻网站VentureBeat放出了Michael Nuñez的一篇“埃隆·马斯克对Meta的Llama 3 AI的‘还不错’评价引发关注”的文章。

文章里对Meta的Llama 3 AI给出了很高的评价。来,我们瞅瞅文章说了啥。

大家都知道,埃隆·马斯克是那种你很难打动他的人。

这位特斯拉和SpaceX的老板,以他的坚持不懈、超高的标准和打破炒作的习惯而出名。

所以,当马斯克在X.com(前身为Twitter)上对Meta的最新人工智能模型发表评论时,所有人都在看。

他的评价是“还不错”。

这三个字可能听起来普普通通,但从马斯克那里来说,绝对意味着大事。

Meta的新语言模型,被称为Llama 3,显然引起了硅谷最挑剔和最苛刻的人物的注意。这也不奇怪。

今天,Llama 3以开源形式发布,这对于Meta的AI雄心来说是一个重大的飞跃。

这个模型有80亿和700亿参数两个版本。

它在一个定制构建的2.4万个GPU的集群上,使用了15万亿个数据令牌进行训练。

训练出来的结果是一个能与世界上最好的语言模型抗衡的系统,它能以惊人的流畅性和连贯性生成类人的文本。

还不错— Elon Musk (@elonmusk) 2024年4月18日

策略上的高招

但Llama 3不只是一个技术成就——它也是一个策略上的高招。通过开源这个模型,Meta正在将自己置于AI世界中一个日益浮现的透明度和协作运动的前沿。

近几个月来,像Stable Diffusion和LAION这样的项目展示了开放数据和开放模型在推动机器学习快速进步方面的力量。

现在,有了Llama 3,Meta正在打赌,AI的未来并不在于专有的黑盒子,而在于开放的生态系统,在这些系统中,研究人员和开发人员可以自由地分享和建立彼此的工作。

这个举动并没有被AI社区忽视。Andrej Karpathy,特斯拉AI前主管,OpenAI的GPT模型开发的关键人物,对Llama 3赞不绝口。

他在X.com上发贴称:“超级欢迎!Llama 3是Meta发布的一个看起来非常有能力的模型。坚持基础性工作,花大量的优质时间在坚实的系统和数据工作上,探索长时间训练模型的极限。”

Karpathy的认可在AI世界也有分量。

作为大型语言模型的先驱之一,他对于什么能区分真正的突破性和仅仅是增量的有敏锐的眼光。

他对Llama 3的兴奋表明,Meta确实实现了一些非凡的事情——一个推动了当前技术和架构可能性边界的模型。

祝贺@AIatMeta发布Llama 3! 注意: 发布了80亿和700亿个参数的(基础和微调)模型,他们在自己的模型类别中表现强劲(但我们会看到排名在@lmsysorg:)) 4000亿个参数的模型仍在训练,但已经不容小觑…— Andrej Karpathy (@karpathy) 2024年4月18日

AI霸主之战

但Llama 3不只是一个研究项目。它也是Meta将AI能力嵌入其庞大的应用和服务生态系统战略的关键部分。

这个模型将为一个新的虚拟助手提供动力,这个助手承诺将成为最先进的虚拟助手产品,可以无缝集成到Facebook、Instagram、WhatsApp和Messenger。

对于Meta来说,近年来它的核心广告业务受到压力,AI就成了推动参与度、解锁新的收入来源和重申其在社交媒体领域主导地位的关键机会。

当然,Meta在追求AI霸权的道路上充满竞争对手。OpenAI,它的ChatGPT系统在大型语言模型领域设定了步伐,而Google、Mistral以及一大批初创公司和研究实验室都在争夺这块蛋糕。

但是,有了Llama 3,Meta已经展示出它具有与业界最好的竞争的技术实力和战略眼光。

Llama 3正式成为从发布到Hugging Face #1趋势的最快模型 - 只用了几个小时。 基于llama 1 & 2,已经发布了3万个新模型,所以我迫不及待地想看看第三个也是最强大的版本将对生态系统产生何种影响!— clem (@ClementDelangue) 2024年4月18日

Hugging Face的创始人Clement Delangue在X.com的一篇文章中高度赞扬了Meta,赞扬了它的技术实力和战略眼光。

Hugging Face 运营着一个广泛使用的机器学习模型中心,特别是那些专注于自然语言处理和其他人工智能任务的模型。

当 Llama 3 这样的模型在 Hugging Face 上登上“热门榜第一”时,意味着它已经迅速获得了平台上开发者和研究人员社区的最多关注或使用。

这通常表明由于模型的功能、对先前版本的改进或在各个领域的潜在应用而引起的极大兴趣。

根据Delangue的说法,Llama 3成为了Hugging Face上最快达到第一名趋势的模型,仅用了几个小时就实现了这个壮举。

考虑到之前版本的受欢迎程度,Llama 3的影响可能会很大。

正如Delangue所指出的,已经有超过3万个新模型基于Llama 1和2发布了。由于Llama 3是迄今为止最强大的版本,它肯定会对生态系统产生重大影响。

开源AI的未来

Llama 3的发布恰逢AI行业的关键时刻。

随着技术以惊人的速度不断发展,人们对其可能对社会产生的影响,如工作岗位流失和误导信息的传播,越来越担忧。

通过拥抱开放性和透明性,Meta正在将自己定位为这些强大新工具的负责任的管理者,即使它正在努力为自己的目标而利用AI的潜力。

最后,Llama 3的成功将不仅仅取决于其技术能力,而且还将取决于其驱动实际影响的能力。

它能否帮助Meta抵挡住TikTok的威胁,并为AI时代重新塑造自己?

它会在开源AI社区中引发一波新的创新和创业潮吗?

它会在一个常常因其不透明性而受到批评的行业中设立新的透明度和责任标准吗?

这些问题将定义人工智能的未来——有了Llama 3,Meta刚刚投放了一枚定会在未来几年内在整个行业内产生深远影响的炸弹。

AI战争正在升温,而埃隆·马斯克正在关注。

我们也最好这么做。

本文系外文翻译,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系外文翻译前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 策略上的高招
  • AI霸主之战
  • 开源AI的未来
相关产品与服务
大模型知识引擎
大模型知识引擎(LLM Knowledge Engine),是面向企业客户及合作伙伴的,基于大语言模型的知识应用构建平台,结合企业专属数据,提供知识问答、知识总结等应用范式,更快更高效地完成大模型应用的构建,推动大语言模型在企业服务场景的应用落地。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档