前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >风水轮流转!被骂“山寨”中国大模型,成了美国巨头的“香饽饽”?

风水轮流转!被骂“山寨”中国大模型,成了美国巨头的“香饽饽”?

作者头像
释然IT杂谈
发布2025-01-01 09:50:43
发布2025-01-01 09:50:43
800
举报
文章被收录于专栏:释然IT杂谈

一贯被网友喷只会抄袭山寨的中国AI,竟成了西方科技巨头模仿的香饽饽。连外国网友都惊呼倒反天罡,难道现在是“中国AI一开源,美国大模型就进步了”?

事情的起因是近日,美国AI巨头Meta和斯坦福大学的团队联手,开源了Apollo模型。这个Apollo一经问世,就被吹上天。

当然也是无比得意,号称Apollo-3B超越了几乎所有的7B模型,其中Apollo-7B变体更是7B模型中目前最佳的。

极度尴尬的是,外国网友很快就发现,Apollo性能之所以如此炸裂,其实是参考了中国阿里云的开源大模型Qwen2.5。不是你Apollo厉害,而是人家中国AI厉害!

一些美国的开发者对此震惊不已,因为Meta和斯坦福大学那可是美国顶尖的科技巨头和大学啊。如今,Meta竟然连大模型底层技术是参考了Qwen2.5的。

这让科技博主杰克逊表示不敢相信:Apollo基于Qwen来运行的啊?

这可不是空穴来风,眼尖的网友发现,Meta宣称的Apollo可以轻松理解长视频,处于世界领先水平。而几个月前,Qwen2.5开源的全球最强大规模视觉语言模型Qwen2-VL-72B,就已经可以理解长视频,具备调节手机和设备的视觉智能体能力,视觉理解能力超越GPT-4o水平了!

事实也进行了实锤,开发者特地检查了Apollo的license,结果Apollo好巧不巧,正是基于的Qwen2.5。

当然还有更劲爆的,外国开发者深扒发现,Apollo的1.5B、3B和7B尺寸模型,都是基于Qwen2.5而来。还有眼尖的老外发现,Meta的另一个大模型LongVU也参考了Qwen2.5。

Apollo被曝出参考Qwen2.5,无异于是杀人诛心。要知道,美国执全球人工智能领域牛耳,像美国大数据公司Palantir CEO Alex Karp就叫嚣称:AI是美国继原子弹后的最大优势,没有人愿意去中国开AI公司!

结果呢?中国AI啪啪打了美国科技吹的脸。尤其Meta本身就是美国开源AI领域的门面,况且自己就有Llama大模型,被一些美国人称之为开源“标杆”模型。

Apollo作为新发布的重磅大模型,Meta不用Llama,转而选择了中国的Qwen2.5,一方面说明阿里云开源Qwen2.5的技术实力过硬,另一方面说明中国开源大模型的技术自信。

此前阿里云开源的Qwen2.5-Coder-32B,在代码能力的12个主流基准上,Qwen2.5-Coder-32B与GPT-4o对决斩获9胜,打破闭源编程模型的绝对统治!

最近,阿里云又开源了业界首个开源多模态推理模型QVQ-72B-Preview,在解决数学、物理、科学等领域的复杂问题上表现尤为突出。经过多项测评,QvQ的能力超越了此前的视觉理解模型「开源王者」Qwen2-VL,整体表现与「满血版」OpenAI o1、Claude3.5 Sonnet等顶级推理模型相当!

这次参考中国AI事件发生后,也许是Meta觉得丢人挂不住面子,海外博主发现Meta直接撤下了Apollo模型。

Meta的行为连日本开发者都看不下去,他对Meta一顿“阴阳”:理解Meta不断推出视频大模型,但Meta为啥不使用自己的Llama,而是都以Qwen2.5为基础呢。

研发科技容不得走捷径,头部大厂其实应该有更高的技术洁癖。过去这一年,中国AI经历了狂风骤雨。这次Apollo参考Qwen2.5,更让全世界对中国AI刮目相看。

从追赶美国,到被美国拿来作为标杆“参考”,这波逆袭干的挺漂亮!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 释然IT杂谈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档