一贯被网友喷只会抄袭山寨的中国AI,竟成了西方科技巨头模仿的香饽饽。连外国网友都惊呼倒反天罡,难道现在是“中国AI一开源,美国大模型就进步了”?
事情的起因是近日,美国AI巨头Meta和斯坦福大学的团队联手,开源了Apollo模型。这个Apollo一经问世,就被吹上天。
当然也是无比得意,号称Apollo-3B超越了几乎所有的7B模型,其中Apollo-7B变体更是7B模型中目前最佳的。
极度尴尬的是,外国网友很快就发现,Apollo性能之所以如此炸裂,其实是参考了中国阿里云的开源大模型Qwen2.5。不是你Apollo厉害,而是人家中国AI厉害!
一些美国的开发者对此震惊不已,因为Meta和斯坦福大学那可是美国顶尖的科技巨头和大学啊。如今,Meta竟然连大模型底层技术是参考了Qwen2.5的。
这让科技博主杰克逊表示不敢相信:Apollo基于Qwen来运行的啊?
这可不是空穴来风,眼尖的网友发现,Meta宣称的Apollo可以轻松理解长视频,处于世界领先水平。而几个月前,Qwen2.5开源的全球最强大规模视觉语言模型Qwen2-VL-72B,就已经可以理解长视频,具备调节手机和设备的视觉智能体能力,视觉理解能力超越GPT-4o水平了!
事实也进行了实锤,开发者特地检查了Apollo的license,结果Apollo好巧不巧,正是基于的Qwen2.5。
当然还有更劲爆的,外国开发者深扒发现,Apollo的1.5B、3B和7B尺寸模型,都是基于Qwen2.5而来。还有眼尖的老外发现,Meta的另一个大模型LongVU也参考了Qwen2.5。
Apollo被曝出参考Qwen2.5,无异于是杀人诛心。要知道,美国执全球人工智能领域牛耳,像美国大数据公司Palantir CEO Alex Karp就叫嚣称:AI是美国继原子弹后的最大优势,没有人愿意去中国开AI公司!
结果呢?中国AI啪啪打了美国科技吹的脸。尤其Meta本身就是美国开源AI领域的门面,况且自己就有Llama大模型,被一些美国人称之为开源“标杆”模型。
Apollo作为新发布的重磅大模型,Meta不用Llama,转而选择了中国的Qwen2.5,一方面说明阿里云开源Qwen2.5的技术实力过硬,另一方面说明中国开源大模型的技术自信。
此前阿里云开源的Qwen2.5-Coder-32B,在代码能力的12个主流基准上,Qwen2.5-Coder-32B与GPT-4o对决斩获9胜,打破闭源编程模型的绝对统治!
最近,阿里云又开源了业界首个开源多模态推理模型QVQ-72B-Preview,在解决数学、物理、科学等领域的复杂问题上表现尤为突出。经过多项测评,QvQ的能力超越了此前的视觉理解模型「开源王者」Qwen2-VL,整体表现与「满血版」OpenAI o1、Claude3.5 Sonnet等顶级推理模型相当!
这次参考中国AI事件发生后,也许是Meta觉得丢人挂不住面子,海外博主发现Meta直接撤下了Apollo模型。
Meta的行为连日本开发者都看不下去,他对Meta一顿“阴阳”:理解Meta不断推出视频大模型,但Meta为啥不使用自己的Llama,而是都以Qwen2.5为基础呢。
研发科技容不得走捷径,头部大厂其实应该有更高的技术洁癖。过去这一年,中国AI经历了狂风骤雨。这次Apollo参考Qwen2.5,更让全世界对中国AI刮目相看。
从追赶美国,到被美国拿来作为标杆“参考”,这波逆袭干的挺漂亮!