首页
学习
活动
专区
圈层
工具
发布

DeepSeek新模型到底有没有科学进步?

1、缘起

2025年中国春节期间,DeepSeek发布新模型,并在全球范围内产生很高热度,也引发了不少在人工智能大模型界居于前沿的企业的关注。其中在刚刚结束的法国人工智能行动峰会期间,2024年诺贝尔化学奖之一、Google DeepMind的联合创始人兼CEO德米斯·哈萨比斯对最近引起轰动的中国人工智能公司DeepSeek产品进行了评价。他承认DeepSeek新模型给人留下了深刻印象,并认为可能是他所见过来自中国的最佳作品,但他也指出该模型并未带来任何实质性的新科学进展。哈萨比斯表示:“关于DeepSeek,这是一项令人印象深刻的产品,但我认为实际上并没有新的科学进步,因为它只是使用了已知的技术。”

2、我们如何理解什么是科学上的进步

现代对科学或科学的形态的理解已经发生了很大变化。按照传统的观念和分类,科学是自然规律的发现,技术是人类的发明,创新是科学通过技术的应用转化,这种科学与技术是两个分离概念的观念,现在已经不符合人们对科学技术与创新的理解了。事实上,不论在理论上还是在创新实践中,科学与技术、科学技术与创新之间,是既有区别又相互联系的几个概念,通过不断深度融合,已经很难将之完全分开。因此,科技创新成为一个融合词,并不奇怪。同时,科学的形态也从牛顿时代、乃至爱因斯坦时代的纯科学形态演变为基础科学(如理论物理学、天文学等纯科学)、技术与工程科学(如化学工程等)、技性科学(如计算机科学等)、地方科学等一些新形态。因此,哈萨比斯如果是从纯科学角度来看待DeepSeek模型在科学上是否有大的进展,他的说法有一定道理。不过,如果从纯科学或基础科学的角度看,即使是哈萨比斯获得诺贝尔化学奖的成果,也未必有多大科学上的进展,因为几位获奖者是通过发现和优化了一种人工智能模型,并应用在预测蛋白质的结构上取得的科技突破,而其人工智能模型本质是运用神经网络原理一种模型技术进步,或者说是技术科学的一种进步。当然,这并不能否定2024年诺贝尔化学奖获得者们科技成果的重大价值。

3、DeepSeek模型到底有什么科学上的进步

显然,如果我们用上面的科学与技术关系的理解来看待问题,DeepSeek模型在科学上的进展与哈萨比斯获得化学奖的成果的类别是相似的,他们的成果都基本不属于纯基础科学成果,而是技术与工程科学成果。正如DeepSeek创始人梁文锋所强调的,DeepSeek的创新是在有限资源下的模型结构创新,是通过基础性研究得到的,这种模型结构创新是有其背后的技术原理性进步所支撑的;他还强调,除了模型结构,DeepSeek还做了大量其他的研究,包括怎么构造数据,如何让模型更像人类等,这都体现在我们发布的新模型里。我们从模型的训练效率和推理成本上,也可以看出,DeepSeek的创新不可能只是简单的模仿,而是有一定的技术原创性。

4、一个科学传播问题

因此,我们可以看出,哈萨比斯对DeepSeek的评价,既有肯定,也有偏颇。其实这种评价并不难理解。对现代科学,特别是对技术科学或工程科学、技性科学的传播与评价,早就不再是完全中立的,何况哈萨比斯并不完全是一个科学家,而是已经纳入谷歌旗下的DeepMind公司的联合创始人兼CEO,与DeepSeek是一种竞争关系。因此,哈萨比斯的评价是全球AI竞赛中技术博弈与舆论角力的体现。应该说,在一定程度上DeepSeek在技术原理上和工程化应用上的突破确实影响到了谷歌等巨头的垄断性市场地位。但是,这里提出另一个问题是,由于科学、技术与创新之间的深度融合,科学传播越来越与科技竞争、产业竞争联系在一起,科学传播、科学舆论战越来越关系到其背后巨大的经济利益之争。

这件事情也提醒我们,AI领域乃至许多其他前沿科技领域的竞争不仅是技术的较量,更是生态、市场和话语权的较量(DeepSeek回答)。中国科技在工程能力的基础上,要想获得更多竞争优势,既需要进一步加强基础性科学(包括基础科学、技术科学、工程科学)研究,也需要加强科学传播,争取更多话语权,及时澄清不实之辞。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OtP6QeLSP8felrygPtr8Xvxg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券