首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

中国AI大模型创业公司发布最新成果性能超OpenAI o1正式版

在人工智能领域,技术的迅猛演进正持续刷新着我们的认知范畴。2024年1月20日,国内两家声名远扬的人工智能大模型创业公司——月之暗面(Kimi)和深度求索(DeepSeek),近乎于同一时刻公布了其最新的研究成果,且在性能测试里均彰显出了超越 OpenAI o1 正式版模型的强劲实力。此消息不但在国内引发了轩然大波,还吸引了全球范畴内的普遍关注。

一、月之暗面Kimi k1.5:多模态思考模型的突破

月之暗面此次发布的Kimi k1.5多模态思考模型,在多模态推理和通用推理能力上实现了SOTA(State Of The Art,即某个领域中最先进的技术或方法)级别的突破。在short-CoT(Chain of Thought,思考链)模式下,Kimi k1.5的数学、代码、视觉多模态和通用能力均大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,领先幅度高达550%。这一成绩无疑是对Kimi团队技术创新能力的有力证明。

而在long-CoT模式下,Kimi k1.5同样展现出了强大的实力。其数学、代码、多模态推理能力均达到了长思考SOTA模型OpenAI o1正式版的水平。这意味着,Kimi k1.5在保持高效思考的同时,也具备了处理复杂问题和进行深度推理的能力。

值得注意的是,Kimi团队此次还发布了原创技术long2short,该技术通过高效思维链+原生多模的方式,进一步提升了模型的性能和通用性。这一技术的公开,无疑为人工智能领域的研究者提供了新的思路和方法。

二、深度求索DeepSeek R1:强化学习技术的创新应用

与此同时,深度求索发布的DeepSeek R1模型也在性能测试中展现出了不俗的实力。该模型在后训练阶段大规模使用了强化学习技术,这一创新应用使得模型在仅有极少标注数据的情况下,依然能够极大提升推理能力。

在数学、代码、自然语言推理等任务上,DeepSeek R1的性能已经比肩OpenAI o1正式版。这一成绩不仅体现了深度求索团队在强化学习技术上的深厚积累,也展示了其将先进技术应用于实际问题的强大能力。

值得注意的是,DeepSeek团队此次同样公开了其技术报告,主打高性价比的模型设计理念。这一理念的提出,无疑为人工智能领域的商业化应用提供了新的可能性和方向。

三、海外关注与认可:中国AI技术的崛起

随着Kimi k1.5和DeepSeek R1的发布,两家中国公司都公开了他们的原理及技术报告,引发了海外从业者的广泛解读和关注。英伟达高级科学家范麟熙(Jim Fan)在社交媒体上发文表示, “两篇论文披露了大量技术细节,并惊人地得出相似结论,读到令人鼓舞。

范麟熙的发言代表了其个人对于这两篇技术报告的认同与称赏,折射出海外人工智能领域对中国 AI 技术崛起的关注与期冀。这一趋向无疑会为中国 AI 企业于全球范畴内的竞争与发展给予有力的支撑和保障。

四、未来展望:持续创新与合作共赢

伴随人工智能技术的持续演进,未来会有更多的挑战与机遇等候着我们去应对和掌控。对于像月之暗面和深度求索这般的中国 AI 大模型创业公司而言,持久的技术革新以及与全球同行的合作共荣将是它们未来发展的关键之所在。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/ORzg3-doof5X4yitKEUOF2pw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券