距离深度求索推理大模型DeepSeek-R1发布已经过去约一周时间。1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。
而其竞技场得分达到1357分,略超OpenAI o1的1352分。这是继DeepSeek-V3在剔除OpenAI o1等闭源模型排名开源模型类第一后,DeepSeek-R1向全球最强AI大模型的再一次进击。
面对这一结果,英国《经济学人》也做出了较为客观的评价。只是仍在细节上存在一些心有不甘的表达,见图,大家一看便知。
中国公司Deepseek拥有一个不仅规模远超许多西方同行,而且性能更优的大型语言模型(LLM),能与之匹敌的仅有谷歌和OpenAI的模型。该模型的训练成本低廉,运行成本也同样较低。
你对此有什么看法,欢迎评论区交流。
领取专属 10元无门槛券
私享最新 技术干货