1 月 20 日晚,深度求索发布了 DeepSeek-R1 推理模型正式版
这一发布,瞬间在 AI 领域投下了一颗重磅炸弹,与其他模型不同,DeepSeek-R1 展现出了极高的开放性,在发布的同时,毅然选择开源模型权重。
同时,还允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。这一许可,极大地拓展了 DeepSeek-R1 的应用范围,让它的价值得到了更充分的发挥。(地址见文末)
推理是亮点、数学能力有待加强
DeepSeek R1 系列模型采用强化学习训练,其推理过程包含大量反思与验证,思维链长度可达数万字。更值得一提的是,它还为用户呈现了 o1 未曾公开的完整思考过程。
DeepSeek - R1 在数学、代码、自然语言推理等任务上的表现,与 OpenAI o1 正式版不相上下。在算法类代码场景(Codeforces)和知识类测试(GPQA、MMLU)中,DeepSeek - R1 的得分略低于 OpenAI o1,但在工程类代码场景(SWE - Bench Verified)、美国数学竞赛(AIME 2024、MATH)项目上,DeepSeek - R1 均超过了 OpenAI o1
价格还算厚道,有助于广泛应用
DeepSeek - R1 的 API 服务定价还是很厚道的。
每百万输入 tokens: 1 元(缓存命中)/4 元(缓存未命中)
每百万输出 tokens :16 元
相比之下,DeepSeek - R1 的输出 API 价格只有 OpenAI o1 的 3% 左右,这无疑为广大用户和开发者提供了一个性价比极高的选择。
体验地址:
https://www.deepseek.com/
模型地址:
https://huggingface.co/deepseek-ai?continueFlag=f18057c998f54575cb0608a591c993fb
好了,今天的内容就分享到这里希望你们喜欢!欢迎关注、点赞和分享
领取专属 10元无门槛券
私享最新 技术干货