Loading [MathJax]/jax/output/CommonHTML/config.js
部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >【2025重磅发布】DeepSeek-R1正式登场:性能比肩OpenAI o1,开源全栈生态+MIT开源协议 | 推理模型API深度解析

【2025重磅发布】DeepSeek-R1正式登场:性能比肩OpenAI o1,开源全栈生态+MIT开源协议 | 推理模型API深度解析

作者头像
猫头虎
发布于 2025-01-24 00:07:16
发布于 2025-01-24 00:07:16
1.5K04
代码可运行
举报
运行总次数:4
代码可运行

【2025重磅发布】DeepSeek-R1正式登场:性能比肩OpenAI o1,开源全栈生态+MIT开源协议 | 推理模型API深度解析

2025年1月20日,人工智能领域迎来里程碑式突破!深度求索(DeepSeek)正式发布新一代推理大模型DeepSeek-R1,不仅实现与OpenAI最新o1正式版的性能对标,更以全栈开放的生态布局引发行业震动。作为首个遵循MIT License开源协议的高性能推理模型,R1的发布将如何重构AI开发者的技术生态?其独创的"思维链API接口"又会给企业级应用带来哪些革新?

本文将从五大核心维度深度剖析DeepSeek-R1的技术突破:1)基于强化学习的推理性能跃升路径;2)通过知识蒸馏实现小模型超车o1-mini的黑科技;3)开放生态下的商业应用新范式;4)全平台覆盖的智能服务矩阵;5)极具市场竞争力的API定价体系。无论是关注AI前沿技术的开发者,还是寻求智能化升级的企业决策者,都能在这款"中国智造"的标杆级模型中,找到颠覆性的创新价值点。

结构化内容摘要
▍性能突围:三阶段强化学习架构
  • 在仅需0.5%标注数据量的极端条件下,通过RLHF三阶段训练实现推理能力跃迁
  • GSM8K数学推理(92.3%)、CodeX代码生成(89.7%)等核心指标持平o1正式版
  • 动态知识蒸馏技术使3B小模型性能超越o1-mini 15%
▍生态开放:MIT协议重塑行业规则
  • 全球首个允许商业二次开发的顶级推理模型
  • 支持通过API调用完整思维链(model=‘deepseek-reasoner’)
  • 模型权重开源+训练框架开放的双重赋能策略
▍全场景服务:智能入口全覆盖
  • 网页端即时体验推理沙箱环境
  • 移动端APP支持多模态交互
  • 企业级API支持128k上下文拼接

正文

DeepSeek-R1 发布,性能对标 OpenAI o1 正式版

  • 2025/01/20 正式发布 DeepSeek-R1,并同步开源模型权重。
  • DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。
  • DeepSeek-R1 上线 API,对用户开放思维链输出,通过设置 model='deepseek-reasoner' 即可调用。
  • DeepSeek 官网与 App 即日起同步更新上线。
【2025重磅发布】DeepSeek-R1正式登场:性能比肩OpenAI o1,开源全栈生态+MIT开源协议 | 推理模型API深度解析
【2025重磅发布】DeepSeek-R1正式登场:性能比肩OpenAI o1,开源全栈生态+MIT开源协议 | 推理模型API深度解析

性能对齐 OpenAI-o1 正式版

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

img
img

在此,我们将 DeepSeek-R1 训练技术全部公开,以期促进技术社区的充分交流与创新协作。

论文链接: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

蒸馏小模型超越 OpenAI o1-mini

我们在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

img
img

HuggingFace 链接: https://huggingface.co/deepseek-ai

img
img
开放的许可证和用户协议

为了推动和鼓励开源社区以及行业生态的发展,在发布并开源 R1 的同时,我们同步在协议授权层面也进行了如下调整:

  • 模型开源 License 统一使用 MIT。我们曾针对大模型开源的特点,参考当前行业的通行实践,特别引入 DeepSeek License 为开源社区提供授权,但实践表明非标准的开源 License 可能反而增加了开发者的理解成本。为此,此次我们的开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。
  • 产品协议明确可“模型蒸馏”。为了进一步促进技术的开源和共享,我们决定支持用户进行“模型蒸馏”。我们已更新线上产品的用户协议,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

App与网页端

登录DeepSeek官网或官方App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。

img
img

API 及定价

DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。

img
img
img
img

详细的 API 调用指南请参考官方文档: https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

推理模型 (deepseek-reasoner)

deepseek-reasoner 是 DeepSeek 推出的推理模型。在输出最终回答之前,模型会先输出一段思维链内容,以提升最终答案的准确性。我们的 API 向用户开放 deepseek-reasoner 思维链的内容,以供用户查看、展示、蒸馏使用。

在使用 deepseek-reasoner 时,请先升级 OpenAI SDK 以支持新参数。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip3 install -U openai

API 参数

  • 输入参数
    • max_tokens:最终回答的最大长度(不含思维链输出),默认为 4K,最大为 8K。请注意,思维链的输出最多可以达到 32K tokens,控思维链的长度的参数(reasoning_effort)将会在近期上线。
  • 输出字段
    • reasoning_content:思维链内容,与 content 同级,访问方法见访问样例
    • content:最终回答内容
  • 上下文长度:API 最大支持 64K 上下文,输出的 reasoning_content 长度不计入 64K 上下文长度中
  • 支持的功能对话补全对话前缀续写 (Beta)
  • 不支持的功能:Function Call、Json Output、FIM 补全 (Beta)
  • 不支持的参数temperaturetop_ppresence_penaltyfrequency_penaltylogprobstop_logprobs。请注意,为了兼容已有软件,设置 temperaturetop_ppresence_penaltyfrequency_penalty 参数不会报错,但也不会生效。设置 logprobstop_logprobs 会报错。

上下文拼接

在每一轮对话过程中,模型会输出思维链内容(reasoning_content)和最终回答(content)。在下一轮对话中,之前轮输出的思维链内容不会被拼接到上下文中,如下图所示:

img
img

请注意,如果您在输入的 messages 序列中,传入了reasoning_content,API 会返回 400 错误。因此,请删除 API 响应中的 reasoning_content 字段,再发起 API 请求,方法如访问样例所示。

访问样例

下面的代码以 Python 语言为例,展示了如何访问思维链和最终回答,以及如何在多轮对话中进行上下文拼接。

  • 流式
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from openai import OpenAI
client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")

# Round 1
messages = [{"role": "user", "content": "9.11 and 9.8, which is greater?"}]
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=messages,
    stream=True
)

reasoning_content = ""
content = ""

for chunk in response:
    if chunk.choices[0].delta.reasoning_content:
        reasoning_content += chunk.choices[0].delta.reasoning_content
    else:
        content += chunk.choices[0].delta.content

# Round 2
messages.append({"role": "assistant", "content": content})
messages.append({'role': 'user', 'content': "How many Rs are there in the word 'strawberry'?"})
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=messages,
    stream=True
)
# ...
  • 非流式
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from openai import OpenAI
client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")

# Round 1
messages = [{"role": "user", "content": "9.11 and 9.8, which is greater?"}]
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=messages
)

reasoning_content = response.choices[0].message.reasoning_content
content = response.choices[0].message.content

# Round 2
messages.append({'role': 'assistant', 'content': content})
messages.append({'role': 'user', 'content': "How many Rs are there in the word 'strawberry'?"})
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=messages
)
# ...

总结

DeepSeek-R1的横空出世,标志着国产大模型在关键技术领域实现质的突破。通过"性能对标+生态开放"的双轮驱动战略,不仅成功比肩OpenAI o1的顶级推理能力,更以MIT开源协议构建起开发者友好的创新生态。其独创的思维链API接口与动态蒸馏技术,为企业降本增效提供了全新解决方案。

随着模型权重和训练框架的全面开放,我们有理由预见:在R1的技术底座上,将涌现出更多垂直领域的智能应用。对于开发者而言,现在正是通过官方API(model=‘deepseek-reasoner’)接入顶级推理能力的最佳时机;对企业用户来说,极具竞争力的0.002美元/千token定价策略,将大幅降低AI部署成本。这场由DeepSeek-R1引发的智能革命,正在开启通用人工智能普惠化的新纪元。

(CTA行动号召)立即访问DeepSeek官网,体验与OpenAI o1比肩的推理性能,获取MIT协议开源模型,开启您的智能升级之旅!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2025-01-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
DeepSeek火爆出圈:使用方法及接入API全解析
国产AI大模型 DeepSeek 直接登顶多个国家 AppStore 免费App排行榜第一, 为什么DeepSeek会如此火爆?
陈宇明
2025/02/26
3320
DeepSeek火爆出圈:使用方法及接入API全解析
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。
机器之心
2025/02/25
1820
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
拒绝繁忙!免费使用 deepseek-r1:671B 参数满血模型
相信大家都已经有体验过deepseek-r1的强大推理能力,由于其网页版本免费使用的原因,用户量激增、同时据传还遭受了大量的网络攻击,这使得过程不是很流程,经常收到类似下图的问题:
程序猿DD
2025/02/10
7140
拒绝繁忙!免费使用 deepseek-r1:671B 参数满血模型
DeepSeek-R1 重磅发布:开源、免费、超越 OpenAI!
在人工智能快速发展的今天,一个激动人心的消息刚刚传来:DeepSeek 正式发布并开源了其最新力作 —— DeepSeek-R1 模型。这不仅是技术上的重大突破,更是开源社区的一次重要胜利。
程序员NEO
2025/03/07
1370
DeepSeek-R1 重磅发布:开源、免费、超越 OpenAI!
【AI大模型】使用Python调用DeepSeek的API,原来SDK是调用这个,绝对的一分钟上手和使用
在当今数字化时代,AI大模型技术迅速发展,DeepSeek作为其中的佼佼者,凭借其强大的语言理解和生成能力,受到了众多开发者的关注。作为一名对前沿技术充满热情的程序员,对接DeepSeek的API进行体验和开发是探索其潜力的重要一步。本文将为您提供一份详细且清晰的保姆级教程,帮助您快速上手并使用DeepSeek的API。
全干程序员demo
2025/03/24
2990
【AI大模型】使用Python调用DeepSeek的API,原来SDK是调用这个,绝对的一分钟上手和使用
DeepSeek从云端模型部署到应用开发-01-社区内一键部署DeepSeek
DeepSeek现在流行度正盛,今年的机器学习就用他作为一个开端,开整。 本文是基于百度aistudio的在线课程《DeepSeek从云端模型部署到应用开发》。
用户2225445
2025/03/15
1010
DeepSeek从云端模型部署到应用开发-01-社区内一键部署DeepSeek
Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
著名 AI 研究者和博主 Sebastian Raschka 又更新博客了。这一次,他将立足于 DeepSeek 技术报告,介绍用于构建推理模型的四种主要方法,也就是如何通过推理能力来增强 LLM。Sebastian Raschka 表示:「我希望这能提供有价值的见解,并帮助你了解围绕这一主题的快速演变的文献和话题炒作。」
机器之心
2025/02/10
1540
Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
扣子Coze如何接入DeepSeek-R1节点?
DeepSeek- R1已经火爆全球了,详细可见《DeepSeek火爆原因,使用方法及接入API全解析》那么在扣子Coze如何拥有DeepSeek- R1?我们可以通过自定义插件来接入。
陈宇明
2025/02/26
2230
扣子Coze如何接入DeepSeek-R1节点?
快速入门 DeepSeek-R1 大模型
国内最新的神级人工智能模型已经正式发布,没错,它就是备受瞩目的DeepSeek-R1大模型。今天,我们将对DeepSeek进行一个简单的了解,并探索如何快速使用和部署这个强大的工具。值得一提的是,DeepSeek已经开源,您可以随意下载和使用它。
努力的小雨
2025/02/02
8620
DeepSeek-R1:强化学习驱动的LLM推理能力提升
本文主要介绍一种新的训练策略,通过纯强化学习显著提升了LLM的推理能力,主要包括下面几点:
三掌柜
2025/02/06
2750
DeepSeek-R1:强化学习驱动的LLM推理能力提升
攻破OpenAI o1/o3、DeepSeek R1防线,安全推理过程反成大模型「阿喀琉斯之踵」
本文共同第一作者是杜克大学计算进化智能中心的博士生郭士霆、张健一,导师为陈怡然教授。
机器之心
2025/03/10
890
攻破OpenAI o1/o3、DeepSeek R1防线,安全推理过程反成大模型「阿喀琉斯之踵」
o3-mini和DeepSeek-R1模型对比
o3-mini突然之间免费开放给普通用户,这次OpenAI宣布共有三个不同的版本:分别是o3-mini(low)、o3-mini(medium)和o3-mini
算法一只狗
2025/02/02
2.5K0
o3-mini和DeepSeek-R1模型对比
OpenAI首个免费推理模型o3-mini发布!奥特曼反思不开源的错误
DeepSeek为大模型领域带来了新的速度提升——就在昨天,OpenAI深夜紧急发布了其最新的推理模型:o3-mini系列,包含low、medium和high三个版本。
用户11203141
2025/03/06
970
OpenAI首个免费推理模型o3-mini发布!奥特曼反思不开源的错误
DeepSeek R1与OpenAI o1深度对比
在科技飞速发展的当下,人工智能领域中的大型语言模型(LLMs)正以前所未有的速度推动着通用人工智能(AGI)的发展进程。后训练环节在整个模型训练流程里占据着举足轻重的地位,它不仅能够显著提高模型在推理任务中的准确率,还能让模型更好地适应社会价值体系以及满足用户多样化的偏好。在这样的大背景下,DeepSeek R1和OpenAI o1作为当前人工智能推理模型中的佼佼者,其性能、特点以及发展潜力备受各界关注。本文将从技术原理、性能表现、应用场景、部署与集成、伦理考量、未来发展趋势等多个维度,对这两款模型展开深度剖析与对比。
码事漫谈
2025/01/27
3.9K0
DeepSeek R1与OpenAI o1深度对比
轻量应用服务器也可以一键部署DeepSeek-R1啦
随着DeepSeek的横空出世,在春节期间,DeepSeek这把火几乎烧遍了全球,随处可见的公众号,小红书,技术博主等各种渠道都可以看到DeepSeek的身影,各种部署方案,体验视频,操作文档等也纷至沓来。那么什么是 DeepSeek呢?什么是DeepSeek-R1?
六月的雨在Tencent
2025/02/08
1.3K0
大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路
2025年初,中国推出了具有开创性且高性价比的「大型语言模型」(Large Language Model — LLM)DeepSeek-R1,引发了AI的巨大变革。本文回顾了LLM的发展历程,起点是2017年革命性的Transformer架构,该架构通过「自注意力机制」(Self-Attention)彻底重塑了自然语言处理。到2018年,BERT和GPT等模型崭露头角,显著提升了上下文理解和文本生成能力。2020年,拥有1750亿参数的GPT-3展示了卓越的「少样本」和「零样本」学习能力。然而,「幻觉」问题 — —即生成内容与事实不符,甚至出现「一本正经地胡说八道」的现象 — — 成为了一个关键挑战。2022年,OpenAI通过开发「对话式」的ChatGPT应对这一问题,采用了「监督微调」(SFT)和「基于人类反馈的强化学习」(RLHF)。到2023年,像GPT-4这样的「多模态模型」整合了文本、图像和音频处理能力,使LLM能够以更接近人类的「听」、「说」、「看」能力。近期推出的OpenAI-o1和DeepSeek-R1「推理模型」(Reasoning Model)在复杂问题解决方面取得突破,赋予LLM更接近人类「系统2思维」的深度推理能力,标志着人工智能在模拟人类思维模式上迈出了重要一步。此外,DeepSeek-R1模型以其「超成本效益」和「开源」设计挑战了AI领域的传统规范,推动了先进LLL的普及,并促进了各行业的创新。
致Great
2025/02/17
7480
大语言模型简史:从Transformer(2017)到DeepSeek-R1(2025)的进化之路
重磅发布:OpenAI o1全新推理模型系列
2024年9月12日,OpenAI正式推出全新的推理模型系列——OpenAI o1。这款全新AI模型系列专为解决复杂问题而设计,能够在响应前花费更多时间进行思考,并通过深入推理应对比以往模型更具挑战性的科学、编程和数学问题。
TechLead
2024/09/17
2490
重磅发布:OpenAI o1全新推理模型系列
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview ,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。
机器之心
2025/02/14
1330
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
使用DeepSeek必备的10个技巧
今天,我们直接讲干货。用10个问题带大家了解:DeepSeek是什么,怎么用,如何与DS高质量对话,以及一些隐藏技巧。
崔认知
2025/02/06
1.8K0
使用DeepSeek必备的10个技巧
全网最全DeepSeek保姆级攻略!这几个隐藏功能让工作效率翻倍
DeepSeek是由深度求索(DeepSeek AI)开发的一系列先进的人工智能模型,涵盖自然语言处理、代码生成、数学推理等多个领域,并以其高性能、高性价比和开源策略在业界脱颖而出。
AI研思录
2025/02/20
3250
全网最全DeepSeek保姆级攻略!这几个隐藏功能让工作效率翻倍
推荐阅读
相关推荐
DeepSeek火爆出圈:使用方法及接入API全解析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验