部署DeepSeek模型,进群交流最in玩法!
立即加群
发布
社区首页 >专栏 >DeepSeek火爆出圈:使用方法及接入API全解析

DeepSeek火爆出圈:使用方法及接入API全解析

作者头像
陈宇明
发布2025-02-26 21:48:01
发布2025-02-26 21:48:01
19600
代码可运行
举报
文章被收录于专栏:设计模式
运行总次数:0
代码可运行

国产AI大模型 DeepSeek 直接登顶多个国家 AppStore 免费App排行榜第一, 为什么DeepSeek会如此火爆?

第一:免费好用

电脑使用直接访问DeepSeek官网即可,手机可在各大应用市场下载,全部免费使用。

  • 官网:https://chat.deepseek.com/
  • App:在应用市场搜索 “DeepSeek”

使用效果

首先它使用起来非常简单,无需复杂的提示词技巧(记得勾选上【深度思考】模式)。比如我让它:用鲁迅口吻写一份拒绝加班的声明

首先它会先进行深度思考,整个深度思考过程:从用户需求的分析到该怎么来写,最后还有检查机制,不得不说这思考真非常深度,给小编23天也想不出来,而它只用了23秒!!

最后看下思考过后的输出

不得不说,这篇声明绝了!把加班比作"拆卖魂魄",报表说成"黄表纸裁的工时簿",精准戳中打工人痛点。用老典故骂新世道,句句都是我们想说不敢说的硬话,最后那句"人得站着走路"直接封神,堪称现代社畜的文言文嘴替。

如何更好的使用推理模型?

在这篇文章《o1 isn’t a chat model (and that’s the point)》提到了两个使用技巧:

原文:https://www.latent.space/p/o1-skill-issue

1. 提供丰富的背景信息

使用推理模型时要像跟朋友详细诉说难题一样,把问题背景、尝试过的办法等相关细节都告诉它。

案例

你想给家里的小花园重新规划一下,就可以这样说:“我家小花园面积大概20平米,呈不规则形状。目前里面种了一些花,但布局有点乱。之前我试着按照颜色分区种植,但效果不太好,显得有些杂乱。我希望能打造一个有特色、美观的小花园,平时还能种点蔬菜。我比较喜欢自然清新的风格,预算有限。”

2. 关注目标,明确输出

告诉推理模型你最终想要的结果就行,别管它具体怎么做。

案例

“我需要一份小花园重新规划的方案,包括植物布局、蔬菜种植区域划分、整体风格设计,要体现自然清新风格,且要考虑低成本。”

第二:技术开源

DeepSeek 模型开源 License 统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。

  • 开源地址:https://github.com/deepseek-ai/DeepSeek-LLM
  • HuggingFace 链接:https://huggingface.co/deepseek-ai

技术实力

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

论文:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

DeepSeek-R1通过引入「冷启动数据」和「多阶段训练」进一步提升了推理性能,达到了与OpenAI-o1-1217相当的水平。此外,通过「蒸馏技术」成功将推理能力转移到更小的密集模型中,显著提高了这些模型的推理性能。

冷启动数据: DeepSeek-R1在开始大规模强化学习之前,先使用一小部分高质量的“冷启动”数据进行微调。这些数据帮助模型快速进入一个较好的状态,减少了从零开始训练所需的迭代次数和时间。 多阶段训练: DeepSeek-R1采用了一个多阶段的训练流程。首先,通过强化学习来增强模型的推理能力;然后,在接近收敛时,结合监督数据进行进一步的微调。这种方法确保了模型在不同任务上的表现都能得到优化。 蒸馏技术: 蒸馏是一种将大型模型的知识转移到小型模型的技术。DeepSeek-R1作为教师模型,生成了大量用于训练的样本。这些样本被用来微调较小的模型,使它们能够继承大型模型的推理能力。这种方法不需要对小型模型进行大规模的强化学习,从而节省了计算资源。

同等性能的情况下 DeepSeek-R1 API 价格比 OpenAI o1 API 价格便宜几十倍,堪称性价比之王!

如果你要结成到自己的业务中可以使用API的方式

如何接入DeepSeek-R1 API?

  1. 进入DeepSeek官网 https://www.deepseek.com/
  1. 注册并登录账户,进入工作后台 https://platform.deepseek.com/usage
  1. 选择API菜单,创建API Keys,并将其复制保存。
  2. API文档地址 https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

推理模型会在输出最终回答之前,模型会先输出一段思维链内容,以提升最终答案的准确性。

在每一轮对话过程中,模型会输出思维链内容(reasoning_content)和最终回答(content)。在下一轮对话中,之前轮输出的思维链内容不会被拼接到上下文中,如下图所示:

在使用 deepseek-reasoner 时,请先升级 OpenAI SDK 以支持新参数。

代码语言:javascript
代码运行次数:0
复制
代码语言:javascript
代码运行次数:0
复制
pip3 install -U openai

下面的代码以 Python 语言为例,展示了如何访问思维链和最终回答,以及如何在多轮对话中进行上下文拼接。

代码语言:javascript
代码运行次数:0
复制
from openai import OpenAI
client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")

# Round 1
messages = [{"role": "user", "content": "9.11和9.8,哪个更大?"}]
response = client.chat.completions.create(
    model="deepseek-reasoner",
    messages=messages
)

reasoning_content = response.choices[0].message.reasoning_content
content = response.choices[0].message.content
代码语言:javascript
代码运行次数:0
复制

总结

DeepSeek的爆火绝非偶然,技术普惠从来不是空话,而是镌刻在每一行开源代码中的自由精神,更是技术平权浪潮里永不褪色的承诺

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-01-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 码个蛋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 第一:免费好用
  • 使用效果
    • 1. 提供丰富的背景信息
    • 2. 关注目标,明确输出
  • 第二:技术开源
  • 技术实力
  • 如何接入DeepSeek-R1 API?
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档