图1:DeepSeek 接入 Claude Code 封面图
这篇文章想讲一件很具体、也很日常的小事:
作为一个想薅 AI 羊毛、又想少踩坑的普通开发者,我是怎么从「迷信 CCR 这种万能适配器」,一路绕弯路,最后回到一个更本质的答案:协议才是本体,并把 Qwen/DeepSeek 稳稳接到了 Claude Code 里。
不会有太多代码,因为代码可以随时让 AI 再帮我写一遍; 我更想讲的是:一个新手,是怎么从 0 折腾到 1 的。
故事要从「薅羊毛变难了」说起。
最开始,我是用 Cursor、Augment 这一类工具,配合各种「域名号池」的骚操作,勉强薅到一些算力。但随着各家风控收紧,这条路越来越难走:
那段时间我在想:
与其天天琢磨怎么薅羊毛,不如直接把主力工具换成一个「体验好、上下文工程做得强」的产品。
于是 Claude Code 显然成了最顺眼的那个。

图2:Claude Code 接入示意
Claude Code 是 Anthropic 在 2025 年 5 月正式发布的一款全新 AI 编码工具,一上线就成了 AI Coding 领域的现象级产品(它的上下文工程做的非常好!)
但是,用了你就会发现:它有一个非常明显的硬伤——
原因其实很简单:
你要是想系统对比 Anthropic 家和 OpenAI 家的 API 区别,可以看这篇总结:
A 家和 O 家的格式区别参考:https://zhuanlan.zhihu.com/p/1933112792816292424

图3:Anthropic 与 OpenAI API 协议对比示意图
那问题就来了:
当我看到魔搭社区提供了 Qwen 和 DeepSeek 的最新模型免费 API(每天 2000 次),那一刻的想法其实很简单:
如果我能把「魔搭的免费 Qwen/DeepSeek」接入到 Claude Code 里,那就太完美了。
只是,我一开始选的路径,有点走远了。

图4:CCR 开源项目示意图
当时我看到一个开源项目:CCR。
它打出来的卖点大概是这样的:
让任意模型都能嵌入到 Claude Code。
对一个只是想「赶紧上手用」的开发者来说,这简直是天籁之音:
太好了,有人帮我把各种 API 格式的坑都填了,我只要学会怎么用 CCR 就行了。
于是我干了什么?
我开始认真啃 CCR 的文档,理解它大致是怎么干事的:
别看这里只是几行字,当时花的时间其实不少:
那时候我的心态是:
没关系,开源项目嘛,多花点时间理解也是应该的。
在反复折腾之后,我终于让 CCR 和 Claude Code 跑起来了。
然而没多久,项目更新了。
更新之后,之前好不容易调通的配置——直接失效了。
那一刻的心情大概是:
我到底是在用 Claude 写代码,还是在给 CCR 打工做测试?

图5:CCR 配置报错与调试过程截图
接下来就是典型的「开源项目自救流程」:

图6:论坛中各种 CCR 玄学解决方案截图
现实情况是:
我这……coding 还需要看概率?
那几天的体验给了我一个很强的直觉:
下面这张图,大概就是当时在论坛各种翻找解决方案时的场景:

图7:论坛里寻找各种 CCR 玄学解法
在玄学尝试了一圈、成功率始终不稳定之后,我终于不再继续「评论区指哪儿我试哪儿」,而是决定停下来问自己三个问题:

图8:思考 CCR 本质是翻译器的示意图
这时候我慢慢意识到:
翻译器本身会带来什么?
于是问题变成:
我是真的需要这么一个「万能翻译器」,还是其实只需要找一个「本来就说同一种话」的平台?
这个视角一旦转过来,后面的路就开始变得清晰了。

图9:寻找原生支持 Anthropic 协议平台的思路转变
后来有一天,我在魔搭社区看模型接口文档的时候,突然看到这样一行说明——大意是:
某些模型接口,已经支持 Anthropic 格式。
当时的感觉只有一句:
我这……走了半天弯路,结果答案在文档里一直写着。
魔搭提供的 Qwen/DeepSeek 模型,本身就可以用 Anthropic 协议 调用。
这意味着什么?
也就是说,只要做到两件事:
下面这张图,就是当时我在魔搭页面上看到「支持 Anthropic 接口格式」时的大概样子:

图10:魔搭模型接口页面中对 Anthropic 协议的支持说明
实际上DeepSeek官方也推出了一个满足Claude Code的接口格式,

图11:DeepSeek 官方文档支持 Claude Code 接口格式说明
看到这里,我心里的思路瞬间变成:
与其在各种中间件上赌运气,不如直接找一个官方就讲 Anthropic 语言的平台。
接下来就是「从 0 到 1 的配置过程」了。
下面这部分是你可以直接照抄的教程部分:

图12:Claude Code 配置魔搭 API 步骤概览
.claude/settings.json 帮你把配置收拢在一处。这一步很简单,官方文档也写得很清楚,这里只说关键点:
注意:
魔搭现在给的免费额度,大致是每天 2000 次调用,对我这种折腾+日常小规模使用的人来说已经够用。
在动系统级配置之前,我的习惯是:
先在当前终端用「一次性环境变量」跑通一遍,确认链路没问题再说。
在 Windows PowerShell 里,可以用这样的形式设置环境变量(注意:这些是一次性的,只在当前窗口有效):
$env:ANTHROPIC_BASE_URL = "https://api-inference.modelscope.cn"
$env:ANTHROPIC_AUTH_TOKEN = "你的魔搭 API Key"
$env:ANTHROPIC_MODEL = "Qwen/Qwen3-Coder-480B-A35B-Instruct"这里有三个关键点:
https://api-inference.modelscope.cnQwen/Qwen3-Coder-480B-A35B-Instruct
图13:PowerShell 设置一次性环境变量示例
设置完这三个环境变量之后,在同一个 PowerShell 窗口里,直接启动 Claude Code CLI:
claude进入对话界面后,我做的第一件事不是写代码,而是问它:
你是什么模型?
这一次,Claude 工具就会带着你配置好的 Qwen 模型名称去请求魔搭服务器,服务端能正确识别并返回信息。
成功时大概长这样:

图14:Claude CLI 中询问「你是什么模型」并返回 Qwen 相关信息
那一刻的感觉有点像校招拿到第一封 offer:
哦,原来这个思路是真的通了。
后面我又实际跑了一下补全,确认在 Claude Code 里用 Qwen 模型写代码是没问题的:

图15:成功在 Claude Code 中使用 Qwen 模型进行补全
上面那种 $env:... 的方式,有一个典型的坑:
只在当前终端窗口有效。关掉窗口,一切归零。
如果你每次开一个新终端都要重新打一遍这三行命令,很快就会崩溃。
所以更实用的做法,是通过 Windows 系统环境变量,把这三项配置成用户级环境变量。
ANTHROPIC_BASE_URLhttps://api-inference.modelscope.cnANTHROPIC_AUTH_TOKEN你的魔搭 API KeyANTHROPIC_MODELQwen/Qwen3-Coder-480B-A35B-Instruct只有在新开的终端里,这些环境变量才会真正生效。
整个过程大概会看到这样的界面:

图16:Windows 环境变量配置示例
做完这些之后,以后你只要:
claude就可以直接在任何终端里调用到魔搭上的 Qwen/DeepSeek,而不需要重复配置。
.claude/settings.json 固化项目级配置系统环境变量解决的是「这台机器上所有终端都能用」的问题。
但如果你像我一样:
那再加一层配置会更安心:.claude/settings.json。
.claude 目录C:\Users\%username%\.claudesettings.json{
"env": {
"ANTHROPIC_BASE_URL": "https://api-inference.modelscope.cn",
"ANTHROPIC_AUTH_TOKEN": "your-api-key",
"ANTHROPIC_MODEL": "Qwen/Qwen3-Coder-480B-A35B-Instruct"
}
}这一步的好处是:
.claude/settings.json 文件,Claude Code 也能读到这些配置。大概长这样:

图17:.claude/settings.json 配置示例
最后,切回到你的项目目录下,再次启动 Claude:
claude就可以顺畅地继续用 Qwen/DeepSeek 模型写代码了:

图18:在项目目录中启动 Claude 并继续使用 Qwen 模型
写完这些,我回头看了一眼这整个从 0 到 1 的过程,最有感的其实是三件事:
一开始我特别迷信 CCR:
结果现实是:
对一个只是想「赶紧写代码」的人来说,这显然是跑偏了。
真正解锁 Claude Code 的钥匙,不是 CCR,也不是某个具体脚本,而是:
有没有一个平台,本身就支持 Anthropic 协议。
当我发现魔搭的 Qwen/DeepSeek 模型可以用 Anthropic 格式调用时,整件事一下子变得简单:
工具可以换很多代,UI 也可以不停更新,但协议选对了,你就不会被某一个中间层绑死。
在最混乱的那时候,我其实就是:
真正让事情回到正轨的,是那一刻我停下来问自己:
我到底想解决什么问题?
是用上 CCR,还是用上 Qwen/DeepSeek?
当我把这两个问题拆开之后,答案就变得很清晰:

图19:从迷信中间件到回归协议本质的反思总结
最后,用几条很实际的小建议收个尾:
如果你也正好在折腾「Claude Code + 国产模型」,希望这篇从 0 到 1 的踩坑记录,能帮你少踩几次我已经踩过的坑。
轮到你了! 你觉得在哪些业务场景容易陷入这种细节误区模式? 欢迎在评论区分享你的想法或遇到的问题!