混合推理只是开胃菜,在V3.1的tokenizer_config.json文件中多了一个thinking变量,开启就是思考推理,关闭就是直接输出。这个变量在 V3 和 R1 中都没有。而且在网页端上使用深度思考模式,它会告诉你现在它是DeepSeek V3,而不是R1。还有就是UI的变化,网页端界面的「深度思考(R1)」已经变成了「深度思考」。DeepSeek V3.1的tokenizer.txt多了<|search_begin>和<|search_end>。这意味着 V3.1 具备了实时检索能力,能在生成过程中主动获取外部知识。在网页端就算关闭了搜索按钮也会主动搜索。实测DeepSeek-V3.1代码水平是有提升的,前端、3D模拟、物理模拟、长代码输出表现都比V3好,部分比 GPT-5 好。DeepSeek V3.1在aider(代码编辑和协作数据集)上得分71.6%,拿下非推理模型SOTA,接近Claude Opus 4(thinking)模式,费用却只有1/68,超过了DeepSeek-R1。在SVGBench(SVG 生成任务)上,V3.1 > V3(thinking) > R1-0528DeepSeek V3.1的文字风格有变化,V3是理科生、V3.1是文科生DeepSeek V3.1的指令遵循能力提升,可以稳定输出给定的json格式,但使用API的时候,V3.1输出无效的空内容概率变高了,约10%DeepSeek V3.1在Tool Use(工具使用)上体验更好,工具调用格式变得更加紧凑。参数直接以字符串形式跟在函数名后面,用 <|tool sep|> 分隔。调用MCP Servers的成功率会更高。DeepSeek V3.1开始中英夹杂了,推理到一定长度后,还会切换到英文进行思考。DeepSeek-V3.1 和 DeepSeek-V3 都支持 128K 超长上下文,但 V3.1 在长文本理解和信息提取方面更加准确,减少了冗余回答。Token使用量比V3下降了约13%,遇到复杂问题,V3.1也会意识到自己解不出来后选择放弃。DeepSeek-V3.1 的幻觉依旧严重我还在等 R 2。。。 https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base