本文深入探讨了 DeepSeek 提出的组相对策略优化(GRPO)算法。通过阐述其背景与动机,详细剖析核心原理,包括分组采样、归一化相对奖励及 KL 散度约束等...
就像你去餐厅点菜,只说"来个菜",服务员怎么知道你想吃什么?是川菜还是粤菜?辣的还是清淡的?
Reddit 看到一个帖子,探讨如何极限情况下运行 DeepSeek-R1-0528
看一下我高频使用的,在2*4090显卡上部署的 DeepSeek-R1-0528-Qwen-8B 性能如何
今天我要讲的是借助DeepSeek R1大模型来直接通过创建 html+svg网页的方式来直接构建某一个核心主题概念的知识图谱。
今天给大家推荐和导读下《DeepSeek原理与项目实战》这本书。为何导读这本书,因为在DeepSeek方面的书,前面更多的都是关于DeepSeek应用技能和提示...
对于DeepSeek的深度思考过程我没有专门的截图出来,实际在和整个AI交互中,我发现详细学习DeepSeek的CoT思维链输出,反而是一个重要的提示自己认知和...
今天接着跟大家聊采用DeepSeek工具来绘制软件功能架构图。对于场景的流程图,包括软件设计里面的用例图,序列图讲这块的已经很多了。即通过DeepSeek工具来...
前两周准备在公司做一个DeepSeek普及性的培训,所以刚好就用DeepSeek来做这个培训的PPT。当然主流核心流程参考标准做法。即首先跟DeepSeek对话...
我并不需要告诉DeepSeek需要具备什么技能,应该是DeepSeek R1深度思考后自己分析应该采用哪些技能才能够帮我解决问题。
在这个复杂性与不确定性交织的时代,我们每天都在面对职场决策、生活管理、技术变革等诸多问题的挑战。当常规的直觉反应和零散的思考难以应对精密问题时,结构化思维链就像...
今天准备再谈下CoT思维链方面的话题。经过最近1~2个月我对的DeepSeek的使用,我发现跟我原来用GPT或者是Kimi最大的一个差异点,就是它提供了深度思考...
最近,国内大模型赛道杀出一匹黑马——DeepSeek。其热度不亚于年初的ChatGPT,甚至在开发者圈内掀起“平替GPT-4”的讨论。其核心吸引力可总结为三点:
平台私有评测集:新版 DeepSeek-R1 的综合胜率为0.5619,较旧版 DeepSeek-R1 的0.5310提升了3.09pp,细分来看,主观中文单轮...
最近MindIE开始支持DeepSeek MTP(multi token prediction)特性了,用于推理加速。但是有些开发者打开MTP开关后,没有发现明...
我瞥见他屏幕上大段"随着社会发展""研究显示"的机械表达,数据表里塞满"某研究机构""部分学者"的模糊指代。这不正是三个月前我踩过的坑?直到看见课题组女神张琳的...