暂无搜索历史
RAG(检索增强生成)与扩展的上下文窗口(context window)虽然同为短期记忆机制,但在应用场景、成本效率和数据管理方面存在显著差异,以下为详细分析:
自回归模型在生成推理答案时,依次生成每个 token。虽然每一步的生成都是基于概率采样,可能会出现轻微偏离,但这种上下波动并不会必然单调累积为整体错误。实际上,...
在人工智能快速发展的今天,DeepSeek R1和OpenAI o3等推理大模型展现出令人瞩目的潜力,同时也面临着独特的挑战。本文深入探讨这些模型在落地应用中的...
Xiao Hong is truly exceptional! Clear-minded, shrewd, and remarkably, he maintai...
Since ChatGPT's explosive rise in 2022, artificial intelligence has rapidly tran...
The recent explosion of Manus claimed as the first generic agent product has bro...
人工智能 Agent(智能代理/智能体)的发展正引领着新一轮技术变革。从最初只能回答问题的聊天机器人,到如今能够自主规划和执行任务的Agent(智能代理/智能体...
2022年ChatGPT核爆式崛起以来,AI技术正在经历从"可询问的聊天式工具(chatbot)"到"可执行的智能体(agent)"的根本转变。在这场技术革命中...
肖弘(Xiao Hong, Red)是最近大火的大模型 agent Manus 的 CEO,继 DeepSeek 后国内大模型行业的新星。听肖弘的访谈,感觉就是...
大型语言模型(LLM)的崛起在过去几年引发了人工智能领域的飞跃式发展。尤其是 2022 年底 OpenAI 推出的 ChatGPT,短短两个月内月活用户就突破一...
在ChatGPT引发的人工智能热潮中,我们亲眼见证了AI应用形态的戏剧性演变。回想2022年底,当人们首次体验ChatGPT时,那种震撼感仍历历在目——一个能够...
当ChatGPT核爆式走红时,全人类第一次意识到,AI不仅能回答问题,还能成为你的"赛博同事"。早期的Copilot(副驾驶)类助手就像乖巧的实习生——勤快听话...
- 训练时间(Training Time):参数空间Θ的优化过程,目标函数为误差最小化 minL(θ;D_train) - 推断时间(Inference Tim...
推理模型是当前生成式AI的主流热点,带火了一个热词(buzz word)叫 test time compute,咱们就先从它谈起。
在人工智能发展的历史长河中,符号逻辑和神经网络一直如两条平行线,难以交汇。然而,2024年春节,DeepSeek发布的推理大模型R1揭示了一个令人惊叹的技术突破...
Mr. Huang's background features three S-curves, illustrating the scaling relay r...
黄教主背后是三个S曲线,illustrate 的是大模型三个阶段的“做大做强”的 scaling 接力赛,颇显挖山不止的愚公移山精神。
深度学习模型本质上是高维概率密度估计器,它的核心目标是通过参数θ找到条件概率分布P(y|x;θ)的最佳近似。模型通过学习大量的训练数据,试图捕捉数据中的大大小小...
在大模型后训练中,像deepseek R1那样交替使用监督微调(SFT)和强化学习(RL),而非单一依赖 RL 或蒸馏,背后的核心逻辑如下。
A: DeepSeek R1 采用了四阶段的训练流程,包括两个强化学习(RL)阶段和两个监督微调(SFT)阶段 (DeepSeek-R1的四个训练阶段 - 蝈蝈...
暂未填写公司和职称
暂未填写技能专长