面向技术/非技术同学的一篇入门级技术分享,帮助快速理解 LLM、Agent、Token、Ask、Plan 等概念,以及当前主流大模型的差异与适用场景。
LLM 是一种基于深度学习(主要是 Transformer 架构)的模型,核心能力是:
典型代表:
可以把 LLM 理解为:
一个“超级强的语言补全引擎” —— 它并不是“知道答案”,而是根据上下文预测“下一个最合理的 token”。
Token 是大模型计算和计费的最小单位,可以理解为:
示例:
你好,世界
大致 token 数:
英文:
Artificial Intelligence
可能被拆成:
结论:中文更“费 token”,英文更省。
Prompt 并不是一句自然语言问题,而是一次模型调用中全部输入信息的总和。
在工程实践中,Prompt 往往由以下部分共同构成:
从成本角度看:
因此在工程中:
Prompt 是一种需要被设计、被版本化、被复用的工程资产,而不是临时拼接的字符串。
Context 指的是:
当前一次模型调用中,模型能够“看到”的全部内容
它包含:
需要特别强调的是:
在工程实践中:
Context Window 是模型在一次调用中可处理 token 的最大上限。
常见规格包括:
需要注意:
工程结论是:
上下文窗口不是越大越好,而是“够用即可”。
Plan 指模型在执行任务前,对完成路径进行的步骤拆解。
典型表现为:
Plan 的工程意义在于:
但同时也意味着:
因此:
Plan 是用 token 换确定性,而不是“免费能力”。
Agent 并不是一种新的模型,而是一种系统形态:
Agent = LLM + Plan + 工具调用 + 状态管理
与普通聊天模型的核心区别在于:
这也直接导致:
工程上常见结论是:
Agent 适合高价值、低频、复杂任务,而不适合高 QPS 场景。
Rules 用于定义模型的长期行为边界,例如:
在工程中,Rules 往往通过:
进行固化。
rules.mdc 的核心价值在于:
可以理解为:
MDC 是“模型的长期工作说明书”。
这类参数用于控制模型输出的随机性。
工程经验是:
在生产系统中,通常会:
幻觉指模型在信息不足或不确定时,仍然生成看似合理但实际错误的内容。
工程视角下:
常见手段包括:
RAG 是企业级 AI 系统中最常见的架构模式之一。
它的核心思想是:
RAG 的本质权衡是:
Embedding 是将文本转换为向量,用于语义相似度计算。
在工程中,它通常:
是构建知识库和搜索系统的基础能力。
这是 Agent 系统中的关键能力:
它让 LLM 从“语言模型”升级为“系统调度器”。
多轮交互是 Agent 和复杂任务的常态,但也意味着:
工程上通常通过:
来控制成本。
思维链是模型内部推理能力的外显形式。
工程取舍是:
流式输出通过边生成边返回结果,改善用户体验。
但在工程上:
一次模型调用的 token 消耗 =
输入 tokens + 输出 tokens
举例:
在企业 API 计费中,通常:
在工程系统中,这三者往往被混用,但本质含义非常接近:
在成本核算中:
一次 Ask,几乎必然对应一次 Call,也必然产生 token 消耗。
如果一个用户操作背后触发多次 Call,那么真实成本往往被严重低估。
在不同平台/团队中叫法略有差异,但本质一致:
名称 | 含义 |
|---|---|
Ask | 一次“向 AI 提问/请求”的行为 |
Request | 一次完整的 API 请求 |
Call | 一次模型调用(计费单位) |
一次 Ask ≈ 一次模型 Call ≈ 一次 token 结算
如果你的系统:
Plan(规划) 指的是:
在执行任务前,模型先“想清楚步骤”,再按步骤完成
例如:
目标:生成一份技术方案
Plan:
1. 拆解需求
2. 设计整体架构
3. 列出关键模块
4. 输出文档
Agent = LLM + 规划能力 + 工具调用 + 状态记忆
它不只是“聊天”,而是:
一个典型 Agent 的流程
用户目标
↓
Plan(任务规划)
↓
Action(调用工具 / LLM)
↓
Observation(观察结果)
↓
Loop(直到完成目标)
为什么 Agent 特别“烧 token”
Agent 的本质是:用 token 换自动化能力
Rules 是对模型的“长期行为约束”,例如:
常见形式:
在工程中,MDC 通常指:模型的长期上下文定义文件,常见是 <span>rules.mdc</span> 或 markdown 文件:
用途:
示例作用:
对工程化落地来说,MDC 是成本控制和稳定性的关键手段。
模型 | 优点 | 缺点 | 适合场景 |
|---|---|---|---|
GPT-4.x / GPT-5 | 推理、代码、通用能力最强 | 成本高 | 复杂分析、代码、Agent |
Claude 3.x | 长上下文、文本理解强 | 中文稍弱 | 文档分析、总结 |
Gemini | 多模态强 | 工程稳定性一般 | 图文理解 |
通义千问 | 中文友好、性价比高 | 推理略弱 | 中文业务系统 |
文心一言 | 国内生态、合规 | 技术深度有限 | 国内应用 |
实战建议如下:
在工程视角下,对于相关的AI系统有诸多关键要素需要进行统一总结。这些要素如同构建系统大厦的基石,每一个都有着不可替代的作用。
一个成熟的AI系统,本质是一个高度受约束的工程系统。这意味着在构建和运行AI系统时,需要遵循一系列严格的规则和约束条件,对各个关键要素进行精细的管理和控制,才能确保系统的高效、稳定运行,实现预期的功能和目标。