大家好,这是我的专题《AI颠覆人类倒计时:普通人自救指南》系列文章之一。
前文我们打造一个既能精准清洗需求(去伪存真),又能高情商拒绝(有理有据)的智能 Agent。
今天,我们就来引入下思维链和思维树,让Agent思考逻辑且可视,并且具备多维度审视需求的能力。
看完本文,你可以获得什么呢?
何为 CoT(思维链)& ToT(思维树)?

1. COT:思维链 (Chain-of-Thought)
定义:COT 是一种提示(Prompting)技术,它让大语言模型在生成最终答案之前,先生成一系列中间推理步骤(即“思维链”)。
核心机制: 传统的提示方式是“输入 → 输出”,而 COT 变成了“输入 →中间推理步骤→ 输出”。这种方式将复杂问题分解为一系列连贯的语言序列
2. TOT:思维树 (Tree of Thoughts)
定义:TOT 是由尧顺雨等人在2023年提出的一种推理框架,旨在解决 COT 的局限性。它将语言模型的推理过程建模为在树结构上的搜索过程,从而实现更深思熟虑的“系统2”思维。
核心机制:“非线性推理+评估”
◦ 非线性结构: TOT 不再是一条单一的链,而是维护一棵“思维树”。每个节点代表一个部分的解决方案(Thought),模型可以同时探索多条可能的推理路径。
◦ 自我评估与决策: 模型不仅生成想法,还会对当前的推理状态进行自我评估(Self-evaluation),判断当前路径是“有希望”、“可能”还是“不可能”。
◦ 搜索算法: 引入了经典的搜索算法(如广度优先搜索 BFS 或深度优先搜索 DFS)。这使得模型能够进行前瞻(Lookahead,预判某条路是否通向答案)和回溯(Backtracking,如果当前路不通则退回上一步重新选择)。
第一部分. 思维链对Agent思考能力的提升
1. 零样本CoT:Zero-Shot COT
这是最简单的应用方式,无需提供示例。
• 设置方法: 只需在 Prompt 末尾之后附加 “Let's think step by step” (让我们一步步思考)。
【效果验证】
1. 我们在提示词里加入“Lets think step by step”;
2. 输入前文我们模拟的一段杂乱的需求沟通会议纪要(【Dify Agent实战】用 RTC框架清洗无效需求,让产品工作回归价值)

3. 助理的思考过程以及最终生成方案,一下子变得清晰起来。效果对比前文输出,也是得到了比较大的增强。“一个自带思考过程,按提示词要求一步步推导出来的方案,让我采纳起来更加放心。”

2. Few-Shot COT(少样本):适用于我们有明确的思考链路规范的场景。
这种方式效果通常优于零样本。你需要在 Prompt 中提供 1 到 5 个包含完整推理过程(问题 -> 思维链 -> 答案)的示例。
• 设置方法: 构建 Question(问题) -> Thought (推理过程) -> Answer 的格式。
【效果验证】
1. 我们在提示词里加入范例:“Question-〉Thought-〉Answer”;
2. 输入前文我们模拟的一段杂乱的需求沟通会议纪要

可以看到,agent按照输入参考的few-shot,进行思考过程的分解。
避坑提示:
1. 选用参数量大,思考能力强的模型,如果选用模型太小,效果可能适得其反。
2. 如果没有非常明确的逻辑链路和思考路径的要求,建议采用零样本COT即可,采用样本在规范的同时,也限制了agent的思考。
第二部分. 思维树如何应用到需求评估中
1. 思维分解与路径生成:(比如结合RICE和KANO模型)

2. 注入prompt
#Instructions
:运用思维树技术评估每个需求的有效性
Step 1 (Propose):
基于需求描述,生成 3 个考察视角:用户真实痛点、技术实现难度、与现有功能冲突风险。
Step 2 (Evaluate):
对每个视角进行深思熟虑的评估。
• 对于痛点:必须引用用户反馈或数据支持。
• 对于技术:如果涉及未知领域,请标记为“不确定”并建议调用搜索工具。
• 对于冲突:检查是否破坏现有逻辑。
Step 3 (Decision):
• 如果任一视角存在致命缺陷(Fatal Flaw),请直接拒绝需求并说明理由。
• 如果所有视角均通过,请生成 PRD 摘要。
• 如果有疑点,请提出具体问题以供人类澄清(Human-in-the-loop)。【实现效果】

可以看到,通过思维树,agent具备了更加深度思考和审视需求的能力。