← agent lab
// agent lab · deep dive 03

DESIGN PATTERNS

架构模式深入 —— 每种模式跑一遍、跑挂一遍,再学会怎么选
01 / REACT, AND HOW IT BREAKS

ReAct:好用,但会原地打转

入门篇的模拟器展示了 ReAct 顺风局。生产环境更值得研究的是逆风局:模型没有全局计划,每一步只看眼前,遇到反复失败的工具时容易陷入"换汤不换药"的重试循环。逐步播放一个真实的卡死案例和工程解法👇

case study · 任务:『查 ACME 公司 2025 年营收』
防打转的三件套

① 步数预算:超过 N 步强制停下来汇报;② 重复检测:连续相同的(工具, 参数)调用直接拦截,把"你在重复自己"写进上下文;③ 失败记录显式化:让模型维护一个"已试过 & 不行"清单——写下来的失败比埋在历史里的失败更能改变行为。

02 / PLAN-AND-EXECUTE

先规划后执行:计划赶不上变化怎么办

这个模式的精髓不是"先列清单",而是清单是活的。点击"推进",看一个数据迁移任务怎么在第 3 步翻车,又怎么靠重规划(replan)救回来——注意计划修改的不是失败那一步,而是后续所有步骤👇

simulator · 任务:『把用户表从 MySQL 迁到 PostgreSQL』
点击"推进"开始执行计划。
计划的隐藏价值:给人看

计划是天然的 human-in-the-loop 切入点:执行前用户能审一眼(Claude Code 的 plan mode 就是这个思路),执行中清单就是进度条,出错时也容易定位"卡在第几步"。相比之下 ReAct 的决策埋在每轮思考里,人很难提前干预。

03 / REFLECTION

自我反思:收益是递减的

"生成 → 批评 → 修订"听起来可以无限循环下去,实际上第一轮反思吃掉大部分收益,之后快速递减,而每一轮的 token 成本是恒定的。点击"再反思一轮",体会这条曲线👇

simulator · 任务:『写一个 email 校验函数』
质量
让批评有牙齿

纯"自我感觉"式反思容易空转——模型夸自己写得不错,然后改两个变量名交差。反思的质量取决于反馈信号的质量:能跑测试就跑测试,能 lint 就 lint,能让另一个模型当评审就别让作者自评。外部信号 ≫ 自我感觉。

04 / MULTI-AGENT

多智能体:拓扑决定成败

"多个 Agent 协作"不是一种模式,是一族。拓扑选错,沟通成本会吃掉全部并行收益。点击切换四种常见拓扑,注意各自的信息流向和翻车方式👇

topology · 点击切换
多智能体的第一定律

能单 Agent 解决的别上多 Agent。子 Agent 之间不共享上下文,每次交接都是有损压缩——A 知道的细节传到 B 手里只剩一段转述。收益要来自真并行(互不依赖的子任务)或真隔离(每个子任务的上下文都很重),否则只是把一个模型的活拆给三个模型干,又慢又贵还容易口径不一。

05 / WHICH ONE?

选型决策树:回答三个问题

没有最好的模式,只有匹配任务的模式。回答下面几个问题,拿到一个起步建议(注意只是起步——真实系统经常是混合体)👇

decision tree · 点击作答
混搭才是常态

真实系统很少"纯血":Claude Code 是 ReAct 主循环 + 可选 plan mode + 测试驱动的 reflection + 按需派生子 Agent。先用最简单的模式跑通,eval 指出短板后再针对性叠加——架构是长出来的,不是选出来的。

06 / QUIZ

随堂测验:检验一下

5 道题。答错没关系,解析比答案重要。

quiz · 点击选项作答
→ / KEEP GOING

继续深入