AI Engineer 2026 · Video Notes 05

Theo：很多人以为自己在调教 agent，其实只是在用过期文档给模型制造幻觉

Theo 比 Matt 更进一步，他不只说 repo 文档会浪费上下文，还说很多时候你该修的不是提示文件，而是代码库本身。

Theo 这条视频更像一次“上下文管理总复盘”。他援引研究，也给出自己的实测，结论非常直白，CLAUDE.md / AGENT.md 往往让模型表现更差，而且代价不仅是 token 变贵，还包括错误引导、注意力分散，以及维护一份注定过期的伪 source of truth。

核心观点提炼

Theo 先引用研究结果，Agent MD / Claude MD 在多个模型上会稳定拉低表现，然后用自己 20% 左右的额外成本和更差结果去呼应。这个一致性很有说服力。

他对某个 agent MD 样本的拆解很狠，commands、架构、数据流状态、目录说明，几乎都被判定为“代码里已经有”。重复描述只会把模型往错误方向 steer。

Theo 一个很有意思的点是，把 agent 的困惑当作 codebase design feedback。它卡住的地方，往往说明你的结构、命名、边界或 discoverability 有问题。

他甚至会有意通过 agent MD 暴露模型卡点，但目标不是长期保留这些提示，而是借此观察，再去调整架构。

开场

Theo 先把“每个 repo 都该有 CLAUDE.md”这类流行信条打碎。

前半段

他把问题归结到 context management，不必要的 steer 会让模型偏离真正该看的源头。

中段

commands、architecture、workflow states 等条目被逐一否定，因为它们并非高价值常驻信息。

后半段

Theo 说明自己很多时候只 merge 少量 agent 改动，但会利用其余输出去改进代码库。

结论

这把“prompting”问题重新定位回软件工程本身。

“If the info is in the codebase, it probably doesn’t need to be in the agent MD file.”

这是整条视频最值得记住的一句。

“Agent MD files will go out of date.”

不是可能会，而是几乎必然会。

“I merge less than a fifth of the changes it proposes, but the other four out of five I use to make the codebase better.”

Theo 最强的洞察在这里，agent 不只是写代码机器，还是暴露系统缺陷的探针。

Theo 把问题讲得更彻底，很多人把 agent 失误归咎于“没写好提示文件”，但真正的病灶常常在 repo 本身。对 2026 年的 AI engineer 来说，最有价值的能力不是写更长的 CLAUDE.md，而是把代码库做成一个 agent 自然读得懂、走得通、改得动的环境。