上下文主权比功能数量更重要
Mario 对 Cloud Code 的真正不满,不是 UI 抖动或 feature bloat,而是系统提示、工具定义、system reminder 会在版本中不断变化,破坏他已建立的稳定工作流。对于 2026 年的工程师,这意味着 harness 的首要价值是可预测性,不是花哨功能。
Mario 对 Cloud Code 的真正不满,不是 UI 抖动或 feature bloat,而是系统提示、工具定义、system reminder 会在版本中不断变化,破坏他已建立的稳定工作流。对于 2026 年的工程师,这意味着 harness 的首要价值是可预测性,不是花哨功能。
Pi 选择很小的 system prompt、少量内建工具、Markdown skills 和 TypeScript extension API。这个方向本质上是在说,agent 应该适应工作流,而不是逼团队适应 harness。
他反复强调 observability 和 hooks 深度。能不能看见 agent 做了什么,能不能在 session 内热重载扩展,决定了团队是“调系统”还是“碰运气”。
Mario 最后不是在鼓吹全自动,而是在强调任务必须有边界、模块化和可验证目标。agent 适合做 bounded work,不适合在缺上下文时瞎补架构。
从早期惊艳到后期失望,问题集中在上下文被产品方不断改写、缺 observability、缺 model choice。
terminal-bench 让他意识到,复杂本地集成不一定比简单 tmux/keystroke harness 更优,关键在控制面和上下文设计。
provider abstraction、agent core、TUI framework、coding agent 分层,配合 skills 与 extensions,让 agent 可以自我修改。
clankers、低质量 issue、自动化 PR 噪声,把 maintainer 时间从创造性工作拖进了垃圾处理。
真正的结论不是“全自动”,而是放慢,把 agent 用在模块化、可验证、非关键的任务上。
如果 Ryan 代表的是“大规模把 agent 纳入生产系统”,Mario 代表的就是另一条同样重要的线:先把 harness 做成你真正能理解、能修改、能限制的工具。对 2026 年的 AI engineer 来说,这比追最新 benchmark 更重要。