Overview
Shell + Skills + Compaction:长时代理的可执行工作流
文章核心观点:要让长时代理真正能做“现实工作”,需要三件套——Skills(流程/规范)、Shell(执行环境)、Compaction(长上下文持续性)。它们组合在一起,才能把“能想”变成“能做且可控”。
Skills = 过程
把流程、模板、边界条件打包成可复用技能,模型按描述路由调用。
Shell = 执行
在真实终端中安装依赖、运行脚本、生成可交付产物。
Compaction = 续航
自动压缩上下文,保障长流程持续推进。
Key Tips
- 技能描述要像路由规则:何时用/何时不用/输出与验收。
- 加入负例与边界案例,能显著提升技能触发准确率。
- 模板与示例放在 skill 里,只有调用时才加载。
- 长流程要复用容器、传 previous_response_id、默认启用 compaction。
- 需要确定性时,直接指令“使用某技能”。
- 技能 + 联网风险高:收紧 allowlist,把工具输出当不可信。
- /mnt/data 是产物交付边界。
Build Patterns
- Install → Fetch → Write Artifact:最基础也最可靠的可交付模式。
- Skills + Shell:把流程固化进技能,保证可重复执行。
- Skills as SOP:企业级场景中,技能成为可迭代的标准作业流程。
“用 Skills 定如何做,用 Shell 负责执行,用 Compaction 保持持续性;再加上网络安全约束,长时代理才能真正落地。”