深度解析 AI 代理框架 "pi"

对话 Mario 与 Armen：关于极简主义、安全风险与编程的未来

核心要点

pi 框架的核心是一个极其简单的 "While 循环"，调用 LLM 并赋予其少量工具。实际上，当前最先进的模型（如 Claude/Opus）只需要 Bash 环境即可完成绝大多数任务。

LLM 是聊天工具，而代理（Agent）是拥有工具（如文件读写、Bash 执行）的 LLM。未来的趋势是代理根据上下文“自我修正”和“自我扩展”，而非依赖僵化的外部工具。

当前的代理处于“狂野西部”阶段。提示注入（Prompt Injection）和恶意网页可能诱导代理读取本地敏感文件并上传。普通用户难以理解这种风险，安全与便利性目前存在冲突。

Mario 认为 MCP（Model Context Protocol）过于复杂且不可组合。它强迫将所有工具塞入上下文，导致 Token 浪费。相比之下，让代理编写临时 Shell 脚本或自我修改工具更为高效。

开场与背景

Mario 介绍 pi 是一个极简的、可无限扩展的代理框架。它不仅是 Claude Bot 等背后的底层理念，更是为那些想构建“全能代理”的人设计的安全带。其核心发现是：LLM 只需要 Bash 环境就能通过文件系统和命令行完成复杂的编程和日常任务。

技术深潜

讨论指出，与其构建复杂的工具链，不如直接给 LLM 一个终端。Armen 和 Mario 发现，模型非常擅长阅读手册并编写自己的 Bash 脚本来解决问题。云端开发环境（如 Cloud Code）本质上就是“文件夹 + Bash + LLM”。

关键议题

Mario 警告说，代理无法区分用户指令和恶意第三方数据（如网页里的隐藏文本）。如果代理有读取文件和联网的权限，这就相当于远程代码执行漏洞。目前业界缺乏完美的解决方案，只能靠模型“不要做蠢事”的指令，这是不够的。

架构之争

Mario 批评当前流行的 MCP 协议。他认为代理应该具备“自我修复”和“热重载”能力。例如，如果浏览器 Cookie 设置变了，代理应该自己修改控制脚本，而不是等待开发者更新 MCP 服务器。代码即真理，不需要额外的记忆层。

应用场景

嘉宾分享了实际用例：自动化处理学校繁杂的 PDF 通告、抓取杂货店价格进行比价（行动主义）、帮助科学家妻子建立数据处理管道。普通人也能通过自然语言获得“超能力”。

未来展望

Mario 预测，未来我们不再关注具体的工具配置，一切都将变成“系统”。虽然目前技术像“漏洞百出的软件”，但随着模型能力的提升，自我修改和自我生成的代码将成为常态。

"pi 本质上就是一个 while 循环，它调用一个带有四个工具的 LLM……事实证明，你只需要 bash 就够了。"

— Mario

"代码即真理。它在不断发展，我不需要再维护另一个记忆系统了。"

— Mario

"我们生活在未来，但未来就像一个漏洞百出的软件。"

— Mario

"这就像我的第一次体验，即使九个月后，看到电脑按指令做事仍然让我感到震撼。"

— Armen