```html
pi 框架的核心是一个极其简单的 "While 循环",调用 LLM 并赋予其少量工具。实际上,当前最先进的模型(如 Claude/Opus)只需要 Bash 环境即可完成绝大多数任务。
LLM 是聊天工具,而代理(Agent)是拥有工具(如文件读写、Bash 执行)的 LLM。未来的趋势是代理根据上下文“自我修正”和“自我扩展”,而非依赖僵化的外部工具。
当前的代理处于“狂野西部”阶段。提示注入(Prompt Injection)和恶意网页可能诱导代理读取本地敏感文件并上传。普通用户难以理解这种风险,安全与便利性目前存在冲突。
Mario 认为 MCP(Model Context Protocol)过于复杂且不可组合。它强迫将所有工具塞入上下文,导致 Token 浪费。相比之下,让代理编写临时 Shell 脚本或自我修改工具更为高效。
Mario 介绍 pi 是一个极简的、可无限扩展的代理框架。它不仅是 Claude Bot 等背后的底层理念,更是为那些想构建“全能代理”的人设计的安全带。其核心发现是:LLM 只需要 Bash 环境就能通过文件系统和命令行完成复杂的编程和日常任务。
讨论指出,与其构建复杂的工具链,不如直接给 LLM 一个终端。Armen 和 Mario 发现,模型非常擅长阅读手册并编写自己的 Bash 脚本来解决问题。云端开发环境(如 Cloud Code)本质上就是“文件夹 + Bash + LLM”。
Mario 警告说,代理无法区分用户指令和恶意第三方数据(如网页里的隐藏文本)。如果代理有读取文件和联网的权限,这就相当于远程代码执行漏洞。目前业界缺乏完美的解决方案,只能靠模型“不要做蠢事”的指令,这是不够的。
Mario 批评当前流行的 MCP 协议。他认为代理应该具备“自我修复”和“热重载”能力。例如,如果浏览器 Cookie 设置变了,代理应该自己修改控制脚本,而不是等待开发者更新 MCP 服务器。代码即真理,不需要额外的记忆层。
嘉宾分享了实际用例:自动化处理学校繁杂的 PDF 通告、抓取杂货店价格进行比价(行动主义)、帮助科学家妻子建立数据处理管道。普通人也能通过自然语言获得“超能力”。
Mario 预测,未来我们不再关注具体的工具配置,一切都将变成“系统”。虽然目前技术像“漏洞百出的软件”,但随着模型能力的提升,自我修改和自我生成的代码将成为常态。
"pi 本质上就是一个 while 循环,它调用一个带有四个工具的 LLM……事实证明,你只需要 bash 就够了。"
"代码即真理。它在不断发展,我不需要再维护另一个记忆系统了。"
"我们生活在未来,但未来就像一个漏洞百出的软件。"
"这就像我的第一次体验,即使九个月后,看到电脑按指令做事仍然让我感到震撼。"