近期,AI Agent Manus 的开发团队发表了一篇引人深思的文章,提出了他们的核心理念:“上下文工程就是你所需要的一切 (Context Engineering is All You Need)。” [1] 这一理念,标志着业界从追求“从零打造专用模型”的思路,向“精心设计通用大模型上下文”的一次重要转变。本文将深入剖析 Manus 团队从实践中总结的关键经验,并为“上下文工程”这一新兴领域提供一个批判性的分析视角。
文章的核心论点在于,构建和优化 LLM 输入(即“上下文工程”)的艺术与科学,相比于漫长且昂贵的模型训练过程,能够带来更显著、更快速的性能提升。Manus 团队的经验表明,通过专注于“提示 (Prompt)”,开发者可以“有效利用 OpenAI 等巨头在模型研发上投入的数十亿美元资金。” [1]
这无疑是一个极具吸引力的主张。它降低了 AI Agent 的开发门槛,将重心从资源密集型的模型训练,转移到更易于实现和快速迭代的上下文优化上。这意味着,释放 Agent 潜力的关键,或许不在于创造一个全新的“大脑”,而在于如何为现有的“大脑”以最高效的方式提供最精准的信息。
文章详细阐述了在 Manus 开发过程中,被证明行之有效的几项核心策略。
Manus 团队极其重视对 KV 缓存的优化。KV 缓存是 Transformer 架构中的核心机制,用于存储中间计算结果,其命中率直接决定了 Agent 的响应速度和成本效益。团队直言:“KV 缓存命中率是 Agent 性能最重要的指标。” [1] 为此,他们提出了三项基本原则:
对 KV 缓存的极致追求,是工程实用主义的体现。它不仅正视了使用顶尖 LLM 的经济成本,更将技术限制巧妙地转化为了自身的竞争优势。
当 Manus 这样的 Agent 拥有大量可用工具时,如何向模型有效呈现这些工具便成了一个难题。传统方法可能会动态地从上下文中移除当前不可用的工具,但文章一针见血地指出,这种做法会“破坏 KV 缓存,并让模型感到困惑。” [1]
Manus 的解决方案是“掩码 (Masking)”。它并非直接移除工具,而是在生成回复时,通过编程方式干预(操纵 token logits),降低模型选择不可用工具的概率。这种“软引导”更为优雅和高效,既能指引 Agent 做出正确决策,又维护了上下文的完整性。
LLM 有限的上下文窗口是其处理复杂任务时的天然瓶颈。Manus 团队的破局之法,是将文件系统视为一种可持久化的外部记忆体。Agent 可以将大段信息(如网页内容)存入文件,然后在上下文中仅保留文件路径作为索引,从而“有效地获得了无限的上下文窗口”。[1]
这是一个看似简单却意义深远的思维转变。它让 Agent 的能力不再局限于模型本身,而是扩展到了更广阔的计算环境,这是构建高能 AI Agent 的关键一步。
在执行长耗时任务时,Agent 很容易“迷失方向”。为了解决这一问题,Manus 团队采用了他们称之为“复述 (Recitation)”的技巧。他们让 Agent 维护一个 todo.md
文件,并周期性地回顾和更新其内容。团队认为,这种方式能够“将核心任务规划始终保持在模型的近期注意力范围内。” [1]
这是一个巧妙管理模型“注意力”的绝佳范例。在 Agent 的世界里,注意力是与上下文窗口同等宝贵的稀缺资源。该技巧为解决 Agent 的失焦问题提供了一个极具操作性的方案。
也许最反直觉、也最富洞见的经验,是选择将错误信息保留在上下文中。文章的观点是:“当模型看到自己执行了某个动作并遭遇失败后,它会从中学习,避免重蹈覆辙。” [1] 这正是区分一个 Agent 是否真正具备“智能”的关键特质——从失败中学习的能力。
这种方法与业界普遍倾向于隐藏错误、向模型呈现“完美”上下文的做法形成了鲜明对比。通过让模型直面自己的失败,Manus 团队实际上是在培养一种更鲁棒、更具适应性的学习能力。
Manus 团队对上下文工程的深度探索,无疑为 AI Agent 开发领域做出了卓越贡献。它为业界提供了一条区别于传统模型训练的、更讲求实用与效率的创新路径。这些策略并非纸上谈兵,而是源于构建真实世界 AI Agent 的宝贵实践。
然而,我们同样需要认识到,上下文工程并非“银弹”。其有效性终究受限于底层 LLM 的能力上限。随着模型技术的不断演进,今天奏效的工程技巧,未来可能需要不断调整和迭代。
此外,尽管文章描绘了激动人心的前景,但要成功实施这些策略,需要开发者对 LLM 的内在机制和 Agent 的应用场景都有着深刻的理解。这本身就是一项复杂的、充满挑战的工程任务。
Manus 的研发历程,为“上下文工程”的重要性提供了强有力的证明。通过将创新的焦点从模型本身转向模型与环境的交互(即上下文),Manus 团队开辟出一条兼具实用与前瞻性的发展道路。他们的经验与教训,对于每一位致力于构建下一代 AI Agent 的开发者而言,都是一份不容错过的宝贵财富。正如其文章所言,在 AI Agent 的世界里,“上下文为王”。
来源: [1] Context Engineering for AI Agents: Lessons from Building Manus (https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)