上下文为王：深入剖析 Manus 背后的上下文工程哲学

近期，AI Agent Manus 的开发团队发表了一篇引人深思的文章，提出了他们的核心理念：“上下文工程就是你所需要的一切 (Context Engineering is All You Need)。” [1] 这一理念，标志着业界从追求“从零打造专用模型”的思路，向“精心设计通用大模型上下文”的一次重要转变。本文将深入剖析 Manus 团队从实践中总结的关键经验，并为“上下文工程”这一新兴领域提供一个批判性的分析视角。

核心论点：上下文优于模型

文章的核心论点在于，构建和优化 LLM 输入（即“上下文工程”）的艺术与科学，相比于漫长且昂贵的模型训练过程，能够带来更显著、更快速的性能提升。Manus 团队的经验表明，通过专注于“提示 (Prompt)”，开发者可以“有效利用 OpenAI 等巨头在模型研发上投入的数十亿美元资金。” [1]

这无疑是一个极具吸引力的主张。它降低了 AI Agent 的开发门槛，将重心从资源密集型的模型训练，转移到更易于实现和快速迭代的上下文优化上。这意味着，释放 Agent 潜力的关键，或许不在于创造一个全新的“大脑”，而在于如何为现有的“大脑”以最高效的方式提供最精准的信息。

Manus 上下文工程的关键策略

文章详细阐述了在 Manus 开发过程中，被证明行之有效的几项核心策略。

1. KV 缓存：不可动摇的性能基石

Manus 团队极其重视对 KV 缓存的优化。KV 缓存是 Transformer 架构中的核心机制，用于存储中间计算结果，其命中率直接决定了 Agent 的响应速度和成本效益。团队直言：“KV 缓存命中率是 Agent 性能最重要的指标。” [1] 为此，他们提出了三项基本原则：

稳定的前缀 (Stable Prefix): 保持提示的初始部分在多轮交互中的一致性。
仅追加的上下文 (Append-Only Context): 只在上下文后追加新信息，避免修改已有内容。
确定性序列化 (Deterministic Serialization): 确保相同信息始终以完全相同的方式进行文本表示。

对 KV 缓存的极致追求，是工程实用主义的体现。它不仅正视了使用顶尖 LLM 的经济成本，更将技术限制巧妙地转化为了自身的竞争优势。

2. 工具掩码：更优雅的 Agent 引导术

当 Manus 这样的 Agent 拥有大量可用工具时，如何向模型有效呈现这些工具便成了一个难题。传统方法可能会动态地从上下文中移除当前不可用的工具，但文章一针见血地指出，这种做法会“破坏 KV 缓存，并让模型感到困惑。” [1]

Manus 的解决方案是“掩码 (Masking)”。它并非直接移除工具，而是在生成回复时，通过编程方式干预（操纵 token logits），降低模型选择不可用工具的概率。这种“软引导”更为优雅和高效，既能指引 Agent 做出正确决策，又维护了上下文的完整性。

3. 文件系统：Agent 的无限外置记忆体

LLM 有限的上下文窗口是其处理复杂任务时的天然瓶颈。Manus 团队的破局之法，是将文件系统视为一种可持久化的外部记忆体。Agent 可以将大段信息（如网页内容）存入文件，然后在上下文中仅保留文件路径作为索引，从而“有效地获得了无限的上下文窗口”。[1]

这是一个看似简单却意义深远的思维转变。它让 Agent 的能力不再局限于模型本身，而是扩展到了更广阔的计算环境，这是构建高能 AI Agent 的关键一步。

4. 目标复述：让 Agent 保持专注的秘诀

在执行长耗时任务时，Agent 很容易“迷失方向”。为了解决这一问题，Manus 团队采用了他们称之为“复述 (Recitation)”的技巧。他们让 Agent 维护一个 todo.md 文件，并周期性地回顾和更新其内容。团队认为，这种方式能够“将核心任务规划始终保持在模型的近期注意力范围内。” [1]

这是一个巧妙管理模型“注意力”的绝佳范例。在 Agent 的世界里，注意力是与上下文窗口同等宝贵的稀缺资源。该技巧为解决 Agent 的失焦问题提供了一个极具操作性的方案。

5. 拥抱错误：通往真正“智能”的必经之路

也许最反直觉、也最富洞见的经验，是选择将错误信息保留在上下文中。文章的观点是：“当模型看到自己执行了某个动作并遭遇失败后，它会从中学习，避免重蹈覆辙。” [1] 这正是区分一个 Agent 是否真正具备“智能”的关键特质——从失败中学习的能力。

这种方法与业界普遍倾向于隐藏错误、向模型呈现“完美”上下文的做法形成了鲜明对比。通过让模型直面自己的失败，Manus 团队实际上是在培养一种更鲁棒、更具适应性的学习能力。

客观评估与展望

Manus 团队对上下文工程的深度探索，无疑为 AI Agent 开发领域做出了卓越贡献。它为业界提供了一条区别于传统模型训练的、更讲求实用与效率的创新路径。这些策略并非纸上谈兵，而是源于构建真实世界 AI Agent 的宝贵实践。

然而，我们同样需要认识到，上下文工程并非“银弹”。其有效性终究受限于底层 LLM 的能力上限。随着模型技术的不断演进，今天奏效的工程技巧，未来可能需要不断调整和迭代。

此外，尽管文章描绘了激动人心的前景，但要成功实施这些策略，需要开发者对 LLM 的内在机制和 Agent 的应用场景都有着深刻的理解。这本身就是一项复杂的、充满挑战的工程任务。

结语

Manus 的研发历程，为“上下文工程”的重要性提供了强有力的证明。通过将创新的焦点从模型本身转向模型与环境的交互（即上下文），Manus 团队开辟出一条兼具实用与前瞻性的发展道路。他们的经验与教训，对于每一位致力于构建下一代 AI Agent 的开发者而言，都是一份不容错过的宝贵财富。正如其文章所言，在 AI Agent 的世界里，“上下文为王”。

来源: [1] Context Engineering for AI Agents: Lessons from Building Manus (https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)