上下文工程:为什么AI模型"看到"什么比"如何提问"更重要
核心问题:提示词已经过时
过去三年,AI从业者花费大量精力优化提示词——精心措辞,添加角色定位,使用"思考链"技巧。但一个不舒服的事实正在浮现:怎样问问题,远不如给模型什么样的信息重要。
这个转变有一个名字:上下文工程(Context Engineering)。它改变了我们对AI系统的基本假设。
提示词工程 vs 上下文工程:区别在哪里
提示词工程关注的是如何构造问题——用什么词、什么顺序、什么框架来引导模型给出更好的答案。这有用,但有局限性。
上下文工程则完全不同。它关注的是:
- 模型在回答前能够访问什么信息
- 这些信息如何组织和呈现
- 模型的注意力资源如何分配
- 相关信息的优先级和可检索性
根据行业分析,AI团队正在从优化提示词转向优化上下文。原因很简单:即使是世界级的提示词,如果模型看不到相关的事实、数据或上下文,也无法做出好的决策。
为什么上下文工程在生产环境中至关重要
考虑一个实际例子。假设一家上海的财务团队使用AI来分析季度报告。
用提示词工程的方式:
"请分析我们的Q2财务数据,考虑市场波动和行业趋势。"
模型会尽力,但它不知道:
- 贵公司上年同期的具体数字
- 你们行业的竞争对手表现如何
- 相关的税务政策变化(如增值税率调整)
- 你们公司特有的成本结构
用上下文工程的方式:
在提出问题之前,你准备一个精心组织的上下文包:过去三年的财务报表、行业基准数据、近期的监管变化文件、你们公司的运营手册。模型在分析时能够直接访问这些信息,而不是凭记忆或猜测。
差别是巨大的。一项研究表明,优化上下文结构可以显著改善AI在数据科学应用中的性能。
上下文窗口:你实际拥有的"工作内存"
现代语言模型有一个关键限制:上下文窗口。这是模型在一次对话中能够"看到"的最大信息量。
Claude、GPT-4o、Gemini等模型的上下文窗口现在通常在10万到200万个token之间。这听起来很大,但在生产环境中,窗口大小不是唯一问题——如何使用它才是。
| 方法 | 优势 | 劣势 |
|---|---|---|
| 长上下文窗口 | 可以加载完整文档;无需外部检索系统 | 成本高;推理速度慢;信息过载可能降低准确性 |
| RAG(检索增强生成) | 成本低;速度快;精确检索相关信息 | 依赖检索质量;可能漏掉隐含关系 |
| 混合方法 | 结合两者的优点;智能优先级排序 | 实现复杂;需要精心设计 |
关键洞察:上下文窗口利用率是一个可优化的超参数。你不需要填满整个窗口;你需要在正确的位置放置正确的信息。
实际应用:文件夹结构即架构
最新研究表明,上下文的组织方式——甚至包括文件夹结构——可以作为一种代理架构,帮助AI系统更好地导航和优先级排序信息。
对于中文用户来说,这意味着什么?
例子:新加坡公司的合规文档管理
一家在新加坡运营的中资企业需要遵守新加坡税务局(IRAS)的要求。与其将所有政策文件混在一起,你可以这样组织上下文:
📁 合规框架
📁 IRAS_税务指南
├─ 企业所得税_2026.md
├─ GST_申报_最新.md
📁 劳工法规
├─ MOM_薪酬规定.md
📁 公司运营
📁 财务记录
├─ Q1_2026_账户.csv
📁 员工信息
├─ 薪资表_2026.xlsx
这个结构告诉AI模型:"这些是相关类别。当我问及税务问题时,优先查看左侧;当我问及薪资时,优先查看右侧。"模型不需要你明确说明——良好的上下文组织本身就是一种指令。
RAG与上下文工程的关系
RAG是检索增强生成的一种模式,它自动从大型知识库中提取相关信息,然后将其注入到模型的上下文中。这是上下文工程的一个具体实现。
关键点:RAG系统的质量完全取决于上下文工程的质量。一个设计得很好的RAG系统:
- 能够精确检索相关文档
- 将最相关的信息放在模型最容易注意到的位置
- 剔除噪声和无关信息
- 优先级排序,确保高优先级上下文不被"淹没"
对于在香港的金融公司来说,这意味着你的AI系统应该能够:当被问及港元汇率影响时,自动检索香港税务局(IRD)的相关汇兑损益指南,而不是香港公司法的一般条款。
2026年的趋势:从提示工程到上下文设计
2026年的演变从提示工程转向上下文设计,反映了一个成熟的认识:AI系统的瓶颈不再是"如何措辞问题",而是"如何组织可用的知识"。
这对你的团队意味着什么?
- 投资上下文管理,而非提示优化。建立一个能够组织、标记和检索信息的系统,比花时间调整提示词更有回报。
- 设计可被AI解析的数据结构。你的文件夹、标签、元数据应该反映AI需要做出好决策的逻辑类别。
- 测量上下文质量,而非提示"魔力"。好的上下文是可重复和可扩展的;好的提示是易变的。
- 为代理架构做准备。未来的AI系统不是被动地接收上下文,而是主动导航和选择相关上下文。
对工程团队的实际建议
如果你在中国、台湾、香港、新加坡或马来西亚的公司里负责AI系统,这里是可立即采取的行动:
1. 审查你的上下文源。你正在向模型提供什么样的信息?是否有冗余、过时或不相关的数据在占用上下文空间?
2. 优化信息组织。你的知识库是否以模型容易理解和检索的方式组织?考虑使用向量数据库或图数据库,而不是平面文件。
3. 建立检索质量指标。当你的系统检索上下文时,检索的信息有多相关?精确度(precision)和召回率(recall)应该是你关注的指标,而不仅仅是提示词的措辞。
4. 为地区法规和数据建立上下文库。如果你在处理税务、劳工法规或合规问题,创建一个区域特定的上下文资源库——包括中国的税法、新加坡的IRAS规定、香港的IRD指南——然后自动将其注入到模型的上下文中。
最后的思考:信息结构即AI的工作环境
可以这样想:如果一个人类分析师走进你的办公室,要求在一个充满杂乱纸张、没有索引、没有组织的房间里工作,他们的工作会很糟糕。现在,你给AI模型的上下文也是如此。
一个AI模型,给定充分、有序、优先级排序的上下文,可以做出令人惊讶的好决策——即使你的提示词很简单。
相反,即使是最精美的提示词,如果模型看不到它需要的信息,也无法帮助。
这就是为什么上下文工程是2026年AI系统的核心竞争力。从今天开始关注它,你的AI系统会感谢你。