AI Tech News
By K.T.

上下文工程:为什么AI模型"看到"什么比"如何提问"更重要

核心问题:提示词已经过时

过去三年,AI从业者花费大量精力优化提示词——精心措辞,添加角色定位,使用"思考链"技巧。但一个不舒服的事实正在浮现:怎样问问题,远不如给模型什么样的信息重要。

这个转变有一个名字:上下文工程(Context Engineering)。它改变了我们对AI系统的基本假设。

提示词工程 vs 上下文工程:区别在哪里

提示词工程关注的是如何构造问题——用什么词、什么顺序、什么框架来引导模型给出更好的答案。这有用,但有局限性。

上下文工程则完全不同。它关注的是:

  • 模型在回答前能够访问什么信息
  • 这些信息如何组织和呈现
  • 模型的注意力资源如何分配
  • 相关信息的优先级和可检索性

根据行业分析,AI团队正在从优化提示词转向优化上下文。原因很简单:即使是世界级的提示词,如果模型看不到相关的事实、数据或上下文,也无法做出好的决策。

为什么上下文工程在生产环境中至关重要

考虑一个实际例子。假设一家上海的财务团队使用AI来分析季度报告。

用提示词工程的方式:

"请分析我们的Q2财务数据,考虑市场波动和行业趋势。"

模型会尽力,但它不知道:

  • 贵公司上年同期的具体数字
  • 你们行业的竞争对手表现如何
  • 相关的税务政策变化(如增值税率调整)
  • 你们公司特有的成本结构

用上下文工程的方式:

在提出问题之前,你准备一个精心组织的上下文包:过去三年的财务报表、行业基准数据、近期的监管变化文件、你们公司的运营手册。模型在分析时能够直接访问这些信息,而不是凭记忆或猜测。

差别是巨大的。一项研究表明,优化上下文结构可以显著改善AI在数据科学应用中的性能

上下文窗口:你实际拥有的"工作内存"

现代语言模型有一个关键限制:上下文窗口。这是模型在一次对话中能够"看到"的最大信息量。

Claude、GPT-4o、Gemini等模型的上下文窗口现在通常在10万到200万个token之间。这听起来很大,但在生产环境中,窗口大小不是唯一问题——如何使用它才是。

较长的上下文窗口与RAG(检索增强生成)各有优缺点

方法 优势 劣势
长上下文窗口 可以加载完整文档;无需外部检索系统 成本高;推理速度慢;信息过载可能降低准确性
RAG(检索增强生成) 成本低;速度快;精确检索相关信息 依赖检索质量;可能漏掉隐含关系
混合方法 结合两者的优点;智能优先级排序 实现复杂;需要精心设计

关键洞察:上下文窗口利用率是一个可优化的超参数。你不需要填满整个窗口;你需要在正确的位置放置正确的信息。

实际应用:文件夹结构即架构

最新研究表明,上下文的组织方式——甚至包括文件夹结构——可以作为一种代理架构,帮助AI系统更好地导航和优先级排序信息。

对于中文用户来说,这意味着什么?

例子:新加坡公司的合规文档管理

一家在新加坡运营的中资企业需要遵守新加坡税务局(IRAS)的要求。与其将所有政策文件混在一起,你可以这样组织上下文:

📁 合规框架
  📁 IRAS_税务指南
    ├─ 企业所得税_2026.md
    ├─ GST_申报_最新.md
  📁 劳工法规
    ├─ MOM_薪酬规定.md
📁 公司运营
  📁 财务记录
    ├─ Q1_2026_账户.csv
  📁 员工信息
    ├─ 薪资表_2026.xlsx

这个结构告诉AI模型:"这些是相关类别。当我问及税务问题时,优先查看左侧;当我问及薪资时,优先查看右侧。"模型不需要你明确说明——良好的上下文组织本身就是一种指令

RAG与上下文工程的关系

RAG是检索增强生成的一种模式,它自动从大型知识库中提取相关信息,然后将其注入到模型的上下文中。这是上下文工程的一个具体实现。

关键点:RAG系统的质量完全取决于上下文工程的质量。一个设计得很好的RAG系统:

  • 能够精确检索相关文档
  • 将最相关的信息放在模型最容易注意到的位置
  • 剔除噪声和无关信息
  • 优先级排序,确保高优先级上下文不被"淹没"

对于在香港的金融公司来说,这意味着你的AI系统应该能够:当被问及港元汇率影响时,自动检索香港税务局(IRD)的相关汇兑损益指南,而不是香港公司法的一般条款。

2026年的趋势:从提示工程到上下文设计

2026年的演变从提示工程转向上下文设计,反映了一个成熟的认识:AI系统的瓶颈不再是"如何措辞问题",而是"如何组织可用的知识"。

这对你的团队意味着什么?

  • 投资上下文管理,而非提示优化。建立一个能够组织、标记和检索信息的系统,比花时间调整提示词更有回报。
  • 设计可被AI解析的数据结构。你的文件夹、标签、元数据应该反映AI需要做出好决策的逻辑类别。
  • 测量上下文质量,而非提示"魔力"。好的上下文是可重复和可扩展的;好的提示是易变的。
  • 为代理架构做准备。未来的AI系统不是被动地接收上下文,而是主动导航和选择相关上下文。

对工程团队的实际建议

如果你在中国、台湾、香港、新加坡或马来西亚的公司里负责AI系统,这里是可立即采取的行动:

1. 审查你的上下文源。你正在向模型提供什么样的信息?是否有冗余、过时或不相关的数据在占用上下文空间?

2. 优化信息组织。你的知识库是否以模型容易理解和检索的方式组织?考虑使用向量数据库或图数据库,而不是平面文件。

3. 建立检索质量指标。当你的系统检索上下文时,检索的信息有多相关?精确度(precision)和召回率(recall)应该是你关注的指标,而不仅仅是提示词的措辞。

4. 为地区法规和数据建立上下文库。如果你在处理税务、劳工法规或合规问题,创建一个区域特定的上下文资源库——包括中国的税法、新加坡的IRAS规定、香港的IRD指南——然后自动将其注入到模型的上下文中。

最后的思考:信息结构即AI的工作环境

可以这样想:如果一个人类分析师走进你的办公室,要求在一个充满杂乱纸张、没有索引、没有组织的房间里工作,他们的工作会很糟糕。现在,你给AI模型的上下文也是如此。

一个AI模型,给定充分、有序、优先级排序的上下文,可以做出令人惊讶的好决策——即使你的提示词很简单。

相反,即使是最精美的提示词,如果模型看不到它需要的信息,也无法帮助。

这就是为什么上下文工程是2026年AI系统的核心竞争力。从今天开始关注它,你的AI系统会感谢你。