
你有没有和 AI(比如智能音箱或聊天机器人)聊过天,却觉得它“完全没 get 到你的点”?它给出的答案也许技术上正确,却完全帮不上忙。这时候,一个超级重要的新概念——**情境工程(Context Engineering)**就派上用场了!
什么是情境工程?
可以这样想:
AI 就像一个厨艺高超的大厨,什么菜都会做。如果你直接走进厨房说:“给我做点吃的!”——你觉得会得到什么?也许是一份三明治,也许是一块精致的蛋糕,也可能完全不是你想要的!大厨虽然聪明,却没有足够的背景信息来为你量身定制。
情境工程就像一位贴心顾客,提前把所有正确食材和清晰指令交给大厨,让他做出你真正想吃的菜。
它不仅是“问问题”,更是为 AI 布置完整的工作环境,让 AI 掌握完成任务所需的一切信息。
没有情境工程会怎样?
如果不做情境工程,聪明的大厨 AI 可能会犯大错:
- 给你千篇一律、对你毫无用处的答案。
- 提供毫不相干的信息。
- 甚至会编造答案——在 AI 术语里这叫“幻觉(hallucinations)”。
回到厨师的例子:如果你只说“做点吃的”,而你既纯素又对坚果过敏,结果大厨端上来一份牛排配花生酱!这就是情境失败——大厨很棒,却缺少关键细节。
情境工程如何运作?——给 AI 的“食谱大全”
情境工程在 AI 真正回答问题前就启动,像替厨师备齐所有食材与食谱。
它远不止你输入的那一句提问,还包括所有能引导 AI 思考的背景信息。
情境工程的关键“食谱配料”
配料 | 说明 | 类比厨师 |
---|---|---|
规则 | 给 AI 的通用准则,如“请礼貌回答”“用简体中文”。 | 厨房守则:只用新鲜食材、待人有礼。 |
背景信息/数据 | AI 需要的、却不在提问里的知识: - 短期记忆:当前对话前文 - 长期记忆:用户偏好(如“我是素食者”) - 实时检索:联网查天气、查资料(RAG) | 额外情报:顾客吃素、对坚果过敏、今天气温骤降。 |
示例(示范图) | 给 AI 看“好答案长什么样”,让它明白格式与风格。 | 给厨师看一张“理想摆盘”的照片。 |
禁止项与边界 | 告诉 AI 不该做什么、如何格式化输出。 | “别放坚果”“把菜装在方盘里”。 AI 例:请用 JSON 回答 {'destination': '...', 'days': ...} 。 |
为什么要这么“折腾”?
情境工程能把基础 AI变成真正强大且可靠的系统:
- 减少错误:提供足够细节,AI 不再答非所问。
- 提升实用性:能处理复杂、多步骤任务,从“廉价演示”跃升为“神奇产品”。
- 保持一致:AI 学会项目的“风格”与规则,回答始终如一。
- 更像人类:理解人类语言中的微妙暗示,互动更自然。
真实场景举例
- 智能家居:天冷了,系统不只开暖气,还知道你在度假,避免浪费能源。
- 个性化饮食计划:AI 健身私教需了解年龄、性别、体重、活动量、饮食偏好、伤病史,才能给你安全有效的方案。
- 电商推荐:不只按点击记录推商品,还结合实时天气、潮流趋势、地理位置。
情境工程 vs 提示工程
维度 | 提示工程 | 情境工程 |
---|---|---|
核心目标 | 打磨一句提问/指令以获得理想输出。 | 构建动态系统,在每次调用时为模型提供所有必要信息。 |
关注范围 | 问什么。局限于单条文本。 | 如何准备模型来回答。涵盖整个交互与整个上下文窗口。 |
组成要素 | 巧妙措辞、关键词。 | 系统提示、用户输入、短期记忆、长期记忆、RAG 检索、工具定义、工具返回、结构化输出、全局状态…… |
复杂度 | 适合简单、一次性任务。常需反复试错。 | 针对多步骤、数据丰富、动态场景。追求可复现框架;从架构层面减少 AI 失效。 |
结果表现 | 对一条输入有效,换条问法就崩溃。 | 把 LLM 从简单聊天机器人变成强大、目标驱动的系统与自主智能体。 |
关键挑战 | 想出一句“神 prompt”。 | 策划并优化模型的“工作记忆”,受上下文长度、格式、相关性限制。 |
与 RAG 关系 | 不包含 RAG,RAG 是独立技术。 | RAG 是核心组件之一,情境工程把 RAG 与记忆、格式等统筹调度。 |