目录 大模型上下文工程权威指南 第一部分:认识上下文工程 第一章 上下文工程概述 1.1 什么是上下文工程 1.2 从提示词工程到上下文工程 1.3 上下文工程的核心价值 1.4 本书结构与学习路径 本章小结 第二章 大模型基础与上下文窗口 2.1 大语言模型工作原理 2.2 上下文窗口的本质 2.3 Token 与上下文限制 2.4 主流模型的上下文能力对比 2.5 SSM vs Transformer 在上下文工程中的对比 本章小结 第三章 上下文工程的理论框架 3.1 信息环境设计原则 3.2 四大核心策略概览 3.3 上下文质量评估 3.4 上下文工程方法论 3.5 上下文管理的量化评估方法 本章小结 第二部分:核心技术与策略 第四章 上下文写入与存储 4.1 外部存储与记忆系统 4.2 记忆架构设计 4.3 知识库构建与管理 4.4 向量数据库实践 本章小结 第五章 上下文选择与检索 5.1 检索增强生成原理 5.2 文档分块策略 5.3 嵌入模型与语义搜索 5.4 重排序与相关性优化 5.5 混合检索与高级检索增强生成 本章小结 第六章 上下文压缩与优化 6.1 信息密度与压缩原理 6.2 摘要与信息提取 6.3 对话历史管理 6.4 上下文窗口优化策略 6.5 压缩策略案例分析 本章小结 第七章 上下文隔离与结构化 7.1 结构化上下文设计 7.2 XML 标签与指令分层 7.3 系统提示词设计 7.4 多任务上下文隔离 7.5 隔离策略案例分析 本章小结 第三部分:进阶技术与架构 第八章 工具调用与能力扩展 8.1 函数调用机制 8.2 工具定义与设计 8.3 工具执行与结果处理 8.4 模型上下文协议与工具标准化 本章小结 第九章 智能体上下文管理 9.1 智能体架构与上下文 9.2 单智能体上下文管理 9.3 多智能体上下文传递 9.4 智能体记忆与学习 9.5 智能体上下文管理的高级主题 本章小结 第十章 进阶技术与架构 10.1 自主检索增强生成与自主检索 10.2 Graph RAG 与知识图谱 10.3 自适应与智能上下文管理 10.4 长上下文模型应用 10.5 多模态上下文管理 10.6 Graph RAG 失败案例分析 10.7 多模态上下文安全策略 10.8 长时间任务的上下文策略 本章小结 第十一章 反模式与常见错误 11.1 过度压缩与信息丢失 11.2 上下文污染与隔离失效 11.3 检索失败与相关性陷阱 本章小结 第四部分:工程实战与未来演进 第十二章 生产环境最佳实践 12.1 上下文工程工作流 12.2 性能优化与成本控制 12.2.1 成本建模与 ROI分析框架 12.2.2 成本优化的具体行业数据 12.3 可观测性与调试 12.4 安全性与治理 12.4.1 上下文工程中的安全与合规 12.5 故障排查与问题诊断 本章小结 第十三章 行业应用与架构案例 13.1 医疗:电子病历问答系统 13.2 金融:风控知识库构建 13.3 法律:合同审查智能体 13.4 教育:个性化学习助手 13.5 案例分析:全自主智能体架构(示意) 本章小结 第十四章 综合实战 - 构建企业知识库问答系统 14.1 项目需求与架构设计 14.2 知识库构建与向量化 14.3 检索系统实现 14.4 对话历史管理 14.5 性能优化与部署 14.6 持续迭代与改进 14.7 可运行的代码示例与实现模式 EnterpriseKnow 可运行最小实验 本章小结 第十五章 未来展望与发展趋势 15.1 上下文工程的技术演进 15.2 行业应用趋势 15.3 挑战与机遇 15.4 成为上下文工程专家 本章小结 附录 附录 A:术语表 附录 B:工具与技术生态 附录 C:参考资源 附录 D:参考文献 附录 E:快变事实核验表