Skip to content

Latest commit

 

History

History
85 lines (54 loc) · 6.82 KB

File metadata and controls

85 lines (54 loc) · 6.82 KB

附录 D:参考文献

本文档列出了书中引用的学术论文和关键技术报告,供读者深入研读。

学术论文

基础架构

  • Attention Is All You Need: Vaswani, A., et al. (2017). Attention Is All You Need. NIPS.
    • 解读:Transformer 架构的奠基之作,理解 Self-Attention 机制的必读文献。

检索增强生成

长上下文与注意力

知识图谱与 Graph RAG

智能体与记忆

  • MemGPT: Packer, C., et al. (2023). MemGPT: Towards LLMs as Operating Systems.

    • 解读:提出将上下文窗口视为“主内存”、外部存储视为“磁盘”的操作系统隐喻,通过虚拟上下文管理实现无限对话记忆。
  • MemOS: Li, Z., et al. (2025). MemOS: A Memory OS for AI System.

    • 解读:以 MemCube(记忆立方体)为基本单元封装记忆内容与元数据,统一管理明文、激活、参数三类记忆的表示、调度与演化,并采用接口层、操作层、基础设施层的三层架构。
  • Generative Agents: Park, J. S., et al. (2023). Generative Agents: Interactive Simulacra of Human Behavior. UIST 2023.

    • 解读:斯坦福的生成式智能体研究,展示了如何通过反思(Reflection)和记忆检索构建具有可信行为的智能体。
  • Reflexion: Shinn, N., et al. (2023). Reflexion: Language Agents with Verbal Reinforcement Learning. NeurIPS 2023.

    • 解读:让智能体通过语言化的自我反思进行学习,将失败经验转化为长期记忆,提升后续任务的成功率。
  • ReAct: Yao, S., et al. (2023). ReAct: Synergizing Reasoning and Acting in Language Models. ICLR 2023.

    • 解读:提出“思考-行动-观察”的交替循环模式,是现代智能体架构的核心范式。
  • Agentic Reasoning: Wei, T., et al. (2026). Agentic Reasoning for Large Language Models. arXiv preprint arXiv:2601.12538. DOI: 10.48550/arXiv.2601.12538.

    • 解读:系统梳理基础智能体推理、自我进化推理和集体多智能体推理三层框架,适合作为第九章高级智能体上下文管理的理论背景。
  • OpenAI Dreaming: OpenAI. (2026). Dreaming: Better memory for a more helpful ChatGPT.

    • 解读:ChatGPT 记忆从“保存的记忆”(显式写入)演进到后台自动综合的工程实践;提出“带上下文前进 / 遵循偏好 / 随时间保持时效”三条记忆评测目标,是第九章“做梦”机制的真实产品对照。

工具使用

技术报告与基准测试