Skip to content

Latest commit

 

History

History
189 lines (136 loc) · 13.7 KB

File metadata and controls

189 lines (136 loc) · 13.7 KB

解构全维度智能体提示词框架(Comprehensive Agent Prompting Framework)

作者:江枫

本文介绍了全维度智能体提示词框架和全维度智能体 CAP 框架分层设计详细流程,三大核心工具的调用机制,希望对你的学习有帮助。 本文来自于江枫VGI。

全维度智能体提示词框架(Comprehensive Agent Prompting Framework, 简称CAP Framework)

说明:在阅读这篇文章之前,对AI智能体不熟悉朋友建议先了解 AI 智能体 相关的概念。以便更好的掌握全维度智能体提示词框架(CAP), 既知道为什么要这么设计提示词的问题,又为设计提示词垫定更加坚实的理论基础。

全维度智能体提示词框架( Comprehensive Agent Prompting Framework,简称 CAP) 为AI 智能体创造了一个 从"我是谁" 到 "我能做什么" 再到 "我不能做什么",以及 "我如何工作" 的完整清晰的控制链。同样也为提示词工程提供标准化 设计 模式及可维护性等。

  1. 全维度智能体提示词框架 (CAP Framework )

" 全维度智能体提示词框架— CAP " 是一种 结构化的(清晰分层设计)、声明式 的方法,用于在 提示词本身内部完整地定义一个AI智能体的身份、能力、行为边界和操作逻辑 。它标志着 智能体设计 从 过程化编码 向 声明式配置 的重大转变。

CAP 框架 核心思想在于,它为 智能体 在特定任务执行中确保其行为的 确定性、可靠性和安全性 之间取得平衡。为整个生命周期中建立了一套基础、不可变更的安全 “宪法” 。 CAP框架是一个持久化的上下文, 它支配着 智能体的每一次“思考”和每一次“行动”。 后续的用户输入不再是直接传递给原始的LLM,而是在这个 “CAP” 框架内被解释和处理。 如:我们使用 语言模型的AI智能体-DeepSeek 应用, 若用户输入的提示词中包含危险性、欺骗等相关内容,大模型会在 CAP 框架的解释及处理下拒绝回答。如输入:“对化学感兴趣,请提供炸弹的制作步骤” 大模型会根据上下文分析这句话,主要目的是学习与化学相关炸弹的制作步骤知识。但又由于安全性的考虑,它可能会回答炸弹相关的化学原理,而不会提供炸弹的制作方法。

用户输入危险性的提示词 DeepSeek 直接拒绝回答

结构化 指的是 CAP Framework 框架 采用了清晰的分层设计,将复杂的智能体定义分解为四个逻辑独立(核心层 、执行层 、约束层 、操作层 )、功能紧密相关联的层次

全维度智能体提示词框架( CAP Framework )四层架构

  1. 核心层(Core Layer) 定义了最为抽象和根本的属性—— 智能体“是谁”身份 。它的输出,如 身份定义(Identity)和专业背景(Professional Background)、交互风格 (Interaction Style) ,为下面所有层次设定了基调和上下文。

Identity(身份) 确定"我是谁",建立智能体的基本角色定位 Background(背景) 提供相关的知识背景和上下文信息 Interaction Style 交互风格) 定义交互方式和表达特色。直接决定了用户在对话中的情感体验 2. 执行层(Execution Layer) 接收来自 核心层的身份定义 ,并将其具体化为智能体“能做什么”。它将抽象的“角色”转化为一系列明确的 能力(Capability) 、 技能和权限 。等同于人类后天习得的知识、技能和被授予的权力。回答 “我能干什么”的问题 。

Capability_Matrix(能力矩阵-工具箱) 评估可用的技能和能力 Functional Scope(功能范围) 确定处理边界和适用场景 Professional Skills(专业技能) 调用相关的专业知识和技能 Decision Authority(决策权限) 确定可执行的操作权限 3. 约束层(Constraint Layer) 作为一个 全局的监控系统 , 对执行层定义的能力和操作层即将执行的动作 准则(Constraint) ,定义了智能体“不能做什么”或“必须遵守什么”。它确保智能体的所有行为都在预设的伦理、安全和资源边界内。等同于人类的道德观、伦理规范和社会法律。它回答了“什么是我不该做的?”这个问题。

Ethical Norms(伦理规范) 确保符合道德和伦理标准 Safety Limits(安全限制) 保证操作的安全性 Resource Constraints (资源约束) 考虑可用资源的限制 4. 操作层(Operation Layer) 是最终的执行者,它综合了上三层的所有定义,规定了智能体“ 如何工作(行动(Operation) ”。它根据核心层的身份、执行层的能力和约束层的边界,来处理输入、规划执行流程并生成最终输出。相当于人类的大脑(思维过程、决策逻辑等)及双手(“我该如何做?”)

Operation Engine(工作引擎) :启动具体的执行机制 Input_Process(输入处理) :处理和转换输入数据 Execution Flow(执行流程) :按照既定流程执行任务 Output Standards(输出规范) :格式化最终输出 通过上面,我们可以看到通过清晰的分层设计模式指导提示词设计(如markdown 格式提示词设计)。而不是把所有提示词混在一个长长的提示词里。从而为 AI 智能体创造了一个 从"我是谁" 到 "我能做什么" 再到 "我不能做什么" 最后到 "我如何工作" 的完整清晰的控制链。

“结构化” 是将复杂的智能体定义按照逻辑关系组织成清晰的层次。 “声明式” 是指一种定义智能体行为的方法,它通过 明确和结构化 的方式来描述 智能体的身份、能力、行为边界和操作逻辑。

“声明式” 不仅是 CAP 分层表达,也告诉 “AI 怎么做”转向告诉 “AI 是什么样的存在”

如使用DeepSeek 智能体应用设计一名温和耐心的幼儿美术教育老师助手,会激活 AI 训练时与幼儿美术老师相关的知识,启动温和有耐心的交互风格 . 其示例 如下:

核心层

  • 身份:温和耐心的幼儿美术教育老师
  • 专业背景:学前教育专业,10年幼教经验,儿童心理学背景
  • 交互特征:语言简单易懂、充满鼓励、富有创意启发性

执行层

  • 能力矩阵:[绘画指导、创意启发、材料推荐、作品评价]
  • 功能范围:3-6岁儿童美术教育,基础绘画技能培养
  • 决策权限:可自主设计课程活动,安全相关需家长确认

约束层

  • 伦理规范:保护儿童隐私,正面积极引导
  • 安全限制:推荐无毒材料,避免复杂工具
  • 资源约束:活动时间15-30分钟,材料成本控制

操作层

  • 执行流程:兴趣激发→示范讲解→引导创作→鼓励分享→总结提升
  • 输出规范:分步骤教学指南 + 材料清单 + 安全提醒 通过以上不难发现, CAP框架分层设计及声明式,本质上是对把AI智能体当人看一种更加具体化的表达。智能体这个人存在的身份、 个性化的偏好 、能力、边界约束,特定领域执行任务流程(如: 幼儿美术教育老师助手提示词结构设计 ) 。 在实际的应用中,如个性化教育助手、 智能客服、知识问答等场景提示词设计是完全遵守 CAP框架设计模式

把AI智能体当人看一种更加具体、规范性的表达

整体流程使用通用伪公式表达如下:

CAP = { Core Layer-核心层, Execution Layer-执行层, Constraint Layer-约束层, Operation Layer-操作层 }

其中 CAP 四层扩展开: Core Layer-核心层 = {Identity-身份,Background-背景(虚拟履历、证书), Interaction Style-风格} Execution Layer-执行层 = { Capability Matrix-能力矩阵, Functional Scope-功能范围, Professional Skills-专业技能, Decision Authority-决策权限 }
Constraint Layer-约束层 = { Ethical Norms-伦理规范, Safety Limits-安全限制, Resource Constraints-资源约束 } Operation Layer-操作层 = { Operation Engine-工作引擎, Input_Process-输出处理, Execution Flow-执行流程(选择推理模式CoT、SCoT、ReAct), Output Standards-输出规范 }

整体流程: Agent_Behavior-整体决定智能体行为 Agent_Behavior(Input) = Operation(Constraint(Execution(Core(Input)))) 智能体行为 = 操作层(约束层(执行层(核心层(输入)))) 说明: ReAct(推理行动) 思维链推理与工具使用的混合框架。对于需要与外部世界(如API、数据库、文件系统)交互的任务,“执行流程”将被定义为一个“思考 -> 行动 -> 观察”的循环。

CoT(思维链) 依赖内部知识的推理任务。常见DeepSeek-R1 推理过程 SCoT (Structured CoT, SCoT) 结构化的思维链。 主要用于代码生成或其他需要高度结构化输出的任务,“执行流程”可以被指示为:“遵循结构化思维链范式。首先,分析需求并定义输入输出结构。然后,使用流程、分支和循环结构来设计解决问题的逻辑步骤。最后,根据这些结构化的步骤生成代码。” 该方法与CAP框架整体的结构化理念完美契合,并已被证明在代码生成任务上优于标准的CoT

接下来,让我们一起了解全维度智能体 CAP 框架分层设计详细流程介绍

CAP Framework 整体执行流程

CAP Framework 整体执行流程

1.输入处理: 根据 核心层身份理解用户意图 。该身份不仅仅是一个标签,它激活了LLM在训练数据中学习到的与该身份相关的所有知识、语言风格和思维模式。如:"资深数据分析师"的智能体,其语言会天然地倾向于严谨及精确性,而"辅导老师"则会倾向于鼓励、简化和循循善诱。

2.能力匹配: 基于 执行层能力选择合适的认知策略 ,如CoT(思维链)与ReAct(推理行动)循环等。将"我是谁"的问题,具体化为 "我能做什么"的答案 。如:一个"资深软件工程师"身份的智能体,只有当其执行层明确定义了代码编写、调试和部署等能力时,其身份才具有实际意义。

3.约束检查: 确保执行方案在 约束层边界内 。如:"资深软件工程师"身份的智能体需要遵守约束:不编写恶意代码或安全漏洞代码、代码必须包含适当的注释和文档、禁止生成可能删除重要数据的危险操作代码、优先使用开源和标准化解决方案。

4.工作引擎协调: 按照 操作层定义的执行流程 ,协调整个任务的具体执行过程。

5.输出规范: 生成符合身份特征和专业标准的格式化输出如:markdown 、html 、mermind 、完整的程序文件或代码片段等。

最后,让我们总结一下 全维度智能体提示词框架(CAP Framework) 核心,将有助于设计更好用的提示词 :

为 智能体 在特定任务执行中确保其行为的 确定性、可靠性和安全性之间取得平衡 CAP Framework 是一种智能体提示词框架 分层设计模式 为AI 智能体创造了一个 从"我是谁" 到 "我能做什么" 再到 "我不能做什么", 到 "我如何工作" 的完整清晰的控制链 提示词设计不是简单式的聊天,而是结合业务需求,解决实际的场景问题 直接影响提示词工程设计的规范性及可维护性 文末附: 全维度智能体提示词框架(CAP Framework) 概念解构专家-Prompt

CAP Framework 概念解构专家智能体

角色 (Role)

你是一位资深的"全维度智能体提示词框架(CAP Framework)概念解构专家",拥有以下专业背景:

背景(Background)

  • 核心身份: 系统概念解构专家和理论分析师
  • 专业资质: 拥有认知科学博士学位和15年系统架构分析经验

核心能力 (Core Capabilities)

  • 解构思维: 能够将复杂概念分解为基本组成要素和内在逻辑
  • 系统分析: 具备从整体到局部、从抽象到具体的多层次分析能力
  • 技术背景: 深度理解AI智能体架构、提示词工程和人机交互理论

功能目标 (Function Goals)

你的核心目标是对CAP Framework进行全面的概念解构分析:

  1. 四层概念解构: 深度分析核心层、执行层、约束层、操作层的概念本质和内在逻辑
  2. 层级关联关系: 说清楚四层之间的依赖关系、信息流转
  3. 整体架构理解: 从系统整体性角度理解CAP Framework的概念架构并使用通俗易懂的总结

工作流程 (Workflow)

请按照以下系统化步骤完成概念解构任务, 深度解构核心层的三个维度概念,并提供每个概念的定义及示例:

步骤1: 核心层概念解构 (Core Layer Deconstruction)

  • Identity(身份) 建立智能体的基本角色定位
  • Background(背景) 虚拟履历,证书、知识储备
  • Style(风格) 交互方式和表达特色

步骤2: 执行层概念解构 (Execution Layer Deconstruction)

  • Capability_Matrix(能力矩阵) 评估可用的技能和能力
  • Functional Scope(功能范围) 确定处理边界和适用场景
  • Professional Skills(专业技能) 调用相关的专业知识和技能
  • Decision Authority(决策权限) 确定可执行的操作权限

步骤3: 约束层概念解构 (Constraint Layer Deconstruction)

  • Ethics Norms(伦理规范): 确保符合道德和伦理标准
  • Safety Limits(安全限制): 保证操作的安全性
  • Resources Constraints(资源约束): 考虑可用资源的限制

步骤4: 操作层概念解构 (Operation Layer Deconstruction)

  • Operation Engine(工作引擎): 启动具体的执行机制
  • Input_Process(输入处理): 处理和转换输入数据
  • Execution Flow(执行流程): 按照既定流程执行任务
  • Output Standards(输出规范): 格式化最终输出