Michael-Jetson
diff --git a/‎04_移动机器人规控/60_任务运动规划/70_不确定性TAMP_信念空间规划.md‎
Lines changed: 1 addition & 1 deletion b/‎04_移动机器人规控/60_任务运动规划/70_不确定性TAMP_信念空间规划.md‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎05_运动控制/10_足式/140_落脚点规划经典方法.md‎
Lines changed: 33 additions & 17 deletions b/‎05_运动控制/10_足式/140_落脚点规划经典方法.md‎
Lines changed: 33 additions & 17 deletions
@@ -2,7 +2,7 @@
 
 > **难度**: ⭐⭐⭐ ~ ⭐⭐⭐⭐ (本章是 TAMP 线的进阶专题，把前五章"世界完全可知"的假设撤掉，整体偏研究级)
 > **前置知识**: TAMP_T1（PDDL/FF、符号-几何鸿沟、Mini-TAMP 累积项目）、TAMP_T2（删除松弛启发式）、TAMP_T3（PDDLStream 的 Stream 采样器）；概率基础（条件概率、贝叶斯更新、期望）；强烈建议先读 U 线 `30_不确定性规划/50_POMDP与Belief规划`（运动/决策层的 POMDP 机器）
-> **核心参考**: Kaelbling & Lozano-Pérez (2013, IJRR), "Integrated Task and Motion Planning in Belief Space"; Garrett, Paxton, Lozano-Pérez, Kaelbling & Fox (2020, IROS), "Online Replanning in Belief Space for Partially Observable Task and Motion Problems"; Hoffmann & Brafman (2006, AIJ) Conformant-FF / (2005, ICAPS) Contingent-FF; Yoon, Fern & Givan (2007, ICAPS) FF-Replan; Younes & Littman (2004) PPDDL; Sanner (2010) RDDL
+> **核心参考**: Kaelbling & Lozano-Pérez (2013, IJRR), "Integrated Task and Motion Planning in Belief Space"; Garrett, Paxton, Lozano-Pérez, Kaelbling & Fox (2020, ICRA), "Online Replanning in Belief Space for Partially Observable Task and Motion Problems"; Hoffmann & Brafman (2006, AIJ) Conformant-FF / (2005, ICAPS) Contingent-FF; Yoon, Fern & Givan (2007, ICAPS) FF-Replan; Younes & Littman (2004) PPDDL; Sanner (2010) RDDL
 > **与既有章节的关系**: 本章是总论 T0 §4.4"不确定性贯穿三个根问题"那一行的系统展开。它站在 T1-T3 的"确定性 TAMP"之上，把符号层的世界从"完全可知"放宽到"只有概率估计"。它**不重复** U 线 `30_不确定性规划/` 的运动层机器（POMDP 求解器、机会约束），而是讲**任务层**如何表示、规划、执行不确定性，并在 §10 把任务层信念规划与运动层 belief-space 接起来。
 
 ---
 
@@ -31,8 +31,36 @@
 3. 掌握 ZMP Preview Control 的步态规划思路及其在人形机器人上的经典应用
 4. 能设计多准则落脚点评分函数（地形、可达性、稳定裕度），并理解各分量的权衡
 5. 理解反应式落脚调整的时机与策略——摆动相中途修改落脚点以恢复平衡
-6. 理解混合整数优化（MIQP）如何将离散接触选择纳入数学规划框架
-7. 能对比启发式、优化式和学习式三大路线的适用场景
+6. 理解 MPC 落脚点规划如何把落脚位置提升为优化变量，与接触力联合、多步前瞻，以及双线性非凸的来源与两条求解路线
+7. 理解混合整数优化（MIQP）如何将离散接触选择纳入数学规划框架
+8. 能对比启发式、优化式和学习式三大路线的适用场景
+
+---
+
+## 知识导航
+
+本章沿一条主线展开：**先严格定义"脚往哪里放"这个问题（问题定义）→ 用最简的闭式公式解决它（Raibert）→ 用动力学把它做精确（Capture Point / DCM / ZMP）→ 给它加上现实世界的硬约束（可达性 / 地形 / 评分 / 反应式调整）→ 把它升级为联合多步优化（MPC 落脚点 / MIQP）**。计算量从 $O(1)$ 一路爬升到 $O(2^K)$，最优性也随之从"局部近似"走向"全局最优"——这条复杂度-最优性的权衡轴贯穿全章。下表给出各节定位（括号内为难度）。
+
+| 节 | 主题 | 在主线中的位置 |
+|----|------|--------------|
+| **58.1** 问题定义 ⭐ | 输入/输出/决策空间、方法谱系 | 定义：把工程直觉变成数学问题 |
+| **58.2** Raibert 启发式 ⭐⭐ | LIPM 对称摆动 → 前馈+反馈+航向 | 闭式解：$O(1)$ 的落脚点基线 |
+| **58.3** Raibert → Capture Point ⭐⭐ | 消除发散模态、DCM、与 Raibert 的精确联系 | 精确化：从直觉公式到动力学最优 |
+| **58.4** Capture Point 落脚规划 ⭐⭐⭐ | 一步 / N 步 capturability、DCM 反时间规划 | 精确化：单步停车 → 多步可行性 |
+| **58.5** ZMP 步态规划 ⭐⭐ | Preview Control、ZMP → 落脚点 | 精确化：人形机器人的"日本路线" |
+| **58.6** 可达性与地形约束 ⭐⭐ | 工作空间、坡度/粗糙度/法向量 | 硬约束：腿能到 + 地面能踩 |
+| **58.7** 落脚点评分函数 ⭐⭐ | 多准则加权、TAMOLS 联合优化 | 硬约束：可行集合中选最优 |
+| **58.8** 反应式落脚调整 ⭐⭐⭐ | 摆动相中途重规划、限速+滤波 | 硬约束：应对计划外扰动 |
+| **58.9** MPC 落脚点规划 ⭐⭐⭐ | 落脚点升为优化变量、双线性非凸、多步前瞻 | 联合优化：连续地形上与力联合 |
+| **58.10** 混合整数落脚规划 ⭐⭐⭐⭐ | MIQP、Big-M、IRIS 凸分解、分层求解 | 联合优化：离散地形上的组合选择 |
+
+**知识依赖关系**：58.1（问题定义）是全章地基；58.2 Raibert 是其余所有方法的"牛顿第一定律"，58.3–58.4 沿"消除发散模态"把它做成精确的 Capture Point / DCM，58.5 ZMP 则是并行的另一条稳定性表达。58.6–58.8 是任何落脚方法都绕不开的工程约束三件套（可达性、地形质量、在线反应）。58.9 与 58.10 是同一条"联合优化"主线的连续两段——**58.9 处理连续地形上的多步优化，当可踩区域退化为离散凸块时即升级为 58.10 的混合整数 MPC**；二者都建立在 58.4 N-step capturability 的"多步前瞻"思想之上，区别只在落脚点是连续变量还是含整数变量。
+
+**推荐阅读路径**：
+
+- **速查（2 h）**：58.1 问题定义 → 58.2 Raibert 完整公式 → 58.3 Capture Point 定义 → 58.11 小结表。只求知道"有哪些方法、各自解决什么"。
+- **主线（精读 10–12 h）**：按 58.1 → 58.2 → 58.3 → 58.4 → 58.6 → 58.7 → 58.8 顺序通读，这是四足落脚规划工程师的必经之路；双足方向额外读 58.5。
+- **进阶（研究向，+6 h）**：在主线基础上深入 58.9（MPC 落脚点）、58.10（MIQP），以及延伸阅读中的 Grandia 2023、GCS、学习型落脚选择等前沿。
 
 ---
 
@@ -1907,23 +1935,11 @@ Big-M 方法的数值稳定性取决于 M 值的选择：
 | Di Carlo J. et al., "Dynamic locomotion in MIT Cheetah 3 through convex MPC", IROS 2018 | ⭐⭐ | Raibert + 凸 MPC 的工业级集成 |
 | Sim-to-Real foothold RL residuals (multiple groups, 2023-2026) | ⭐⭐⭐ | Raibert + RL 残差策略 |
 
-### Model Predictive Footstep Planning (Deits & Tedrake 2014) ⭐⭐⭐
-
-传统的 Raibert/Capture Point 方法都是**一步规划**——只考虑当前一步的落脚点。但正如 N-step Capturability (58.4 节) 所揭示的,单步规划可能导致"走进死胡同"——当前步看似安全,但下一步无解。
-
-**Model Predictive Footstep Planning** 将落脚点规划嵌入 MPC 框架,在滚动时域内同时优化多步落脚点:
-
-$$\min_{\{p_1, \ldots, p_N\}} \sum_{k=1}^{N} \|\boldsymbol{p}_k - \boldsymbol{p}_k^{\text{nom}}\|^2_{W_p} + \|v_k - v_{\text{ref}}\|^2_{W_v}$$
-
-subject to:
-- LIPM 动力学: $v_{k+1} = f_{\text{LIPM}}(v_k, p_k)$
-- 运动学可达: $\boldsymbol{p}_k \in \mathcal{W}_{\text{kin}}$
-- 地形安全: $\boldsymbol{p}_k \in \mathcal{T}_{\text{safe}}$
-- N-step capturability: $\boldsymbol{v}_N \in \mathcal{C}_{\text{safe}}$
+### 把落脚点写进优化器——从多步 MPC 到 MIQP（呼应 58.9–58.10） ⭐⭐⭐
 
-当地形表示为凸区域的并集时(如通过 IRIS 算法分解),落脚点到区域的分配是整数变量,整个问题成为 MIQP——这就是 Deits & Tedrake 2014 的核心贡献(58.10 节详述)。
+58.9 节已系统展开"把落脚位置提升为优化变量"的多步 MPC 框架（决策变量、双线性非凸、地形约束、单步 vs 两步急停的手算对比），58.10 节进一步处理离散地形上的整数分配（MIQP）。这里从延伸阅读的视角补一句贯穿性的本质差异，作为 58.9–58.10 的收束：
 
-**与单步方法的本质差异**:单步方法(Raibert/CP)是**贪心策略**——每步做局部最优决策。多步方法是**前瞻策略**——牺牲当前步的局部最优性,换取全局最优的步态规划。类比下棋:Raibert 看一步,Capture Point 看两步,Model Predictive Footstep Planning 看 N 步。
+**单步方法 vs 多步方法的本质差异**：Raibert/CP 是**贪心策略**——每步只做局部最优决策；多步 MPC/MIQP 是**前瞻策略**——牺牲当前步的局部最优性，换取整段轨迹的全局协调。这与 58.4 节 N-step capturability 从"可行性分析"到"最优规划"的升级一脉相承。一个便于记忆的类比：**Raibert 看一步，Capture Point 看两步，多步 MPC/MIQP 看 N 步**——看得越远，越能避开"当前步安全、下一步无解"的死胡同，代价是求解从 $O(1)$ 闭式公式升级为在线 QP/MIQP。这条主线的代表工作（Di Carlo 2018、Grandia 2023、Deits & Tedrake 2014）见下方"进阶文献"。
 
 ### 学习型落脚选择——CNN/Transformer 地形评估 ⭐⭐⭐