Skip to content

Commit 077c459

Browse files
Michael-Jetsonclaude
andcommitted
checkpoint9: 复合220/机械臂D04扩写 + 足式140润色 (复核修中)
扩写: 复合 220_经典人形全身控制2003(+WBIC/N步可捕获/修CapturePoint出处)、机械臂 D04_双臂学习2003(+DiffusionPolicy底层,修ALOHA2机制/RDT-1B cross-attn两事实错)。润色: 足式140_落脚(补知识导航+目标MPC+杀§58.13僵尸节,2027)。注: 06RL复核(AMP/GAIL等3错)与TAMP复核(2 venue错)的修复agent进行中,部分文件为中间态。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
1 parent af190ad commit 077c459

7 files changed

Lines changed: 575 additions & 26 deletions

File tree

04_移动机器人规控/60_任务运动规划/70_不确定性TAMP_信念空间规划.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -2,7 +2,7 @@
22

33
> **难度**: ⭐⭐⭐ ~ ⭐⭐⭐⭐ (本章是 TAMP 线的进阶专题,把前五章"世界完全可知"的假设撤掉,整体偏研究级)
44
> **前置知识**: TAMP_T1(PDDL/FF、符号-几何鸿沟、Mini-TAMP 累积项目)、TAMP_T2(删除松弛启发式)、TAMP_T3(PDDLStream 的 Stream 采样器);概率基础(条件概率、贝叶斯更新、期望);强烈建议先读 U 线 `30_不确定性规划/50_POMDP与Belief规划`(运动/决策层的 POMDP 机器)
5-
> **核心参考**: Kaelbling & Lozano-Pérez (2013, IJRR), "Integrated Task and Motion Planning in Belief Space"; Garrett, Paxton, Lozano-Pérez, Kaelbling & Fox (2020, IROS), "Online Replanning in Belief Space for Partially Observable Task and Motion Problems"; Hoffmann & Brafman (2006, AIJ) Conformant-FF / (2005, ICAPS) Contingent-FF; Yoon, Fern & Givan (2007, ICAPS) FF-Replan; Younes & Littman (2004) PPDDL; Sanner (2010) RDDL
5+
> **核心参考**: Kaelbling & Lozano-Pérez (2013, IJRR), "Integrated Task and Motion Planning in Belief Space"; Garrett, Paxton, Lozano-Pérez, Kaelbling & Fox (2020, ICRA), "Online Replanning in Belief Space for Partially Observable Task and Motion Problems"; Hoffmann & Brafman (2006, AIJ) Conformant-FF / (2005, ICAPS) Contingent-FF; Yoon, Fern & Givan (2007, ICAPS) FF-Replan; Younes & Littman (2004) PPDDL; Sanner (2010) RDDL
66
> **与既有章节的关系**: 本章是总论 T0 §4.4"不确定性贯穿三个根问题"那一行的系统展开。它站在 T1-T3 的"确定性 TAMP"之上,把符号层的世界从"完全可知"放宽到"只有概率估计"。它**不重复** U 线 `30_不确定性规划/` 的运动层机器(POMDP 求解器、机会约束),而是讲**任务层**如何表示、规划、执行不确定性,并在 §10 把任务层信念规划与运动层 belief-space 接起来。
77
88
---

05_运动控制/10_足式/140_落脚点规划经典方法.md

Lines changed: 33 additions & 17 deletions
Original file line numberDiff line numberDiff line change
@@ -31,8 +31,36 @@
3131
3. 掌握 ZMP Preview Control 的步态规划思路及其在人形机器人上的经典应用
3232
4. 能设计多准则落脚点评分函数(地形、可达性、稳定裕度),并理解各分量的权衡
3333
5. 理解反应式落脚调整的时机与策略——摆动相中途修改落脚点以恢复平衡
34-
6. 理解混合整数优化(MIQP)如何将离散接触选择纳入数学规划框架
35-
7. 能对比启发式、优化式和学习式三大路线的适用场景
34+
6. 理解 MPC 落脚点规划如何把落脚位置提升为优化变量,与接触力联合、多步前瞻,以及双线性非凸的来源与两条求解路线
35+
7. 理解混合整数优化(MIQP)如何将离散接触选择纳入数学规划框架
36+
8. 能对比启发式、优化式和学习式三大路线的适用场景
37+
38+
---
39+
40+
## 知识导航
41+
42+
本章沿一条主线展开:**先严格定义"脚往哪里放"这个问题(问题定义)→ 用最简的闭式公式解决它(Raibert)→ 用动力学把它做精确(Capture Point / DCM / ZMP)→ 给它加上现实世界的硬约束(可达性 / 地形 / 评分 / 反应式调整)→ 把它升级为联合多步优化(MPC 落脚点 / MIQP)**。计算量从 $O(1)$ 一路爬升到 $O(2^K)$,最优性也随之从"局部近似"走向"全局最优"——这条复杂度-最优性的权衡轴贯穿全章。下表给出各节定位(括号内为难度)。
43+
44+
|| 主题 | 在主线中的位置 |
45+
|----|------|--------------|
46+
| **58.1** 问题定义 ⭐ | 输入/输出/决策空间、方法谱系 | 定义:把工程直觉变成数学问题 |
47+
| **58.2** Raibert 启发式 ⭐⭐ | LIPM 对称摆动 → 前馈+反馈+航向 | 闭式解:$O(1)$ 的落脚点基线 |
48+
| **58.3** Raibert → Capture Point ⭐⭐ | 消除发散模态、DCM、与 Raibert 的精确联系 | 精确化:从直觉公式到动力学最优 |
49+
| **58.4** Capture Point 落脚规划 ⭐⭐⭐ | 一步 / N 步 capturability、DCM 反时间规划 | 精确化:单步停车 → 多步可行性 |
50+
| **58.5** ZMP 步态规划 ⭐⭐ | Preview Control、ZMP → 落脚点 | 精确化:人形机器人的"日本路线" |
51+
| **58.6** 可达性与地形约束 ⭐⭐ | 工作空间、坡度/粗糙度/法向量 | 硬约束:腿能到 + 地面能踩 |
52+
| **58.7** 落脚点评分函数 ⭐⭐ | 多准则加权、TAMOLS 联合优化 | 硬约束:可行集合中选最优 |
53+
| **58.8** 反应式落脚调整 ⭐⭐⭐ | 摆动相中途重规划、限速+滤波 | 硬约束:应对计划外扰动 |
54+
| **58.9** MPC 落脚点规划 ⭐⭐⭐ | 落脚点升为优化变量、双线性非凸、多步前瞻 | 联合优化:连续地形上与力联合 |
55+
| **58.10** 混合整数落脚规划 ⭐⭐⭐⭐ | MIQP、Big-M、IRIS 凸分解、分层求解 | 联合优化:离散地形上的组合选择 |
56+
57+
**知识依赖关系**:58.1(问题定义)是全章地基;58.2 Raibert 是其余所有方法的"牛顿第一定律",58.3–58.4 沿"消除发散模态"把它做成精确的 Capture Point / DCM,58.5 ZMP 则是并行的另一条稳定性表达。58.6–58.8 是任何落脚方法都绕不开的工程约束三件套(可达性、地形质量、在线反应)。58.9 与 58.10 是同一条"联合优化"主线的连续两段——**58.9 处理连续地形上的多步优化,当可踩区域退化为离散凸块时即升级为 58.10 的混合整数 MPC**;二者都建立在 58.4 N-step capturability 的"多步前瞻"思想之上,区别只在落脚点是连续变量还是含整数变量。
58+
59+
**推荐阅读路径**
60+
61+
- **速查(2 h)**:58.1 问题定义 → 58.2 Raibert 完整公式 → 58.3 Capture Point 定义 → 58.11 小结表。只求知道"有哪些方法、各自解决什么"。
62+
- **主线(精读 10–12 h)**:按 58.1 → 58.2 → 58.3 → 58.4 → 58.6 → 58.7 → 58.8 顺序通读,这是四足落脚规划工程师的必经之路;双足方向额外读 58.5。
63+
- **进阶(研究向,+6 h)**:在主线基础上深入 58.9(MPC 落脚点)、58.10(MIQP),以及延伸阅读中的 Grandia 2023、GCS、学习型落脚选择等前沿。
3664

3765
---
3866

@@ -1907,23 +1935,11 @@ Big-M 方法的数值稳定性取决于 M 值的选择:
19071935
| Di Carlo J. et al., "Dynamic locomotion in MIT Cheetah 3 through convex MPC", IROS 2018 | ⭐⭐ | Raibert + 凸 MPC 的工业级集成 |
19081936
| Sim-to-Real foothold RL residuals (multiple groups, 2023-2026) | ⭐⭐⭐ | Raibert + RL 残差策略 |
19091937

1910-
### Model Predictive Footstep Planning (Deits & Tedrake 2014) ⭐⭐⭐
1911-
1912-
传统的 Raibert/Capture Point 方法都是**一步规划**——只考虑当前一步的落脚点。但正如 N-step Capturability (58.4 节) 所揭示的,单步规划可能导致"走进死胡同"——当前步看似安全,但下一步无解。
1913-
1914-
**Model Predictive Footstep Planning** 将落脚点规划嵌入 MPC 框架,在滚动时域内同时优化多步落脚点:
1915-
1916-
$$\min_{\{p_1, \ldots, p_N\}} \sum_{k=1}^{N} \|\boldsymbol{p}_k - \boldsymbol{p}_k^{\text{nom}}\|^2_{W_p} + \|v_k - v_{\text{ref}}\|^2_{W_v}$$
1917-
1918-
subject to:
1919-
- LIPM 动力学: $v_{k+1} = f_{\text{LIPM}}(v_k, p_k)$
1920-
- 运动学可达: $\boldsymbol{p}_k \in \mathcal{W}_{\text{kin}}$
1921-
- 地形安全: $\boldsymbol{p}_k \in \mathcal{T}_{\text{safe}}$
1922-
- N-step capturability: $\boldsymbol{v}_N \in \mathcal{C}_{\text{safe}}$
1938+
### 把落脚点写进优化器——从多步 MPC 到 MIQP(呼应 58.9–58.10) ⭐⭐⭐
19231939

1924-
当地形表示为凸区域的并集时(如通过 IRIS 算法分解),落脚点到区域的分配是整数变量,整个问题成为 MIQP——这就是 Deits & Tedrake 2014 的核心贡献(58.10 节详述)。
1940+
58.9 节已系统展开"把落脚位置提升为优化变量"的多步 MPC 框架(决策变量、双线性非凸、地形约束、单步 vs 两步急停的手算对比),58.10 节进一步处理离散地形上的整数分配(MIQP)。这里从延伸阅读的视角补一句贯穿性的本质差异,作为 58.9–58.10 的收束:
19251941

1926-
**与单步方法的本质差异**:单步方法(Raibert/CP)**贪心策略**——每步做局部最优决策。多步方法是**前瞻策略**——牺牲当前步的局部最优性,换取全局最优的步态规划。类比下棋:Raibert 看一步,Capture Point 看两步,Model Predictive Footstep Planning 看 N 步。
1942+
**单步方法 vs 多步方法的本质差异**Raibert/CP **贪心策略**——每步只做局部最优决策;多步 MPC/MIQP 是**前瞻策略**——牺牲当前步的局部最优性,换取整段轨迹的全局协调。这与 58.4 节 N-step capturability 从"可行性分析"到"最优规划"的升级一脉相承。一个便于记忆的类比:**Raibert 看一步Capture Point 看两步,多步 MPC/MIQP 看 N 步**——看得越远,越能避开"当前步安全、下一步无解"的死胡同,代价是求解从 $O(1)$ 闭式公式升级为在线 QP/MIQP。这条主线的代表工作(Di Carlo 2018、Grandia 2023、Deits & Tedrake 2014)见下方"进阶文献"
19271943

19281944
### 学习型落脚选择——CNN/Transformer 地形评估 ⭐⭐⭐
19291945

0 commit comments

Comments
 (0)