Skip to content

Commit fe802b9

Browse files
Michael-Jetsonclaude
andcommitted
checkpoint11: 5章扩写达标(M07/复合110/160/190/足式40) + 机械臂复核修2引用(D01/F01) + README统计刷新
- M07 OMPL 2001, 复合110轮足SimToReal 2032, 复合160四足臂 2416, 复合190 Visual_WBC 2195, 足式40 CppAD 2003 - D01 Diffusion Policy 2024→2023; F01 Springer Handbook 2008/Ch.7→2016/Ch.9 - README: 442文件/712,772行; 修04方向行数统计bug(15,613→142,532) Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>
1 parent 72144ab commit fe802b9

8 files changed

Lines changed: 1776 additions & 21 deletions

05_运动控制/10_足式/40_CppAD与代码生成.md

Lines changed: 482 additions & 8 deletions
Large diffs are not rendered by default.

05_运动控制/20_机械臂/D01_导论_双臂任务分类.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1384,7 +1384,7 @@ ALOHA(A Low-cost Open-source Hardware System for Bimanual Teleoperation)由
13841384
核心问题:如何不依赖精确模型完成复杂双臂任务?
13851385
代表工作:
13861386
- Zhao et al. 2023 (ACT): 行为克隆 + ALOHA
1387-
- Chi et al. 2024 (Diffusion Policy): 扩散模型动作生成
1387+
- Chi et al. 2023 (Diffusion Policy): 扩散模型动作生成
13881388
主要成果:数据驱动的双臂策略,遥操作数据采集管线
13891389
遗留问题:泛化能力有限,安全性无保证
13901390

05_运动控制/20_机械臂/F01_导论_阻抗导纳二分法.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1444,7 +1444,7 @@ $$\quad\quad\quad \tau_{min} \leq \tau \leq \tau_{max} \quad \text{(力矩限制
14441444
|------|--------|--------|---------|
14451445
| 2003 | 柔性关节阻抗 | Albu-Schaffer, Ott (DLR) | 双质量模型无源化→Franka/iiwa 理论基础 |
14461446
| 2005 | 多优先级 WBC | Sentis & Khatib (Stanford) | 从操作空间到全身控制 |
1447-
| 2008 | Springer Handbook Ch.7 | Villani & De Schutter | 力控教学黄金参考 |
1447+
| 2016 | Springer Handbook 2nd ed. Ch.9 | Villani & De Schutter | 力控教学黄金参考 |
14481448
| 2016 | 变阻抗稳定性 | Kronander & Billard (EPFL) | 能量罐 + KB 条件 |
14491449
| 2017 | 碰撞安全四阶段 | Haddadin et al. (TUM) | 检测→隔离→分类→反应 |
14501450

05_运动控制/20_机械臂/M07_OMPL采样规划.md

Lines changed: 21 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -425,6 +425,25 @@ $$
425425
426426
> **反事实推理**: 如果连接半径不随 $n$ 变化会怎样?固定半径太大 → 图过于稠密,查询时 A* 太慢($O(n^2)$ 条边);固定半径太小 → 图不连通,找不到路径。PRM* 的自适应半径在连通性和效率之间取得最优平衡。
427427
428+
### r-disc 与 k-nearest:PRM* 的两种连接策略 ⭐⭐⭐
429+
430+
上一段给出的是**半径型(r-disc)** PRM*——每个新节点与半径 $r(n)$ 内的所有邻居相连。但 OMPL 的 `PRMstar` 与 `RRTstar` 默认走的其实是另一条等价路线:**k-近邻型(k-nearest)**。两者都能达到渐近最优,但工程行为不同,初学者最容易在这里把固定 K 近邻(原始 PRM 的做法)误当成 k-nearest PRM*。把这两条策略并排讲清楚,正好为 M07.4 的 RRT*/BIT* 的 `use_k_nearest` 配置项(M07.6 的 YAML 里出现过)打下地基。
431+
432+
**两种策略的渐近最优条件并排对照**:
433+
434+
| 策略 | 连接规则 | 渐近最优阈值 | OMPL 实现 |
435+
|------|---------|------------|----------|
436+
| r-disc | 连接 $r(n)$ 半径内全部邻居 | $r(n)=\gamma\left(\frac{\log n}{n}\right)^{1/d}$,$\gamma>\gamma^*$ | `setRange` 间接控制 |
437+
| k-nearest | 连接最近的 $k(n)$ 个邻居 | $k(n)=k_0\log n$,$k_0>e\left(1+\frac{1}{d}\right)$ | `setMaxNearestNeighbors`,`use_k_nearest:1` |
438+
439+
关键洞察是:两者的"自适应"形式不同,但量级一致。r-disc 让半径随 $n$ **收缩**($r(n)\to 0$),k-nearest 让邻居数随 $n$ **缓慢增长**($k(n)=k_0\log n\to\infty$)。这并不矛盾——在 $n$ 个均匀点中,半径 $r(n)$ 的球内**期望**恰好包含 $n\cdot\frac{\zeta_d r(n)^d}{\mu(\mathcal{C}_{\text{free}})}\sim\log n$ 个点。换言之,"半径内点数"和"近邻个数"在期望意义上都被钉死在 $\Theta(\log n)$ 这个"刚好够连通又不至于稠密"的临界量级上——这正是 M07.4 会用到的随机几何图(RGG)连通相变的同一个 $\log n$。
440+
441+
> **对比性思维(不是 X 而是 Y)**:固定 K 近邻(每个点永远连最近的 10 个,原始 PRM 的常见写法)**不是** k-nearest PRM*。差别在于 $k$ 是否随 $n$ 增长:固定 $k$ 时,随采样加密,每个点的邻居在空间上越挨越近,图退化成一堆局部小团,跨区域的"长边"永远不会出现——于是图可能整体连通但最优路径所需的边缺失,渐近最优**失效**。只有让 $k(n)=k_0\log n$ 随 $n$ 增长,才能在加密的同时保留足够的连接广度。这一字之差($k$ 常数还是 $k\propto\log n$),就是"看着像最优"和"真能最优"的分水岭,和 M07.4 里 RRT 与 RRT* "能否改父节点"的分野是同一类陷阱。
442+
443+
**工程上该选哪个?** k-nearest 在实践中通常更受青睐,原因是它对 $\mu(\mathcal{C}_{\text{free}})$ 的估计不敏感——r-disc 的 $\gamma^*$ 阈值里含 $\mu(\mathcal{C}_{\text{free}})$,而自由空间体积在有障碍场景里根本无法精确知道,只能保守高估,导致半径偏大、图偏稠密;k-nearest 的阈值 $k_0>e(1+1/d)$ 只依赖维度 $d$,与自由空间体积无关,因此更稳健、更易调参。这也是 OMPL 把 `use_k_nearest` 默认设为 1 的原因。
444+
445+
> **本质洞察**:r-disc 和 k-nearest 不是两个"不同算法",而是同一个渐近最优条件在"以距离为锚"和"以个数为锚"两种坐标下的写法。理解了这一点,你就能在 M07.6 的 YAML 里看懂 `use_k_nearest` 和 `rewire_factor`——后者正是把理论阈值 $k_0$(或 $\gamma$)乘上一个 $\geq 1$ 的安全系数,让实际连接比理论下界更密一点以换取经验上更高的成功率,代价是更多的碰撞检测。
446+
428447
### Lazy-PRM: 延迟碰撞检查 ⭐⭐
429448
430449
碰撞检测是 PRM 预处理的最大开销(80-95% 时间)。Lazy-PRM 的思路:
@@ -466,6 +485,7 @@ $$
466485
467486
1. **[编程]** 用 OMPL 的 PRM* 在 $\mathbb{R}^2$ 中构建路标图(100 个障碍矩形)。可视化路标图结构。然后查询 10 对随机起点-终点,记录查询时间。与单次 RRT-Connect 对比总耗时。
468487
2. **[思考]** 在动态环境中(障碍物移动),PRM 的路标图可能包含已失效的边。如何高效处理?提示:考虑 Lazy 检查 vs 增量删除/重建。
488+
3. **[对比]** 用 OMPL 的 `PRMstar` 在同一 $\mathbb{R}^7$ 场景上分别设 `use_k_nearest:1` 和 `use_k_nearest:0`(r-disc),各跑 50 次,记录路标图边数、平均度数与查询成功率。验证 r-disc 因需保守高估 $\mu(\mathcal{C}_{\text{free}})$ 而边数偏多的预期;再把固定 K 近邻(不随 $n$ 增长)与之对比,观察固定 $k$ 在采样加密后成功率为何不再提升。
469489
470490
---
471491
@@ -1804,7 +1824,7 @@ VAMP 的 2024 年后续工作 VAMP-MR(RSS 2024)进一步扩展到多臂协
18041824
| K1 | 构型空间 | 在关节空间规划;C-space 障碍是工作空间障碍的复杂高维映射 | M07.1 | ⭐ |
18051825
| K2 | 不可显式构造 | 维度灾难使栅格化不可行,必须随机采样探索 | M07.1 | ⭐⭐ |
18061826
| K3 | 采样策略 | 均匀/桥/高斯/信息增益各有适用场景,按场景特征选 | M07.2 | ⭐⭐ |
1807-
| K4 | PRM/PRM* | 预计算路标图供多次查询;PRM* 自适应半径达渐近最优 | M07.3 | ⭐⭐ |
1827+
| K4 | PRM/PRM* | 预计算路标图供多次查询;PRM* 自适应半径达渐近最优;r-disc 与 k-nearest 两种连接策略量级一致($\Theta(\log n)$) | M07.3 | ⭐⭐ |
18081828
| K5 | RRT/RRT-Connect | 单次搜索找可行路径,双向+贪心连接是 MoveIt2 默认 | M07.4 | ⭐⭐ |
18091829
| K6 | 概率完备性 | 形式化定义 + $\delta$-鲁棒前提 + 几何级数证明骨架 | M07.4 | ⭐⭐⭐ |
18101830
| K7 | 渐近最优性 | RRT 几乎必然次优($\Pr=0$ 最优),RRT* 靠 Rewire 修复 | M07.4 | ⭐⭐⭐ |

0 commit comments

Comments
 (0)