前辅文
第1章 具身智能概述
1.1 引言
1.2 具身智能简史
1.3 典型的具身智能任务
1.4 具身智能的体系结构
1.5 具身智能的优点、缺点与难点
1.6 具身智能与机器人智能的关系
1.7 小结
第2章 神经网络与深度学习基础
2.1 引言
2.2 多层感知机
2.3 图像的特征提取
2.4 序列的特征提取
2.5 图结构的特征提取
2.6 视觉目标检测与分割
2.7 前沿阅读
2.8 小结
第3章 动作学习基础
3.1 引言
3.2 马尔可夫决策过程
3.3 值函数学习方法
3.3.1 Q学习
3.3.2 深度Q网络
3.4 策略学习方法
3.4.1 基本策略梯度方法
3.4.2 REINFORCE算法
3.5 Actor-Critic方法
3.6 近端策略优化算法
3.7 模仿学习
3.7.1 行为克隆
3.7.2 学徒学习
3.8 前沿阅读
3.9 小结
第4章 仿真平台
4.1 引言
4.2 Gym仿真环境
4.2.1 Gym强化学习算法框架
4.2.2 Gym集成的仿真环境与任务简介
4.3 AI2THOR仿真平台框架
4.3.1 场景数据集
4.3.2 环境介绍
4.3.3 交互动作
4.4 实验示例
4.5 前沿阅读
4.6 小结
第5章 形态计算
5.1 引言
5.2 形态计算的基本原理与物理实现
5.3 形态计算的动态系统分析方法
5.3.1 储备池计算模型
5.3.2 物理储备池模型
5.4 形态计算的信息论分析方法
5.5 前沿阅读
5.6 小结
第6章 结构化形态控制
6.1 引言
6.2 问题描述
6.3 结构化形态控制方法
6.3.1 形态的表示
6.3.2 输出模型
6.3.3 特殊情形
6.4 结构化形态控制实例
6.4.l Reacher智能体
6.4.2 SnakeThree智能体
6.4.3 Hopper智能体
6.4.4 HalfCheetah智能体
6.4.5 Walker2D智能体
6.5 不同形态之间的迁移学习
6.5.1 结构迁移学习
6.5.2 故障迁移学习
6.6 前沿阅读
6.7 小结
第7章 形态与控制的协同优化
7.1 引言
7.2 问题描述
7.3 形态参数的优化
7.3.1 算法设计
7.3.2 实例分析
7.4 形态结构的优化
7.4.1 形态变化阶段
7.4.2 形态控制阶段
7.4.3 学习算法
7.4.4 实例分析
7.5 前沿阅读
7.6 小结
第8章 视觉语言导航
8.1 引言
8.2 问题描述
8.3 基本方法
8.3.1 模型结构
8.3.2 导航模型训练
8.4 实例分析
8.4.1 实验设置
8.4.2 实验结果
8.5 前沿阅读
8.6 小结
第9章 视觉语义导航
9.1 引言
9.2 问题描述
9.3 基本方法
9.3.1 模型结构
9.3.2 导航模型训练
9.4 基于场景图谱的视觉语义导航
9.4.1 场景图谱的生成
9.4.2 融入场景图谱的导航模型学习
9.5 实例分析
9.5.1 实验设置
9.5.2 实验结果
9.6 前沿阅读
9.7 小结
第10章 具身场景语义描述
10.1 引言
10.2 问题描述
10.3 基本方法
10.3.1 模型结构
10.3.2 场景图像语言描述的评价
10.3.3 模型训练
10.4 实例分析
10.4.1 实验设置
10.4.2 实验结果
10.5 物理实验
10.5.1 机器人实验
10.5.2 人机交互实验
10.6 前沿阅读
10.7 小结
第11章 具身学习
11.1 引言
11.2 问题描述
11.3 基本方法
11.3.1 模型结构
11.3.2 模型训练
11.4 实例分析
11.4.1 实验设置
11.4.2 实验结果
11.5 前沿阅读
11.6 小结
第12章 具身多智能体协作
12.1 引言
12.2 问题描述
12.3 基本方法
12.3.1 模型结构
12.3.2 模型训练
12.4 实例分析
12.4.1 实验设置
12.4.2 实验结果
12.5 前沿阅读
12.6 小结
第13章 总结与展望