由启发式方法反复进行试行错误实验,对于给定条件,可以生成良好的动作。可是,如果树枝间距等控制条件发生变化情况下,用以前的条件得到的前馈动作在新的条件下已经不适合了,所以必须再次进行试行错误,以不断适应于环境的变化。因此,本节通过插补几个控制条件下得到的经验值,论述在未经历条件下进行控制的方法。然后,一边用它们进行反馈控制,一边让树枝间距和高度都不相同时的条件下泛化经验。
机器人通常具有多自由度,其控制系统为多输入多输出系统。在控制系统设计上,把控制器分割到每个关节的结构在设计上是有利的——因为可以通过组织与协调级对基本控制单元的协调和组织实现灵活的控制。
智能学习运动控制研究中的手法包括:
采用神经网络的阶层型进化算法;
采用遗传算法的阶层型进化算法;
采用遗传算法的模糊控制器的学习手法;
采用强化学习的模糊控制器的学习方法;
多数控制器下的学习手法。