迭代学习控制的学习因子怎么确定

如题所述

迭代学习管控计算分析及在机械臂之应用
作者:lgg
本文是机械工程论文,目前,ILC的研究已经取得了很多成果,本文在此基础上对ILC作了进一步的探讨和研究,针对如何提高迭代学习的收敛速度设计了新的学习算法,理论分析了算法的

第 1 章 绪 论

1.1 引言
随着科学技术的发展以及生产力水平的提高,人们对一些复杂的、不确定的系统的控制要求不断提高。我们在生产实际中遇到的系统大多存在着非线性、强耦合以及不确定性等特点,从而导致系统的精确模型无从获取。因此,采用传统的基于模型的控制方法不能很好的对这些系统进行控制。智能控制应运而生,自 20 世纪 70年代形成至今不过 40 多年的时间,但其发展势头却异常迅猛。学习控制是智能控制的一个高级分支,相对于传统的智能控制方法而言,它具备了自己学习的能力。1978 年 Uchiyama[1]提出了一种控制高速运行的机械手的思想,此思想描述为:重复地对同一个运动轨迹进行跟踪控制,与此同时不断地调节控制律,依此便可以达到较好的控制效果。1984 年,Arimoto 等人在 Uchiyama 对机器人控制研究的基础之上,提出了迭代学习控制(ILC)的概念。迭代学习控制方法是利用控制系统之前得到的控制经验,并根据系统以往的控制输入信号、实际输出信号以及期望信号来寻找理想的控制输入信号。这里我们把以往的信息看成一种经验,迭代学习是利用经验知识使得被控对象产生期望的运动,由此不仅削弱了对模型的依赖,还改进了跟踪控制的性能。由于迭代学习控制自身的特点,比如要求系统较少的先验知识以及较少的计算量,并且一般情况下无需辨识系统的参数,因此能处理未知参数以及不确定性等复杂问题,同时还具备了很好的鲁棒性。这些特点使得迭代学习控制方法适用于一类机器人或其它机械装置系统,为其基于自主学习来调整运动性能提供了一种较好的方法。因此,它的研究对像机器人那样有着高度的非线性、难建模、强耦合等特点的系统实现高精度轨迹跟踪控制有着非常重要的实际意义。
………………

1.2 课题的研究背景及意义
迭代学习控制理论的提出是以工业机器人的跟踪控制为背景的,在实际的生产过程中,各种不确定因素的存在导致我们无法获得系统的精确数学模型,因此传统的以系统的数学模型为基础的分析方法便无法较好的解决这些实际问题。随着科技的发展和生产的需要,人们越来越关注如何采用合适的方法来处理实际中存在的不确定性问题,以期达到较好的跟踪控制效果。在实际的生产过程中,普遍存在着不断重复的控制过程,如包装机的包装过程,零部件批量生产的过程,机械手重复完成某种操作的过程等等。以包装机的工作过程为例,其包装过程就是一个典型的不断重复操作的过程,如果被包装物品的重量、尺寸以及其它相关参数都相同,就相当于假设了每次运行时的初始条件相同,那么整个包装机的运动轨迹就会基本上是完全一致。对于这样一类具有重复运动性质的被控对象,运用迭代学习控制能起到很好的控制效果。迭代学习控制不要求已知系统的精确模型,而是利用已有的先验知识不断地进行学习,也就是说,它是利用在重复中学习的方法,最终实现在有限时间区间上对期望轨迹的完全跟踪。它较为简单的形式以及广泛的实用价值引起了人们的大量关注。与此同时,怎样解决迭代学习算法的初始状态问题以及如何加快迭代学习的收敛速度成为很多学者研究的热点问题。如果系统能在较短的时间内实现对期望轨迹的跟踪有着较高的实用价值。
……………

第 2 章 迭代学习控制的理论基础

2.1 迭代学习控制的基本原理
机器人的诞生有着划时代的意义,它的发展为人类文明的进步作出了卓越的贡献,人们对机器人技术的研究也形成了一门新的学科——机器人学。它是一门综合性学科,其发展离不开机械电子学、仿生学、控制理论、信息科学、人工智能等学科。机器人的发展过程可以分为三个阶段,1959 年世界上第一台工业机器人问世,它是美国人英格伯格和德沃尔共同研制的成果,它的诞生标志着机器人历史的开始,同时它也是机器人成长的第一个阶段。第一批工业机器人被称为“尤尼梅特”,具有“万能自动”的含义。1962 年生产出的工业机器人,命名为“沃尔萨特兰”,有着“万能搬动”的意思。“尤尼梅特”和“沃尔萨特兰”也因此被认为是世界上最早的工业机器人,并且沿用至今。1970 年左右,第二代机器人产生,他们开始了外界环境的实用阶段,同时得到了较好的普及。随着智能控制等学科的发展,机器人不仅具备了“感知”能力,还具有独立判断和行动的能力,与此同时,它们还具备了记忆、推理和决策的能力,从而能够完成一些复杂的动作。这些机器人被称为第三代机器人,即智能机器人。如今,智能机器人被广泛应用于各行各业,不仅节约了大量的人力物力,同时提高了作业效率。机器人的应用情况体现了一个国家的综合国力。工业机器人在我国仅有 20 多年的发展历史,我国曾研发并制造出一系列工业机器人,如喷涂机器人、氩弧焊机器人、装卸载机器人等,并成功投入使用。虽然我国对机器人的研究起步晚,但现在也已走上了进步和发展的道路,与此同时我们也应该看到,与国外机器人的研究相比我们还有很长的路要走。今后我们要加深基础学科的研究,开展跨国区域交流合作,理论联系实际应用,争取早日跻身于世界先进之列。
……………

2.2 迭代学习控制过程的表述
本章主要对迭代学习控制作了理论上的介绍,详细介绍了迭代学习的基本原理,迭代学习控制过程的表述以及迭代学习算法的流程。最后,为迭代学习收敛性分析所用理论及数学知识作了介绍,迭代学习算法在收敛性证明时常用到 Banach 空间,向量和矩阵范数,λ 范数,Bellman-Gronwall 引理以及 Lipschitz 条件。这些理论知识都为后续学习律的设计,收敛性分析以及仿真研究等工作奠定了理论基础。目前,智能控制在机器人控制中应用最多的是神经网络控制和模糊控制。神经网络具有容错性、自学习和自适应等特点,因此在控制机器人时不要求机器人的精确数学模型,从而引起学者们的极大关注。模糊控制是以模糊数学、模糊语言形式以及模糊逻辑规则推理为基础的控制科学,模糊控制系统是利用计算机控制技术构成闭环结构的一种智能控制系统。它亦不需要建立被控对象的精确数学模型,因此能对具有高度非线性,无精确数学模型的机器人系统进行有效控制。
……………

第 3 章 机器人指数变增益快速迭代学习控制........20
3.1 引言 ....... 20
3.2 系统描述 ..... 21
3.3 主要结果 ..... 22
3.3.1 新算法的提出 ........ 22
3.3.2 考虑机械臂转角限位时算法的改进 ........ 22
3.4 收敛性分析 ....... 23
3.5 仿真研究 ..... 26
3.6 本章小结 ..... 29
第 4 章 带扰动的非线性系统的快速迭代学习控制......31
4.1 引言 ....... 31
4.2 问题的描述 ....... 32
4.3 主要结果 ..... 33
4.4 收敛性证明 ....... 34
4.5 仿真研究 ..... 36
4.6 本章小结 ..... 38
第 5 章 具有可变遗忘因子的迭代学习算法.....39
5.1 引言 ....... 39
5.2 新算法的提出 ......... 39
5.3 主要结果 ..... 41
5.4 可变遗忘因子的设计 ......... 44
5.5 系统模型转换 ......... 45
5.6 仿真研究 ..... 46
5.7 本章小结 ..... 48

第5章 具有可变遗忘因子的迭代学习算法及在机械臂中的应用

5.1 引言
ILC 算法自 1984 年由 Arimoto 等人提出以来就一直受到控制界的广泛关注。它适用于一类具有重复运动特性的被控对象,其任务是寻找最优的控制输入,使得被控系统的实际输出轨迹在有限时间区间上实现与期望输出轨迹的完全跟踪[66]。文献[67]对于重复运行的被控系统,设计了开环 P 型以及闭环 P 型迭代学习控制器,实现了在有限时间区间内对期望轨迹的跟踪。文献[68]中采用的开闭环 PD 型迭代学习律,与 P 型学习律相比增加了误差信息量,提高了收敛速度,但因导数信号的引入增加了测量难度。文献[67,68]的学习律都是因果型迭代学习律,即利用前一次迭代的t时刻的误差信息来调节下一次t时刻的学习律。文献[55]中综述了因果型迭代学习律与非因果型迭代学习律的区别,即非因果型学习律是利用前一次迭代中未来时刻的误差信息来调节学习律,非因果型学习律由于利用了前次迭代的未来时刻的误差信息,使得控制器具有提前补偿未来扰动的功能。文献[69]提出了带有遗忘因子的迭代学习律,削弱了系统模型不确定部分和非重复干扰对系统收敛性的影响,但文献中引入的遗忘因子被设为固定常数,从而不能随系统特性的变化而实时调整,使得迭代学习律无法得到令人满意的收敛效果。针对以上问题,本文提出了具有可变遗忘因子的非因果型迭代学习算法。该算法不要求迭代初态与期望初态一致,并且能利用前一次迭代控制中未来时刻的误差信息来调整下一次的控制律,既增加了信息量又避免了导数信号的使用;同时,引入的可变遗忘因子能根据系统特性的变化自行调节学习律,很好的处理了跟踪速度和稳态误差的矛盾。本文所提新算法兼备了 D 型控制算法的超前性和 P 型控制算法易于执行的特性。
………………

结 论

ILC 不要求已知被控对象的精确数学模型,并且只需系统较少的先验知识,从而引起学者们的广泛关注和探讨。本文对迭代学习控制的收敛速度问题进行了深入研究,主要开展了以下工作:
(1)对于含有初始误差的机器人的轨迹跟踪问题,首先将机器人系统的动力学方程转化为状态方程,然后采用指数变增益的非因果型迭代学习算法对其进行控制。学习增益在迭代过程中有效的变化,从而加快了迭代学习的收敛速度。
(2)由于迭代学习算法不需要精确的数学模型,且对未建模的系统有一定的鲁棒性,由此本文针对具有状态扰动和输出干扰的一类非线性系统的轨迹跟踪问题,采用了带角度修正的 ILC 算法。用输出向量的角度关系作为反馈系数,用来判断控制输入好坏,依此对学习律的变化趋势做出“奖惩”,因此收敛速度得到了有效提高。
(3)对于一般的非线性系统,采用了一种具有可变遗忘因子的非因果型迭代学习算法。非因果型迭代学习律相比于因果型学习律在迭代过程中使用了未来时刻的误差信息,不仅增加了信息量还使得控制器具有提前补偿未来扰动的功能;引入可变的遗忘因子可以根据系统所处的状态有效的调节控制输入同时沿迭代方向进行滤波,从而加快了收敛速度,并削弱了系统的不确定部分对收敛性的影响。最后将此方法应用于机械臂的轨迹跟踪控制,达到了较好的收敛效果。
……………
参考文献(略)
温馨提示:答案为网友推荐,仅供参考
相似回答