上一篇中我们引入了输出调节(Output Regulation)的概念,并且介绍了采用静态反馈(static feedback)构成了output regulator实现闭环系统的稳定,以及输出 的稳定(到原点)。如果对本文中一些写法感到奇怪,请重新回头看看上一篇。
这篇文章我们要继续上一次的讨论,展开两个问题的研究: 如何采用动态反馈实现output regulation,以及如何设计鲁棒output regulation使得控制器能够适用于模型参数的变化。
知识的掌握和升华需要经历两个阶段:一是总结和教授,二是实践和应用。本篇依旧参考[1]中Linear Output Regulation部分,算是对这本书线性部分知识的一个总结。下一篇文章将总结这两篇的知识,阐述所谓的内模原理(IMP)。
虽然题为SISO控制设计,但是这个方法实际上适用于MIMO系统。
本篇目录:
1. Linear Output Regulation Problem的简单回顾
2. Linear Output Regulation Problem的动态输出反馈实现
3. Linear Robust Output Regulation Problem的概述
4. 友矩阵、 p-copy Internal Model
5. 鲁棒动态反馈控制器 Robust Dynamic Feedback Controller
6. 总结 Summary
1. Linear Output Regulation Problem的简单回顾
我简单地回顾一下Linear Output Regulation Problem(LORP)概念。LORP旨在设计一个regulator或者controller,解决:
A. 闭环系统的渐进稳定
B. 调节系统的被控输出至给定的工作点
初看LORP与tracking problem没有什么关系,但是如果我们设计被控输出为跟踪误差(tracking error) ,那么跟踪问题就可以转化为LORP问题。我们考虑一个系统:
其中 是系统状态向量, 是被测量的输出(measured output),而 是外界扰动。我们现在想让系统的被测量输出 跟踪某一个参考信号 ,那么我们就要设计一个反馈控制器或者调节器,在理论上就等价于设计其所服从的控制律 。这个控制律要满足A与B两个条件。显然我们需要控制器能够抑制扰动对输出的干扰,让被测输出 能够跟踪信号 。现在设计一个新的被控输出 ,把控制目标转化为设计regulator将 调节到原点。让我们把方程联立:
是我们注意这里定义了两个输出:measured output 与 controlled output。所谓measured output是指实际测量的输出,而controlled output是想要被控制的输出。controlled output一般可以自由设计,而实际测量输出一般由于物理限制是事先确定的。在(2)中,我们想要把 控制到原点,而直接可以测量得到的(暂且假设)是 。当然这里如果 可以测量,那么 也可以测量,如此measured output和controlled output可以是一致的。把扰动 和参考信号 结合成一个新向量 ,我们就得到了等价的开环系统(参考上一篇):
上一篇文章中我们讲到可以设计静态反馈控制律: 来实现LORP。一般情况下,只要满足regulator equation有唯一解,就可以确定这两个增益 。
那么如果 如果不能直接测量到,我们就无法使用这个静态反馈控制律来解决LORP问题了。我们在下一节中解决。
2. Linear Output Regulation Problem的动态输出反馈实现
如果 无法测量,我们自然就想到了状态观测器的形式。我们可以构造一个动态反馈控制器(dynamical output feedback)服从控制律:
这个形式和一般龙伯格状态观测器的形式是一致的:
只能测量误差 时,这样的做法是可以的。更一般的情况,当能够测量的输出 的维度和参考输入 的维度不匹配的时候, 就不能直接计算得到,但我们仍可以将 作为一个名义上的被控输出。而我们修改一下(4),采用测量输出 构成反馈律:
如此构成的闭环系统为:
采用新向量 ,那么我们得到闭环系统:
在上一篇中我们说是regulator equation有唯一解 可以推出LORP得解,即:
现在令(8) , , , 。这样只要 与 的特征值没有重合,(9)就有唯一解,那么LORP就能得到解决:即闭环稳定与输出调节至原点。实际上把各矩阵代入(9)后,存在唯一解 等效于:
证明见[1,p13],过程很简单,也很显然。结论就是(9)有唯一解 ,可以表示为 (意思是一个由X,Z构成的新向量),意味着图1中第一组方程有唯一解 ,并且 也满足一个Sylvester equation以及 。
为了满足regulator equation (9),我们就必须先构造出控制律(6)中的 来得到 与 。我们之前既然已经得到了静态反馈控制律,我们可以通过控制律(6)来估计 和 ,使得静态控制律变成动态控制律。这样,我们把已经有的几个方程再罗列一下:
根据状态观测器的原理,我们只要把向量 当作新的状态变量, 作为输出,令 作为 的估计,那么我们可以构造状态观测器:
反馈控制律就是:
这里的增益根据(9)等效的图1中的前两个方程的解X,U计算得到,方法如上一篇文章中所述一样。只不过差别就是这里 都是估计量。
(10)(11)(12)构成的闭环系统可以解决LORP,其中(11)(12)构成了动态输出反馈控制律,反馈增益由 决定,等价于regulator equation的唯一解决定。总结一下步骤就是:
- 构造(11)(12),可以把等价化成(6)的形式,计算得到相应的 。注意满足能观性假设。
- 根据(9)计算得到 ,得到 ,再根据图1中的公式得到 。或者直接解方程
得到 。
3. 选择 使得闭环系统稳定,计算 。
3. Linear Robust Output Regulation Problem的概述
现在我们考虑robustness的问题。我们看到增益 如果发生变化,是会影响 的值,而它们的值也取决于状态空间方程中的矩阵 。在上一篇文章中我们说到,采用静态反馈,系统稳态时的状态为: 。如果系统矩阵的参数发生微小的变动,那么我们就会得到一个不一样的稳态 ,于是下式就无法保证为0:
那么输出或者说跟踪误差就无法调节至0。
为了解决系统参数变动时,控制器仍然能满足控制要求的问题,我们引入robustness的概念。在LORP问题中,我们要求控制器在系统矩阵 发生变化时仍然能胜任。
我们来定义系统参数的变化,我们定义 作为与原矩阵想同维度的矩阵,来表示在原矩阵参数上的不确定变化。我们用以下符号来标记实际的系统矩阵:
代表一个向量,包含了 所有entries。当 时,就表示nominal matrices。所以我们面对的系统可以写成:
要实现(16)的闭环稳定和输出调节是不能采用静态反馈控制的[1,Lemma 1.21,p19],简单的原因上面已经说过了, 系统参数变化,采用以nominal matrices计算出来的,从而得到的 还有闭环稳态是不足以使得 收敛至0的。系统发生了变化,而仍然采用静态增益,虽然很多时候能保证闭环稳定性,但其控制性能已经发生了改变。
针对这种情况,我们必须设计动态反馈控制律。我们有两种方案,这里采用误差作为测量输出:
A. 既然 中 会不断改变,我们就让第二项动态变化,设计状态反馈:
B. 采用输出反馈
注意(17)(18)虽然采用了同样的字母 但它们的维度却不一定一致。在测量输出反馈( )中也会发生维度变化。
现在我们讨论(17)代入(16)构成闭环系统, 其中 :
我们也可以记为:
对于闭环系统(20), 我们依然有regulator equations如(21)。下面的定理告诉我们RLORP问题
定理1([1,p18]):
如果控制器使得 是Hurwitz的,其中 , 是 附近的某个邻域,并且(21)存在唯一解 ,那么Linear Robust Output Regulation Problem就得到了解决。
这个定理的证明和上一篇中关于regulator equations的证明基本相同。不过我们注意到的是,由于系统参数在发生变化,所以唯一解也在发生变化,因此采用上一篇中的方法, 的取值也会发生变化。而想用不变的 去适应变化的系统参数,这里是行不通的。于是我们不能用(21)的解来确定反馈增益,一来我们不知道真知,二来真值可能还会随着时间变化。
既然如此,我们直接考虑(16)和(17)或者(18)合并:
控制律可以为全状态反馈 或者部分状态反馈 。目标就是要满足 是Hurwitz的,并且(21)第一个方程的解 也满足第二个方程。
4. 友矩阵、 p-copy Internal Model
为了构造满足这个目标的控制器,我们引入下面的概念:
定义1(p-copy internal model)[1,p20]: 给定任意一个方阵 ,如果一个矩阵对 有如下的形式:
其中 可以是任意维度的常数矩阵,只要矩阵之间维度是兼容运算的。 是与 同维的非奇异矩阵。 描述如下:
其中的 , 是常数方阵维度为某个整数 , 是一个常数向量,维度也为 ,使得:
(i) 是controllable的
(ii) 的极小多项式(minimal polynomial) 能除 的特征多项式(characteristic polynomial)。
那么我们就说矩阵对 包含了p份A的内模(incorporate p-copy internal model of A)。
我们要注意 就是 或者 的维度,即 。
这个定义初看是云里雾里,矩阵对包含了p-copy internal model,这是什么意思呢? 我们知道矩阵对构成了我们的动态反馈控制器(17)(18),而 需要满足(ii),使得 的“特征"嵌入了 中。所以说矩阵对 包含了 的p个内模。所谓 p-copy 在英语里是关于p份复制品的意思。
的极小多项式(minimal polynomial)是唯一存在的、最小次数的首一多项式(monic polynomial) q(x),并且使得 。我们已经熟悉了矩阵的特征多项式 了,特征方程满足 ,但是其次数大于等于极小多项式。实际上,一个矩阵的极小多项式总是能除它的特征多项式,意味着存在某个首一多项式 :
按照(ii)的条件,我们说矩阵 的特征多项式 包含了A的极小多项式 。由于 是不为0的,我们利用(24):
那么 的特征值 显然能令 的极小多项式 。因为 的极小多项式总能除 的特征多项式,所以 的特征值 也能令 的极小多项式 。 的维度是不能小于 的,又因为极小多项式是唯一的,那么 的所有特征值 一定也是 的特征值。当极小多项式与特征多项式相同时,矩阵有相异的特征值,矩阵可以对角化。
这么看来,所谓的内模就是指把矩阵 的特征值都包含在了 中,这样在 中又包含了 份这样的特征值,从而也在 之中。而 的成分是要保证 ,也就是 是能控的。
实际上这样的 总是能够存在的:任意 的极小多项式,一定对应于一个友矩阵。该友矩阵的极小多项式也同时是其特征多项式。(事实上任意一个首一多项式都对应一个友矩阵,其特征多项式和极小多项式是一致的)。我们对友矩阵一定不陌生,在讲能控性时我们就讲过标准型就是友矩阵形式。关于极小多项式和友矩阵,发现一篇博文还可以,虽然有些符号比较乱,但是可以看懂latex就没问题:
任取一个方阵 ,它的极小多项式,假设次数为 :
那么一定能找到一个对应的 矩阵:
其特征多项式和极小多项式是一样的,正是式(26)!我们为了满足(i)的controllable条件,那么 显然就是:
对于我们要的 份copy,完全可以令:
这样组成的 都满足(i)与(ii)。
如此根据定义,我们只要选择 这几个矩阵就可以构造出 来。满足上述定义的 ,我们说它包含了p份A的内模。既然之前说可以任取常数矩阵,我们不妨让 , 取identity matrix,那么 ,显然 满足要求(i)(ii)。我们提出下一个定义:
定义2(dynamic compensator):如果 包含了 的p-copy internal model,那么我们说动态补偿器
包含了系统(16)的p-copy internal model。当 ,我们说动态补偿器
是系统(16)的p-copy internal model。
这里我们令上面定义的 ,如此我们就把外扰和参考的模型包括在了控制器之中,即所谓的“内模”。
我们在上面让 的特征多项式等于 的极小多项式,那么对应的矩阵就是友矩阵,此时 的维度也是最小的,所以构成的 维度也是最小的。这种情况下 是系统(16)的minimal p-copy internal model。
5. 鲁棒动态反馈控制器 Robust Dynamic Feedback Controller
现在我们要知道一个包含了( 的)p-copy internal model的动态反馈控制器或者补偿器是否能够解决Linear Robust Output Regulation Problem。是否能解决LRORP就看是否满足定理(21)。让我们考虑反馈控制律 ,此时的开环系统变成了:
这里的思路就是引入动态补偿器,把整个闭环系统的维度升高(引入了 )。把控制律和误差 代入之后得到:
我们如果定义:
我们就有闭环系统写成:
所以问题就是(31)是否能够闭环稳定,并且使得 。根据定理1,只要(21)的第一个方程有唯一解 ,并且该解也满足(21)第二个方程即可。下面这个定理告诉我们,包含了( 的)p-copy internal model的补偿器构成的闭环系统(30)或者(31)满足定理1的两个条件。
定理2([1,p23,Lemma 1.27,p25, Theorem 1.30]): 如果 包含了 的p-copy internal model,并且 是Hurwitz的,其形式为:
其特征值与 没有重合,那么
有唯一解 ,并且 满足:
这个定理至关重要,要解释一下。首先我们设计的控制 要包含p-copy internal model,这是我们要证明的事情,就是是否这样的控制器能够解决LRORP。 没有共同的特征值,则(32)有唯一解,这是一个我们说过好几遍的定理了。而根据定理1,如果 是Hurwitz的,并且闭环系统同时满足(32)和(33),那么控制器就解决了LRORP了。与定理1不同的是,这里我们具体设计了一种控制器,以 为主要设计对象,证明其是否满足定理1。于是在逻辑上我们只差一环,我们要证明唯一解 是否满足(33)呢?如果Yes,那么根据定理1和定理2,我们就得出了这样包含内模的控制器能够解决LRORP问题。是否满足(33),限于篇幅,请参见[1,p23]的proof。关于那个证明的关键,依旧是 的极小多项式能除 的特征多项式。
结合定理1和定理2,我们得出结论: 作用于系统(29)能够解决Linear Robust Output Regulation Problem。我们可以看到,引入了这样的反馈律后,原来的抗扰和追踪问题就被转化为了扩张的( 是扩张的状态)闭环系统的稳定问题。当然其中我们还是涉及到一些细节问题,比如(29)开环系统被证明是stabilizable的[1,p22,Lemma 1.26]。
当系统状态 不可得到的时候,我们可以采用 控制律来解决。我之前用 的符号,这里需要注意的是,这里的 的维度已经不是 中的 了,我用 来代替。我们让 ,这样实际上 就和原来的 的很像了,只不过 有一部分是用状态观测器的估计出来的 ,可以详见[1,p25,p26]相关的证明。
6. 总结 Summary
在不考虑系统参数变化的情况下,我们上一篇文章和这一篇文章的前半部分都讲到了解决Linear Output Regulation Problem的关键是regulator equations的可解性问题。而在鲁棒性的要求下,系统参数发生变化,我们同样将 的模型包含在了控制器设计中,这是内模原理的表现。下一篇我们将内模原理总结一下,再继续讲述Feedback Control Of Dynamic Systems中的内容。
参考文献 Reference
[1] Huang, J. (2004).Nonlinear output regulation: theory and applications .Siam.
评论(0)
您还未登录,请登录后发表或查看评论