上一篇中我们引入了输出调节(Output Regulation)的概念,并且介绍了采用静态反馈(static feedback)构成了output regulator实现闭环系统的稳定,以及输出 [公式] 的稳定(到原点)。如果对本文中一些写法感到奇怪,请重新回头看看上一篇。

这篇文章我们要继续上一次的讨论,展开两个问题的研究: 如何采用动态反馈实现output regulation,以及如何设计鲁棒output regulation使得控制器能够适用于模型参数的变化。

知识的掌握和升华需要经历两个阶段:一是总结和教授,二是实践和应用。本篇依旧参考[1]中Linear Output Regulation部分,算是对这本书线性部分知识的一个总结。下一篇文章将总结这两篇的知识,阐述所谓的内模原理(IMP)

虽然题为SISO控制设计,但是这个方法实际上适用于MIMO系统。

本篇目录:

1. Linear Output Regulation Problem的简单回顾

2. Linear Output Regulation Problem的动态输出反馈实现

3. Linear Robust Output Regulation Problem的概述

4. 友矩阵、 p-copy Internal Model

5. 鲁棒动态反馈控制器 Robust Dynamic Feedback Controller

6. 总结 Summary


1. Linear Output Regulation Problem的简单回顾

我简单地回顾一下Linear Output Regulation Problem(LORP)概念。LORP旨在设计一个regulator或者controller,解决:

A. 闭环系统的渐进稳定

B. 调节系统的被控输出至给定的工作点

初看LORP与tracking problem没有什么关系,但是如果我们设计被控输出为跟踪误差(tracking error) [公式] ,那么跟踪问题就可以转化为LORP问题。我们考虑一个系统:

[公式]

其中 [公式] 系统状态向量 [公式] 被测量的输出(measured output),而 [公式] 是外界扰动。我们现在想让系统的被测量输出 [公式] 跟踪某一个参考信号 [公式] ,那么我们就要设计一个反馈控制器或者调节器,在理论上就等价于设计其所服从的控制律 [公式] 。这个控制律要满足A与B两个条件。显然我们需要控制器能够抑制扰动对输出的干扰,让被测输出 [公式] 能够跟踪信号 [公式] 。现在设计一个新的被控输出 [公式] ,把控制目标转化为设计regulator将 [公式] 调节到原点。让我们把方程联立:

[公式]

[公式] 是我们注意这里定义了两个输出:measured output 与 controlled output。所谓measured output是指实际测量的输出,而controlled output是想要被控制的输出。controlled output一般可以自由设计,而实际测量输出一般由于物理限制是事先确定的。在(2)中,我们想要把 [公式] 控制到原点,而直接可以测量得到的(暂且假设)是 [公式] 。当然这里如果 [公式] 可以测量,那么 [公式] 也可以测量,如此measured output和controlled output可以是一致的。把扰动 [公式] 和参考信号 [公式] 结合成一个新向量 [公式] ,我们就得到了等价的开环系统(参考上一篇):

[公式]

上一篇文章中我们讲到可以设计静态反馈控制律: [公式] 来实现LORP。一般情况下,只要满足regulator equation有唯一解,就可以确定这两个增益 [公式] 

那么如果 [公式] 如果不能直接测量到,我们就无法使用这个静态反馈控制律来解决LORP问题了。我们在下一节中解决。

2. Linear Output Regulation Problem的动态输出反馈实现

如果 [公式] 无法测量,我们自然就想到了状态观测器的形式。我们可以构造一个动态反馈控制器(dynamical output feedback)服从控制律:

[公式]

这个形式和一般龙伯格状态观测器的形式是一致的:

[公式]

只能测量误差 [公式] 时,这样的做法是可以的。更一般的情况,当能够测量的输出 [公式] 的维度和参考输入 [公式] 的维度不匹配的时候, [公式] 就不能直接计算得到,但我们仍可以将 [公式] 作为一个名义上的被控输出。而我们修改一下(4),采用测量输出 [公式] 构成反馈律:

[公式]

如此构成的闭环系统为:

[公式]采用新向量 [公式] ,那么我们得到闭环系统:

[公式]

在上一篇中我们说是regulator equation有唯一解 [公式] 可以推出LORP得解,即:

[公式]

现在令(8) [公式], [公式] , [公式] ,[公式] 。这样只要 [公式]  [公式] 的特征值没有重合,(9)就有唯一解,那么LORP就能得到解决:即闭环稳定与输出调节至原点。实际上把各矩阵代入(9)后,存在唯一解 [公式] 等效于:

图1

证明见[1,p13],过程很简单,也很显然。结论就是(9)有唯一解 [公式] ,可以表示为 [公式] (意思是一个由X,Z构成的新向量),意味着图1中第一组方程有唯一解 [公式] ,并且 [公式] 也满足一个Sylvester equation以及 [公式] 

为了满足regulator equation (9),我们就必须先构造出控制律(6)中的 [公式] 来得到 [公式]  [公式] 。我们之前既然已经得到了静态反馈控制律,我们可以通过控制律(6)来估计 [公式]  [公式] ,使得静态控制律变成动态控制律。这样,我们把已经有的几个方程再罗列一下:

[公式]

根据状态观测器的原理,我们只要把向量 [公式] 当作新的状态变量, [公式] 作为输出,令 [公式] 作为 [公式] 估计,那么我们可以构造状态观测器:

[公式]

反馈控制律就是:

[公式]

这里的增益根据(9)等效的图1中的前两个方程的解X,U计算得到,方法如上一篇文章中所述一样。只不过差别就是这里 [公式] 都是估计量。

(10)(11)(12)构成的闭环系统可以解决LORP,其中(11)(12)构成了动态输出反馈控制律,反馈增益由 [公式] 决定,等价于regulator equation的唯一解决定。总结一下步骤就是:

  1. 构造(11)(12),可以把等价化成(6)的形式,计算得到相应的 [公式] 。注意满足能观性假设。
  2. 根据(9)计算得到 [公式] ,得到 [公式] ,再根据图1中的公式得到 [公式] 。或者直接解方程

[公式]

得到 [公式] 

3. 选择 [公式] 使得闭环系统稳定,计算 [公式]

3. Linear Robust Output Regulation Problem的概述

现在我们考虑robustness的问题。我们看到增益 [公式] 如果发生变化,是会影响 [公式] 的值,而它们的值也取决于状态空间方程中的矩阵[公式] 。在上一篇文章中我们说到,采用静态反馈,系统稳态时的状态为: [公式] 。如果系统矩阵的参数发生微小的变动,那么我们就会得到一个不一样的稳态 [公式] ,于是下式就无法保证为0:

[公式]

那么输出或者说跟踪误差就无法调节至0。

为了解决系统参数变动时,控制器仍然能满足控制要求的问题,我们引入robustness的概念。在LORP问题中,我们要求控制器在系统矩阵 [公式] 发生变化时仍然能胜任。

我们来定义系统参数的变化,我们定义 [公式] 作为与原矩阵想同维度的矩阵,来表示在原矩阵参数上的不确定变化。我们用以下符号来标记实际的系统矩阵:

[公式]

[公式] 代表一个向量,包含了 [公式] 所有entries。当 [公式] 时,就表示nominal matrices。所以我们面对的系统可以写成:

[公式]

要实现(16)的闭环稳定和输出调节是不能采用静态反馈控制的[1,Lemma 1.21,p19],简单的原因上面已经说过了, 系统参数变化,采用以nominal matrices计算出来的[公式],从而得到的 [公式] 还有闭环稳态是不足以使得 [公式] 收敛至0的。系统发生了变化,而仍然采用静态增益,虽然很多时候能保证闭环稳定性,但其控制性能已经发生了改变。

针对这种情况,我们必须设计动态反馈控制律。我们有两种方案,这里采用误差作为测量输出:

A. 既然 [公式]  [公式] 会不断改变,我们就让第二项动态变化,设计状态反馈:

[公式]

B. 采用输出反馈

[公式]

注意(17)(18)虽然采用了同样的字母 [公式] 但它们的维度却不一定一致。在测量输出反馈( [公式] )中也会发生维度变化。

现在我们讨论(17)代入(16)构成闭环系统, 其中 [公式] 

[公式]

我们也可以记为:

[公式]

对于闭环系统(20), 我们依然有regulator equations如(21)。下面的定理告诉我们RLORP问题

定理1([1,p18]):
[公式]
如果控制器使得 [公式] 是Hurwitz的,其中 [公式] , [公式]  [公式] 附近的某个邻域,并且(21)存在唯一解 [公式] ,那么Linear Robust Output Regulation Problem就得到了解决。

这个定理的证明和上一篇中关于regulator equations的证明基本相同。不过我们注意到的是,由于系统参数在发生变化,所以唯一解也在发生变化,因此采用上一篇中的方法, [公式] 的取值也会发生变化。而想用不变的 [公式] 去适应变化的系统参数,这里是行不通的。于是我们不能用(21)的解来确定反馈增益,一来我们不知道真知,二来真值可能还会随着时间变化。

既然如此,我们直接考虑(16)和(17)或者(18)合并:

[公式]控制律可以为全状态反馈 [公式] 或者部分状态反馈 [公式] 。目标就是要满足 [公式] 是Hurwitz的,并且(21)第一个方程的解 [公式] 也满足第二个方程。

4. 友矩阵、 p-copy Internal Model

为了构造满足这个目标的控制器,我们引入下面的概念:

定义1(p-copy internal model)[1,p20]: 给定任意一个方阵 [公式] ,如果一个矩阵对 [公式] 有如下的形式:
[公式]

其中 [公式] 可以是任意维度的常数矩阵,只要矩阵之间维度是兼容运算的。 [公式] 是与 [公式] 同维的非奇异矩阵。 [公式] 描述如下:

[公式]

其中的 [公式]  [公式] 是常数方阵维度为某个整数 [公式]  [公式] 是一个常数向量,维度也为 [公式] ,使得:
(i) [公式] 是controllable的
(ii) [公式] 极小多项式(minimal polynomial) 能除 [公式] 特征多项式(characteristic polynomial)
那么我们就说矩阵对 [公式] 包含了p份A的内模(incorporate p-copy internal model of A)

我们要注意 [公式] 就是 [公式] 或者 [公式] 的维度,即 [公式] 

这个定义初看是云里雾里,矩阵对包含了p-copy internal model,这是什么意思呢? 我们知道矩阵对[公式]构成了我们的动态反馈控制器(17)(18),而 [公式] 需要满足(ii),使得 [公式] 的“特征"嵌入了 [公式] 中。所以说矩阵对 [公式] 包含了 [公式] 的p个内模。所谓 p-copy 在英语里是关于p份复制品的意思。

[公式] 极小多项式(minimal polynomial)唯一存在的、最小次数首一多项式(monic polynomial) q(x),并且使得 [公式] 。我们已经熟悉了矩阵的特征多项式 [公式] 了,特征方程满足 [公式] ,但是其次数大于等于极小多项式。实际上,一个矩阵的极小多项式总是能除它的特征多项式,意味着存在某个首一多项式 [公式] [公式]

按照(ii)的条件,我们说矩阵 [公式] 的特征多项式 [公式] 包含了A的极小多项式 [公式] 。由于 [公式] 是不为0的,我们利用(24):[公式]

那么 [公式] 的特征值 [公式] 显然能令 [公式] 的极小多项式[公式] 。因为 [公式] 的极小多项式总能除 [公式] 的特征多项式,所以 [公式] 的特征值 [公式] 也能令 [公式] 的极小多项式 [公式]  [公式] 的维度是不能小于 [公式] 的,又因为极小多项式是唯一的,那么 [公式] 的所有特征值 [公式] 一定也是 [公式] 的特征值。当极小多项式与特征多项式相同时,矩阵有相异的特征值,矩阵可以对角化。

这么看来,所谓的内模就是指把矩阵[公式] 的特征值都包含在了 [公式] 中,这样在 [公式] 中又包含了 [公式] 份这样的特征值,从而也在 [公式] 之中。而 [公式] 的成分是要保证 [公式] ,也就是 [公式] 是能控的。

实际上这样的 [公式] 总是能够存在的:任意 [公式] 的极小多项式,一定对应于一个友矩阵。该友矩阵的极小多项式也同时是其特征多项式。(事实上任意一个首一多项式都对应一个友矩阵,其特征多项式和极小多项式是一致的)。我们对友矩阵一定不陌生,在讲能控性时我们就讲过标准型就是友矩阵形式。关于极小多项式和友矩阵,发现一篇博文还可以,虽然有些符号比较乱,但是可以看懂latex就没问题:

任取一个方阵 [公式] ,它的极小多项式,假设次数为 [公式] 

[公式]

那么一定能找到一个对应的 [公式] 矩阵:

[公式]

其特征多项式和极小多项式是一样的,正是式(26)!我们为了满足(i)的controllable条件,那么 [公式] 显然就是:

[公式]

对于我们要的 [公式] 份copy,完全可以令:

[公式]这样组成的 [公式] 都满足(i)与(ii)。

如此根据定义,我们只要选择 [公式] 这几个矩阵就可以构造出 [公式] 来。满足上述定义的 [公式] ,我们说它包含了p份A的内模。既然之前说可以任取常数矩阵,我们不妨让 [公式]  [公式] 取identity matrix,那么 [公式] ,显然 [公式] 满足要求(i)(ii)。我们提出下一个定义:

定义2(dynamic compensator):如果 [公式] 包含了 [公式] 的p-copy internal model,那么我们说动态补偿器
[公式]
包含了系统(16)的p-copy internal model。当 [公式] ,我们说动态补偿器
[公式]
系统(16)的p-copy internal model。

这里我们令上面定义的 [公式] ,如此我们就把外扰和参考的模型包括在了控制器之中,即所谓的“内模”

我们在上面让 [公式] 的特征多项式等于 [公式] 的极小多项式,那么对应的矩阵就是友矩阵,此时 [公式] 的维度也是最小的,所以构成的 [公式] 维度也是最小的。这种情况下 [公式] 是系统(16)的minimal p-copy internal model。

5. 鲁棒动态反馈控制器 Robust Dynamic Feedback Controller

现在我们要知道一个包含了([公式] 的)p-copy internal model的动态反馈控制器或者补偿器是否能够解决Linear Robust Output Regulation Problem。是否能解决LRORP就看是否满足定理(21)。让我们考虑反馈控制律 [公式],此时的开环系统变成了:

[公式]

这里的思路就是引入动态补偿器,把整个闭环系统的维度升高(引入了 [公式] )。把控制律和误差 [公式] 代入之后得到:

[公式]

我们如果定义:

[公式]

我们就有闭环系统写成:

[公式]

所以问题就是(31)是否能够闭环稳定,并且使得 [公式] 。根据定理1,只要(21)的第一个方程有唯一解 [公式] ,并且该解也满足(21)第二个方程即可。下面这个定理告诉我们,包含了( [公式] 的)p-copy internal model的补偿器构成的闭环系统(30)或者(31)满足定理1的两个条件。

定理2([1,p23,Lemma 1.27,p25, Theorem 1.30]): 如果 [公式] 包含了 [公式] 的p-copy internal model,并且 [公式] 是Hurwitz的,其形式为:
[公式]
其特征值与 [公式] 没有重合,那么
[公式]
有唯一解 [公式] ,并且 [公式] 满足:
[公式]

这个定理至关重要,要解释一下。首先我们设计的控制 [公式] 要包含p-copy internal model,这是我们要证明的事情,就是是否这样的控制器能够解决LRORP。 [公式] 没有共同的特征值,则(32)有唯一解,这是一个我们说过好几遍的定理了。而根据定理1,如果 [公式] 是Hurwitz的,并且闭环系统同时满足(32)和(33),那么控制器就解决了LRORP了。与定理1不同的是,这里我们具体设计了一种控制器,以 [公式] 为主要设计对象,证明其是否满足定理1。于是在逻辑上我们只差一环,我们要证明唯一解 [公式] 是否满足(33)呢?如果Yes,那么根据定理1和定理2,我们就得出了这样包含内模的控制器能够解决LRORP问题。是否满足(33),限于篇幅,请参见[1,p23]的proof。关于那个证明的关键,依旧是 [公式] 的极小多项式能除 [公式] 的特征多项式。

结合定理1和定理2,我们得出结论: [公式] 作用于系统(29)能够解决Linear Robust Output Regulation Problem。我们可以看到,引入了这样的反馈律后,原来的抗扰和追踪问题就被转化为了扩张的([公式] 是扩张的状态)闭环系统的稳定问题。当然其中我们还是涉及到一些细节问题,比如(29)开环系统被证明是stabilizable的[1,p22,Lemma 1.26]。

当系统状态 [公式] 不可得到的时候,我们可以采用 [公式] 控制律来解决。我之前用 [公式] 的符号,这里需要注意的是,这里的 [公式] 的维度已经不是 [公式] 中的 [公式] 了,我用 [公式] 来代替。我们让 [公式] ,这样实际上 [公式] 就和原来的 [公式] 的很像了,只不过 [公式] 有一部分是用状态观测器的估计出来的 [公式] ,可以详见[1,p25,p26]相关的证明。

6. 总结 Summary

在不考虑系统参数变化的情况下,我们上一篇文章和这一篇文章的前半部分都讲到了解决Linear Output Regulation Problem的关键是regulator equations的可解性问题。而在鲁棒性的要求下,系统参数发生变化,我们同样将 [公式] 的模型包含在了控制器设计中,这是内模原理的表现。下一篇我们将内模原理总结一下,再继续讲述Feedback Control Of Dynamic Systems中的内容。

参考文献 Reference

[1] Huang, J. (2004).Nonlinear output regulation: theory and applications .Siam.