资源预览内容
第1页 / 共67页
第2页 / 共67页
第3页 / 共67页
第4页 / 共67页
第5页 / 共67页
第6页 / 共67页
第7页 / 共67页
第8页 / 共67页
第9页 / 共67页
第10页 / 共67页
亲,该文档总共67页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
第十章 二次型性能指标的线性系统最优控制 在实际工程问题中,二次型性能指标的线性系统最优控制问题具有特别重要的意义。这是由于:二次型性能指标具有鲜明的物理意义,它代表了大量工程实际问题中提出的性能指标要求;在数学处理上比较简单,可求得最优控制的统一解析表示式;特别可贵的是可得到状态线性反馈的最优控制规律,易于构成闭环最优控制,这一点在工程实现上具有重要意义。 因此二次型性能指标的线形系统最优控制问题被广泛应用到各种工程实际中,例如:导弹的角度控制、电冰箱的温度控制等。电冰箱温度控制导弹角度控制二次型性能指标线性系统最优控制问题可以描述如下:设线性系统状态方程及输出方程为:(10-1)(10-1)式中, 为 维状态向量, 为 维控制向量, 为 维输出向量。假设: ; 不受约束; 为理想输出, 与同维数,并定义为误差向量(10-3) 这里,权函数 , 为正半定矩阵, 为正定矩阵。假定 固定。要求寻找最优控制 ,使性能指标 为最小。性能指标为 (10-4) 这里,被积函数的第一项 代表整个过程中误差 的大小。由于 的正半定性,决定了这一项的非负性;被积函数的第二项 代表控制功率的消耗,其积分表示整个过程中控制能量的消耗。由于 的正定性,决定了这一项总为正,由于这个原因,对 往往不需再疑义约束,而常设 为自由的;指标函数的第一项 表示终值误差。从理论上讲,被积函数的第一项已经包括了终端误差的万分,但如需特别强调终值误差,则可加上此项。 矩阵 则是用来权衡各个误差成分及控制分量相对重要程度的加权阵。这里, 及 可以是时间函数,以表示在不同时刻的不以加权。因此,二次型性能指标的最优控制问题实质上是:要求用较小的控制能量来获得较小误差的最优控制。下面,我们将分别讨论几种特殊情况: 状态调节器问题。它对应于 及 的情况。这时要求用不大的控制能量以保持状态在零值附近。 输出调节器问题。它对应于 的情况。这时要求用不大的控制能量以保持输出在零值附近。 跟踪器问题。这时 ,它要坟用不大的控制能量使输出量 跟踪 。第一节 线性连续系统状态调节器问题设线性系统的状态方程为(10-5) 终端时刻 固定。要求寻找最优控制 ,使性能指标 为最小。不受约束,性能指标为(10-6) 这个问题的求解可以用极小值原理或动态规划法,这里,我们应用极小值原理来求解。首先列写哈密尔顿函数(10-7)由此可得正则方程(10-8)(10-9)由于控制不受约束,控制方程满足(10-10)由于 的正定性保证了 存在,从而 才可能存在。 由此可得:(10-11)将式(10-11)代入正则方程(10-12)(10-13)这是一组一阶线必微分方程,其边界条件为:及横截条件(10-14)(10-15) 由于横截条件中 与 存在线性关系,而正则方程又是线性的。因此可以假设,在任何时刻 与 均可以存在如下线性关系;(10-16)对式(10-16)求导(10-17)将式(812)、式(816)代入式(817)(10-18)将式(816)代入式(89)(10-19)由此可得:(10-20)上式应对任何 均成立,故有 该式称为矩阵黎卡提微分方程,它是一个阶非线性矩阵微分方程。 (10-21) 它是一个阶非线性矩阵微分方程。比较式(10-15)及式(10-16),可知式(10-21)的边界条件为: (10-22) 由黎卡提微分方程解出 后,代入式(811),可得最优控制规律为:(10-23)下面对以上结论作几点说明: 优控制规律是一个状态线性反馈规律,它能方便地实现闭环最优控制。这一点在工程上具有十分重要的意义。闭环最优控制的结构原理图如图10-1。图10-1 闭环最优控制结构图 可以证明(略), 是一个对称阵。由于它是非线性微分方程之解,通常情况下难求得解析解,一般都需由计算机求出其数值解,并且由于具边界条件在终端处。因此需要逆时间方向求解,并且必须在过程开始之前就将 解出,存入计算机以供过程中使用。由于黎卡提微分方程与状态及控制变量无关,因此在定常系统情况下,预先算出可能的。 是时间函数,由此得出结论,即使线性系统是时不变的,为了实现最优控制,反馈增益应该是时变的,而不是常值反馈增益。这一点与经典控制方法的结论具有本质的区别。 将最优控制及最优状态轨线代入指标函数,最后可求得性能指标的最小值为:(证明略)。(10-24)例10-1 设线性系统状态方程为: 初始条件为: 不受约束, 固定,性能指标为:最求最优控制 ,使性能指标 为最小。解: 本例相应的具有关矩阵为:设:将 代入式根据等号两边矩阵的对应元素就相等,可得下列方程:已知为 对称矩阵,故 ,上式可变成:已知 ,上列方程的终端边界条件为: 上式的求解一般由计算机进行,将 的解代入式(10-23)可得最优控制为:第二节 时线性定常连续系统状态调节器问题 为常值矩阵,并满足 为正半定的, 为正定的。求最优点控制 ,使性能指标 为最小。设线性系统状态方程为(10-25)这里, 为常值矩阵, 不受约束,性能指标为(10-26)这里讨论的问题与第二节相比,有以下几点不同:1.系统是时不变的,性能指标的权矩阵为常值矩阵。 2.端时刻 。在前节讨论已知,即使线性系统是时不变的,求得的反馈增益矩阵是时变的,这使系统的结构大为复杂。终端时刻 取作无穷大,目的是期望能得到一个常值反馈增益矩阵。 3. 终值权矩阵 ,即没有终端性能指标。这是因为人们总在关注系统在有限时间内的响应,当 时,这时的终值性能指标就没有多大实际意义了,并且终端状态容许出现任何非零值时,由于积分限为 ,都会引起必须指标趋于无穷。 4.要求受控制系统完全可控,以保证最优系统的稳定性。在前节讨论控制区间 为有限时,即使出现某些状态的不可控制情况,其以性能指标的影响通常总是有限的,因此最优控制仍然可以存在。但是,当控制区间为无限时,如果出现状态不可控,则不论采取什么控制,都将使性能指标趋于无穷大,也就无法比较各种控制的优劣了。 在注意到以上几点差别后,就可按照前节所述方法来求解最优控制了,可以得到相似的结果如下: 最优控制存在并唯一,其形式为(10-27) 为黎长提微分方程(10-21)之解,但因为这时 ,其边界条件应为:(10-28)性能指标的最小值为(10-29) 下面,着重讨论一个黎卡提微分方程解的性质。一般情况下, 曲线的形状大致如图10-2所示。可能看到, 曲线具有以下性质:图10-2 曲线大致形状2. 在接近终端时变化比较剧烈。3.但在远离终端时, 慢慢趋于某个常值 。1. 时, 。 由此,可以把 曲线看作以 作为起始时刻, 作为起始值,逆时间方向进行的一个过程。当 离终端时刻 足够远时,这个过程已经逐渐衰减并趋于其 。由于 的过渡过程存在于靠近终端区域,因此最优系统的有限控制区间总是远离终端的,从而 实际可以采用稳态值,即 。这里 显然满足 时的黎卡提微分方程 (10-30) 上式称为黎卡提矩阵代数方程。这是一个非线性代数方程,求解式(10-30)可得稳态值 。这了保证最优系统的稳定性, 必须是正定的(证明略)。这样,得到了所期望的结果,即:最优控制为状态线性反馈,并且反馈增益为常值。由此可以构成线性时不变的状态调节器,使结构大为简化,这一点在工程实现上具有很大实用意义。闭环最优控制的结构图如图10-3所示。图10-3 最优控制的结构图例10-2 设系统状态方程为不受约束,性能指标为:寻求最优控制 ,使性能指标 为最小。解: 本例的有关矩阵为:可见 及 矩阵均为正定的,并因此系统可控,故存在唯一的最优控制。 首先由黎卡提代数方程求解 上式给出方程:由此解得:为了保证 的正定性要求,最后解得代入 ,可得第三节 线线连续系统输出调节器问题设系统动态方程为:(10-31)式中 为正半定矩阵, 为正定矩阵,要求最优控制 ,使性能指标 为最小。 不受约束,固定 ,性能指标为:(10-32) 这类问题可以首先把它转化成等效的状态调节器问题,然后利用第三节的结果来求最优控制规律。将 代入性能指标,得:(10-33) 与状态调节器问题相比,可以发现其唯一差别是:在指标函数中的权函数有了变换,即由 分别替换了 及 。因此,只要这种变换成立,则状态调节器问题的所有结果在这里都能适用。在状态调节器的讨论中已知,为使最优控制存在,要求权矩阵 , 对称并为正半定的。 对称并为正定的。 目前情况下, 阵未变,因此为使最优控制存在,相应地要求矩阵 为对称并为正半定的,这就是变换成立的条件。为此,我们引入以下定理。 定理:如果 及 为正半定的,当且仅当系统(831)为完全可观测时,矩阵 是正半定的。证明:如果系统完全可观测,则满足即以上矩阵包含 个线性无关的列向量。于是 ,即任一状态向量唯一地与输出向量 相对应。 已知 为正半定的,则 ,将 代入,故 ,该式表明,当且仅当系统为完全可观测时,对任何 均成立,由此可知, 亦是正半定的。同理可证得 亦是正半定的。 利用状态调节器问题的结果得出的输出调节器问题的结论如下:当且仅当系统是完全可观测时,则存在唯一的最优控制为:(10-34)其中, 满足(10-35)(10-36)几点说明: 输出调节吕的最优控制规律,并不是输出量 的线性反馈,而仍是状态 的线性反馈,此点反映了一个本质问题,即构成最优控制需要的是全部状态信息,输出量仅仅反映了状态各分量的线性组合,但是它无法提供各个状态分量全部信息,因此从原理上讲,仅由输出反馈时,没有充分利用全部信息,从而不能构成最优控制。 当 并系统为定常时的输出调节器问题,只要系统是完全可控并可观的,可以类似地利用 时的定常状态调节器的结果,即:最优控制存在并唯一,其形式为: 为以下黎卡提代数方程正定解;最小性能指标为:(10-37) 例10-3 设系统动态方程为:不受约束,性能指标为:要求最优控制 ,使性能指标 为最小。 解: 显然,系统是可控及可观测的。并 ,满足正定要求。将以上系统数代黎卡提代数方程:解得:为保证 的正定性,取最后得最优控制为:第四节 线性连续系统跟踪器问题 设系统动态方程为:(10-38)(10-39) 系统完全可观测,理想输出为 ,与 同维数。 不受 约束,固定,性能指标为要求最优控制 ,使性能指标 为最小。(10-40) 跟踪器的任务是消耗不大的控制能量的情况下,能使 准确地跟踪 。则得正则方程为:我们用极小值原理来求解。首先建立哈密尔顿函数(10-41)其边界条件为: 及横截条件为:(10-44)(10-42)(10-43)由于 不受约束,控制方程成立(10-45)由此得:(10-46)同样,我们根据正则方程为线性方程及终端条件 与 及 成线性关系,假设这里, 是与 有关的未知函数。 (10-47)对比式(10-44)可知 (10-48)(10-49)对式(10-47)求导,得(10-50)将式(10-43)和式(10-47)代入式(10-50),最后得:(10-51)将式(10-42)及(10-52)代入式(10-51),最后整理得(10-53) 上式应对任何时刻、任何状态 及 成立,故等式两边对应项应相等,由此可得:(10-54)(10-55)其边界条件为:(10-56)(10-57) 下面,对式(10-54)和式(10-55)作一些讨论。式(10-54)与输出调节器中所得的黎卡提微分方程完全一样。式(10-55)是以 作为输入的一阶线性微分方程。由于其边界条件是终端值,需要逆时间方向求角,又因它为非齐次方程,因此要求预先 知道的全部信息。但是,在很多实际工程问题中,这往往是做不到的,这是一个过于苛刻的要求,正由于这一点,跟踪器的应用范围受到了限制。 由式(10-54)、式(10-55)解得 及 ,代入式(10-52),即可求得最优控制 ,它包括了两部分,一部分为状态的线性函数,它与输出调节器中完全一样。另一部分则为 的线性函数,它由给定的 所形成。 对于线性时不变系统,当理想输出 为常值、终端时刻 极大但不等于无穷大时,可以导出一个近似的最优控制规律,它是有很大的实用意义。虽然这个近似规律对于终端时刻等于无穷大时在理论上并不成立。但工程应用上已足够精确。下面,不作推导地给出结果如下:系统完全可以控并完全可观测 设系统动态方程为(10-58)(10-59)理想输出 足够大,性能指标为 (10-60)则其最优控制存在唯一,其形式为(10-61)其中 满足(10-62)满足当 足够大时的时不变跟踪器结构图如图10-4所示。(10-63)例10-4 设系统动态方程为 系统理想输出 为不受约束, 足够大,性能指标为要求最优控制 ,使性能指标 为最小。解: 由例10-3已知,系统是完全可控及可观测的,并已解得 现在我们主要来解 。最后得最优控制为:第五节 离散系统状态调节器设离散系统状态方程为(10-64)要求最优控制 ,使性能指标 为最小。不受约束,性能指标为(10-65)下面,我们仍用极小值原理来求解。首先建立哈密尔顿函数(10-66)则可得正则方程(10-67)(10-68)其边界条件为:(10-69)及横截条件为:(10-70)由于控制不受约束,控制方程成立(10-71)由此得:(10-72)同连续系统中一样,我们假设(10-73)并以 代入正则方程(10-68),得:(10-74)由此可得(10-75) 将式(10-72)代入式(10-67)得:(10-76) 以 代入式(10-76)得: (10-77) 以式(10-78)代入式(10-75)得:(10-79)(10-78)上式应对所得有 都成立,故得:(10-80)式(10-81)称为黎卡提差分方程。 整理得:(10-81) 确定了 ,已知 ,代入正则方程(10-68),可得:(10-82)(10-83)代入式(10-72),最后得最优控制为(10-84) 由式(10-84)可见,最优控制 为状态的线性函数,因此同连续系统一样,可以方便地实现闭环最优控制。离散系统状态调节器结构图如图10-5所示。图10-5 离散系统状态调节器结构图
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号