文档库 最新最全的文档下载
当前位置:文档库 › 线性系统时间最优控制的存在性和唯一性

线性系统时间最优控制的存在性和唯一性

线性系统时间最优控制的存在性和唯一性
线性系统时间最优控制的存在性和唯一性

线性系统时间最优控制的存在性和唯一性

王思江 08070110242

贵州大学 理学院信计

1.内容介绍:

最优控制理论是现代控制理论中最早发展起来的分支之一。所谓控制就是人们用某种方法和手段去影响事件及其运动的进程和轨道,使之朝着有利于控制主体的方向发展。对于一个给定的受控系统,常常要求找到这样的控制函数,使得在它的作用下,系统从一个状态转移到为设计者希望的另一个状态,且使得系统的某种性能尽可能好。通常称这种控制问题为最优控制问题。最优控制理论主要讨论求解最优控制问题的方法和理论,包括最优控制的存在性、唯一性和最优控制应满足的必要条件等。最优控制理论始于20世纪50年代末,其主要标志是前苏联数学家庞特里亚金等提出的“最大值原理”。最优控制理论在工矿企业、交通运输、电力工业、国防工业和国民经济管理等部门有着广泛的应用。

2.问题:

控制系统

000

()()()()(),()(2.1)()ad x t A t x t B t u t t t x t x u U

=+>??

=???∈?

其中01():[,]n n A t t R ??→,01():[,]n m B t t R ??→.初始状态0x 是n

R 中给定的点.控制区

域U 是m

R 中有界闭集,ad U 表示取值于U 的可积函数全体.

12()((),(),,())T n n x t x t x t x t R =∈ 表示控制系统的状态变量, 12()((),(),,())T m m u t u t u t u t R =∈ 表示控制系统的控制变量.

假定以下基本条件成立:

()[0,;],()[0,;]:[0,)2[0,),()n n n n m

loc loc R A L R B L R L M Hausdorff t M t ρ∞?∞???∈+∞?∈+∞??

+∞→???∈+∞??

是关于度量连续的多值函数对是非空紧集. 对于00,[1,)t T p ≤<<+∞∈+∞,记

00[,]{:[,]()}u t T u t T U u =→?可测, 00[,+{:[,+()}u t u t U u ∞=∞→?))可测, 00[,][0,](,;)p p m u t T u T L t T R = ,

000[,)[,)(,;)p p m loc u t u t L t R +∞=+∞+∞ ,

0000(,;){:[,)()[,],}p m m p loc L t R u t R u L t T T t +∞=+∞→?∈?>.

000(,)[0,)n t x R t t ?∈+∞?≥对以及,能达集00()(;,)t t t x ?=?是凸紧的.

假设

{()()}(2.2)t t M t t ≥?≠? ,

表示从00(,)t x 到目标()M ?是能控的.

定义

00000(())(();,)

inf{(;,,())()}

J u J u t x t t y t t x u M t ?=?=≥?∈,

即00(();,)J u t x ?是轨线00(;,,())y t t x u ?首次遇到()M ?的时间. 规定inf ?=+∞.

问题(TC):对于00(,)[0,)n t x R ?∈+∞?,假设条件0

{()()}t t M t t ≥?≠? 成立.寻找控

制*()[0,)u t u ∈+∞使得

*0000()[0,)

(();,)inf

(();,)u u J u t x J u t x ?∈+∞?=

?(2.3).

*00()[0,)

=

inf

(();,)u u t J u t x ?∈+∞?—最优时间.

满足(2.3)的控制*()[0,)u u ?∈+∞称为最优时间控制.

2.最优控制的存在性和唯一性的证明:

首先,我们叙述以下引理.

引理(3.1) 设L 以及(2.2)成立,则最优时间

*0inf{()()}t t t M t =≥??≠? .

下面我们不加证明的给出与最优控制的存在性有关的一系列定理.

定理(3.2) 设L 以及(2.2)成立,则问题(TC)至少存在一个时间最优控制*()u ?,且

最有时间*

t 满足

*0min{()()}t t t M t =≥??≠? .

定理(3.3) 设L 以及(2.2)成立,0(0)x M ?,*

t 是问题(TC)的最优时间,则

****[()][()]()()M t t M t t ???=?≠? .

定理(3.4) 设L 以及(2.2)成立,0(0)x M ?,则最优时间*

t 是以下函数在[0,)

+∞上的最小零点

001()

()inf{max ,(,0)max ,(,)()}t

z M t u U

F t t x z t s B s u ds λλλ=∈∈=?Φ->+?Φ>?.

进一步,如果

01λ=,满足

*

*

*

*

0000

()

max ,(,0)max ,(,)()0t u U

z M t t x z t s B s u ds λλ∈∈?Φ->+?Φ>=?, 则最优控制*

()u ?满足以下最大值条件

****00max ,(,)(),(,)()()..[0,](3.1)u U

t s B s u t s B s u s a e s t λλ∈?Φ?=?Φ?∈,

***(,())x x t u ≡?

满足如下横截条件

()**0,0,()3.2z x z M t λ?-?≥?∈.

其中Φ是方程组

()()()x

t A t x t =

的转移矩阵。

**0()(,)[0,]T t t t t t ?λ=Φ?∈.

则()t ?满足

**

0()()()[0,](3.3)()T t A t t t t t ?

??λ?=-?∈??=??

. 利用()t ?,式(3.1)改写为

**max (),()(),()()..[0,](3.4)u U

t B t u t B t u t a e t t ??∈??=??∈,

式(3.2)改写为

()***(),0,()3.5t z x z M t ??-?≥?∈.

定理(3.4)(最大值原理) 设L 成立,控制*()u t 是问题(TC)的最优控制,*

t 是问题(TC)

的最优时间,则存在(3.3)的非零解()??,使得最大值条件(3.4)和(3.5)成立.

定理(3.5)(Bang-Bang 原理)设L 以及(2.2)成立,则存在控制**

()[0,]u u t ?∈使得

**()..

[0,](3.6)u U a e t t ?∈?∈.

当[0,1]m

U =时,(3.6)意味着

**()0 1...

[0,]u or a e t t ?=∈.

以下讨论定常线性系统

00

0()()(),,()(3.7)()x

t Ax t Bu t t t u t U x t x '=+>∈??

=? 这里,,n n n m A R B R U ??∈∈是m

R 中的有界凸多面体,并且U 与A B 、满足下列条件:对于平行于U 的某一条棱的向量w ,n 个向量

1,,,n Bw ABw A Bw -

是线性无关的.这里U 的棱是指U 的边界面的交线.

定理(3.6) 把系统(3.7)从状态0x 最快转移到状态1x 的最优控制是唯一的.

定理的证明参见[1]

.

连续系统的最优控制

第6章 连续系统的最优控制 6.1 最优化问题 6.2 最优控制的变分法求解 6.3 线性系统二次型性能指标的最优控制 1、线性系统有限时间最优状态调节系统 ◆二次型性能指标 设受控系统对平衡点的增量方程为 ()()()()()x t A t x t B t u t ?=?+?,00()x t x ?=? 简记为 ()()()()()x t A t x t B t u t =+,00()x t x = 最优状态调节是指:对上述系统,在时间区间0[,]f t t t ∈,

寻求最优状态反馈控制,使初始状态偏差00()x t x =迅速衰减,且同时使二次型性能泛函 11()()[()()()()]d 22f t t t t f f f x u t J x t Q x t x t Q x t u t Q u t t =++? * min f x u J J J J J =++→= 式中 ()0f n n Q ?≥——终端加权矩阵。 ()0x n n Q ?≥——状态加权矩阵。 ()0u r r Q ?>——控制加权矩阵。 三个加权矩阵均为对称矩阵,为简单,一般取为对角矩 阵。 ●1()()2 t f f f f J x t Q x t =表示对终端状态偏差即稳态控制精度的限制。当1 diag[]f f fn Q q q =,2 1 1()2n f fi i f i J q x t ==∑

●0 1()()d 2f t t x x t J x t Q x t t =?表示对控制过程中状态偏差衰减速度的要求。当1 diag[]x x xn Q q q =,0 2 11()d 2f t n x xi i i t J q x t t ==∑? ●0 1()()d 2f t t u u t J u t Q u t t =?表示对控制过程中所消耗的能量的限制,以避免状态偏差过快衰减导致控制量超过允许数值。当 1 diag[]u u ur Q q q =,0 2 11()d 2f t r u ui i i t J q u t t ==∑?,2()i u t 可理解为功率。 实际上,在性能指标中,x J 已经对控制的稳态精度有所要求。当对稳态精度有更高的要求时,才增加f J 项。 由上可知,上述二次型性能指标的物理意义是,在整个时间区间0[,]f t t t ∈,特别是终值时刻f t t =上状态变量尽量接近于0

强非线性随机振动系统的最优控制

项目名称:强非线性随机振动系统的最优控制 推荐单位:中国力学学会 推荐单位意见: 我单位认真审核了该项目推荐书及附件材料,确认全部材料真实有效,相关栏目均符合国家自然科学奖推荐书填写要求。 多自由度强非线性随机振动系统的最优控制是振动控制理论与随机振动力学学科迫切需要发展的学科前沿,同时也是一个极为困难的研究领域,原有的研究成果极少。该项目针对多种随机激励下多自由度强非线性随机系统的多种不同目标的最优控制进行了系统深入的研究,取得了一系列原创性成果。提出并发展了多自由度强非线性随机振动系统多种不同目标的的最优控制理论、计及实际应用中多种非理想因素的最优控制理论、以及多种随机激励下多自由度强非线性系统的随机平均法,构成了一个非线性随机振动系统最优控制的较为完整的理论体系,对振动控制理论与随机振动力学学科的发展具有里程碑意义,并为解决科学与工程中广泛存在又十分困难的强非线性随机振动系统的控制问题提供了一整套崭新而有效的理论方法。该项目的研究成果得到了美国工程院院士Y.K. Lin、印度国家工程院院士T.K. Datta、中国科学院院士胡海岩、方同教授、李杰教授等国内外动力学与控制领域著名专家学者的广为引用与高度评价,认为该项目具有首创性与系统性,首次建立了非线性随机振动最优控制的系统的理论方法,整体上达到了国际领先水平。特推荐该项目申报国家自然科学奖。 对照国家自然科学奖授奖条件,推荐该项目申报国家自然科学奖二等奖。 项目简介: 该项目属振动控制理论、随机振动力学学科。多自由度强非线性随机振动系统的最优控制是振动控制理论与随机振动力学学科迫切需要发展的前沿,是一个极为困难的研究领域,原有研究成果极少。该项目针对多种随机激励下多自由度强非线性随机振动系统的多种目标并计及多种非理想因素的最优控制进行了系统深入的研究,取得了一系列原创性成果。 主要研究内容:研究多种随机激励下多自由度强非线性振动系统的响应、稳定性及可靠性的最优控制理论,发展计及实际控制中可能出现的各种因素的强非线性随机振动系统的最优控制方法。 主要科学发现点:(1)建立了多自由度强非线性随机振动系统的最优控制理论,提出并发展了分别以响应最小、稳定性裕度最大、可靠度最大、平均寿命最长及给定平稳概率密度为目标的非线性随机最优控制设计方法;(2)针对实际控制系统的部分可观测与不确定,实际控制力的时滞、有界及不能完全执行最优控制律等难题,提出并发展了有效解决这些难题的多自由度强非线性随机振动系统的最优控制理论方法;(3)提出并发展了非高斯白噪声激励、非经典(包括滞迟、时滞及含分数阶

最优控制应用概述

最优控制的应用概述 1.引言 最优控制是现代控制理论的重要组成部分,它研究的主要问题是:在满足一定约束条件下,寻求最优控制策略,使得性能指标取极大值或极小值。最优控制是使控制系统的性能指标实现最优化的基本条件和综合方法。可概括为:对一个受控的动力学系统或运动过程,从一类允许的控制方案中找出一个最优的控制方案,使系统的运动在由某个初始状态转移到指定的目标状态的同时,其性能指标值为最优。最优控制是最优化方法的一个应用。从数学意义上说,最优化方法是一种求极值的方法,即在一组约束为等式或不等式的条件下,使系统的目标函数达到极值,即最大值或最小值。从经济意义上说,是在一定的人力、物力和财力资源条件下,是经济效果达到最大(如产值、利润),或者在完成规定的生产或经济任务下,使投入的人力、物力和财力等资源为最少。 最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科,基本内容和常用方法包括动态规划、最大值原理和变分法。这方面的开创性工作主要是由贝尔曼(R.E.Bellman)提出的“动态规划”和庞特里亚金等人提出的“极大值原理”,到了60年代,卡尔曼(Kalman)等人又提出了可控制性及可观测性概念,建立了最优估计理论。这方面的先期工作应该追溯到维纳(N.Wiener)等人奠基的控制论(Cybernetics)。最优控制理论的实现离不开最优化技术。控制系统最优化问题,包括性能指标的合理选择以及最优化控制系统的设计,而性能指标在很大程度上决定了最优控制性能和最优控制形式。最优化技术就是研究和解决最优化问题,主要包括两个需要研究和解决的方面:一个是如何将最优化问题表示为数学模型;另一个是如何根据数学模型尽快求出其最优解。 2.最优控制问题 所谓最优控制问题,就是指 在给定条件下,对给定系统确定 一种控制规律,使该系统能在规 定的性能指标下具有最优值。也 就是说最优控制就是要寻找容 许的控制作用(规律)使动态系 统(受控系统)从初始状态转移 到某种要求的终端状态,且保证 所规定的性能指标(目标函数)图1 最优控制问题示意图 达到最大(小)值。 最优控制问题的示意图如图1所示。其本质乃是一变分学问题。经典变分理论只能解决一类简单的最优控制问题。为满足工程实践的需要,20世纪50年代中期,出现了现代变分理论。最常用的方法就是极大值原理和动态规划。最优控制在被控对象参数已知的情况下,已成为设计复杂系统的有效方法之一。

第四章线性系统的可控性和可观性1

第四章 线性系统的可控性和可观性 §4-1 问题的提出 经典控制理论中用传递函数描述系统的输入—输出特性,输出量即被控量,只要系统是因果系统并且是稳定的,输出量便可以受控,且输出量总是可以被测量的,因而不需要提出可控性和可观性的概念。 现代控制理论是建立在用状态空间法描述系统的基础上的。状态方程描述输入)(t u 引起状态)(t x 的变化过程;输出方程描述由状态变化所引起的输出)(t y 的变化。可控性和可观性正是定性地分别描述输入)(t u 对状态)(t x 的控制能力,输出)(t y 对状态)(t x 的反映能力。它们分别回答: “输入能否控制状态的变化”——可控性 “状态的变化能否由输出反映出来”——可观性 可控性和可观性是卡尔曼(Kalman )在1960年首先提出来的。可控性和可观性的概念在现代控制理论中无论是理论上还是实践上都是非常重要的。例如:在最优控制问题中,其任务是寻找输入)(t u ,使状态达到预期的轨线。就定常系统而言,如果系统的状态不受控于输入)(t u ,当然就无法实现最优控制。另外,为了改善系统的品质,在工程上常用状态变量作为反馈信息。可是状态)(t x 的值通常是难以测取的,往往需要从测量到的)(t y 中估计出状态)(t x ;如果输出)(t y 不能完全反映系统的状态)(t x ,那么就无法实现对状态的估计。 状态空间表达式是对系统的一种完全的描述。判别系统的可控性和可观性的主要依据就是状态空间表达式。 【例如】 (1)u x x ?? ? ???+??????=202001 []x y 01= 分析:上述动态方程写成方程组形式:?? ? ??=+==1221122x y u x x x x 从状态方程来看,输入u 不能控制状态变量1x ,所以状态变量1x 是不可控的;从输出方程看,输出y 不能反映状态变量2x ,所以状态变量2x 是不能观测的。 即状态变量1x 不可控、可观测;状态变量2x 可控、不可观测。

非线性系统最优控制理论综述

非线性系统最优控制理论综述 时间:2015-06-17 作者:马玲珑 摘要:非线性系统,其最优控制求解相当困难,寻求近似的最优控求解方法是当下解决这一问题的主要途径。目前,比较成熟的最优控制求解方法主要有七类,本文对这七种方法进行了详细的阐述,并对其优缺点进行了客观的对比。 论文关键词:非线性,最优控制 近年来,最优控制理论[1,2]的研究,无论在深度和广度上,都有了很大的发展,已成为系统与控制领域最热门的研究课题之一,取得了许多研究成果。同时,也在与其他控制理论相互渗透,出现了许多新的最优控制方式,形成了更为实用的学科分支。例如鲁棒最优控制[3]、随机最优控制[4]、分布参数系统的最优控制[5]、大系统的次优控制[6]、离散系统的最优控制及最优滑模变结构控制[7,8]等。而对于非线性系统,其最优控制求解相当困难,需要求解非线性HJB方程或非线性两点边值问题,除简单情况外[9],这两个问题都无法得到解析解。因此,许多学者都致力于寻求近似的求解方法[10~13],通过近似解得到近似的最优控,即次优控制。 1、非线性最优控制理论研究成果分类 目前,较为流行的近似最优控制求解方法主要有以下几类[6][13]。 1)幂级数展开法:幂级数展开方法通过一个幂级数来构造控制律,得到序列形式的近似最优解,或者将系统中的非线性项以幂级数形式分解,或者通过引进一个临时变量并围绕它展开。 将上式代入HJB方程求得级数近似解,也可利用Adomian分解将非线性项进行分解,由此寻求非线性HJB方程级数的近似解。 2)Galerkin逐次逼近方法:由动态规划得到的一般性偏微分HJB方程,引入一个迭代过程来求解一般非线性HJB方程的一个近似解序列。 3)广义正交多项式级数展开法:其主要思想是将最优控制问题中的状态变量,控制输入,性能指标和各个参数分别用广义正交多项式展开,利用广义正交多项式的积分、乘积运算阵 将描述系统的微分方程转化为一系列的代数方程。然后,得到 ,T非奇异时由得到的控制律是一个多项式级数解。该方法将最优控制问题转化为代数极值问题,从而避免了求解时变非线性Riccati方程。 4)有限差分和有限元方法:经典的有限差分和有限元方法可以用来近似求解非线性

最优控制实验报告

实验报告 课程名称:现代控制工程与理论实验课题:最优控制 学号:12014001070 姓名:陈龙 授课老师:施心陵

最优控制 一、最优控制理论中心问题: 给定一个控制系统(已建立的被控对象的数学模型),选择一个容许的控制律,使被控对象按预定要求运行,并使给定的某一性能指标达到极小值(或极大值) 二、最优控制动态规划法 对离散型控制系统更为有效,而且得出的是综合控制函数。这种方法来源于多决策过程,并由贝尔曼首先提出,故称贝尔曼动态规划。 最优性原理:在一个多级决策问题中的最优决策具有这样的性质,不管初始级、初始状态和初始决策是什么,当把其中任何一级和状态做为初始级和初始状态时,余下的决策对此仍是最优决策 三、线性二次型性能指标的最优控制 用最大值原理求最优控制,求出的最优控制通常是时间的函数,这样的控制为开环控制当用开环控制时,在控制过程中不允许有任何干扰,这样才能使系统以最优状态运行。在实际问题中,干扰不可能没有,因此工程上总希望应用闭环控制,即控制函数表示成时间和状态的函数。 求解这样的问题一般来说是很困难的。但对一类线性的且指标是

二次型的动态系统,却得了完全的解决。不但理论比较完善,数学处理简单,而且在工际中又容易实现,因而在工程中有着广泛的应用。 一.实验目的 1.熟悉Matlab的仿真及运行环境; 2.掌握系统最优控制的设计方法; 3.验证最优控制的效果。 二.实验原理 对于一个给定的系统,实现系统的稳定有很多途径,所以我们需要一个评价的指标,使系统在该指标下达到最优。如果给定指标为线性二次型,那么我们就可以利用MATLAB快速的计算卡尔曼增益。 三.实验器材 PC机一台,Matlab仿真平台。 四.实验步骤 例题1 (P269)考虑液压激振系统简化后的传递函数方框图如下,其中K a为系统前馈增益,K f为系统反馈增益,w h为阻尼固有频率。(如图5-5所示) 将系统传递函数变为状态方程的形式如下: ,

Lorenz 系统的最优控制

- 37 - Lorenz 系统的最优控制 周俊冬 马 明 (南通广播电视大学,江苏 南通 226006) 【摘 要】文章讨论了Lorenz 系统的最优控制问题,将该混沌系统控制到任意所期望的状态。基于哈密顿-雅可比-贝尔曼方程将构建最优控制器问题归结为解偏微分方程问题,通过巧妙构造Lyapunov 函数从而得到最优控制器。数值仿真表明,所设计的控制器实用有效并且易于实现。 【关键词】Lorenz 系统;最优控制;哈密顿-雅可比-贝尔曼方程 【中图分类号】TP273 【文献标识码】A 【文章编号】1008-1151(2010)05-0037-02 (一)引言 1963年Lorenz 发现了第一个混沌吸引子——Lorenz 系统,从此揭开了混沌研究的序幕。Lorenz 系统在信息加密和保密通信等领域有着广阔的应用前景,自从Pecora 和Carroll 提出混沌系统控制的观点和理论以后,线性和非线性反馈控制、自适应控制、延迟控制、变结构控制等多种不同方法都被成功地应用于Lorenz 混沌系统的控制中。 近十多年来,混沌控制的研究得到了蓬勃的发展,这一方向迅速成为混沌和控制学科交叉研究的热点,其间,人们提出了各种混沌控制方法,其中优化控制是一种在系统控制中应用最为广泛的手段,通常给定性能指标,或称目标函数泛函,寻找一容许控制,使目标泛函沿系统所有可能的状态轨迹取最小值。 目前,国内外学者已提出许多不同的混沌最优控制方法,并且问题最后都归结为求解动态规划中所涉及的偏微分方程。实际上,在许多情况下,动态规划中的偏微分方程的解是不存在或不惟一的。因此,求解动态规划中的偏微分方程是获得非线性系统最优控制的主要障碍。 本文针对Lorenz系统提出了一种最优控制方法,将该混沌系统控制到任意所期望的状态。基于哈密顿-雅可比-贝尔曼方程将构建最优控制器问题归结为解偏微分方程问题,通过巧妙构造Lyapunov函数从而得到最优控制器,同时找出了哈密顿-雅可比-贝尔曼方程的解。仿真结果表明该方法的有效性。 (二)哈密顿-雅可比-贝尔曼方程 设一个连续的非线性动力系统方程为: *()()(),()0x t f x g x u f x =+=& (1) 式中n x R ∈是状态变量,m u R ∈是控制器,():n n f x R R →和 ():n n m g x R R ×→是连续函数,驱使系统从任意初始值到任意 确定点* x 的最优控制方案是,使目标函数 [][()]T J u q x u Ru dt ∞ =+∫ (2) 取得最小值,式中()q x 是连续、可微且正定的函数,根据动态规划,最优控制归结为Hamilton-Jacobi-Bellman 偏微分方程: min 0u U u u dS dS dt dt ωω∈=????+=+=???????? (3) 式中()T q x u Ru ω=+,(())min [()]T t u U S x t q x u Ru dt ∞ ∈=+∫ ,U 为所有 控制器的集合。0u 为最优控制 (三)Lorenz系统的最优控制 Lorenz 系统的数学模型为: 121212133123 ()x a x x x bx x x x x x x cx =??? =????=??&&& (4) 当参数10a =、28b =、83c =时,系统是混沌的,图1显 示了系统的混沌吸引子。下面把该混沌系统从任意初始点稳 定到任意给定的目标点****123(,,)T x x x x =。 x (3) 图1 Lorenz 系统的混沌吸引子 控制器分为前馈控制****123(,,) T u u u u =和反馈控制123(,,)T u u u u =两部分,那么系统(4)变为: * 12111 * 2121322* 312333 ()x a x x u u x bx x x x u u x x x cx u u ?=?++?=??++??=?++?&&& (5) 取前馈控制为: ***1122 ******* 212133113******31212213 2u ax ax ax u bx x x x x x x x u x x x x x x cx ?=?+?=?+++???=??+? (6) 则受控系统(5)变为: 【收稿日期】2010-01-29 【作者简介】周俊冬,南通广播电视大学机械工程系教师;马明,南通广播电视大学机械工程系教师。

综述非线性系统最优控制理论.docx

综述非线性系统最优控制理论 近年来,最优控制理论[1,2]的研究,无论在深度和广度上,都有了很大的发展,已成为系统与控制领域最热门的研究课题之一,取得了许多研究成果。同时,也在与其他控制理论相互渗透,出现了许多新的最优控制方式,形成了更为实用的学科分支。例如鲁棒最优控制[3]、随机最优控制[4]、分布参数系统的最优控制[5]、大系统的次优控制[6]、离散系统的最优控制及最优滑模变结构控制[7,8]等。而对于非线性系统,其最优控制求解相当困难,需要求解非线性HJB方程或非线性两点边值问题,除简单情况外[9],这两个问题都无法得到解析解。因此,许多学者都致力于寻求近似的求解方法[10~13],通过近似解得到近似的最优控,即次优控制。 1、非线性最优控制理论研究成果分类 目前,较为流行的近似最优控制求解方法主要有以下几类[6][13]。 1)幂级数展开法:幂级数展开方法通过一个幂级数来构造控制律,得到序列形式的近似最优解,或者将系统中的非线性项以幂级数形式分解,或者通过引进一个临时变量并围绕它展开。 将上式代入HJB方程求得级数近似解,也可利用Adomian分解将非线性项进行分解,由此寻求非线性HJB方程级数的近似解。 2)Galerkin逐次逼近方法:由动态规划得到的一般性偏微分HJB方程,引入一个迭代过程来求解一般非线性HJB方程的一个近似解序列。 3)广义正交多项式级数展开法:其主要思想是将最优控制问题中的状态变量,控制输入,性能指标和各个参数分别用广义正交多项式展开,利用广义正交多项式的积分、乘积运算阵 将描述系统的微分方程转化为一系列的代数方程。然后,得到,T非奇异时由得到的控制律是一个多项式级数解。该方法将最优控制问题转化为代数极值问题,从而避免了求解时变非线性Riccati方程。 4)有限差分和有限元方法:经典的有限差分和有限元方法可以用来近似求解非线性HJB方程。近年来,这类方法用来近似求取非线性HJB方程的粘性解。 5)状态相关Riccati方程方法:这种方法适用的模型是仿射非线性系统,

最优控制理论与系统胡寿松版课后习题答案

2-5 求通过(0)1x =,(1)2x =,使下列性能泛函为极值的极值曲线* ()x t : 2(1)f t t J x dt =+?& 解:由题可知,始端和终端均固定, 被积函数2 1L x =+&,0L x ?=?,2L x x ?=?&&, 2d L x dt x ??=?&&& 代入欧拉方程0L d L x dt x ??-?=??&,可得20x =&&,即0x =& & 故1x c =& 其通解为:12x c t c =+ 代入边界条件(0)1x =,(1)2x =,求出11c =,21c = 极值曲线为* ()1x t t =+ 2-6 已知状态的初值和终值为 (1)4x =,()4f x t = 式中f t 自由且f t >1,试求使下列性能泛函达到极小值的极值轨线* ()x t : 2 1 1[2()()]2 f t J x t x t dt =+ ?& 解:由题可知,2 122L x x =+ &,()4f t ψ=,()14x =,()4f x t = 欧拉方程: L 0d L x dt x ??-=??& 横截条件:()00t x =x ,()() f f x t t ψ=,( )0f T t L L x x ψ ?? ?+-= ??? ? &&& 易得到 2dx dt =& 故12x t c =+& 其通解为:()2 12x t t c t c =++ 根据横截条件可得:()()()122 121114424 f f f f f x c c x t t c t c x t t c ?=++=??=++=??=+=??& 解以上方程组得:12569f t c c =??=-??=? 还有一组解??? ??===1212 1c c t f (舍去,不符合题意f t >1)

实验五 线性系统的稳定性和稳态误差分析

实验五 自动控制系统的稳定性和稳态误差分析 一、实验目的 1、研究高阶系统的稳定性,验证稳定判据的正确性; 2、了解系统增益变化对系统稳定性的影响; 3、观察系统结构和稳态误差之间的关系。 二、实验任务 1、稳定性分析 欲判断系统的稳定性,只要求出系统的闭环极点即可,而系统的闭环极点就是闭环传递函数的分母多项式的根,可以利用MATLAB 中的tf2zp 函数求出系统的零极点,或者利用root 函数求分母多项式的根来确定系统的闭环极点,从而判断系统的稳定性。 (1)已知单位负反馈控制系统的开环传递函数为 0.2( 2.5) ()(0.5)(0.7)(3) s G s s s s s += +++,用MATLAB 编写程序来判断闭环系统的稳定性, 并绘制闭环系统的零极点图。 在MATLAB 命令窗口写入程序代码如下: z=-2.5 p=[0,-0.5,-0.7,-3] k=0.2 Go=zpk(z,p,k) Gc=feedback(Go,1) Gctf=tf(Gc) dc=Gctf.den dens=poly2str(dc{1},'s') 运行结果如下: dens= s^4 + 4.2 s^3 + 3.95 s^2 + 1.25 s + 0.5 dens 是系统的特征多项式,接着输入如下MATLAB 程序代码: den=[1,4.2,3.95,1.25,0.5]

p=roots(den) 运行结果如下: p = -3.0058 -1.0000 -0.0971 + 0.3961i -0.0971 - 0.3961i p为特征多项式dens的根,即为系统的闭环极点,所有闭环极点都是负的实部,因此闭环系统是稳定的。 下面绘制系统的零极点图,MATLAB程序代码如下: z=-2.5 p=[0,-0.5,-0.7,-3] k=0.2 Go=zpk(z,p,k) Gc=feedback(Go,1) Gctf=tf(Gc) [z,p,k]=zpkdata(Gctf,'v') pzmap(Gctf) grid 运行结果如下: z = -2.5000 p = -3.0058 -1.0000 -0.0971 + 0.3961i -0.0971 - 0.3961i k = 0.2000

现代控制理论试题

现代控制理论试题 一、 名词解释(15分) 1、 能控性 2、能观性 3、系统的最小实现 4、渐近稳定性 二、 简答题(15分) 1、连续时间线性时不变系统(线性定常连续系统)做线性变换时不改变系统的那些性质? 2、如何判断线性定常系统的能控性?如何判断线性定常系统的能观性? 3、传递函数矩阵 的最小实现A 、B 、C 和D 的充要条件是什么? 4、对于线性定常系统能够任意配置极点的充要条件是什么? 5、线性定常连续系统状态观测器的存在条件是什么? 三、 计算题(70分) 1、RC 无源网络如图1所示,试列写出其状态方程和输出方程。其中,为系统的输入,选两端的电压为状态变量 , 两端的电压为状态变量 ,电压 为为系统的输出 y 。 2、计算下列状态空间描述的传递函数 g(s) 3、 求出下列连续时间线性是不变系统的时间离散化状态方程: 其中,采样周期为T=2. 4、 求取下列各连续时间线性时不变系统的状态变量解 和 图1:RC 无源网络

5、确定是下列连续时间线性时不变系统联合完全能控和完全能观测得待定参数a的 取值范围: 6、对下列连续时间非线性时不变系统,判断原点平衡状态即是否为大范围渐近 稳定: 7、给定一个单输入单输出连续时间线性时不变系统的传递函数为 试确定一个状态反馈矩阵K,使闭环极点配置为,和。 现代控制理论试题答案 一、概念题 1、何为系统的能控性和能观性? 答:(1)对于线性定常连续系统,若存在一分段连续控制向量u(t),能在有限时间区间[t0,t1]内将系统从初始状态x(t0)转移到任意终端状态x(t1),那么就称此状态是能控的。 (2)对于线性定常系统,在任意给定的输入u(t)下,能够根据输出量y(t)在有限时间区间[t0,t1]内的测量值,唯一地确定系统在t0时刻的初始状态x(t0 ),就称系统在t0时刻是能观测的。若在任意初始时刻系统都能观测,则称系统是状态完全能观测的,简称能观测的。 2、何为系统的最小实现? 答:由传递函数矩阵或相应的脉冲响应来建立系统的状态空间表达式的工作,称为实现问题。在所有可能的实现中,维数最小的实现称为最小实现。 3、何为系统的渐近稳定性?

线性系统的可控性和可观测性

8.4线性系统的可控性和可观测性 8.4.1可控性和可观测性的概念 第三节介绍了系统的稳定性,本节接着介绍系统另外两个重要特性,即系统的可控性和可观测性,这两个特性是经典控制理论所没有的。在用传递函数描述的经典控制系统中,输出量一般是可控的和可以被测量的,因而不需要特别地提及可控性及可观测性的概念。现 代控制理论用状态方程和输出方程描述系统,输出和输入构成系统的外部变量,而状态为系 统的内部变量,系统就好比是一块集成电路芯片,内部结构可能十分复杂,物理量很多,而 外部只有少数几个引脚,对电路内部物理量的控制和观测都只能通过这为数不多的几个引脚进行。这就存在着系统内的所有状态是否都受输入控制和所有状态是否都可以从输出反映出来的问题,这就是可控性和可观测性问题。如果系统所有状态变量的运动都可以通过有限的控制点的输入来使其由任意的初态达到任意设定的终态,则称系统是可控的,更确切的说是 状态可控的;否则,就称系统是不完全可控的,简称为系统不可控。相应地,如果系统所有的状态变量任意形式的运动均可由有限测量点的输出完全确定出来,则称系统是可观测的,简称为系统可观测;反之,则称系统是不完全可观测的,简称为系统不可观测。 可控性与可观测性的概念,是用状态空间描述系统引伸出来的新概念,在现代控制理论 中起着重要的作用。可控性、可观测性与稳定性是现代控制系统的三大基本特性。 下面举几个例子直观地说明系统的可控性和可观测性。 (a) (b) (c) 图8-20 电路系统可控性和可观测性的直观判别 对图8-20所示的结构图,其中图(a)显见洛受U的控制,但X2与U无关,故系统不可控。系统输出量丫=捲,但X!是受X2影响的,y能间接获得X2的信息,故系统是可观测的。图(b)中的,X2均受u的控制,故系统可控,但y与X2无关,故系统不可观测。图 (c)中的X i、X2均受u的控制,且在y中均能观测到X i、X2,故系统是可控可观测的。 只有少数简单的系统可以从结构图或信号流图直接判别系统的可控性与可观测性,如果系统结构复杂,就只能借助于数学方法进行分析与研究,才能得到正确的结论。

二阶系统的最优控制

二阶系统的最优控制 Ξ 肖 滨 (海军潜艇学院 青岛 266071) 摘 要 应用最优控制理论验证了二阶系统最优控制为典型的Bang 2Bang 控制,通过理论推导得出了其相轨迹,并讨论了二阶系统最优控制的实现。 关键词 最优控制 二阶系统 Bang 2Bang 控制 The Opti m al Con trol of Second -Order System X iao B in (N avy S ub m arine A cad e m y ,Q ing d ao ,266071) ABSTRACT T h is paper demo strated that the op ti m al contro l of second 2o rder system is the typ ical Bang 2Bang contro l by app lying the Op ti m al Contro l T heo ry .T he state track about th is contro l m ethod is obtained also by using theo ry inference ,and how to realize the op ti m al contro l of second 2o rder system is discussed deep ly at last . KEY WOR D S op ti m al contro l ,second 2o rder system ,Bang 2Bang contro l 在雷达声纳等控制系统中,都涉及到目标自动搜索及跟踪问题,而其控制一般都采用闭环自动控制和调整实现,对于二阶系统而言,如何获得最优控制,使系统动态性能达到最快速的跟踪控制效果,一直是人们所关注的问题。 二阶系统的传递函数为 H (S )=k m S (S T m +1) (1)采用图1所示的闭环控制后,其传递函数为H (S )= K m T m S 2+S T m +K m T m (2)图2是二阶闭环系统阶跃响应曲线,可以看出:当系统阻尼太大时,系统响应时间长;而当系统阻尼太小时,输出超调量又太大。这是二阶闭环系统的矛盾缺陷,本文试图从最优控制理论出发,讨论二阶系统的最优控制问题。 图1二阶系统的闭环控制框图y (s )S (S T m +1)k m - +x (s )u (s )1 二阶系统最优控制的理论推导〔1〕以x (t )=[x 1(t ),x 2(t )]T 表示系统状态,其中x 1(t )、x 2(t )分别表示系统输出y (t )及输出的一阶导 数y 2(t ),将二阶系统开环传递函数式(1)以系统状态方 程形式记作: x 1′x 2′=x 2-x 2 T m +uk m T m (3)考虑到输入量的限制,规定: u (t ) ≤1 (4)? 92? 第22卷 第1期火力与指挥控制 (总第22-029) Ξ收稿日期 1996-06-20

线性系统的稳定性分析

第三章 线性系统的稳定性分析 3.1 概述 如果在扰动作用下系统偏离了原来的平衡状态,当扰动消失后,系统能够以足够 的准确度恢复到原来的平衡状态,则系统是稳定的。否则,系统不稳定。一个实际的系统必须是稳定的,不稳定的系统是不可能付诸于工程实施的。因此,稳定性问题是系统控制理论研究的一个重要课题。对于线性系统而言,其响应总可以分解为零状态响应和零输入响应,因而人们习惯分别讨论这两种响应的稳定性,从而外部稳定性和内部稳定性的概念。 应用于线性定常系统的稳定性分析方法很多。然而,对于非线性系统和线性时变系 统,这些稳定性分析方法实现起来可能非常困难,甚至是不可能的。李雅普诺夫(A.M. Lyapunov)稳定性分析是解决非线性系统稳定性问题的一般方法。 本章首先介绍外部稳定性和内部稳定性的概念及其相互关系,然后介绍李雅普诺夫 稳定性的概念及其判别方法,最后介绍线性定常系统的李雅普诺夫稳定性分析。 虽然在非线性系统的稳定性问题中,Lyapunov 稳定性分析方法具有基础性的地 位,但在具体确定许多非线性系统的稳定性时,却并不是直截了当的。技巧和经验在解决非线性问题时显得非常重要。在本章中,对于实际非线性系统的稳定性分析仅限于几种简单的情况。 3.2 外部稳定性与内部稳定性 3.2.1 外部稳定: 考虑一个线性因果系统,如果对一个有界输入u (t ),即满足条件: 1()u t k ≤<∞ 的输入u (t ),所产生的输出y (t )也是有界的,即使得下式成立: 2()y t k ≤<∞ 则称此因果系统是外部稳定的,即BIBO (Bounded Input Bounded Output )稳定。 注意:在讨论外部稳定性的时候,我们必须要假定系统的初始条件为零,只有在这种假定下面,系统的输入—输出描述才是唯一的和有意义的。 系统外部稳定的判定准则 系统的BIBO 稳定性可根据脉冲响应矩阵或者传递函数矩阵来进行判别。

一级倒立摆系统最优控制

摘要 倒立摆系统是一个典型的快速、多变量、非线性、不稳定系统,许多抽象的控制理论概念都可以通过倒立摆实验直观的表现出来。因此,倒立摆系统经常被用来检验控制策略的实际效果。应用上,倒立摆广泛应用于航空航天控制、机器人,杂项顶杆表演等领域,研究倒立摆的精确控制对工业复杂对象的控制也有着重要的工程应用价值。 本文以固高公司生产的GIP-100-L型一阶倒立摆系统为研究对象,对直线一级倒立摆模型进行了建模,控制算法的仿真对比,并得出了相应的结论。 文中介绍了倒立摆的分类、特性、控制目标、控制方法等以及倒立摆控制研究的发展及其现状。利用牛顿力学方法推到了直线以及倒立摆的动力学模型,求出其传递函数及其状态空间方程。 在建立了系统模型的基础下,本文还研究了倒立摆系统的线性二次型最优控制问题,并且使用了MATLAB软件进行仿真,通过改变LQR模块及状态空间模块中的参数,在仿真中取得了不同的控制效果,最终得到了最好的控制效果。 关键字:一级倒立摆线性系统、数学建模、最优控制、LQR、仿真

目录 1 一阶倒立摆的概述 (1) 1.1倒立摆的起源与国内外发展现状 (1) 1.2倒立摆系统的组成 (1) 1.3倒立摆的分类: (1) 1.4倒立摆的控制方法: (2) 2.一阶倒立摆数学模型的建立 (3) 2.1概述 (3) 2.2数学模型的建立 (4) 2.4实际参数代入: (5) 3.定量、定性分析系统的性能 (7) 3.1对系统的稳定性进行分析 (7) 3.2 对系统的能空性和能观测性进行分析: (8) 4.线性二次型最优控制设计 (9) 4.1线性二次最优控制简介 (9) 4.2 直线一级倒立摆LQR控制算法 (10) 4.3 最优控制MATLAB仿真 (18) 总结 (21) 参考文献 (22)

最优控制

双闭环直流调速系统的二次最优控制设计方法摘要:利用MA TLAB仿真工具,对线性二次型最优控制方法进行了研究,将之应用于双闭环直流调速系统的设计中,并给出了最优的速度环动态设计方法。仿真和实验结果表明,设计所得到的调速系统获得了良好的控制性能,对参数和扰动也不敏感,文中结合直流提升机调速系统的实际应用,给出了系统响应波形。 工业实际直流调速系统中,一般往往存在惯性滞后和非线性等环节,影响系统的调速性能。按照经典控制理论设计的双闭环调速系统,常常是理论设计与现场调试相差很远。而且一般提高了系统的快速性,系统的稳定性又受到了影响,难以获得最优的控制性能。该文以状态空间理论为基础,以MA TLAB仿真软件为工具,将线性二次型最优控制方法应用于双闭环直流调速系统的设计过程中。二次型(LQ)最优闭环系统具有无穷增益裕量、至少±60。相位裕量、有界超调和一定的非线性容限,并且最优性与初始条件无关等优点。通过该设计方法,使直流调度系统获得了良好的控制性能,并能兼顾系统的快速性、稳定性和抗干扰性能。 1 线性二次型最优控制设计方法 所谓最优控制问题,就是寻找一个控制系统的最优控制方案或最优控制规律,使系统能最优地达到预期的控制目标。线性二次型最优控制就是以状态变量和控制变量二次型函数的积分作为目标函数,通过设计调节器,使二次型目标函数具有最小值的问题。 设LTI系统状态方程模型为: 采用线性二次型目标函数:其中Q,R分别为对状态变量和输入变量的加权矩阵,t0,tf为起始时间和终止时间,S为终态约束矩阵。为使目标函数J,取最小值,由最小值理论可得最优控制为: 其中P(t)为微分Riccati方程的解,Riccati微分方程如下:

连续系统最优控制

第二章连续系统最优控制 ?2.1 引言 ?2.2 时间端点固定的情况 ?2.3 有终端函数约束的情形 ?2.4 终时不指定的情况 ?2.5 小结

(2-1) 为了对动态系统实现最优控制,首先要了解动 态系统,获得描写动态的动态方程;其次,要提出目标,即控制的结果要使什么为最优。然后再用数学手段来处理。00)(),),(),((. .x t x t t u t x f x t s == m n R u R x ∈∈, 式中 ? + =f t t f f u dt t t u t x t t x J 0 )),(),((]),([min φθ泛函求极值 2.1引言

t 0原处于平衡状态(作为零状态),当外界扰动使系统偏离零状态,达到某一状态时,应对系统施加怎样的控制u (t ),才能使系统从时刻起,到时刻止达到所希望的状态,并满足某种目标J 为最小。 )),(),((t t u t x f x = 00)(x t x =f t 上述泛函求极值问题在变分方法中称为Bolza 问题。它表示这样一种概念:非线性系统 )(f t x

为对稳态提出的某种要求,例如稳态 误差;而 为对暂态过程提 出的某种要求,例如暂态误差、能量消耗等。在式(2-1)中,若=某值,则为设计终端控 制器问题;若 =0,则为设计调节器问题。 ]),([f f t t x θdt t t u x f t t )),(,)((0 ? φ在式(2-1)中,目标函数J 为标量,目标J 包含两项: )(f t x )(f t x dt t t u x f t t )),(,)((0 ? φ表示暂态误差与能量消耗, 那么,式(2-1)实际上是多个目标之和。

第4章(1) 线性控制系统的能控性和能观性

第四章 线性控制系统的能控性和能观性 在现代控制理论中,能控性(Controllability)和能观性(Observ- ability)是两个重要的概念,它是卡尔曼(Kalman)在1960年提出的,是最优控制和最优估计的设计基础。 能观(测)性针对的是系统状态空间模型中的状态的可观测性,它反映系统的内部状态x(t)(通常是不可以直接测量的)被系统的输出量y(t)(通常是可以直接测量的)所反映的能力。 能控性严格上说有两种,一种是系统控制输入u(t)对系统内部状态x(t)的控制能力,另一种是控制输入u(t)对系统输出y(t)的控制能力。但是一般没有特别指明时,指的都是状态的可控性。 所以,系统的能控性和能观性研究一般都是基于系统的状态空间表达式的。 4-1 线性连续定常系统的能控性 定义 对于单输入n 阶线性定常连续系统 bu Ax x += 若存在一个分段连续的控制函数u(t),能在有限的时间段 [] f t t ,0内把系统从0t 时刻的初始状态()0t x 转移到任意指定的终态()f t x ,那么就称系统在0t 时刻的状态()0t x 是能控的;如果系统每一个状态()0t x 都能控,那么就称系统是状态完全可控的。反之,只要有一个状态不可控,我们就称系统不可控。 对于线性定常连续系统,为简便计,可以假设00=t ,()0=f t x ,即00=t 时刻的任意初始状态()0x ,在有限时间段转移到零状态()0=f t x (原点)。

4-2线性连续定常系统的能控性判别 4-2-1具有约旦标准型系统的能控性判别 1. 单输入系统 具有约旦标准型系统 bu x x +Λ= ????? ?? ?????????=Λn λλλλ 0000000 00 00003 2 1 n λλλλ≠≠≠≠ 321即为n 个互异根 或bu Jx x += ??????? ????? ???????? ??????=++n m m J λλλλλλ 0000000000000 0010000 00000121 1 11 m 个重根1λ n-m 个互异根n m m λλλ≠≠≠++ 21 例:分析下列系统的能控性 (1)u b x x ??????+??????=221 00 0λλ []x c c y 21 = 解:?=111x x λ 1x 与u 无关,即不受u 控制

线性系统稳定性分析

线性系统稳定性分析 1.系统的稳定性: (1) 外部稳定:又称输出稳定,就是系统在干扰取消后,在一定时间内其输出会恢复到 原来的稳定输出。输出稳定有时描述为系统的BIBO 稳定,即有限的系统输入只能产生有限的系统输出。 (2) 内部稳定:主要针对系统内部状态,反映的是系统内部状态受干扰信号的影响情况。 当干扰信号取消后,若系统的内部状态会在一定时间内恢复到原来的平衡状态,则称系统状态稳定。 经典控制论中,研究对象都是高阶微分方程或传递函数描述的单输入单输出(SISO )系统,反映的仅仅是输入与输出的关系,不涉及系统的内部状态,因此经典控制论只讨论系统的输出稳定问题。对于系统内部状态稳定问题,经典控制论中的方法就不好发挥作用了,需要用到Lyapunov 稳定性理论。 2.平衡状态:设控制系统齐次状态方程为:0.0(,)()|t t X f X t X t X ===,其中,()X t 为系统的n 维状态向量,f 是有关状态向量X 以及时间t 的n 维矢量函数,f 不一定是线性定常的。如果对所有的t ,状态e X 总满足:(,)0e f X t =,则称e X 为系统的平衡状态。对于一般控制系统,可能没有,也可能有一个或多个平衡状态。系统的状态稳定性是针对系统的平衡状态的,当系统有多个平衡状态时,需要对每个平衡状态分别进行讨论。 3. Lyapunov 稳定性分析 (1)Lyapunov 稳定性定义 设一般控制系统的解为:00()(;,)X t t X t =Φ,它是与初始时间0t 及初始状态0X 有关的,体现系统状态从00(,)t X 出发的一条状态轨迹。设e X 为系统的一个平衡点,如果给定一个以e X 为球心,0(,)t δε为半径的n 维球域()S δ,使得从()S δ球域出发的任意一条系统状态轨迹00(;,)t X t Φ在0t t ≥的所有时间内都不会跑出()S ε球域,则称系统的平衡状态e X 是Lyapunov 稳定的。 一般来说,δ的大小不但与ε有关,而且与系统的初始时间0t 有关,当δ仅与ε有关时,称e X 是一致稳定的平衡状态。 进一步地,如果e X 不仅是Lyapunov 稳定的平衡状态,而且当时间t 无限增加时,从()S δ出发的任一条状态轨迹00(;,)t X t Φ都最终收敛于球心平衡点e X ,那么称e X 是渐进稳定的。 更近一步地,如果从()S ∞即整个系统状态空间的任意一点出发的任意一条状态轨迹00(;,)t X t Φ,当t →∞时都收敛于平衡点e X ,那么称e X 是大范围渐进稳定的。显然此时的e X 是系统唯一的平衡点。 反之,对于给定的()S ε,不论0δ>取得多么小,若从()S δ出发的状态轨迹 00(;,)t X t Φ至少有一条跑出()S ε球域,那么平衡点e X 是不稳定的。

相关文档