文档库 最新最全的文档下载
当前位置:文档库 › 基于信息融合控制的机器人操作手的转移控制研究

基于信息融合控制的机器人操作手的转移控制研究

基于信息融合控制的机器人操作手的转移控制研究
基于信息融合控制的机器人操作手的转移控制研究

基于信息融合控制的机器人操作手的转移控制研究

王志胜

(南京航空航天大学 自动化学院, 江苏 南京 210016)

摘要: 信息融合控制是把对控制系统的所有性能要求以及系统动力学转化为可融合信息,然后从信息融合估计的角度,使原问题转化为求控制量的“融合估计”问题。基于信息融合控制理论,研究机器人操作手的转移控制问题,且仿真研究说明了信息融合非线性控制算法的有效性。

关键词: 非线性控制;信息融合控制;路径规划 中图分类号:TP273.1

0 引言

控制也是一种决策,决策离不开信息。信息融合是一种普遍存在的思想,信息融合思想可用来解决广义决策问题,包括估计,评估,规划以及控制等问题。我们在文[1]中首次将信息融合思想引入控制领域,提出信息融合控制的概念,并研究线性离散系统的信息融合控制问题,本文进一步研究非线性离散系统的信息融合控制问题。

对于线性离散控制系统,文[2-5]研究了跟踪期望轨道且要求输入能量最少的最优控制,由于采用状态扩维的方法使最优跟踪问题转化为最优调节问题,使得计算量较大。对于非线性离散控制系统,文[6]提出了一种基于观测器的反馈控制方案,该方案仅适用于SISO 系统的调节问题,且非最优;文[7]提出了DISOPE 算法,该算法是一种动态系统优化和参数估计集成的迭代算法,主要用于解决有终端等式约束的非线性最优控制问题,由于需要较多的迭代运算,计算量较大。

本文基于非线性信息融合估计理论,研究非线性离散控制系统的最优跟踪问题。通过把控制问题转化为估计问题,从信息融合估计的角度,使非线性控制问题转化为求控制量的“非线性估计”问题。首先,给出了非线性信息融合估计定理;然后,研究了信息融合非线性控制算法;最后,通过二自由度机器人操作手的转移控制问题的仿真研究说明了信息融合非线性控制算法的有效性。

1 信息融合估计基本理论

定理1[8] 设关于被估计量的各种信息均可表示为

n R x ∈i i i v x H y +=,n i ~1= (1) 式中,为观测数据;为信息传递矩阵;为观测误差,且i m i R y ∈n m i i R H ×∈i m i R v ∈0=][i v E ,

。若为非奇异,则是基于,?

??≠==j i j i R v v E i

T

j i ,0,][∑=?n i i i T i H R H 11x ?i y n i ~1=的最优融合估计。且 ∑=?=n i i i T i H R H x

In 1

1]?[, (2) ∑=?=n

i i i T i y R H x x In 1

1?]?[式中,表示关于]?[x

In x ?x 的信息量。 称式(1)为信息融合估计的统一线性模型。称为信息关于自身的信息量,记作;为关于被估计量1?i R i y 1][?=i i R y In i i T

i H R H 1

?i y x 的信息量,记作i i T i i H R H x y In 1

][?=。所有关于被估计量x 的信息的信息量

之和等于最优融合估计关于自身的信息量,即x

?∑==n

i i x y In x In 1][]?[,如式(2)所表示。通常,信息关于自身的信息量与该信息的协方差互为倒数。

定理2[9] 在定理1中,若关于x 的各种信息表示为

()i i i v x h y +=,n i ~1= (3)

式中,是上的维光滑单调向量场。若是()?i h n R i m x

?x 的最优融合估计,且为非奇异,则有 ∑=?n

i i i T i H R H 11https://www.wendangku.net/doc/152699909.html,

∑=?=n

i i i T i H R H x

In 1

1]?[, (4) ()∑∑=?=?=n

i i i T i n i i i T i y R H x h R H 1

111?式中,x

x i

i x

h H ?=??=

称式(3)为信息融合估计的统一模型。定理2为非线性信息融合估计定理,定理1为线性信息融合估

计定理。定理1是定理2的特例,定理2是定理1的推广。

但是,当为非线性映射时,定理2给出的仅是关于最优估计及其信息量的隐式表达。若在)(?i h x ?)(?i h ,

中,存在单位映射,则根据定理2可得到一种便于递推计算的显式表达式,且为

n i ~1=)(?j h ∑≠=??+=n

j

i i i i T i j H R H R x

In ,11

1

]?[, (5) (∑≠=??+=n

j

i i i i i T i j j x

h y R H R y x ,11

)?(?)2 信息融合非线性控制

考虑下列非线性离散控制系统

())1(),1()(??=k u k x f k x ,())()(k x h k y = (6) 式中,为状态量;为控制量;为输出量;n R k x ∈)(m R k u ∈)(p R k y ∈)(()??,f 是上的维光滑向量场;是上的维光滑单调向量场,;m n R R ×n ()?h n R p p n ≥0)0(x x =。

我们对信息融合非线性系统最优跟踪问题给出如下提法:即,求最优控制序列{ ,使性能指标函数

})(?k u

∑∑?==+?=1

2)

(12)

(*

)

()

()(f f

k k k N k k k M k u k y k y J (7)

达到极小。式(7)中,右边第一项表示对系统实际输出跟踪期望轨迹的要求,表示相应的信息量;第二项表示系统对控制量尽可能小的要求,表示相应的信息量;为终端时刻。和

均为对称正定阵。

)(k y )(*k y )(k M )(k N f k )(k M )(k N 从信息融合的角度,上述控制问题共包含有个信息,包括由式(6)所决定的个等式约束信息;希望跟踪期望轨迹(,)的个跟踪信息;以及希望每个(,f k 3f k )(*k y f k k ~1=f k )(k u ()1~0?=f k k )都尽

可能小的个控制约束信息。信息融合控制的任务,就是融合上述个信息,估计出,f k f k 3)(?k u

()

1~0?=f k k 。

下面讨论非线性离散系统的信息融合控制算法。

首先,假设在k 时刻,

已经融合时刻以后的所有信息得到k )1(?+k x 及其信息量。且称)1(+k P )1(?+k x 为协状态,为协状态的信息量。此时,关于共有3个信息,即,

和,且为零均值、方差为的白噪声;为零均值、方差为的白噪声。

)1(+k P )(k u ())(),()1(k u k x f k x =+)()(0k n k u +=)1()1()1(?+++=+k w k x k x

)(k n )(1k N ?)1(+k w )1(1+?k P 根据定理2,融合关于的3个信息,有

)(k u []

((0),()1(?)1()()()()1()()(?1

k x f k x k P k B k N k B k P k B k u

T T ?++++=?)) (8) 式中,0)()

()(=??=k u k u f

k B 。

然后,讨论如何融合时刻以后的所有信息得到及其信息量。同样,假设已经融合时刻以后的所有信息得到及其信息量1?k )(?k x

)(k P k )1(?+k x

)1(+k P 。此时,关于的信息共有4个,即,)(k x ())(),()1(k u k x f k x =+)1()1()1(?+++=+k w k x k x

,())()()(*k m k x h k y +=和)()(0k n k u +=,且为零均值、方差为的白噪声。

)(k m )(1k M ?将和)()(0k n k u +=)1()1()1(?+++=+k w k x k x

代入())(),()1(k u k x f k x =+,有 ()(),()1()1(?k n k x f k w k x ?)=+?+ (9) 若将式(9)写成())(0),()1(?k v k x f k x

+=+,则为零均值、方差为的白噪声。且 )(k v )(1k Q ?[1

11)

()()()1()(???++=k B k N k B k P k Q T ]

(10)

https://www.wendangku.net/doc/152699909.html,

现在,所有关于的信息浓缩为2个,即)(k x ())(0),()1(?k v k x f k x

+=+和。于是,根据定理2,可求得

())()()(*k m k x h k y +=)()()()()()()(k H k M k H k A k Q k A k P T T += (11) []()[]

{})(~)()()()0),(~()1(?)()()()(~)(?*1k x h k y k M k H k x f k x k Q k A k P k x k x T T ?+?++=? (12)

式中,0)(),(~)()()(==??=

k u k x k x k x f k A ;)(~)()

()(k x k x k x h k H =??=;)(~

k x 表示系统先验值。 综上所述,下面给出信息融合非线性最优跟踪控制的算法流程。

Step 1 置 ,,δ=)0(?)0(u

0)(?)0(=k u ()

1~1?=f k k ,δ为激励系统的小量; 求 ,,)](?),([)1()0()0()0(k u

k x f k x =+0)0()0(x x =()1~0?=f k k ; Step 2 置迭代序号1=i ;

Step 3 求 )(?)(),()()()

1()1()()(k u k u k x k x i i i k x f

k A ??==??=, )

(?)(),()()()1()1()()(k u k u k x k x i i i k u f

k B ??==??=,()1~0?=f k k ; 求 )

(?)(),()()()1()1()()(k u k u k x k x i i i k x h

k H ??==??=,f k k ~1=; Step 4 置 ,

)()()()()()()(f i f f T

i f i k H k M k H I k P +=(

)[]{

}

)()()()()()()()(?)1(*)()1(1

)()1()(f i f f f T

i f i f i f i f i k x h k y k M k H k x k P k x k x

?????+?+=; 求 [

]

1

)(1)(1)()()

()()()1()(???++=k B k N k B k P k Q T

i i i i ,

)()()()()()()()()()()()()(k H k M k H k A k Q k A k P i T

i i i T

i i += , (

)

)(?),()1(?)1(?)1()1()()(k u k x f k x k x

i i i i ???+=+Δ, (

)[]{

}

)()()()()1(?)()()()()(?)1(*)()()()(1

)()1()(k x h k y k M k H k x k Q k A k P k x k x

i T

i i i T i i i i ????++Δ+=, ()

1~1?=f k k ;

Step 5 求 ())(?),()1(?)1(?)1()()()(k u k x f k x k x

i i i i ??+=+Δ , ,

)()()1()()()()()()(k N k B k P k B k U i i T

i i ++=(

)[

]

)(?)()1(?)1()()()(?)(?)1()()()(1

)()1()(k u k N k x k P k B k U k u k u

i i i T

i i i i ????++Δ++=, (

))(?),()1()()()(k u

k x f k x i i i =+,()

1~0?=f k k ; Step 6 若最优控制收敛或迭代次数已到,算法结束;否则,置1+=i i ,转Step 3。

3 仿真研究

为考察信息融合非线性控制算法性能,我们对一个四阶非线性系统进行仿真研究。该系统代表平面

上的二自由度机器人操作手的转移问题,其数学模型[7]为

)(5.00000]5.0)([2100]5.0)()[()()

()(]5.0)([(1]5.0)()[()(4)()()()1(33224433342221k u T k x T k x k Tx k x k Tx k x k x k x k x k Tx k x k Tx k x k x ????

???

??????

?+++????????????????++++++?+=+ (13) 其中,,代表一个关节链的位置和速度;,代表另一个关节链的位置和速度;)(1k x )(2k x )(3k x )(4k x T 为采样周期,且。

02.0=T 下面我们分信息融合非线性调节器、信息融合非线性航点跟踪器和信息融合非线性轨迹跟踪器三种情况分别进行仿真研究。

3.1信息融合非线性调节器

同文[7]一样,设系统初始状态为[]T x 0102)0(=,400=N 。信息融合非线性最优调节器,就是求使性能指标函数

∑∑?==+

=14000

2

400

12

1)()(k k k u k x J (14)

为极小的控制律。

(a) 第1次运算结果(b) 第3次运算结果

图1 信息融合调节器控制曲线

(a) 第1次运算结果(b) 第3次运算结果

图2 信息融合调节器实际状态曲线

(a) 第1次运算结果(b) 第3次运算结果

图3 信息融合调节器协状态曲线

调节问题是控制问题的基础,它决定控制系统的动态性能。对调节问题,通常希望超调要小;响应要快;控制量(能耗)要小;且初始扰动消除后,控制量应为零。

文[7]采用DISOPE算法对完全相同的问题进行了研究,与信息融合控制算法相比,通过两者仿真结果比较可得出:

(1)两者均没有超调,但DISOPE 算法比信息融合控制算法响应速度要慢;

(2)DISOPE 算法在扰动消除后的控制量大小(包括和)均在1左右,而信息融合控制算法在扰动消除后控制量基本为零;

1u 2u (3)由于DISOPE 算法本质上属于线性控制方法,对线性化后与非线性非匹配的部分通过估计进行修正,因此所得结果需要迭代49次后才获得,而信息融合控制算法迭代3次后即可收敛;

(4)DISOPE 算法不能获得性能指标意义下的最优,而信息融合控制算法可以获得性能指标意义下的最优。

利用信息融合控制算法,对调节器问题所进行的仿真研究如图1至图4所示。其中,图1(a)、图2(a)和图3(a)是没有经过迭代运算的初次计算结果;图1(b)、图2(b)和图3(b)是经过迭代2次后的计算结果;图4表示迭代运算性能指标值的收敛情况。图3为协状态的计算结果。

应该指出的是,线性系统最优调节器的协状态一定均为零,而非线性系统最优调节器的协状态不一定为零。从图3可看出,虽然第1次运算后的协状态几乎都为零,如图3(a)所示;但通过迭代运算后,协状态已经不为零,如图3(b)所示。

3.2信息融合非线性航点跟踪器

设有航点,[]T x x 0102)0()0(*==[]T x 0000)400(*=,[]T x 0101)800(*?=。信息融合非线性最优航点跟踪器,就是希望系统能够经过航点,且能耗最少。因此,最优航点跟踪器问题可转化为求使性能指标函数

∑∑

?==+

?=

18000

2

800

,4002

*2)()()(k k k u k x k x J (15)

为极小的控制律。

图4 信息融合调节器指标值曲线 图5信息融合航点跟踪器控制曲线

图6信息融合航点跟踪器实际状态曲线 图7信息融合航点跟踪器协状态曲线

仿真研究表明,初次启动计算时,对于性能指标函数,当系统激励不充分而计算协状态时,容易出现矩阵条件数过大从而导致计算发散的问题。解决该问题有两种方法,一种是,取为小量,对系

2J )(k u

统进行激励;另一种是,初次计算时取指标函数为

∑∑

≠=?==×?++

?=

800

800

,40012

)(01.0*18000

2

800

,4002

*24

4)

()()()()()(k k I i a k k k x k x k u k x k x i J (16)

式中,表示第i 次运算;i 1)(1==i i a ,0)(1=≠i i a 。

利用信息融合控制算法,对航点跟踪器问题所进行的仿真研究如图5至图7所示。从图6可看出,实际轨迹经过了期望航点,和,且控制平稳。

)0(*x )400(*x )800(*x 3.3信息融合非线性轨迹跟踪器

设有期望轨迹,,t t x sin 5.02)(*1?=t t x sin 1)(*3+=[]16,0∈t ,将其离散化为

()Tk k x sin 5.02)(*

1?=,()Tk k x sin 1)(*

3+= ,800~1=k (17)

式中,??

?

???=T t k ,[表示取整运算。

]?

图8信息融合轨迹跟踪器控制曲线 图9信息融合轨迹跟踪器实际状态曲线

图10信息融合轨迹跟踪器协状态曲线 图11实际轨迹与期望轨迹的比较

信息融合非线性轨迹跟踪器,就是希望系统能够跟踪期望轨迹,且能耗最少。因此,最优轨迹跟踪器问题可转化为求使性能指标函数

∑∑?==+?????

??+?=180********

*3

32*113)()()()()(k k k u k x k x k x k x J (18) 为极小的控制律。

利用信息融合控制算法,对轨迹跟踪器问题所进行的仿真研究如图8至图11所示,该仿真结果为2次运算所得,继续迭代运算后所得结果改善甚微。实际上,若记经过次运算后所得性能指标函数值

为,则对被仿真系统,有i )(3i J %10)1()2()1(333

2()

3()2(333

的情况下,信息融合轨迹跟踪器一般不需要迭代运算。

从仿真结果可看出,当时,实际状态与协状态非常接近,而协状态反应对期望轨迹的要求。当系统对跟踪精度要求愈高时,协状态愈接近期望轨迹,采用最优控制策略后的实际状态愈接近协状态,最终使系统很好地跟踪期望轨迹。理论分析和仿真研究(如图11)还可看出,采用信息融合跟踪控制无相差,幅差亦很小,且依控制受限程度而定。

100>k 4 结束语

控制也是一种决策,决策离不开信息。信息融合是一种普遍存在的思想,信息融合思想也可用来解决控制问题。因此,本文初步探讨了信息融合在非线性系统控制中的应用,详细给出了信息融合非线性控制算法,并以二自由度机器人操作手的转移控制问题为背景进行了仿真研究。

对于信息融合非线性控制,如何融合更一般信息,包括不等式约束信息、时域指标信息或频域指标信息等信息,有待进一步研究。信息融合控制的关键技术在于信息的等效变换,使其成为可融合信息。我们认为,随着信息融合估计技术的发展,必然会推动信息融合控制理论的发展。

参考文献

1. 王志胜, 王道波. 含理想控制策略和期望轨道的最优控制. 控制与决策,21(1), 2006

WANG Zhi-sheng WANG Dao-bo Optimal Control with Ideal Control Strategy and Expected Trajectory . Control and Decision, 20(12), 2005

2. R. S. Pindyck. Optimal Economic Stabilization Policies under Decentralized Control and Conflicting Objectives[J]. IEEE Trans on Automat Contr, 22(4) , 1977: 517~529

3. Yu Xin, Liao Fucheng, Shi Mingkun. Preview control with imaginary input. Chinese Journal of Basic Science and Engineering [J]. 6(3), 1998:319~326

4. 谭跃刚, 刘峰, 周祖德. 基于协调误差的目标轨迹预见跟踪控制的研究. 中国机械工程.14(15), 2003:1265-1268

Tan Yuegang, Liu Feng, Zhou Zude. Study Preview Tracking Control of Object Trajectory Based On Harmony Error[J]. Chinese Mechanical engineering, 14(15) , 2003:1265-1268

5. Halpern M E. Preview tracking for discrete-time SISO systems[J]. IEEE Trans. Automat Contr, 39 (3) , 1994 : 589~592 6.姜勇,董再励,孙茂相。移动机器人数学模型近似线性化及反馈镇定。控制工程,12(1),2005

Jiang Yong, Dong zai-li, Sun Mao-xiang. Approximate linearization and Stabilization of Mathematical model for WMR. Control Engineering, 12(1), 2005

7. 李俊民,万百五,黄正良。 具有模型和实际差异的非线性离散动态系统最优控制。控制理论与应用,16(1),1999 L i Jun-min, Wan Bai-wu, Huang Zheng-liang. Optimal control of nonlinear discrete systems with model-reality differences. Control Theory and Application, 16(1), 1999

8. 周军, 王志胜, 周凤岐. 基于线性均方估计的数据融合理论. 宇航学报, 24(4), 2003: 364~367

Zhou Jun, Wang Zhisheng, Zhou Fengqi. Data fusion theory based on linear least square[J]. Journal of Astronautics, 2003, 24(4): 364~367

9. 王志胜. 信息融合控制理论和方法.[博士后研究工作报告]. 南京航空航天大学,2004: 43~44

Wang Zhisheng. Information fusion control theory and method[A]. Post-doctoral research work report, Nanjing University of Aeronautics and astronautics, 2004: 43~44

Research on Transfer Operation Control of Mechanical Arm Based

on Information Fusion Control Theory

WANG Zhi-sheng

College of Automation, Nanjing University of Aeronautics and Astronautics, Nanjing, 210016, China

ABSTRCT : Information fusion optimal tracking control algorithms of nonlinear discrete system are proposed in this paper. Based on the theories of information control, the transfer operation of mechanical arm is studied in detail, and the mathematical simulation results show the validity of the algorithms presented in this paper.

KEYWORDS : nonlinear control, information control, path programming

相关文档