文档库 最新最全的文档下载
当前位置:文档库 › 矩阵特征值求解

矩阵特征值求解

矩阵特征值求解
矩阵特征值求解

矩阵特征值求解的分值算法

12组

1. 1矩阵计算的基本问题

(1) 求解线性方程组的问题.即给定一个n 阶非奇异矩阵A 和n 维向量b ,求 一个n 维向量X,使得

Ax =b (1.1.1 )

(2) 线性最小二乘问题,即给定一个mx n 阶矩阵A 和m 维向量b ,求一个n 维向量

使得 |A X -b | =min{ |Ay -比严 R n }

(3) 矩阵的特征问题,即给定一个n 阶实(复)矩阵A ,求它的部分或全部特 征值

以及对应的特征向量,也就是求解方程

Ax = Z x

A 的属于特征值A 的特征向量。

在工程上,矩阵的特征值具有广泛的应用,如大型桥梁或建筑物的振动问题: 机械和机件的振动问题;飞机机翼的颤振问题 ;无线电电子学及光学系统的电磁 振动问题;调节系统的自振问题以及声学和超声学系统的振动问题 .又如天文、地 震、信息系统、经济学中的一些问题都与矩阵的特征值问题密切相关。

在科学上,计算流体力学、统计计算、量子力学、化学工程和网络排队的马 尔可夫链模拟等实际问题,最后也都要归结为矩阵的特征值问题.由于特征值问 题在许多科学和工程领域中具有广泛的应用,因此对矩阵的特征值问题的求解理 论研究算法的开发软件的制作等是当今计算数学和科学与工程计算研究领域的 重大课题,国际上这方面的研究工作十分活跃。

1.2矩阵的特征值问题研究现状及算法概述

对一个nxn 阶实(复)矩阵A,它的特征值问题,即求方程(I.1.3)式的非平凡 解,是数值线性代数的一个中心问题.这一问题的内在非线性给计算特征值带来 许多计算问题.为了求(1.1.3)式中的A , —个简单的想法就是显式地求解特征方 程

det(A —几I) = 0

除非对于个别的特殊矩阵,由于特征方程的系数不能够用稳定的数值方法由 行列式的计算来求得,既使能精确计算出特征方程的系数,在有限精度下,其特征 多项式f ") =det(A-ZJ)的根可能对多项式的系数非常敏感 能在理论上是有意义的,实际计算中对一般矩阵是不可行的 数

较大,则行列式det(A -几I)的计算量将非常大;其次,根据 数大于四的多项式求根不存在一种通用的方法 ,基于上述原因,人们只能寻求其 它途径.因此,如何有效地!精确地求解矩阵特征值问题,就成为数值线性代数领 域的一个中心问题.

目前,求解矩阵特征值问题的方法有两大类:一类称为变换方法,另一类称为 向

X,

(1.1.2 )

(1.1.3 ) 一对解(4 X),其中R(C),x- R n (C n ),即A 为矩阵A 的特征值,X 为矩阵

(121 )

.因此,这个方法只 .首先,若矩阵A 的阶 Galois 理论,对于次

量迭代方法.变换方法是直接对原矩阵进行处理,通过一系列相似变换,使之变换成一个易于求解特征值的形式,如Jacobi算法,Givens算法,QR算法等。变换方法由于要存储矩阵元素,因而它只适用于求解中小型矩阵,它一般和向量迭代方法结合起来使用.向量迭代方法是通过一系列矩阵向量乘积而求得特征值和特征向量的.由于向量迭代方法可采用压缩存储技术,因而它适合于求大规模矩阵的特征值问题,尤其是大型稀疏矩阵的部分特征值和特征向量问题,如Lanczos 方法,Amoldi方法Qavidson方法等,现在这类问题仍是比较热的研究课题。

2分治方法的基础及理论研究

2.1分治方法的概述

考虑对称三对角矩阵T n的特征值问题

TnX = Z X

(2.1.1 ) 其中

(2.1.2 )

P n.

1981年Cuppen提出一种求上述对称三对角矩阵T n所有特征值和特征向量

的分而治之方法(divide 一and —conquer method).其基本思想是先将对称三对角矩阵T n分割为两个分别为k X k阶和(n - kp<(n - k)阶低阶对称三对角子矩阵

T⑼和T⑴.T (0)和T⑴)可以用同样的方法也分别分割为两个更低阶的子矩阵,递归的采用这种分割技术可以把矩阵分割为一些能直接求出特征值的足够小的子矩阵(比如2阶或1阶矩阵),或者按照某种标准分割到适当阶数(如小于等于25 阶)后,结合其它求矩阵特征值的方法,如QR算法,求出其特征值。在求出低阶矩阵特征值的基础上,开始胶合过程。在胶合阶段,分割前的矩阵T1的特征值的求出(所谓的“治之”)是建立在其两个子矩阵T(0)和T(1)的特征值的基础上的,其中T(0)和T⑴.是在分割阶段由T1分割出的低阶子矩阵.随后的数值分析表明,Cuppen的方法存在着数值不稳定的危险,特别是当存在特征值束时,计算出的特征向量可能不正交。Gu和Eisenstat对Cuppen的方法作了改进,极大地降低了数值不稳定的危险性。

Cuppen的方法在计算T n的特征值的同时也需要计算对应的特征向量,并且

是在T ⑼和T ⑴的特征值和特征向量的基础上进行计算的 .根据文中,当用残量

|TnX -A X |和正交性|x T X -ln |作为检验准确性的标准时,

的标准时,二分法或多分法精确些.此外Cuppen 的分而治之方法要求矩阵乘积, 存储量为0(n 2),而二分法或多分法的存储量仅为 0(n),比前者少.应此,当只需 计算特征值时,通常选用后者.1987年Dongarra 和Sorensen 把分治思想应用到 求对称三对角矩阵特征值的并行计算,取得了不错的效果,再次引起了人们对分 治方法的极大关注。

分割胶合方法(split-merge method )是后来提出用分治方式求对称三对 角矩阵特征值T n 的方法,不同于分而治之方法在分割过程中采用矩阵的秩 1扰动, 它采用矩阵的秩2扰动.与二分法和多分法相似,在分割胶合方法中,特征值的计 算独立于特征向量的计算.如果需要计算特征向量,可采用反幕法。由于分割胶 合方法计算特征值时采用具有三次收敛的

Laguerre 迭代,数值试验表明,其计算

速度和精度都明显优于二分法和多分法.并且文中给出的用于计算 Laguerre 迭

代的非线性三项递归式可以避免上溢和下溢问题。 2.1.1分割策略

分治方法的第一步就是把原来高阶的对称三对角矩阵特征值问题转化为两 个低阶对称三对角矩阵特征值问题 示如下

(2.1.1.1 )

不妨假设P j HO(j =1,2,…,n-1),即称T n 为不可约矩阵。否则,若存在某些P j =0, 则T n 就可以约化为若干个低阶主子矩阵特征值问题

,T n 的特征值就由这若干个

低阶主子矩阵的特征值构成.当T n 为不可约对称三对角矩阵时,对其作如下分割

Cuppen 的方法比二

分法或多分法精确的多。但文[3中,,如果用扎-k

T n 作为衡量特征值准确性

,即所谓的分割阶段.设对称三对角矩阵T n 表

P n J

a

n

丿

fr (0)

)

Tn

d T ⑴丿

(2.1.1.2)

记T n =T n

+E ,其中T (0)和T ⑴)分别为k 沢k 阶和(n —k )" n-k )或

(n - k -1)x( n - k -1)阶对称三对角矩阵,通常k =[ n/2]。

(0

扰动矩阵.此时有

名1 p 1

P 1

+ J ■

+

J ■

,T ⑴=

+ J ■

+ J ■

Lk

』 Ln

P k 4 叫丿

P n 4 J 丿

f o

P k

nJ

a

n

/

p 1

Q k

卄用

2

P k

P 1

+ ■

T ")=

P k H 4

a k * -

+ J

+ J P k .

+ +

J

J

P n

P k A

叫-p 」

J 丿

1扰动矩阵.此时有 T (0)

P pe

P0 pe 2

Pvv T

时,其中 v =(o ;?-,T,…,0)且

称此为秩

(2)当

Pe k eJ^

称此为秩2

(3)

P k

时,称此为秩3扰动矩阵.此时有

1 P 1

g 七 P k 七

P k

七 叭七

人们关注的问题是:对于上述三种分治策略T n 与

T n 的特征值之间的关系.

利用Hoffman-Wielandt 定理的结论,我们可以得到如下定理:

定理2.1设A 和B 是两个n 阶Hermite 矩阵,它们的特征值分别是几’> 沁才,心 和已>^2 A" >巴,则

其中H F 为Frobenius 范数。

根据上述定理,设T n 与

T n 的特征值分别为Uh "和

A 4 > A 2 A"

工扎n

,则有下面关系成立

(2.1.1.4 )

因此,只要(2.1.1.4)式右端越小,k j 就越接近A j ,即T n

与T n 的特征值就越接

近。对于秩1和秩2扰动,T n 与

T n 的特征值之间关系更详细的描述,将在后文 给出。

2.1.2胶合

在矩阵T n 分割后,先求出矩阵T n 的特征值,即求出T ⑼和T ⑴的特征值。剩

下的工作就是如何由

T n 的特征值出发求出T n

的特征值,这就是胶合阶段主要任

务。在这个阶段可以采用不同的迭代方法,如割线法!Newton 迭代、Laguerre 迭 代以及路径跟踪等,以

T n 的某个特征值或T n 的特征值构成的区间内的点为初 始点经过

若千步迭代,最后收敛到T n 的某个特征值.本文中采用Laguerre 迭代从 特征区间提取特征值。

2.2 Laguerre 迭代

2.2.1 Laguerre 迭代及其计算

根据文中,对于不可约对称三对角矩阵 T n ,它的特征值或特征多项式

f a ) =detT n -M n)的根全为互不相同的实数.因此,适合求多项式的根都是实

n

[J

仏j -P j) ]2 < A -B |F (2.1.1.3)

单根的具有三次收敛的Laguerre迭代

L』x) = X +---------- 「…(2.2.1.1)

-「罟卯V需j需)]

非常适合用来从特征区间提取出T n 的特征值.这个方法早在13世纪就已经提出, 为了避免上述(2.2.1.3)式、(2.2.1.4)式和(221.5)式在计算中可能出现的上 溢或下溢问题,文中给出如下的改进的非线性三项递归式:

2治/2…,n,

(2 . 2. 1.3)式两边都除以得fi^GJ 得

近年来结合分治策略又重新焕发出生机 .文中首次对用Laguerre 迭代求不可约

对称三对角矩阵的特征值的实用性进行了研究 题。

,而后又被用于求矩阵的奇异值问

为了利用Laguerre 迭代求T n 的特征值

,我们需要计算T n 的特征多项式

f 仏)=det (T n -讥)以及其一阶导数f ‘仏)、 二阶导数f "仏).由文中知,计算这 些值的有效的方法是三项递归式.众所周知,当矩阵阶数比较大时,三项递归式 可能

出现上溢或下溢问题.文中给出了一种改进的非线性的三项递归式 ,数值试 验表明,除极其个别的情形,改进的三项递归式可以避免上溢或下溢问题。

对称三对角矩阵T n 的特征多项式及其一、二阶倒数的计算公式

设对称三对角矩阵T n 如 (221.1 )式所示,T k 表示其k 阶顺序主子式,表 示如下

P 1

匕P k j P k 4 ?k >

(2.2.1.2)

f k (Q = det (T k -)?l k )为T k 的特征多项式,则特征多项式及其导数计算公式如

下(三项递归式):

r

fo G ) =1,f 1(Q=% 八

t f i 仏)=(% -Q f i 4仏)—P i !仁⑷,i =2,3,…,n

(221.3

r f 。?) =1,时(二)=-1

(f i (Q =(% -Q f i :仏)-巧仁(Q ,i =2,3,…,n (221.4

'

f0S )=1,f1G )=O

f i (Q = (W -几)f i :⑷-2f i :仏)-巧 f i ;⑷,i

= 2,3,…,n

(221.5

f ") = fn W f ⑷=fn O )f ⑺=f ;G ),

I

匕1 (扎)=a 1 - A

几)=ct j -几 一 i = 2,3,…,n

=4仏)

亠⑷一尚和匚?)—15 ''0,1「,n

可得下面的递归关系

(2.2.1.7)

j £仏)=0,勺仏)=0

J

F i (Q=y^[(% -Q 九⑷+1-j

仏)],i=2,3,…,n I i (九)

式和(2.2.1.8)式进

行简单的推导,我们可以得到下面两个关

系 式-需S 需干⑴

式为改进的三项递归

式.(221.7) 式和(2.2.1.8)式分别为改 ,这些是我们在调用

Laguerre 迭代时所需要计算的.根据文中知,除了个别极其特殊的情形,它们可 以避免计算过程中出现的上溢或下溢现象

.但是,值得注意的是,如果对于某个

i(1勻< n)使得耳⑷=0时,上述改进的各式就会出现中断现象.为了保证排除中 断的发生,在计算中作如下处理

(221.6 )

(2 . 2.1.4)式和(2。 2.1.5)式两边除以f 「仏)并注意下述关系

S O W ]⑴

1

3⑷二帀”叽⑷"

占p i /仏)]」=2,3,…,n

皿)

(2.2.1.8)

分别对

我们称(2.2.1.6)

进的计算特征多项式一阶导数和二阶导数的计算公式

如果?⑴=0,则令匕(扎)=P i g . i =1,2,…,n —1

根据命题2.1,如果令

如果 =0,则令 E n()J =

这里E 为机器精度.上述处理相当于对8或a n 引入一个小扰动I P i S|或I

P n ^sl 。 式,在计算改进 A 处,不大于该 注2.1:我们由三项递归式(2.2.1.3)式经过改进得到(221.6) 的非线性三项递归式(2.2.1.6)式时,同时可以得到在某个给定值 固定值A 的特征值的个数,即q ⑴< 0 (对所有1兰i 兰n )的个数.

222 Laguerre 迭代的性质

对于不可约对称三对角矩阵T n (如(2.1.1.1)式),其特征多项式

f 仏)=detQ n - 几1 n ),

(2.221 )

的所有根为互不相等的实根。设f (心的根为

并令扎。=二和扎卄=。对X 亡仏,人S , Laguerre 迭代L+(x)和L_(x)分别定 义如下

L 』x) =x + ------------- 1

n

/ f(x)\ , L m/ 小/ f'(x) 2 z f "(x) f(x) V

f(x)

f(x)

(2.222)

L - (x) = X + ---------- ( n = (q )-J (n -1)[(n —1)(—3)2

—n(d )] f(x) Y f(x)

f(x)

并且有下面的命题成立.

(222.3)

命题2.1对仏m ,k m S m =0,1,…,n ,则有下述结果成立:

(D 几m VL_(X)CXCL+(X)CA m + ; (2)存在常数C +和c_使得

当x 趋于几m +时,有L +(X)-k m + 兰 c j x -A m 4t 3 ; 当X 趋于扎m 时,有L_(x)

m

兰c 」x -珀m 3

_______ J k ______

=L ;(x) = L +(L +(…L+(x)…))

k I — — ——

—I

xT = Ll(x) =L_(L_(?? L_(x)?")),

L r _(x) = X + ---------- 1 n

=

(f \x)) (n — r 1)( f \x))2 n( f "(X)). (

-匚厂7)_』 ---- [(n _ 1)^7T ) _n(TT ■-)] f (x) V r f (x) f (x)

我们称(2.2.3.1)式和(2.2.3.2)式为改进的Laguerre 迭代.我们需要注意 的是:

当 r =1 时,(2.2.3.1) 式和(2.2.3.2) 式就分别是(2.2.2.2) 式和(2.2.2.3) 式.因此,我们在调用Laguerre 迭代时,通常是先令r =1,然后计算r 来调用(2.2。

3.1)式或(2.2.3.2)式。

由上面的两个式子,可以得到两个序列

--------- ■k

-------

X (k ; =L k

』X)=Lr M Lr 4C Lr^X)…))

则有

.

(2)

(1)

(1)

(2)

J _

—x_ V X _

— A m H

(2.224 )

(2.22.4)

式说明当X 忘仏m ,)u m 』时,L_(x)从X 的左侧趋向于A m , L+(x)从X 的

右侧趋向于

文中指出只要X 非常接近扎m (或非常接近A m 半),一般调用

(2..2.2.3) 式(或(2..2.2.2) 式)两!三次便可收敛于 <(或亦丿。 2.2.3病态接近特征值及改进的Laguerre 迭代

根据文献,当多项式有重根时Laguerre 迭代只是线性收敛.虽然不可约对称 三对角矩阵的特征值为两两互不相同的实数,但是,它们中的某些特征值也可能 非常接近以致于在数值上无法区分,例如Wiikinson 矩阵。当矩阵有一个由r 个非 常接近的特征值构成的束时,在计算中被看作为一个 r 重特征值,在这种情形 下,Laguerre 迭代的收敛率仅为线性的。

为了在上述情形下加速迭代 Laguerre 收敛,对Laguerre 迭代(2..2.22)式和

(2..2.23)式作重新定义,对正整数r ( 0

L r +(x) = X + ---------- j

n

(2.2.3.1 )

(223.2)

___ 北___

X(k SL k_(X)=Lr_(L r『Lr_(X)?T)

当X”为f仏)的r重根时,如果X 并且f (兀)在区间(X,X”)内无根,则序列

X黑,k =1,2,…以三次收敛速度递增地收敛于x j类似地有,如果^<x并且f仏)在区间(x:x)内无根,则序列x(l,k =1,2,…,以三次收敛速度递减地收敛于x*。数值试验表明,即使在病态根束的情形下,(223.1)式和(223.2)式也能

达到三次收敛.对上述改进的Laguerre迭代L^(x)和L^(x),有下面定理:定理

2.2 设禹<扎2成…<A n为多项式f GJ = det(T n -几I n)的根,贝U对

X - C-m, /-m G和任一正整数r c n,我们有

(1)如果-则A m C X C L+(X)

(2)如果-加,则5<」)「<"丄(心宀, 为了方便起见,记% =亠和几卄=g。

注2.2 :设仏m,k m十)为Laguerre迭代的初始点并用它逼近特征值几m十,在某

些情形下,在离扎m+右边非常近的地方可能存在一组特征值,即入m十V扎m七<■" <兀m+它们相对于X离的距离,非常靠近几皿卅。

在这种情形下,在达到A m寺的能够具有三次收敛速度的邻域前,实际计算需要花费许多次调用 La guerre!代.这时,我们可以选择其它初始点来重新开始

Laguerre迭代或者调用改进的Laguerre迭代L r dx)来加速收敛过程。

3求反对称三对角矩阵特征值的方法及分而治之算法

3.1反对称三对角矩阵的算法介绍

反对称矩阵特征值问题在许多实际问题中有广泛应用,如防潮陀螺仪系统的

模型分析【23】等,对这类具有特殊结构的矩阵,已有不少求特征值的算法【21-25】它们基本上是把反对称矩阵特征值问题经过正交相似变换,如HousheuodI变换或Gviens变换,转化为反对称三对角矩阵特征值问题.众所周知,在相似变换下不改

变原矩阵的谱集.对一般矩阵,在采用QL算法之前,通常也是先把原矩阵化为上Hessnehegr型,当矩阵为反对称矩阵时,根据其反对称性,其上Hessnehegr型矩阵

也就是三对角矩阵.因此,我们在下面讨论的反对称矩阵总是已三对角化了的反对 称三对角矩阵,形如

不失一般性 假设P j HO, j =1,2,…,n-1,式称之为不可约反对称三对角矩阵,简记 为LATS,且近一步假设P j >0,j =1,2,…,n-1,若存在P j =0,0< j < n-1,则原问题 可以转化为两个低阶矩阵的特征值问题。

3.1.1求IAST 特征值的QL 算法

考虑IAST ( 3.1.1),如果矩阵阶数n 为奇数,由于IAST 的特征值为互为共扼 的纯虚数或零,因此可以通过位移为零的 QL 迭代把J n 化为

(3.1.1.1)

其中JnA 为偶数阶矩阵,其特征值为互为共轭的纯虚数。不失一般性,我们以后不 妨假设矩阵的阶数n 为偶数。令J n =J ,计算j 的特征值的

(1)计算J 2

+肾1的第n 列

a =(J 2

+ p 12

| e n =(0,0,…,P n 4,P n 20,P 12

-P

(2)计算Househoulder 矩阵p 。使得

P o a =|a||e n ,

2

I

2

n

rp 2

z+

(障_P 2

2)

h 2邛2邛22+(障邛22 7 =2^ -{叮-P 2n J sign(i ) = -signer - P 2nj )

(3)计算 J =Po T JP o ,即

-P 1

P n

-P n .

丿

(3.1.1)

QL 算法描述如下:

2

这里 P 。= I —2W W T

,其中 w =(0,0,…,P n J , p2,0,叮-P 2

n 」 n 4 n-2 J -T T /h

0 *

(I n-4

-S

把P 2T R T

J P 1P 2的(n,n-4)和5-4,n)位置上多两个非零元素,这时在(n,n-5)和(n-5,n ) 位置上多两个非零元素。类似地,通过旋转矩阵R, P 2,…,P n-3,把J 化为 J = P n-3T

?- P 2T P 1T JP 1P 2…P n, 此时#为一个新的LAST 。此时对?进行压缩。在对?的压缩后的矩阵执行双位

移QL 算法,经过若干步上面的循环后,最终可以收敛于 J 的标准型

[25]

其中

‘0 1、 .-1 0 丿.

3.1.2 由LAST 的叉积的压缩矩阵求其特征值的方法

1971年,M.H.C.Paardekooper 曾用于对称矩阵的Jacobi 思想推广到反对称 矩阵

情形,给出了一种求反对称矩阵特征值得算法。 但他的算法仅考虑了反对称

性,未利用其纯虚数特征值共轭成对的性质, 廉庆荣教授等利用这一性质,构造 出矩阵阶数为n =2N 的jj T (其中J 为LAST )的压缩矩阵(N 阶不可约对称三 对角矩阵),简记 CIST (condense irreducible symmetric tridiagonal matrix)。 下面的定理可以说明:CIST 的特征值的开方是对LAST 的特征值的虚部。有关

"0 P i

-P i

0*0* * 0 * 0 0*0* * 0 * 0

然后利用一系列旋转变换把J 化为新的

LAST

具体地,注意J 只是比原矩阵J 在(n,n-3)和 转矩阵

(n-3 ,n )位置上多两个非零元素.用旋

I2 =

算法是在构造出Jj T 的CIST 后,采用对称QL 算法(带Wilkinson 位移)求出CIST 的特征值,然后在对其特征值开方求得 LAST 特征值的虚部。

不失一般性,仍考虑形如(3.1.1 )式的n 阶不可约反对称三对角矩阵J (不 妨设n =2N 为偶数,n 为奇数时,N = h /2】)。令jj T =胪=妬),J 必为特殊的 五对角对称矩阵:

a *

=肾,Ct nn = P :」,a jj =P j 2」+ P j 2,j

=

2,3,

n —1,

何如2"jj \j 十一 P j H j ,j =2,3,…,n -1, ( 3.1.2.1 )

a*=0,其他.

定理3.1设J — JJ T 如(3.121 )所示,

p

2j,j

- P 2j-1,N 出-1 j

—1

,2,

, N

, P j = 0(其

匕),

为不可约对称三对 角矩阵,T =&ij )迂R N 环

G j =a 2i A 2j

」0— j — 1, i, j — 1,2,

, N

).

注3.1当n =2N+1时,T 为N +1阶,定理仍成立。

本文仍采用文[22]中的叫法,称T 和T 为r 的压缩矩阵,其元素可以从r 中 直接得出,以T 为例:

fa - P 2

5N N —

L2N ?

心j 卅,j R j'j 十二 严j =0,其他.

F 面的定理给出定理3.1中T 的特征值与J 的特征值的关系。

定理3.2 [设J 为n 阶LAST 如(3.1.1 )式所示,T 为J J JJ T 的N 阶压缩矩阵(如

(3.122 )式所示),则±巴为J 的共轭对特征值的充分必要条件是 幷为T 的 特征值(j =1,2,…,N ).

由定理3.1易知,气2(j=12…,N )也是T ?T 的二重特征值,而且T 和〒各 有N 个相异非零实特征值。于是T ?T 有相同的特征值42(j =1,2,…,N )。

该定理表明,只要求出N 阶对称三对角矩阵T 的特征值,即可得n 阶不可约 反对称三对角矩阵的特征值。在求N 阶对称三对角矩阵T 的特征值时,采用带有

若选择排列阵P = (Pij )€R ^满足 则P T J ” P =T ?〒,其中T 和T 均 且 a j =a ;i,2j ,T =(%j 空 R N

邓且

G jj

邛:丄 + 時,j =1,2,…,N -1, =-p2j

」p2jJ=1,2;??,N-1,

(3.1.2.2 )

wilk in son位移的QL算法。

3.2求LAST 的特征值的分而治之算法 3.2.1 秩1分割

由定理3.1和定理3.2知,求LAST 得特征值就等价于求N 阶对称三对角矩 阵T 的特征值,其中T 为J 「=JJ T 的压缩矩阵。文[22]是用带有wilk in son 位移 的QL 算法求T 得特征值本节将对T 利用分治策略,给出一种求不可约对称三对 角阵T 的特征值的分而治之算法。如(3.122)式所示,T 形如

其中a j 空X j,j 十H0(j =1,2,…,N -1).对T 作分割策略,即对T 作如下的秩

+ E 酊+ E, (3.2.1.2)

其中

f o

这样,把T 分割为一个分块矩阵和一个秩1矩阵的和。 T (0和T Q 分别进行如上的分割,如此下去,就可以将 T 分割为2'块。

定理2.1说明,当|E |F 充分小时,T 的特征值很接近T 的特征值,但是一般 情况下I E |F 是不可能充分小的。

322胶合

假设分割后所得的子秩阵块T P 和T 0 的特征系统已求得,即设已求得正交

仔1片

S 卅-P62

+

,讥

y kJ.

7 1

a. — P

7

a

V

k 1

k

N -4

N /

丿

T (0)=

N/2I

化1 丫1

丫1 (321.1)

pe

=P vv T

R N

邓,v =

S 且心fV 屮⑴

k 一般取为 如果需要,还可以对

对某个珀(1

向量为

矩阵Q I ,Q 2使得T f 和T C 分别为对角阵D i , D 2,即

D i -Q I TPQ T , D^ Q 2T P Q T ,

其中z =Qv 。

由于T f 和T (都是不可约对称三对角矩阵,它们的特征值为两组互不相同

的实数,则有T 的特征值至多为二重的,并且当T 存在二重特征值时,有下面的 定理成立。

定理3.3设d ( d 是T f 和T ( 的特征值)为T (如(3.2.1.2)式所示)的二 重特征值,则d 是T 的特征值。

证明:设d 为T P 的特征值时,对应特征向量为X1(H O ), d 为T C 的特征值时, 对应特征向量X2(H 0 ),即T (0X^dx 1,T ( X 2 =dx 2,对任意标量《工0和w 工0,使 得向量=(V 1X T

,V 2X T

$为〒=d i aCgf )T C ))的特征值d 对应特征向量,令

Z=(Z,,Z2 ),贝U

Tx =(~ + Pzz : X =dx + ^(v W +V 2Z T

X 2 z ,

Tx +已z T X =dx ,

这说明d 也

是T 的特征值,

根据文

定理 3.4 设 D =diag(D i ,D 2)=diag(d i ,d 2,…,dN ),即 T 的

d 1

(1)当P cO 时有,d j -良T z <人< d , <務兰…-入N 兰d N ; (2)当 P <0时有,d i <》1

z ;

(3.221)

(Q I

Q 2丿,则有

QTQT =QTQ f z T

f D2.

+ Pzz T ,

(322.3)

选取标量V|和V 2使得V i Z :% +V 2Z T X 2 =0

,即(322.3) 式变为:

定理得证。

[1,1O]

的定理和定理3.3我们可以得到下面的定理。 特征值为

U j =aj (D -A jI f z 或U j =aj (D -A jI 『z ),这里(D -妇丨『为矩阵(D -和)的 Moore-pen rose 广义逆。

不妨设P >0 ,此时令d N ^^ =d N + Pz T z 。有定理 3.4知,

Z j 迂d j ,dj /j =1,2,…,N ),即〒的特征值为T 的特征值提供了很好的包含空间。

我们可以根据定理3.3来判断区间端点是否为T 的特征值,从而包含区间可以简 化为几严(d j ,d j 出 J d j 屮 H d j ),如果 d j ^1 =d j 则 Z^d j 。令X j (dj H^ +d j )/2,通过 调用算法Modify-DetEval 计算在特征多项式在x j 处的符号变号数,以此判断 几严

(d j ,X j )或几严(X j ,d j 半确定k j 的包含空间,为了从 扎j 的包含区间内提取出 珀,我们选取初始点X j 用Laguerre 迭代从Z j 的包含区间内提取出入j 。首 先判断在X j 处是否满足调用Laguerre 迭代标准,如果不满足,继续用二分法精 化入j 的包含区间并重复上述过程。对 P <0时有类似上述的处理过程。

4数值实验 4.1数值算例

我们已经在本文第三章和第四张中对求反对称三对角矩阵特征值的方法进 行了讨论,为了对上述算法进行可行性检验,我们用 C 语言编程,在INTER

PENTINUM (CP 为1.5GHz,内存为240M 机器精度为esp =2.2"0-'6

)的计算机上

用QL 算法(调用LAP AC 中的子程序dhseqr )对下述两类矩阵进行数值试验(只 给出对称三对角矩阵的次对角元)

= J k (n -kHk=1,2,...., n-1),具体特征值为: 紅 n + 2^1))1

b =1

4.2精度检验

我们采用下述方法进行精度测试:首先我们知道类型一,类型二的特征值是 已知的,从而我们可以直接计算对应特征值的绝对误差, 令几j 为实际特征值几j 的 近似值(由上述算法计算所得)表 4.1 (其中n 表示矩阵的阶数,S 表示机器的 精度)给出了误差

max

类型一 P k 类型二 P k

恥“心'2…nj ),具体特征为:沁0其中

表4.1关于已知特征值的矩阵的计算精度

由表4.1可以看出,在上述四方法中,这些方法的精度具有同样的数量级。相比而言,S_SM(L)算法精度最高,而S_QL算法和S_DL(L)算法的精度较低,这也符合前面的分析:对于很小的特征值,开方后可能失去意义:QL算法和S_QL 算法的精度随着矩阵阶数的增大而逐渐降级,而S_SM(L)算法似乎不受矩阵的阶数增大的影响;对类型一的矩阵,当阶数n=2000时,QL算法的误差是S_SM(L) 算法的误差的735倍,S_QL 算法的误差是S_SM(L)算法的误差的1197倍。

用MATLAB求矩阵特征值

用matlab求矩阵的特征值和特征向量 我要计算的矩阵: 1 3 5 1/3 1 3 1/5 1/3 1 [v,d]=eig(A); A为你的矩阵,V为特征向量矩阵,D为特征值矩阵,然后对D求最大值即可得最大特征根! [V,D] = EIG(X) produces a diagonal matrix D of eigenvalues and a full matrix V whose columns are the corresponding eigenvectors so that X*V = V*D. V是特征向量,D是特征值 实例: 矩阵: 1 2/3 7/3 7/3 3/2 1 3/2 3/2 3/7 2/3 1 3/2 3/7 2/3 2/3 1 >> format rat >> A=[1 2/3 7/3 7/3 3/2 1 3/2 3/2 3/7 2/3 1 3/2 3/7 2/3 2/3 1] A = 1 2/3 7/3 7/3 3/2 1 3/2 3/2 3/7 2/3 1 3/2 3/7 2/3 2/3 1 >> [V,D]=eig(A)

V = 1793/2855 504/3235 - 146/235i 504/3235 + 146/235i 1990/4773 670/1079 -3527/5220 -3527/5220 -509/959 4350/11989 1160/4499 + 287/3868i 1160/4499 - 287/3868i -350/647 838/2819 181/3874 + 1179/4852i 181/3874 - 1179/4852i 1238/2467 D = 810/197 0 0 0 0 -93/4229 + 455/674i 0 0 0 0 -93/4229 - 455/674i 0 0 0 0 -149/2201 ***************************************************************************************** 如何归一化求权重呢? >> a=[1 3 5;1/3 1 3; 1/5 1/3 1] a = 1.0000 3.0000 5.0000 0.3333 1.0000 3.0000 0.2000 0.3333 1.0000 >> [V,D]=eig(a) V = 0.9161 0.9161 0.9161 0.3715 -0.1857 + 0.3217i -0.1857 - 0.3217i 0.1506 -0.0753 - 0.1304i -0.0753 + 0.1304i D =

第九章矩阵特征值问题的数值方法

第9章矩阵特征值问题的数值 方法 9.1 特征值与特征向量 9.2 Hermite矩阵特征值问题 9.3 Jacobi方法 9.4 对分法 9.5 乘幂法 9.6 反幂法 9.7 QR方法

9.1 特征值与特征向量设A是n阶矩阵,x是非零列向量. 如果有数λ存在,满足, (1) 那么,称x是矩阵A关于特征值λ的特征向量.

如果把(1)式右端写为 ,那么(1)式又可写为: x λ ()0 I A x λ-=||0 I A λ-=即1110 ()||...n n n f I A a a a λλλλλ--=-=++++记 它是关于参数λ的n 次多项式,称为矩阵A 的特 征多项式, 其中a 0=(-1)n |A |. (2)

显然,当λ是A的一个特征值时,它必然 是的根. 反之,如果λ是的根,那么齐次方程组(2)有非零解向量x,使(1)式 成立. 从而,λ是A的一个特征值. A的特征值也称为A的特征根 . ()0 fλ= ()0 fλ=

矩阵特征值和特征向量有如下主要性质: 定理9.1.1 n阶矩阵A是降秩矩阵的充分必要 条件是A有零特征值. 定理9.1.2 设矩阵A与矩阵B相似,那么它们 有相同的特征值. 定理9.1.3 n阶矩阵A与A T有相同的特征值. 定理9.1.4 设λ ≠λj是n阶矩阵A的两个互异特 i 征值,x、y分别是其相应的右特征向 量和左特征向量,那么,x T y=0 .

9.2 Hermite矩阵特征值问题?设A为n阶矩阵,其共轭转置矩阵记为A H. 如果A=A H,那么,A称为Hermite矩阵.

判断矩阵的最大特征值

项目六 矩阵的特征值与特征向量 实验1 求矩阵的特征值与特征向量 实验目的 学习利用Mathematica(4.0以上版本)命令求方阵的特征值和特征向量;能利用软件计算方 阵的特征值和特征向量及求二次型的标准形. 求方阵的特征值与特征向量. 例1.1 (教材 例1.1) 求矩阵.031121201??? ?? ??--=A 的特征值与特值向量. (1) 求矩阵A 的特征值. 输入 A={{-1,0,2},{1,2,-1},{1,3,0}} MatrixForm[A] Eigenvalues[A] 则输出A 的特征值 {-1,1,1} (2) 求矩阵A 的特征向量. 输入 A={{-1,0,2},{1,2,-1},{1,3,0}} MatrixForm[A] Eigenvectors[A] 则输出 {{-3,1,0},{1,0,1},{0,0,0}} 即A 的特征向量为.101,013??? ? ? ??????? ??- (3) 利用命令Eigensystem 同时矩阵A 的所有特征值与特征向量. 输入 A={{-1,0,2},{1,2,-1},{1,3,0}} MatrixForm[A] Eigensystem[A] 则输出矩阵A 的特征值及其对应的特征向量.

例1.2 求矩阵??? ?? ??=654543432A 的特征值与特征向量. 输入 A=T able[i+j,{i,3},{j,3}] MatrixForm[A] (1) 计算矩阵A 的全部(准确解)特征值, 输入 Eigenvalues[A] 则输出 {0, 426-,426+} (2) 计算矩阵A 的全部(数值解)特征值, 输入 Eigenvalues[N[A]] 则输出 {12.4807, -0.480741, -1.34831610-?} (3) 计算矩阵A 的全部(准确解)特征向量, 输入 Eigenvectors[A]//MatrixForm 则输出 1 2 1172422344220342234421172 42234 42 20342234 42 1 (4) 计算矩阵A 的全部(数值解)特征向量, 输入 Eigenvectors[N[A]]//MatrixForm 则输出 0.4303620.5665420.7027220.805060.111190.5826790.4082480.816497 0.408248 (5) 同时计算矩阵A 的全部(准确解)特征值和特征向量, 输入 OutputForm[Eigensystem[A]] 则输出所求结果 (6) 计算同时矩阵A 的零空间, 输入

矩阵特征值、特征向量的研究【开题报告】

毕业论文开题报告 数学与应用数学 矩阵特征值、特征向量的研究 一、选题的背景、意义 (1)选题的背景、意义 “矩阵(Matrix)”术语是由西尔维斯特创用并由凯莱首先明确其概念的。19世纪50年代,西尔维斯特引入“矩阵”一词来表示“一项由几行H列元素组成的矩形阵列”或“各种行列式组”,凯莱作为矩阵理论的创立者,首先为简化记法引进矩阵,然后系统地阐述了矩阵的理论体系。随后,弗罗伯纽斯等人发展完善了矩阵的理论体系形成了矩阵的现代理论。然而,矩阵思想的萌芽由来已久,早在公元前l世纪中国的《九章算术》就已经用到类似于矩阵的名词。但那时矩阵仅是用来作为一种矩形阵列解决实际问题,并没有建立起独立完善的矩阵理论。18世纪末到19世纪中叶,这种排列形式在线性方程组和行列式计算中应用日益广泛,行列式等理论的发展提供了矩阵发展的条件,矩阵概念由此产生,矩阵理论得到系统的发展。20世纪初,无限矩阵理论得到进一步发展[]1。 线性代数(Linear Algebra)是数学的一个分支,它的研究对象是向量,向量空间(或称线性空间),线性变换和有限维的线性方程组。向量空间是现代数学的一个重要课题;因而,线性代数被广泛地应用于抽象代数和泛函分析中;通过解析几何,线性代数得以被具体表示。线性代数的理论已被泛化为算子理论。由于科学研究中的非线性模型通常可以被近似为线性模型,使得线性代数被广泛地应用于自然科学和社会科学中[]2。 由于费马和笛卡儿的工作,线性代数基本上出现于十七世纪。直到十八世纪末,线性代数的领域还只限于平面与空间。十九世纪上半叶才完成了到n维向量

空间的过渡矩阵论始于凯莱,在十九世纪下半叶,因若当的工作而达到了它的顶点。1888年,皮亚诺以公理的方式定义了有限维或无限维向量空间。托普利茨将线性代数的主要定理推广到任意体上的最一般的向量空间中.线性映射的概念在大多数情况下能够摆脱矩阵计算而引导到固有的推理,即是说不依赖于基的选择。不用交换体而用未必交换之体或环作为算子之定义域,这就引向模的概念,这一概念很显著地推广了向量空间的理论和重新整理了十九世纪所研究过的情况。 “代数”这一个词在我国出现较晚,在清代时才传入中国,当时被人们译成“阿尔热巴拉”,直到1859年,清代著名的数学家、翻译家李善兰才将它翻译成为“代数学”,一直沿用至今[]3[]4。 线性代数是讨论矩阵理论、与矩阵结合的有限维向量空间及其线性变换理论的一门学科。 (2)国内外研究现状和发展趋势 主要理论成熟于十九世纪,而第一块基石(二、三元线性方程组的解法)则早在两千年前出现(见于我国古代数学名著《九章算术》)[]5。 ①线性代数在数学、力学、物理学和技术学科中有各种重要应用,因而它在各种代数分支中占居首要地位; ②在计算机广泛应用的今天,计算机图形学、计算机辅助设计、密码学、虚拟现实等技术无不以线性代数为其理论和算法基础的一部分; ③该学科所体现的几何观念与代数方法之间的联系,从具体概念抽象出来的公理化方法以及严谨的逻辑推证、巧妙的归纳综合等,对于强化人们的数学训练,增益科学智能是非常有用的; ④随着科学的发展,我们不仅要研究单个变量之间的关系,还要进一步研究多个变量之间的关系,各种实际问题在大多数情况下可以线性化,而由于计算机的发展,线性化了的问题又可以计算出来,线性代数正是解决这些问题的有力工具。 线性代数起源于对二维和三维直角坐标系的研究。在这里,一个向量是一个有方向的线段,由长度和方向同时表示。这样向量可以用来表示物理量,比如

矩阵特征值和特征向量的研究

矩阵特征值与特征向 量的研究

目录 一矩阵特征值与特征向量研究的背景及意义 (3) 二、特征值与特征向量的定义及其性质 (4) 2.1 定义 (4) 2.2 性质 (4) 三特征值及其特征向量的求法及其MATLAB的实现 (5) 3.1 QR方法 (5) 3.1.1 基本原理 (5) 3.1.2 具体实例 (5) 3.2 用多项式的方法来求解特征值 (10) 四特征值与特征向量的简单应用 (12) 五小结 (16)

一矩阵特征值与特征向量研究的背景及意义 矩阵的特征值与特征向量是高等代数的重要组成部分,通过对矩阵特征值与特征向量的性质介绍,以及对矩阵特征值与特征向量理论的分析,将特征值与特征向量应用于方程组的求解问题是高等代数中的重要内容。 随着社会到的进步,计算机的飞速发展,高等代数这门课程已经渗透到各行各业里面。在许多方面都有着很重要的应用。在多数高等代数教材中,特征值与特征向量描述为线性空间中线性变换A的特征值与特征向量。从理论上来讲只要求出线性变换A的特征值和特征向量就可以知道矩阵A的特征值和特征向量。因此求矩阵的特征值与特征向量就变得尤为重要的引入是为了研究线性空间中线性变换A的属性。 在物理,力学,工程技术中有很多问题在数学上都归结为求矩阵的特征值和特征向量的问题。现在教材中给出的求解特征值和特征性向量的方法基本上都是通过求解特方程来求解。有时候特征方程会极其的麻烦。有一些文章中虽然给了初等行列变换的方法来较少计算量,但是仍未摆脱参数行列式计算的问题。本文中我们将首先讲解有关特征值和特征向量的相关知识,另外介绍一些简单实用的方法来求解矩阵的特征值与特征向量。

求矩阵特征值算法及程序

求矩阵特征值算法及程序简介 1.幂法 1、幂法规范化算法 (1)输入矩阵A 、初始向量)0(μ ,误差eps ; (2)1?k ; (3)计算)1()(-?k k A V μ; (4))max (,) max ()1(1)(--??k k k k V m V m ; (5)k k k m V /)()(?μ; (6)如果eps m m k k <--1,则显示特征值1λ和对应的特征向量)1(x ),终止; (7)1+?k k ,转(3) 注:如上算法中的符号)max(V 表示取向量V 中绝对值最大的分量。本算法使用了数据规范化处理技术以防止计算过程中出现益出错误。 2、规范化幂法程序 Clear[a,u,x]; a=Input["系数矩阵A="]; u=Input["初始迭代向量u(0)="]; n=Length[u]; eps=Input["误差精度eps ="]; nmax=Input["迭代允许最大次数nmax="]; fmax[x_]:=Module[{m=0,m1,m2}, Do[m1=Abs[x[[k]]]; If[m1>m,m2=x[[k]];m=m1], {k,1,Length[x]}]; m2] v=a.u; m0=fmax[u]; m1=fmax[v]; t=Abs[m1-m0]//N; k=0; While[t>eps&&k

m0=m1; m1=fmax[v]; t=Abs[m1-m0]//N; Print["k=",k," 特征值=",N[m1,10]," 误差=",N[t,10]]; Print[" 特征向量=",N[u,10]]]; If[k ≥nmax,Print["迭代超限"]] 说明:本程序用于求矩阵A 按模最大的特征值及其相应特征向量。程序执行后,先通过键盘输入矩阵A 、迭代初值向量)0(μ、精度控制eps 和迭代允许最大次数max n ,程序即可给出每次迭代的次数和对应的迭代特征值、特征向量及误差序列,它们都按10位有效数输出。其中最后输出的结果即为所求的特征值和特征向量序列。如果迭代超出max n 次还没有求出满足精度的根则输出迭代超限提示,此时可以根据输出序列判别收敛情况。 程序中变量说明 a:存放矩阵A ; u:初始向量)0(μ和迭代过程中的向量)(k μ及所求特征向量; v:存放迭代过程中的向量)(k V ; m1:存放所求特征值和迭代过程中的近似特征值; nmax:存放迭代允许的最大次数; eps:存放误差精度; fmax[x]: 给出向量x 中绝对值最大的分量; k:记录迭代次数; t1:临时变量; 注:迭代最大次数可以修改为其他数字。 3、例题与实验 例1. 用幂法求矩阵???? ? ??---=9068846544 1356133A 的按模最大的特征值及其相应特征向量,要求误差410-

特征值和特征向量的几何意义是什么

特征值和特征向量的几何意义是什么? 特征向量的几何意义 特征向量确实有很明确的几何意义,矩阵(既然讨论特征向量的问题,当然是方阵,这里不讨论广义特征向量的概念,就是一般的特征向量)乘以一个向量的结果仍 是同维数的一个向量,因此,矩阵乘法对应了一个变换,把一个向量变成同维数的另一个向量,那么变换的效果是什么呢?这当然与方阵的构造有密切关系,比如可 以取适当的二维方阵,使得这个变换的效果就是将平面上的二维向量逆时针旋转30度,这时我们可以问一个问题,有没有向量在这个变换下不改变方向呢?可以想 一下,除了零向量,没有其他向量可以在平面上旋转30度而不改变方向的,所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意:特征向量不能 是零向量),所以一个变换的特征向量是这样一种向量,它经过这种特定的变换后保持方向不变,只是进行长度上的伸缩而已(再想想特征向量的原始定义Ax= cx,你就恍然大悟了,看到了吗?cx 是方阵A 对向量x 进行变换后的结果,但显然cx 和x 的方向相同),而且x 是特征向量的话,ax 也是特征向量(a 是标 量且不为零),所以所谓的特征向量不是一个向量而是一个向量族, 另外,特征值只不过反映了特征向量在变换时的伸缩倍数而已,对一个变换而言,特征向量指明的方向才是很重要的,特征值不是那么重要,虽然我们求这两个量时 先求出特征值,但特征向量才是更本质的东西! 比如平面上的一个变换,把一个向量关于横轴做镜像对称变换,即保持一个向量的横坐标不变,但纵坐标取相反数,把这个变换表示为矩阵就是 A=??? ? ??-1001 显然??? ? ??-=???? ?????? ??-b a b a 1001 这正是我们想要的效果,那么现在可以猜一下了,这个矩阵的特征向量是什么? 想想什么向量在这个变换下保持方向不变,显 然,横轴上的向量在这个变换下保持方向不变 (记住这个变换是镜像对称变换,那镜子表面上(横轴上)的向量当然不会变化) 所以可以直接猜测其特征向量是 )0( ,0≠??? ? ??a a 还有其他的吗?有,那就是纵轴上的向量,这时经过变换后,其方向反向,但仍在同一条轴上,所以也被认为是方向没有变化,所以 )0( ,0≠??? ? ??b b 也是其特征向量,去求求矩阵A 的特征向量就知道对不对了! (来自百度网站)

幂法求矩阵最大特征值

幂法求矩阵最大特征值 摘要 在物理、力学和工程技术中的很多问题在数学上都归结为求矩阵特征值的问题,而在某些工程、物理问题中,通常只需要求出矩阵的最大的特征值(即主特征值)和相应的特征向量,对于解这种特征值问题,运用幂法则可以有效的解决这个问题。 幂法是一种计算实矩阵A的最大特征值的一种迭代法,它最大的优点是方法简单。对于稀疏矩阵较合适,但有时收敛速度很慢。 用java来编写算法。这个程序主要分成了三个大部分:第一部分为将矩阵转化为线性方程组;第二部分为求特征向量的极大值;第三部分为求幂法函数块。其基本流程为幂法函数块通过调用将矩阵转化为线性方程组的方法,再经过一系列的验证和迭代得到结果。 关键词:幂法;矩阵最大特征值;j ava;迭代

POWER METHOD TO CALCULATE THE MAXIMUM EIGENV ALUE MATRIX ABSTRACT In physics, mechanics and engineering technology of a lot of problems in math boil down to matrix eigenvalue problem, and in some engineering, physical problems, usually only the largest eigenvalue of the matrix (i.e., the main characteristics of the value) and the corresponding eigenvectors, the eigenvalue problem for solution, using the power law can effectively solve the problem. Power method is A kind of computing the largest eigenvalue of real matrix A of an iterative method, its biggest advantage is simple.For sparse matrix is right, but sometimes very slow convergence speed. Using Java to write algorithms.This program is mainly divided into three most: the first part for matrix can be converted to linear equations;The second part is the eigenvector of the maximum;The third part is the exponentiation method of function block.Its basic process as a power law function block by calling the method of matrix can be converted to linear equations, then after a series of validation and iteration to get the results. Key words: Power method; Matrix eigenvalue; Java; The iteration

矩阵的特征值和特征向量

第五章矩阵的特征值和特征向量 来源:线性代数精品课程组作者:线性代数精品课程组 1.教学目的和要求: (1) 理解矩阵的特征值和特征向量的概念及性质,会求矩阵的特征值和特征向量. (2) 了解相似矩阵的概念、性质及矩阵可相似对角化的充分必要条件,会将矩阵化为相似对 角矩阵. (3) 了解实对称矩阵的特征值和特征向量的性质. 2.教学重点: (1) 会求矩阵的特征值与特征向量. (2) 会将矩阵化为相似对角矩阵. 3.教学难点:将矩阵化为相似对角矩阵. 4.教学内容: 本章将介绍矩阵的特征值、特征向量及相似矩阵等概念,在此基础上讨论矩阵的对角化问题. §1矩阵的特征值和特征向量 定义1设是一个阶方阵,是一个数,如果方程 (1) 存在非零解向量,则称为的一个特征值,相应的非零解向量称为属于特征值的特 征向量. (1)式也可写成, (2) 这是个未知数个方程的齐次线性方程组,它有非零解的充分必要条件是系数行列式 , (3) 即 上式是以为未知数的一元次方程,称为方阵的特征方程.其左端是的 次多项式,记作,称为方阵的特征多项式.

== = 显然,的特征值就是特征方程的解.特征方程在复数范围内恒有解,其个数为方程的次数(重根按重数计算),因此,阶矩阵有个特征值. 设阶矩阵的特征值为由多项式的根与系数之间的关系,不难证明 (ⅰ) (ⅱ) 若为的一个特征值,则一定是方程的根, 因此又称特征根,若为 方程的重根,则称为的重特征根.方程的每一个非 零解向量都是相应于的特征向量,于是我们可以得到求矩阵的全部特征值和特征向量的方法如下: 第一步:计算的特征多项式; 第二步:求出特征方程的全部根,即为的全部特征值; 第三步:对于的每一个特征值,求出齐次线性方程组: 的一个基础解系,则的属于特征值的全部特征向量是 (其中是不全为零的任意实数). 例1 求的特征值和特征向量. 解的特征多项式为 =

浅谈矩阵的特征向量特征值的意义

浅谈矩阵的特征向量特征值的意义 描述了矩阵的特征向量和特征值的定义,简述了矩阵的特征向量特征值在数学、物理、信息和哲学上的一些意义,对于从多角度深入理解矩阵的特征向量特征值有积极意义。 标签:线性代数;矩阵;特征向量;特征值 1 线性变换与矩阵的特征向量特征值[1] 线性变换是指一个n维列向量被左乘一个n阶矩阵后得到另一个n维列向量,它是同维向量空间中的把一个向量线性映射成了另一个向量。即 Y=AX (Y,X∈Rn A=(aij)A=(aij)n×n) 如果对于数λ,存在一个n维零列向量X(即X∈Rn且X≠0),使得 AX=?姿X 则称数λ为矩阵A的一个特征值,X为矩阵A对应于λ的特征向量。 在线性代数中研究线性变换就是研究相应的矩阵A,矩阵A的特征向量和特征值是线性变换研究的重要内容。 2 在数学上的意义 矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。这里可以将特征值为负,特征向量旋转180度,也可看成方向不变,伸缩比为负值。所以特征向量也叫线性不变量。特征向量的不变性是他们变成了与其自身共线的向量,他们所在的直线在线性变换下保持不变;特征向量和他的变换后的向量们在同一根直线上,变换后的向量们或伸长或缩短,或反向伸长或反向缩短,甚至变成零向量(特征值为零时)[2]。 对对称矩阵而言,可以求得的特征向量是正交的,就是把矩阵A所代表的空间,进行正交分解,使得A的向量集合可以表示为每个向量a在各个特征向量上面的投影长度。 例如,对于x,y平面上的一个点(x,y),我对它作线性变换A, 这个线性变换相当于关于横轴x做镜像。我们可以求出矩阵A的特征向量

矩阵特征值的意义

矩阵特征值的意义 数学里面的特征值和特征矩阵到底有什么用,它的物理意义在于什么 矩阵的特征值要想说清楚还要从线性变换入手,把一个矩阵当作一个线性变换在某一组基下的矩阵,最简单的线性变换就是数乘变换,求特征值的目的就是看看一个线性变换对一些非零向量的作用是否能够相当于一个数乘变换,特征值就是这个数乘变换的变换比,这样的一些非零向量就是特征向量,其实我们更关心的是特征向量,希望能把原先的线性空间分解成一些和特征向量相关的子空间的直和,这样我们的研究就可以分别限定在这些子空间上来进行,这和物理中在研究运动的时候将运动分解成水平方向和垂直方向的做法是一个道理! 特征值时针对方阵而言的。 两个向量只有维数相同时才能考虑相等的问题,才能有和、有差。 引入特征值与特征向量的概念 ? 引例 在一个n 输入n 输出的线性系统y=Ax 中,其中 ? 我们可发现系统A 对于某些输入x ,其输出y ? 恰巧是输入x 的 倍,即 ;对某些输入,其输出与输入就不存在这种按比例放大的关系。 ??????? ??=??????? ??=??????? ??=n n nn n n n n y y y y x x x x a a a a a a a a a A M M L L L L L L L 2121212222111211,,λx y λ=

? 例如,对系统 ,若输入 ? 则 ? ? 若输入 ,则 ? 所以,给定一个线性系统A ,到底对哪些输入,能使其输出按比例放大,放大倍数 等于多少这显然是控制论中感兴趣的问题。 基于此给出特征值与特征向量的概念: ? 定义 设A 是一个n 阶方阵,若存在着一个数 和一个非零n 维向量x ,使得 则称 是方阵A 的特征值,非零向量x 称为A 对应于特征值 的特征向量,或简称为A 的特征向量 ???? ??=4312A ? ?? ? ??=31x x Ax y 5315155314312=???? ??=???? ??=???? ?????? ??==???? ??=52x x Ax y λ≠???? ??=???? ?????? ??==269524312λx Ax λ=λλ

矩阵特征值求解

矩阵特征值求解的分值算法 12组 1.1 矩阵计算的基本问题 (1)求解线性方程组的问题.即给定一个n 阶非奇异矩阵A 和n 维向量b ,求一个n 维向量x ,使得 b Ax = (1.1.1) (2)线性最小二乘问题,即给定一个n m ?阶矩阵A 和m 维向量b ,求一个n 维向量 x ,使得 },min{n R y b Ay b Ax ∈-=- (1.1.2) (3)矩阵的特征问题,即给定一个n 阶实(复)矩阵A ,求它的部分或全部特征值以及对应的特征向量,也就是求解方程 x Ax λ= (1.1.3) 一对解(λ,x ),其中)(),(n n C R x C R ∈∈λ,即λ为矩阵A 的特征值,x 为矩阵 A 的属于特征值λ的特征向量。 在工程上,矩阵的特征值具有广泛的应用,如大型桥梁或建筑物的振动问题:机械和机件的振动问题;飞机机翼的颤振问题;无线电电子学及光学系统的电磁振动问题;调节系统的自振问题以及声学和超声学系统的振动问题.又如天文、地震、信息系统、经济学中的一些问题都与矩阵的特征值问题密切相关。 在科学上,计算流体力学、统计计算、量子力学、化学工程和网络排队的马尔可夫链模拟等实际问题,最后也都要归结为矩阵的特征值问题.由于特征值问题在许多科学和工程领域中具有广泛的应用,因此对矩阵的特征值问题的求解理论研究算法的开发软件的制作等是当今计算数学和科学与工程计算研究领域的重大课题,国际上这方面的研究工作十分活跃。 1.2 矩阵的特征值问题研究现状及算法概述 对一个n n ?阶实(复)矩阵A,它的特征值问题,即求方程(I.1.3)式的非平凡解,是数值线性代数的一个中心问题.这一问题的内在非线性给计算特征值带来许多计算问题.为了求(l.1.3)式中的λ,一个简单的想法就是显式地求解特征方程 0)det(=-I A λ (1.2.1) 除非对于个别的特殊矩阵,由于特征方程的系数不能够用稳定的数值方法由行列式的计算来求得,既使能精确计算出特征方程的系数,在有限精度下,其特征多项式)det()(I A f λλ-=的根可能对多项式的系数非常敏感.因此,这个方法只能在理论上是有意义的,实际计算中对一般矩阵是不可行的.首先,若矩阵A 的阶数较大,则行列式)det(I A λ-的计算量将非常大;其次,根据Galois 理论,对于次数大于四的多项式求根不存在一种通用的方法,基于上述原因,人们只能寻求其它途径.因此,如何有效地!精确地求解矩阵特征值问题,就成为数值线性代数领

判断矩阵的最大特征值

项目六 矩阵的特征值与特征向量 实验1 求矩阵的特征值与特征向量 实验目的 学习利用Mathematica(4.0以上版本)命令求方阵的特征值和特征向量;能利用软件计算方 阵的特征值和特征向量及求二次型的标准形. 求方阵的特征值与特征向量. 例1.1 (教材 例1.1) 求矩阵.031121201???? ? ??--=A 的特征值与特值向量. (1) 求矩阵A 的特征值. 输入 A={{-1,0,2},{1,2,-1},{1,3,0}} MatrixForm[A] Eigenvalues[A] 则输出A 的特征值 {-1,1,1} (2) 求矩阵A 的特征向量. 输入 A={{-1,0,2},{1,2,-1},{1,3,0}} MatrixForm[A] Eigenvectors[A] 则输出 {{-3,1,0},{1,0,1},{0,0,0}} 即A 的特征向量为.101,013???? ? ??????? ??- (3) 利用命令Eigensystem 同时矩阵A 的所有特征值与特征向量. 输入 A={{-1,0,2},{1,2,-1},{1,3,0}} MatrixForm[A] Eigensystem[A] 则输出矩阵A 的特征值及其对应的特征向量. 例1.2 求矩阵???? ? ??=654543432A 的特征值与特征向量. 输入 A=Table[i+j,{i,3},{j,3}]

MatrixForm[A] (1) 计算矩阵A 的全部(准确解)特征值, 输入 Eigenvalues[A] 则输出 {0, 426-,426+} (2) 计算矩阵A 的全部(数值解)特征值, 输入 Eigenvalues[N[A]] 则输出 {12.4807, -0.480741, -1.34831610-?} (3) 计算矩阵A 的全部(准确解)特征向量, 输入 Eigenvectors[A]//MatrixForm 则输出 (4) 计算矩阵A 的全部(数值解)特征向量, 输入 Eigenvectors[N[A]]//MatrixForm 则输出 (5) 同时计算矩阵A 的全部(准确解)特征值和特征向量, 输入 OutputForm[Eigensystem[A]] 则输出所求结果 (6) 计算同时矩阵A 的零空间, 输入 NullSpace[A] 则输出 {{1,-2,1}} (7) 调入程序包<

特征值和特征向量的物理意义

ABSTRACT: 特征向量:它经过这种特定的变换后保持方向不变。只是进行长度上的伸缩而已。 特征值:一个变换(矩阵)可由它的所有特征向量完全表示,而每一个向量所对应的特征值,就代表了矩阵在这一向量上的贡献率——说的通俗一点就是能量(power)。 内积:内积可以简单的理解为两个函数的相似程度,内积值越大表示两个函数相似程度越大,内积为零表示完全不相似。两个函数内积为零则两个函数正交,在三维空间中它们的夹角为90度,在三维以上不是这样的。 CONTENT 矩阵(既然讨论特征向量的问题。当然是方阵。这里不讨论广义特征向量的概念)乘以一个向量的结果仍是同维数的一个向量。因此。矩阵乘法对应了一个变换。把一个向量变成同维数的另一个向量。那么变换的效果是什么呢?这当然与方阵的构造有密切关系。比如可以取适当的二维方阵。使得这个变换的效果就是将平面上的二维向量逆时针旋转30度。这时我们可以问一个问题。有没有向量在这个变换下不改变方向呢?可以想一下。除了零向量。没有其他向量可以在平面上旋转30度而不改变方向的。所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意:特征向量不能是零向量)。所以一个变换的特征向量是这样一种向量。它经过这种特定的变换后保持方向不变。只是进行长度上的伸缩而已(再想想特征向量的原始定义Ax= cx。你就恍然大悟了。看到了吗?cx是方阵A 对向量x进行变换后的结果。但显然cx和x的方向相同)。而且x是特征向量的话。ax也是特征向量(a是标量且不为零)。所以所谓的特征向量不是一个向量而是一个向量族。另外。特征值只不过反映了特征向量在变换时的伸缩倍数而已。对一个变换而言。特征向量指明的方向才是很重要的。特征值不是那么重要。虽然我们求这两个量时先求出特征值。但特征向量才是更本质的东西! 比如平面上的一个变换。把一个向量关于横轴做镜像对称变换。即保持一个向量的横坐标不变。但纵坐标取相反数。把这个变换表示为矩阵就是[1 0;0 -1]。其中分号表示换行。显然[1 0;0 -1]*[a b]'=[a –b]'。其中上标' 表示取转置。这正是我们想要的效果。那么现在可以猜一下了。这个矩阵的特征向量是什么?想想什么向量在这个变换下保持方向不变。显然,横轴上的向量在这个变换下保持方向不变(记住这个变换是镜像对称变换。那镜子表面上(横轴上)的向量当然不会变化)。所以可以直接猜测其特征向量是[a 0]'(a不为0)。还有其他的吗?有。那就是纵轴上的向量。这时经过变换后。其方向反向。但仍在同一条轴上。所以也被认为是方向没有变化。 当我们引用了Spectral theorem(谱定律)的时候,情况就不一样了。Spectral theorem的核心内容如下:一个线性变换A(用矩阵乘法表示)可表示为它的所

特征值和特征向量的物理意义

特征向量体现样本之间的相关程度,特征值则反映了散射强度。 特征向量的几何意义 .矩阵(既然讨论特征向量的问题 .当然是方阵 .这里不讨论广义特征向量的概念)乘以一个向量的结果仍是同维数的一个向量 .因此 .矩阵乘法对应了一个变换 .把一个向量变成同维数的另一个向量.那么变换的效果是什么呢 ?这当然与方阵的构造有密切关系 .比如可以取适当的二维方阵 .使得这个变换的效果就是将平面上的二维向量逆时针旋转30 度 .这时我们可以问一个问题 .有没有向量在这个变换下不 改变方向呢 ?可以想一下 .除了零向量 .没有其他向量可以在平面上旋转 30 度而不改变方向的 .所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意 :特征向量不能是零向量).所以一个变换的特征向量是这样一种向量 .它经过这种特定的变换后保持方向不变 .只是进行长度上的伸缩而已(再想想特征向量的原始定义 Ax= cx. 你就恍然大悟了 .看到了吗 ?cx 是方阵 A 对向量 x 进行变换后的结果 .但显然 cx 和 x 的方向相同).而且 x 是特征向量的话 .ax也是特征向量(a 是标量且不为零).所以所谓的特征向量不是一个向量而是一个向量族 . 另外 .特征值只不过反映了特征向量在变换时的伸缩倍数而已.对一个变换而言 .特征向量指明的 方向才是很重要的 .特征值不是那么重要 . 虽然我们求这两个量时先求出特征值 .但特征向量才是更本质的东西! 比如平面上的一个变换 .把一个向量关于横轴做镜像对称变换 .即保持一个向量的横坐标不变 .但纵坐标取相反数.把这个变换表示为矩阵就是[ 1 0,0 -1].其中分号表示换行 .显然[ 1 0,0 -1]*[ a b]'=[a -b]'. 其中上标'表示取转置 .这正是我们想要的效果 .那么现在可以猜一下了 .这个矩阵的特征向量是什么 ?想想什么向量在这个变换下保持方向不变 .显然.横轴上的向量在这个变换下保持方向不变(记住这个变换是镜像 对称变换 .那镜子表面上(横轴上)的向量当然不会变化).所以可以直接猜测其特征向量是[a 0]'(a不为 0). 还有其他的吗 ?有 .那就是纵轴上的向量 .这时经过变换后 .其方向反向 .但仍在同一条轴上 .所以也被认为是方向没有变化。 综上,特征值只不过反映了特征向量在变换时的伸缩倍数而已,对一个变换而言,特征向量指明的方向才是很重要的,特征值似乎不是那么重要;但是,当我们引用了Spectral theorem(谱定律)的时候,情况就 不一样了。 Spectral theorem 的核心容如下:一个线性变换(用矩阵乘法表示)可表示为它的所有的特征向量的一个线性组合,其中的线性系数就是每一个向量对应的特征值,写成公式就是: T(V)= λ1(V 1.V)V 1+λ2(V 2.V)V 2+λ3(V 3.V)V 3+... 从这里我们可以看出,一个变换(矩阵)可由它的所有特征向量完全表示,而每一个向量所对应的特征值,就代表了矩阵在这一向量上的贡献率——说的通俗一点就是能量( power),至此,特征值翻身做主人,彻底掌握了对特征向量的主动:你所能够代表这个矩阵的能量高低掌握在我手中,你还吊什么吊?我们知道,一个变换可由一个矩阵乘法表示,那么一个空间坐标系也可视作一个矩阵,而这个坐标系就可由这个矩阵的所有特征向量表示,用图来表示的话,可以想象就是一个空间开的各个坐标角度,这一组向量可以完全表示一个矩阵表示的空间的“特征”,而他们的特征值就表示了各个角度上的能量(可以想象成从各个角度上伸出的长短,越长的轴就越可以代表这个空间,它的 “特征”就越强,或者说显性,而短轴自然就成了隐性特征),因此,通过特征向量 /值可以完全描述某一几何空间这一特点,使得特征向量与特征值在几何(特别是空间几何)及其应用中得以发挥。 关于特征向量(特别是特征值)的应用实在是太多太多,近的比如俺曾经提到过的 PCA 方法,选取特征值最高的 k 个特征向量来表示一个矩阵,从而达到降维分析+ 特征显示的方法;近的比如 Google 公司的成名作 PageRank,也是通过计算一个用矩阵表示的图(这个图代表了整个 Web 各个网页“节点”之间的关联)的特征向量来对每一个节点打“特征值”分;再比如很多人脸识别,数据流模式挖掘分析等方面,都有应用,

矩阵特征值的运算性质及推广

矩阵特征值的运算性质及推广 摘要:本篇论文主要从五方面来进行讲解:引言;矩阵特征值的性质;矩阵特征值的应用推广;分块矩阵的性质;分块矩阵特征值应用推广。 由于本篇论文是要以矩阵特征值性质的应用为主题,首先介绍总结了矩阵的一些基本概念及矩阵基本运算,然后在文中着重阐述了矩阵特征值性质,罗列出相关引理并予以证明,然后通过五种类型的矩阵特征值的应用例子将矩阵特征值的运算性质进行推广。将矩阵拓展到分块矩阵,讨论分块矩阵的性质及应用. 关键词:矩阵,特征值,特征向量,特征方程,特征多项式 The Operation Properties and Promotion of Eigenvalue Cui haiyang (Institute of Computer Science, Math) Abstract Three aspects to this thesis to explain: Introduction; matrix eigenvalue nature; promote the application of Matrix Eigenvalues. Because of this paper is a matrix eigenvalue to the application of the nature of the theme first introduced some basic concepts of matrix and the matrix of basic operations, and then in the text focuses on the eigenvalue properties, set out the relevant Yin Li, and to prove it. Finally, five types of application examples Eigenvalue Eigenvalue computation will be the nature of promotion. Key words:Matrix , Eigenvalue, Eigenvectors, Characteristic equation,Characteristic polynomial 1引言 矩阵计算领域在不断的发展和成熟,作为一门数学学科,它是众多理工学科重要的数学工具,矩阵理论既是经典数学的基础课程,是数学的一个重要且目前仍然非常活跃的领域,又是一门最有实用价值的数学理论,是计算机科学与工

矩阵特征值的计算论文

矩阵特征值的计算方法 SUMMARY : This passage is mainly talking about several digital method to get the eigenvalue of certain matrix,since the eigenvalue is of the most importance to study the matrix linear transformation.First,we come up with the difination of eigenvalue and eigenvector,by which the basic way ——eigenfunction ——is got. Because of the limitation of eigenfunction ,another two means are introduced.Here we can see how these means works.. 内容概要: 由于特征值在矩阵的线性变换中具有重要作用,所以本文主要介绍几种求解某个特定矩阵特征值的方法。文章开始引出了特征值和特征向量的概念,从这个概念出发我们可以得到一种求解的最基本的方法——利用特征函数。但是,这个方法有很多缺陷,而且很难在计算机上实现,为此,我们在这里提出了另外两种方法。本文也就是这两种方法的介绍。 关键字:特征值 特征向量 特征方程 变换法求解 基本幂法 收敛性 一:问题的引入: 我们知道对于在实际的数学应用中矩阵占有重要位置。而线形变换又是矩阵的一种重要运算方式。我们为了利用矩阵来研究线形变换,对于每一个给定的线形变换,我们希望能找到一组基使得它的矩阵具有最简单的形式。为此,我们就必须研究在这个过程中占重要位置的一个概念矩阵的特征值的计算方法。 定义:设A 是数域P 上线性空间V 的一个线性变换,如果对于数域P 中一数λ,存在一个非零向量ξ,使得 A ξ=λξ (1) 那么λ称为A 的一个特征值,而ξ称为A 的属于特征值λ的一个特征向量。从几何上来看,特征向量的方向经过线性变换后,保持在同一条直线上,这时或者方向不变(λ)0)或者方向反向(λ<0),至于λ=0时,特征向量就被线性变换成0。 二:问题的求解 1.利用特征方程求解: 下来我们来寻找求解特征值的方法。设V 是数域P 上n 维线性空间,1ε,2ε,……,n ε是它的一组基,线性变换A 在这组基下的矩阵为A 。设0λ是特征值,它的一个特征向量ξ在1ε,2ε,……,n ε下的坐标是,,0201x x ……n x 0,。 则A ξ的坐标是: ??? ???? ??n x x x A 00201...,0λA 的坐标是:???? ?? ? ??n x x x 002010 ...λ

相关文档