毕业论文开题报告 数学与应用数学 矩阵特征值、特征向量的研究 一、选题的背景、意义 (1)选题的背景、意义 “矩阵(Matrix)”术语是由西尔维斯特创用并由凯莱首先明确其概念的。19世纪50年代,西尔维斯特引入“矩阵”一词来表示“一项由几行H列元素组成的矩形阵列”或“各种行列式组”,凯莱作为矩阵理论的创立者,首先为简化记法引进矩阵,然后系统地阐述了矩阵的理论体系。随后,弗罗伯纽斯等人发展完善了矩阵的理论体系形成了矩阵的现代理论。然而,矩阵思想的萌芽由来已久,早在公元前l世纪中国的《九章算术》就已经用到类似于矩阵的名词。但那时矩阵仅是用来作为一种矩形阵列解决实际问题,并没有建立起独立完善的矩阵理论。18世纪末到19世纪中叶,这种排列形式在线性方程组和行列式计算中应用日益广泛,行列式等理论的发展提供了矩阵发展的条件,矩阵概念由此产生,矩阵理论得到系统的发展。20世纪初,无限矩阵理论得到进一步发展[]1。 线性代数(Linear Algebra)是数学的一个分支,它的研究对象是向量,向量空间(或称线性空间),线性变换和有限维的线性方程组。向量空间是现代数学的一个重要课题;因而,线性代数被广泛地应用于抽象代数和泛函分析中;通过解析几何,线性代数得以被具体表示。线性代数的理论已被泛化为算子理论。由于科学研究中的非线性模型通常可以被近似为线性模型,使得线性代数被广泛地应用于自然科学和社会科学中[]2。 由于费马和笛卡儿的工作,线性代数基本上出现于十七世纪。直到十八世纪末,线性代数的领域还只限于平面与空间。十九世纪上半叶才完成了到n维向量
空间的过渡矩阵论始于凯莱,在十九世纪下半叶,因若当的工作而达到了它的顶点。1888年,皮亚诺以公理的方式定义了有限维或无限维向量空间。托普利茨将线性代数的主要定理推广到任意体上的最一般的向量空间中.线性映射的概念在大多数情况下能够摆脱矩阵计算而引导到固有的推理,即是说不依赖于基的选择。不用交换体而用未必交换之体或环作为算子之定义域,这就引向模的概念,这一概念很显著地推广了向量空间的理论和重新整理了十九世纪所研究过的情况。 “代数”这一个词在我国出现较晚,在清代时才传入中国,当时被人们译成“阿尔热巴拉”,直到1859年,清代著名的数学家、翻译家李善兰才将它翻译成为“代数学”,一直沿用至今[]3[]4。 线性代数是讨论矩阵理论、与矩阵结合的有限维向量空间及其线性变换理论的一门学科。 (2)国内外研究现状和发展趋势 主要理论成熟于十九世纪,而第一块基石(二、三元线性方程组的解法)则早在两千年前出现(见于我国古代数学名著《九章算术》)[]5。 ①线性代数在数学、力学、物理学和技术学科中有各种重要应用,因而它在各种代数分支中占居首要地位; ②在计算机广泛应用的今天,计算机图形学、计算机辅助设计、密码学、虚拟现实等技术无不以线性代数为其理论和算法基础的一部分; ③该学科所体现的几何观念与代数方法之间的联系,从具体概念抽象出来的公理化方法以及严谨的逻辑推证、巧妙的归纳综合等,对于强化人们的数学训练,增益科学智能是非常有用的; ④随着科学的发展,我们不仅要研究单个变量之间的关系,还要进一步研究多个变量之间的关系,各种实际问题在大多数情况下可以线性化,而由于计算机的发展,线性化了的问题又可以计算出来,线性代数正是解决这些问题的有力工具。 线性代数起源于对二维和三维直角坐标系的研究。在这里,一个向量是一个有方向的线段,由长度和方向同时表示。这样向量可以用来表示物理量,比如
第十二讲 矩阵特征值估计 特征值计算较困难,希望找到简便的特征值界限或分布范围的估计方法。 一、 特征值界的估计 定理1. 设n n A R ?∈,λ为A 的任意特征值,则有 () Im M λ≤其中,ij ji 1i ,j n a a M m a x 2 ≤≤-= 证明:设x 为A 的属于特征值λ的单位特征向量,即A x x =λ, H x x 1=, 则 H x A x λ= → ( ) () H H H H H x A x x A x x A x λ== = () ()()H H H T 2jIm x A A x x A A x λ-λ=λ=-=- 将x 写成[] T 12n x ,,,=ξξξ ()()n n H T i ij ji j i 1 j 1 x A A x a a ==-=ξ-ξ∑∑ () ()()n n i ij ji j i 1j 1 n n i ij ji j i 1 j 1 2I m a a a a ====λ= ξ-ξ≤ ξ-ξ∑∑ ∑∑ n ' i j ij ji i ,j 1 a a == ξξ-∑ ('∑表示不含i =j ) n ' i j i ,j 1 2M =≤ξξ∑ () 2 n 2 2 ' i j i ,j 1 I m M =? ?λ≤ξξ ? ? ? ∑
() n 2 2 ' i j i ,j 1M n n 1=≤-ξξ∑ () n 2 2 2 ' i j i ,j 1M n n 1==-ξξ∑ n n n n n 2 2 2 2 4 2 4 ' i j i j i i i i ,j 1 i ,j 1 i 1 i 1 i 1 =====ξξ= ξξ- ξ≤ ξ- ξ∑ ∑ ∑ ∑ ∑ ( )n 2 2 i i i 11== ξ-ξ∑ 不妨写为: ( ) ( ) ( )n 2 222 2 2 1 1 2 2 i i i 3 111==ξ-ξ +ξ -ξ + ξ -ξ∑ ( )( )( )2 2 2 2 2 2 n 11 22 2 2 i i i 3 1112 2 =????ξ +-ξξ +-ξ ? ? ≤++ ξ-ξ ? ? ? ???? ? ∑ 12 ≤ 取等号的条件为2 2 1 2 12 ξ=ξ= ,但 2 x 1 =,所以其它2 i ξ= ∴ () Im M λ≤定理2. 设n n A R ?∈,λ为A 的任意特征值,则有 n λ≤ρ ()R e n λ≤τ () I m n s λ≤ 其中,ij 1i,j n m a x a ≤≤ρ =,ij ji 1i,j n m a x a a ≤≤τ =+,ij ji 1i,j n s m a x a a ≤≤=- 二、 盖尔圆法 定义:设() n n ij n n A a C ??= ∈,由方程 n ii i ij j 1 i j z a R a =≠-≤= ∑ 所确定的圆称 为A 的第i 个盖尔圆,i R 称为盖尔圆的半径。
求矩阵特征值算法及程序简介 1.幂法 1、幂法规范化算法 (1)输入矩阵A、初始向量( 0),误差eps; (2) k 1; (3)计算V(k)A(k 1); (4)m k max(V(k)) ,m k1max( V ( k 1)); (5) (k)V(k)/m k; (6)如果m k m k 1eps,则显示特征值1和对应的特征向量x(1) ),终止; (7)k k 1, 转(3) 注:如上算法中的符号max(V )表示取向量V 中绝对值最大的分量。本算法使用了数据规范化处理技术以防止计算过程中出现益出错误。 2、规范化幂法程序 Clear[a,u,x]; a=Input[" 系数矩阵A="]; u=Input[" 初始迭代向量u(0)="]; n=Length[u]; eps=Input[" 误差精度eps ="]; nmax=Input[" 迭代允许最大次数nmax="]; fmax[x_]:=Module[{m=0,m1,m2}, Do[m1=Abs[x[[k]]]; If[m1>m,m2=x[[k]];m=m1], {k,1,Length[x]}]; m2] v=a.u; m0=fmax[u]; m1=fmax[v]; t=Abs[m1-m0]//N; k=0; While[t>eps&&k 矩阵特征值与特征向 量的研究 目录 一矩阵特征值与特征向量研究的背景及意义 (3) 二、特征值与特征向量的定义及其性质 (4) 2.1 定义 (4) 2.2 性质 (4) 三特征值及其特征向量的求法及其MATLAB的实现 (5) 3.1 QR方法 (5) 3.1.1 基本原理 (5) 3.1.2 具体实例 (5) 3.2 用多项式的方法来求解特征值 (10) 四特征值与特征向量的简单应用 (12) 五小结 (16) 一矩阵特征值与特征向量研究的背景及意义 矩阵的特征值与特征向量是高等代数的重要组成部分,通过对矩阵特征值与特征向量的性质介绍,以及对矩阵特征值与特征向量理论的分析,将特征值与特征向量应用于方程组的求解问题是高等代数中的重要内容。 随着社会到的进步,计算机的飞速发展,高等代数这门课程已经渗透到各行各业里面。在许多方面都有着很重要的应用。在多数高等代数教材中,特征值与特征向量描述为线性空间中线性变换A的特征值与特征向量。从理论上来讲只要求出线性变换A的特征值和特征向量就可以知道矩阵A的特征值和特征向量。因此求矩阵的特征值与特征向量就变得尤为重要的引入是为了研究线性空间中线性变换A的属性。 在物理,力学,工程技术中有很多问题在数学上都归结为求矩阵的特征值和特征向量的问题。现在教材中给出的求解特征值和特征性向量的方法基本上都是通过求解特方程来求解。有时候特征方程会极其的麻烦。有一些文章中虽然给了初等行列变换的方法来较少计算量,但是仍未摆脱参数行列式计算的问题。本文中我们将首先讲解有关特征值和特征向量的相关知识,另外介绍一些简单实用的方法来求解矩阵的特征值与特征向量。 第三部分 矩阵特征值的估计 引言: 矩阵特征值的计算与估计在理论上和实际应用中都是很重要的,但要精确计算特征值并非总是可能的,即使在某些特殊情况下有可能,可是付出的代价也是很大的。幸好在许多应用中并不需要精确计算矩阵的特征值,而只需有一个粗略的估计就够了。比如:在线性系统理论中,通过估计系统矩阵A 的特征值是否有负实部,便可判定系统的稳定性;当研究一个迭代法的收敛性时便要判断迭代矩阵的特征值是否都落在单位圆内;在差分方程的稳定性理论以及自动控制理论中都需要估计矩阵的特征值是否在复平面上的某一确定的区域中。 §1. 特征值的界的估计 引理1. n 阶复矩阵A ,酉相似于一个上(或下)三角矩阵,且三角矩阵的对角线元素是A 的特征值。即存在一个酉矩阵U 和三角矩阵T ,使T AU U T = 引理2. 设n n n n ij C a A ??∈=)(,则∑∑====n i n j F ij H A a AA tr 11 2 2 )( Proof :设n n ij H b AA B ?==)(则 ∑∑===++==n j j n n n j j j a a a a a a a a a b 1 2 11112121 11111111 ∑∑====n j j n j j j a a a b 1 2 21 2222 ∑∑====n j ij n j ij ij ii a a a b 12 1 ∑∑∑======n i n j ij n i ii H a b B tr AA tr 11 2 1 )()( 引理3. A 为正规矩阵?A 酉相似于对角矩阵。 (注:正规矩阵:A A A A H H ?=?)即存在酉矩阵U 使 ),,,(21n H diag AU U λλλ = Th 1.设A 为n 阶矩阵,n λλλ,,,21 为其特征值,则: ?=≤∑∑∑===n i n i n j F ij i A a 1 11 2 2 2 λA 为正规矩阵,等号成立。 Proof:由引理1.存在酉阵U ,使T AU U H =(三角阵)——① 对①两边取共轭转置:U A U AU U T H H H H H ==)(——② ①?②得 H H H H T T U A U AU U ?=?)()( H H H T T U AA U ?=?(为酉阵) )()()(H H H H T T tr AA tr U AA U tr ?==? 即∑∑∑∑∑∑=======≥=n i n j n i n i i ii ij n i n j ij t t a 11 1 1 2 2 2 11 2 λ 设n n C A ?∈,令2 ,2H H A A C A A B -=+=, 则A =B +C : 其中B 为Hermit 阵(即H B B =)实 C 为反Hermit 阵(即H C C -=)虚 特征值和特征向量的几何意义是什么? 特征向量的几何意义 特征向量确实有很明确的几何意义,矩阵(既然讨论特征向量的问题,当然是方阵,这里不讨论广义特征向量的概念,就是一般的特征向量)乘以一个向量的结果仍 是同维数的一个向量,因此,矩阵乘法对应了一个变换,把一个向量变成同维数的另一个向量,那么变换的效果是什么呢?这当然与方阵的构造有密切关系,比如可 以取适当的二维方阵,使得这个变换的效果就是将平面上的二维向量逆时针旋转30度,这时我们可以问一个问题,有没有向量在这个变换下不改变方向呢?可以想 一下,除了零向量,没有其他向量可以在平面上旋转30度而不改变方向的,所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意:特征向量不能 是零向量),所以一个变换的特征向量是这样一种向量,它经过这种特定的变换后保持方向不变,只是进行长度上的伸缩而已(再想想特征向量的原始定义Ax= cx,你就恍然大悟了,看到了吗?cx 是方阵A 对向量x 进行变换后的结果,但显然cx 和x 的方向相同),而且x 是特征向量的话,ax 也是特征向量(a 是标 量且不为零),所以所谓的特征向量不是一个向量而是一个向量族, 另外,特征值只不过反映了特征向量在变换时的伸缩倍数而已,对一个变换而言,特征向量指明的方向才是很重要的,特征值不是那么重要,虽然我们求这两个量时 先求出特征值,但特征向量才是更本质的东西! 比如平面上的一个变换,把一个向量关于横轴做镜像对称变换,即保持一个向量的横坐标不变,但纵坐标取相反数,把这个变换表示为矩阵就是 A=??? ? ??-1001 显然??? ? ??-=???? ?????? ??-b a b a 1001 这正是我们想要的效果,那么现在可以猜一下了,这个矩阵的特征向量是什么? 想想什么向量在这个变换下保持方向不变,显 然,横轴上的向量在这个变换下保持方向不变 (记住这个变换是镜像对称变换,那镜子表面上(横轴上)的向量当然不会变化) 所以可以直接猜测其特征向量是 )0( ,0≠??? ? ??a a 还有其他的吗?有,那就是纵轴上的向量,这时经过变换后,其方向反向,但仍在同一条轴上,所以也被认为是方向没有变化,所以 )0( ,0≠??? ? ??b b 也是其特征向量,去求求矩阵A 的特征向量就知道对不对了! (来自百度网站) 浅谈矩阵的特征向量特征值的意义 描述了矩阵的特征向量和特征值的定义,简述了矩阵的特征向量特征值在数学、物理、信息和哲学上的一些意义,对于从多角度深入理解矩阵的特征向量特征值有积极意义。 标签:线性代数;矩阵;特征向量;特征值 1 线性变换与矩阵的特征向量特征值[1] 线性变换是指一个n维列向量被左乘一个n阶矩阵后得到另一个n维列向量,它是同维向量空间中的把一个向量线性映射成了另一个向量。即 Y=AX (Y,X∈Rn A=(aij)A=(aij)n×n) 如果对于数λ,存在一个n维零列向量X(即X∈Rn且X≠0),使得 AX=?姿X 则称数λ为矩阵A的一个特征值,X为矩阵A对应于λ的特征向量。 在线性代数中研究线性变换就是研究相应的矩阵A,矩阵A的特征向量和特征值是线性变换研究的重要内容。 2 在数学上的意义 矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。这里可以将特征值为负,特征向量旋转180度,也可看成方向不变,伸缩比为负值。所以特征向量也叫线性不变量。特征向量的不变性是他们变成了与其自身共线的向量,他们所在的直线在线性变换下保持不变;特征向量和他的变换后的向量们在同一根直线上,变换后的向量们或伸长或缩短,或反向伸长或反向缩短,甚至变成零向量(特征值为零时)[2]。 对对称矩阵而言,可以求得的特征向量是正交的,就是把矩阵A所代表的空间,进行正交分解,使得A的向量集合可以表示为每个向量a在各个特征向量上面的投影长度。 例如,对于x,y平面上的一个点(x,y),我对它作线性变换A, 这个线性变换相当于关于横轴x做镜像。我们可以求出矩阵A的特征向量 矩阵特征值的意义 数学里面的特征值和特征矩阵到底有什么用,它的物理意义在于什么 矩阵的特征值要想说清楚还要从线性变换入手,把一个矩阵当作一个线性变换在某一组基下的矩阵,最简单的线性变换就是数乘变换,求特征值的目的就是看看一个线性变换对一些非零向量的作用是否能够相当于一个数乘变换,特征值就是这个数乘变换的变换比,这样的一些非零向量就是特征向量,其实我们更关心的是特征向量,希望能把原先的线性空间分解成一些和特征向量相关的子空间的直和,这样我们的研究就可以分别限定在这些子空间上来进行,这和物理中在研究运动的时候将运动分解成水平方向和垂直方向的做法是一个道理! 特征值时针对方阵而言的。 两个向量只有维数相同时才能考虑相等的问题,才能有和、有差。 引入特征值与特征向量的概念 ? 引例 在一个n 输入n 输出的线性系统y=Ax 中,其中 ? 我们可发现系统A 对于某些输入x ,其输出y ? 恰巧是输入x 的 倍,即 ;对某些输入,其输出与输入就不存在这种按比例放大的关系。 ??????? ??=??????? ??=??????? ??=n n nn n n n n y y y y x x x x a a a a a a a a a A M M L L L L L L L 2121212222111211,,λx y λ= ? 例如,对系统 ,若输入 ? 则 ? ? 若输入 ,则 ? 所以,给定一个线性系统A ,到底对哪些输入,能使其输出按比例放大,放大倍数 等于多少这显然是控制论中感兴趣的问题。 基于此给出特征值与特征向量的概念: ? 定义 设A 是一个n 阶方阵,若存在着一个数 和一个非零n 维向量x ,使得 则称 是方阵A 的特征值,非零向量x 称为A 对应于特征值 的特征向量,或简称为A 的特征向量 ???? ??=4312A ? ?? ? ??=31x x Ax y 5315155314312=???? ??=???? ??=???? ?????? ??==???? ??=52x x Ax y λ≠???? ??=???? ?????? ??==269524312λx Ax λ=λλ 矩阵特征值求解的分值算法 12组 1.1 矩阵计算的基本问题 (1)求解线性方程组的问题.即给定一个n 阶非奇异矩阵A 和n 维向量b ,求一个n 维向量x ,使得 b Ax = (1.1.1) (2)线性最小二乘问题,即给定一个n m ?阶矩阵A 和m 维向量b ,求一个n 维向量 x ,使得 },min{n R y b Ay b Ax ∈-=- (1.1.2) (3)矩阵的特征问题,即给定一个n 阶实(复)矩阵A ,求它的部分或全部特征值以及对应的特征向量,也就是求解方程 x Ax λ= (1.1.3) 一对解(λ,x ),其中)(),(n n C R x C R ∈∈λ,即λ为矩阵A 的特征值,x 为矩阵 A 的属于特征值λ的特征向量。 在工程上,矩阵的特征值具有广泛的应用,如大型桥梁或建筑物的振动问题:机械和机件的振动问题;飞机机翼的颤振问题;无线电电子学及光学系统的电磁振动问题;调节系统的自振问题以及声学和超声学系统的振动问题.又如天文、地震、信息系统、经济学中的一些问题都与矩阵的特征值问题密切相关。 在科学上,计算流体力学、统计计算、量子力学、化学工程和网络排队的马尔可夫链模拟等实际问题,最后也都要归结为矩阵的特征值问题.由于特征值问题在许多科学和工程领域中具有广泛的应用,因此对矩阵的特征值问题的求解理论研究算法的开发软件的制作等是当今计算数学和科学与工程计算研究领域的重大课题,国际上这方面的研究工作十分活跃。 1.2 矩阵的特征值问题研究现状及算法概述 对一个n n ?阶实(复)矩阵A,它的特征值问题,即求方程(I.1.3)式的非平凡解,是数值线性代数的一个中心问题.这一问题的内在非线性给计算特征值带来许多计算问题.为了求(l.1.3)式中的λ,一个简单的想法就是显式地求解特征方程 0)det(=-I A λ (1.2.1) 除非对于个别的特殊矩阵,由于特征方程的系数不能够用稳定的数值方法由行列式的计算来求得,既使能精确计算出特征方程的系数,在有限精度下,其特征多项式)det()(I A f λλ-=的根可能对多项式的系数非常敏感.因此,这个方法只能在理论上是有意义的,实际计算中对一般矩阵是不可行的.首先,若矩阵A 的阶数较大,则行列式)det(I A λ-的计算量将非常大;其次,根据Galois 理论,对于次数大于四的多项式求根不存在一种通用的方法,基于上述原因,人们只能寻求其它途径.因此,如何有效地!精确地求解矩阵特征值问题,就成为数值线性代数领 ABSTRACT: 特征向量:它经过这种特定的变换后保持方向不变。只是进行长度上的伸缩而已。 特征值:一个变换(矩阵)可由它的所有特征向量完全表示,而每一个向量所对应的特征值,就代表了矩阵在这一向量上的贡献率——说的通俗一点就是能量(power)。 内积:内积可以简单的理解为两个函数的相似程度,内积值越大表示两个函数相似程度越大,内积为零表示完全不相似。两个函数内积为零则两个函数正交,在三维空间中它们的夹角为90度,在三维以上不是这样的。 CONTENT 矩阵(既然讨论特征向量的问题。当然是方阵。这里不讨论广义特征向量的概念)乘以一个向量的结果仍是同维数的一个向量。因此。矩阵乘法对应了一个变换。把一个向量变成同维数的另一个向量。那么变换的效果是什么呢?这当然与方阵的构造有密切关系。比如可以取适当的二维方阵。使得这个变换的效果就是将平面上的二维向量逆时针旋转30度。这时我们可以问一个问题。有没有向量在这个变换下不改变方向呢?可以想一下。除了零向量。没有其他向量可以在平面上旋转30度而不改变方向的。所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意:特征向量不能是零向量)。所以一个变换的特征向量是这样一种向量。它经过这种特定的变换后保持方向不变。只是进行长度上的伸缩而已(再想想特征向量的原始定义Ax= cx。你就恍然大悟了。看到了吗?cx是方阵A 对向量x进行变换后的结果。但显然cx和x的方向相同)。而且x是特征向量的话。ax也是特征向量(a是标量且不为零)。所以所谓的特征向量不是一个向量而是一个向量族。另外。特征值只不过反映了特征向量在变换时的伸缩倍数而已。对一个变换而言。特征向量指明的方向才是很重要的。特征值不是那么重要。虽然我们求这两个量时先求出特征值。但特征向量才是更本质的东西! 比如平面上的一个变换。把一个向量关于横轴做镜像对称变换。即保持一个向量的横坐标不变。但纵坐标取相反数。把这个变换表示为矩阵就是[1 0;0 -1]。其中分号表示换行。显然[1 0;0 -1]*[a b]'=[a –b]'。其中上标' 表示取转置。这正是我们想要的效果。那么现在可以猜一下了。这个矩阵的特征向量是什么?想想什么向量在这个变换下保持方向不变。显然,横轴上的向量在这个变换下保持方向不变(记住这个变换是镜像对称变换。那镜子表面上(横轴上)的向量当然不会变化)。所以可以直接猜测其特征向量是[a 0]'(a不为0)。还有其他的吗?有。那就是纵轴上的向量。这时经过变换后。其方向反向。但仍在同一条轴上。所以也被认为是方向没有变化。 当我们引用了Spectral theorem(谱定律)的时候,情况就不一样了。Spectral theorem的核心内容如下:一个线性变换A(用矩阵乘法表示)可表示为它的所 特征向量体现样本之间的相关程度,特征值则反映了散射强度。 特征向量的几何意义 .矩阵(既然讨论特征向量的问题 .当然是方阵 .这里不讨论广义特征向量的概念)乘以一个向量的结果仍是同维数的一个向量 .因此 .矩阵乘法对应了一个变换 .把一个向量变成同维数的另一个向量.那么变换的效果是什么呢 ?这当然与方阵的构造有密切关系 .比如可以取适当的二维方阵 .使得这个变换的效果就是将平面上的二维向量逆时针旋转30 度 .这时我们可以问一个问题 .有没有向量在这个变换下不 改变方向呢 ?可以想一下 .除了零向量 .没有其他向量可以在平面上旋转 30 度而不改变方向的 .所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意 :特征向量不能是零向量).所以一个变换的特征向量是这样一种向量 .它经过这种特定的变换后保持方向不变 .只是进行长度上的伸缩而已(再想想特征向量的原始定义 Ax= cx. 你就恍然大悟了 .看到了吗 ?cx 是方阵 A 对向量 x 进行变换后的结果 .但显然 cx 和 x 的方向相同).而且 x 是特征向量的话 .ax也是特征向量(a 是标量且不为零).所以所谓的特征向量不是一个向量而是一个向量族 . 另外 .特征值只不过反映了特征向量在变换时的伸缩倍数而已.对一个变换而言 .特征向量指明的 方向才是很重要的 .特征值不是那么重要 . 虽然我们求这两个量时先求出特征值 .但特征向量才是更本质的东西! 比如平面上的一个变换 .把一个向量关于横轴做镜像对称变换 .即保持一个向量的横坐标不变 .但纵坐标取相反数.把这个变换表示为矩阵就是[ 1 0,0 -1].其中分号表示换行 .显然[ 1 0,0 -1]*[ a b]'=[a -b]'. 其中上标'表示取转置 .这正是我们想要的效果 .那么现在可以猜一下了 .这个矩阵的特征向量是什么 ?想想什么向量在这个变换下保持方向不变 .显然.横轴上的向量在这个变换下保持方向不变(记住这个变换是镜像 对称变换 .那镜子表面上(横轴上)的向量当然不会变化).所以可以直接猜测其特征向量是[a 0]'(a不为 0). 还有其他的吗 ?有 .那就是纵轴上的向量 .这时经过变换后 .其方向反向 .但仍在同一条轴上 .所以也被认为是方向没有变化。 综上,特征值只不过反映了特征向量在变换时的伸缩倍数而已,对一个变换而言,特征向量指明的方向才是很重要的,特征值似乎不是那么重要;但是,当我们引用了Spectral theorem(谱定律)的时候,情况就 不一样了。 Spectral theorem 的核心容如下:一个线性变换(用矩阵乘法表示)可表示为它的所有的特征向量的一个线性组合,其中的线性系数就是每一个向量对应的特征值,写成公式就是: T(V)= λ1(V 1.V)V 1+λ2(V 2.V)V 2+λ3(V 3.V)V 3+... 从这里我们可以看出,一个变换(矩阵)可由它的所有特征向量完全表示,而每一个向量所对应的特征值,就代表了矩阵在这一向量上的贡献率——说的通俗一点就是能量( power),至此,特征值翻身做主人,彻底掌握了对特征向量的主动:你所能够代表这个矩阵的能量高低掌握在我手中,你还吊什么吊?我们知道,一个变换可由一个矩阵乘法表示,那么一个空间坐标系也可视作一个矩阵,而这个坐标系就可由这个矩阵的所有特征向量表示,用图来表示的话,可以想象就是一个空间开的各个坐标角度,这一组向量可以完全表示一个矩阵表示的空间的“特征”,而他们的特征值就表示了各个角度上的能量(可以想象成从各个角度上伸出的长短,越长的轴就越可以代表这个空间,它的 “特征”就越强,或者说显性,而短轴自然就成了隐性特征),因此,通过特征向量 /值可以完全描述某一几何空间这一特点,使得特征向量与特征值在几何(特别是空间几何)及其应用中得以发挥。 关于特征向量(特别是特征值)的应用实在是太多太多,近的比如俺曾经提到过的 PCA 方法,选取特征值最高的 k 个特征向量来表示一个矩阵,从而达到降维分析+ 特征显示的方法;近的比如 Google 公司的成名作 PageRank,也是通过计算一个用矩阵表示的图(这个图代表了整个 Web 各个网页“节点”之间的关联)的特征向量来对每一个节点打“特征值”分;再比如很多人脸识别,数据流模式挖掘分析等方面,都有应用, 矩阵特征值的运算性质及推广 摘要:本篇论文主要从五方面来进行讲解:引言;矩阵特征值的性质;矩阵特征值的应用推广;分块矩阵的性质;分块矩阵特征值应用推广。 由于本篇论文是要以矩阵特征值性质的应用为主题,首先介绍总结了矩阵的一些基本概念及矩阵基本运算,然后在文中着重阐述了矩阵特征值性质,罗列出相关引理并予以证明,然后通过五种类型的矩阵特征值的应用例子将矩阵特征值的运算性质进行推广。将矩阵拓展到分块矩阵,讨论分块矩阵的性质及应用. 关键词:矩阵,特征值,特征向量,特征方程,特征多项式 The Operation Properties and Promotion of Eigenvalue Cui haiyang (Institute of Computer Science, Math) Abstract Three aspects to this thesis to explain: Introduction; matrix eigenvalue nature; promote the application of Matrix Eigenvalues. Because of this paper is a matrix eigenvalue to the application of the nature of the theme first introduced some basic concepts of matrix and the matrix of basic operations, and then in the text focuses on the eigenvalue properties, set out the relevant Yin Li, and to prove it. Finally, five types of application examples Eigenvalue Eigenvalue computation will be the nature of promotion. Key words:Matrix , Eigenvalue, Eigenvectors, Characteristic equation,Characteristic polynomial 1引言 矩阵计算领域在不断的发展和成熟,作为一门数学学科,它是众多理工学科重要的数学工具,矩阵理论既是经典数学的基础课程,是数学的一个重要且目前仍然非常活跃的领域,又是一门最有实用价值的数学理论,是计算机科学与工 矩阵特征值的计算方法 SUMMARY : This passage is mainly talking about several digital method to get the eigenvalue of certain matrix,since the eigenvalue is of the most importance to study the matrix linear transformation.First,we come up with the difination of eigenvalue and eigenvector,by which the basic way ——eigenfunction ——is got. Because of the limitation of eigenfunction ,another two means are introduced.Here we can see how these means works.. 内容概要: 由于特征值在矩阵的线性变换中具有重要作用,所以本文主要介绍几种求解某个特定矩阵特征值的方法。文章开始引出了特征值和特征向量的概念,从这个概念出发我们可以得到一种求解的最基本的方法——利用特征函数。但是,这个方法有很多缺陷,而且很难在计算机上实现,为此,我们在这里提出了另外两种方法。本文也就是这两种方法的介绍。 关键字:特征值 特征向量 特征方程 变换法求解 基本幂法 收敛性 一:问题的引入: 我们知道对于在实际的数学应用中矩阵占有重要位置。而线形变换又是矩阵的一种重要运算方式。我们为了利用矩阵来研究线形变换,对于每一个给定的线形变换,我们希望能找到一组基使得它的矩阵具有最简单的形式。为此,我们就必须研究在这个过程中占重要位置的一个概念矩阵的特征值的计算方法。 定义:设A 是数域P 上线性空间V 的一个线性变换,如果对于数域P 中一数λ,存在一个非零向量ξ,使得 A ξ=λξ (1) 那么λ称为A 的一个特征值,而ξ称为A 的属于特征值λ的一个特征向量。从几何上来看,特征向量的方向经过线性变换后,保持在同一条直线上,这时或者方向不变(λ)0)或者方向反向(λ<0),至于λ=0时,特征向量就被线性变换成0。 二:问题的求解 1.利用特征方程求解: 下来我们来寻找求解特征值的方法。设V 是数域P 上n 维线性空间,1ε,2ε,……,n ε是它的一组基,线性变换A 在这组基下的矩阵为A 。设0λ是特征值,它的一个特征向量ξ在1ε,2ε,……,n ε下的坐标是,,0201x x ……n x 0,。 则A ξ的坐标是: ??? ???? ??n x x x A 00201...,0λA 的坐标是:???? ?? ? ??n x x x 002010 ...λ 特征向量的几何意义 长时间以来一直不了解矩阵的特征值和特征向量到底有何意义(估计很多兄弟有同样感受)。知道它的数学公式,但却找不出它的几何含义,教科书里没有真正地把这一概念从各种角度实例化地进行讲解,只是一天到晚地列公式玩理论——有个屁用啊。 根据特征向量数学公式定义,矩阵乘以一个向量的结果仍是同维数的一个向量,因此,矩阵乘法对应了一个变换,把一个向量变成同维数的另一个向量,那么变换的效果是什么呢?这当然与方阵的构造有密切关系,比如可以取适当的二维方阵,使得这个变换的效果就是将平面上的二维向量逆时针旋转30度,这时我们可以问一个问题,有没有向量在这个变换下不改变方向呢?可以想一下,除了零向量,没有其他向量可以在平面上旋转30度而不改变方向的,所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意:特征向量不能是零向量),所以一个特定的变换特征向量是这样一种向量,它经过这种特定的变换后保持方向不变,只是进行长度上的伸缩而已(再想想特征向量的原始定义Ax=cx, cx是方阵A对向量x进行变换后的结果,但显然cx和x的方向相同)。 这里给出一个特征向量的简单例子,比如平面上的一个变换,把一个向量关于横轴做镜像对称变换,即保持一个向量的横坐标不变,但纵坐标取相反数,把这个变换表示为矩阵就是[1 0;0 -1](分号表示换行), 显然[1 0;0 -1]*[a b]'=[a -b]'(上标'表示取转置),这正是我们想要的效果,那么现在可以猜一下了,这个矩阵的特征向量是什么?想想什么向量在这个变换下保持方向不变,显然,横轴上的向量在这个变换下保持方向不变(记住这个变换是镜像对称变换,那镜子表面上(横轴上)的向量当然不会变化),所以可以直接猜测其特征向量是[a 0]'(a不为0),还有其他的吗?有,那就是纵轴上的向量,这时经过变换后,其方向反向,但仍在同一条轴上,所以也被认为是方向没有变化,所以[0 b]'(b不为0)也是其特征向量。 综上,特征值只不过反映了特征向量在变换时的伸缩倍数而已,对一个变换而言,特征向量指明的方向才是很重要的,特征值似乎不是那么重要;但是,当我们引用了Spectral theorem(谱定律)的时候,情况就不一样了。 Spectral theorem的核心内容如下:一个线性变换(用矩阵乘法表示)可表示为它的所有的特征向量的一个线性组合,其中的线性系数就是每一个向量对应的特征值,写成公式就是: 从这里我们可以看出,一个变换(矩阵)可由它的所有特征向量完全表示,而每一个向量所对应的特征值,就代表了矩阵在这一向量上的贡献率——说的通俗一点就是能量(power),至此,特征值翻身做主人,彻底掌握了对特征向量的主动:你所能够代表这个矩阵的能量高低掌握 矩阵分析几何意义和透彻理解PCA的一些整理这是几篇很不错的文章集合在一起的一篇文章,有些内容来自blog,有些来自文献和教程,解决了我遇到很多疑问,感谢把它推荐给我的人。前四部分来自早期几篇blog,把空间描述的形象且易懂,适合我们这些非数学专业的人搞明白一些抽象的问题。 一、矩阵的特征值概述:矩阵特征值要讲清楚需要从线性变换入手,把一个矩阵当做一个线性变换在某一组基下的矩阵,最简单的是数乘变换,求特征值的目的就是看看一个线性变换对一些非零向量的作用是否能够相当于一个数乘变换,特征值就是这个数乘变换的变换比。这样的一些向量就是特征向量,其实我们更关心的是特征向量,希望把原先的线性空间分解成一些向量相关的子空间的直和,这样我们的研究就可以分别限定在这些子空间上来进行,这和物理中研究运动的时候将运动分解成水平方向和垂直方向的做法是一个道理。 自相关矩阵最大特征值和特征向量并没有和原来的哪个信号一一对应,而且特征分解本身的含义相当于对原来的信号做了这样的正交分解。使得各个分量之间相互不相关,也就是K—L展开,每一个特征值相当于原来各个信号导向矢量的线性组合,因此不能仅仅从某个特征矢量中直接对应原来某个信号的特征。 二、线性空间和矩阵的几个核心概念: 空间(space):空间的数学定义是一个集合,在这个集合上定义某某概念,然后满足某些性质,就可以被称为空间。 我们所生活的空间是一个三维欧几里德空间,我们所生活空间的特点: (1)有很多(实际上是无穷多个)位置点组成 (2)这些点之间存在着相对关系。 (3)可以咋空间中定义长度、角度。 (4)这个空间可以容纳运动(从一个点到一个点的移动,而不是微积分意义上的“连续”性运动) 第(4)点是空间的本质特征,(1)、(2)两点是空间的基础而非性质,第(3)点在其他空间也行并不具备,自然更不是关键的性质。只有第(4)点是空间的本质。 把三维空间的认识拓展到其他空间。事实上,不管是什么空间,都必须容纳和支持在其中发生的符合规律的运动(变换)。我们会发现,在某种空间中往往会存在一种相对应的变换,比如:拓扑空间中有拓扑变换,线性空间中有线性变换,仿射空间中有仿射变换,其实这些变换都只不过是对应空间允许的运动形式而已。 例1.最高次项不大于n次的多项式的全体构成一个线性空间,也就是说,这个线性空间中每一个对象是一个多项式。如果我们以X0,X1,X2,…..,Xn为基,那么任何一个这样的多项式都可以表达为一组n+1维向量,其中的每一个分离ai其实就是多项式Xi-1项系数。 特征值与特征向量在图像处理中的应用 姓名:张x 学号:20092430 班级:2009121 摘要:正所谓学以致用,在长期以来的学习过程中,我们真正能够将所学到的知识运用到生活中的能有多少,我们对课本上那些枯燥的公式虽牢记于心,却不知道它的实际用途。在学习了矩阵论以来,虽然知道很多问题的求法,就如矩阵特征值和特征向量,它们有何意义我们却一点不知。我想纯粹的理知识已经吸引不了我们了,我们需要去知道它们的用途,下面就让我们一起来看看矩阵特征值与特征向量在图像处理中是如何发挥它们的作用的。 关键字: 特征值、特征向量、图像、 正文: 生活中的我们,每天清晨醒来,随之映入眼帘的就是各种形形色色的图像,我们确实也很难想象,在我们的生活中,图像的处理和矩阵特征值、特征向量有什么关系?首相我们先来了解下,何为特征值、特征向量。 定义:设是阶方阵,若有数和非零向量,使得 称数是的特征值,非零向量是对应于特征值的特征向量。 例如对,有及向量,使得,这说明 是的特征值,是对应于的特征向量。 特征值和特征向量的求法: 1.由得,并且由于是非零向量,故行列式,即 (称之为的特征方程) 由此可解出个根(在复数范围内),这就是的所有特征值。 2.根据某个特征值,由线性方程组解出非零解,这就是对应于特征值的特征向量。 特征值和特征向量的性质: 1 ., 2 .若是的特征向量,则对,也是的特征向量。 3 .若是的特征值,则是的特征值,从而是的特征值。 4 .是的个特征值,为依次对应的特征向量,若 各不相同,则线性无关。 我想在了解了特征值和特征向量的基本理论之后,你们很难想象,为什么这些知识会和图像有联系吧。说实话,我自己也不是很清楚,我也是看了别人的理论讲解,才略微理解了一二。让我们一起去了解下。 根据特征向量数学公式定义,矩阵乘以一个向量的结果仍是同维数的一个向量,因此,矩阵乘法对应了一个变换,把一个向量变成同维数的另一个向量,那么变换的效果是什么呢?这当然与方阵的构造有密切关系,比如可以取适当的二维方阵,使得这个变换的效果就是将平面上的二维向量逆时针旋转30度,这时我们可以问一个问题,有没有向量在这个变换下不改变方向呢?可以想一下,除了零向量,没有其他向量可以在平面上旋转30度而不改变方向的,所以这个变换对应的矩阵(或者说这个变换自身)没有特征向量(注意:特征向量不能是零向量),所以一个特定的变换特征向量是这样一种向量,它经过这种特定的变换后保持方向不变,只是进行长度上的伸缩而已(再想想特征向量的原始定义Ax=cx, cx是方阵A对向量x进行变换后的结果,但显然cx和x的方向相同)。 这里给出一个特征向量的简单例子,比如平面上的一个变换,把一个向量关于横轴做镜像对称变换,即保持一个向量的横坐标不变,但纵坐标取相反数,把这个变换表示为矩阵就是[1 0;0 -1](分号表示换行),显然[1 0;0 -1]*[a b]'=[a -b]'(上标'表示取转置),这正是我们想要的效果,那么现在可以猜一下了,这个矩阵的特征向量是什么?想想什么向量在这个变换下保持方向不变,显然,横轴上的向量在这个变换下保持方向不变(记住这个变换是镜像对称变换,那镜子表面上(横轴上)的向量当然不会变化),所以可以直接猜测其特征向量是[a 0]'(a不为0),还有其他的吗?有,那就是纵轴上的向量,这时经过变换后,其方向反向,但仍在同一条轴上,所以也被认为是方向没有变化,所以[0 b]'(b不为0)也是其特征向量。矩阵特征值和特征向量的研究
矩阵理论3.1 特征值界的估计
特征值和特征向量的几何意义是什么
浅谈矩阵的特征向量特征值的意义
矩阵特征值的意义
矩阵特征值求解
特征值和特征向量的物理意义
特征值和特征向量的物理意义
矩阵特征值的运算性质及推广
矩阵特征值的计算论文
特征向量的几何意义
矩阵分析几何意义的整理
矩阵特征值与特征向量在图像处理中的应用