文档库 最新最全的文档下载
当前位置:文档库 › 基于PCA的人脸识别研究毕业论文

基于PCA的人脸识别研究毕业论文

毕业论文(设计)原创性声明

本人所呈交的毕业论文(设计)是我在导师的指导下进行的研究工作及取得的研究成果。据我所知,除文中已经注明引用的内容外,本论文(设计)不包含其他个人已经发表或撰写过的研究成果。对本论文(设计)的研究做出重要贡献的个人和集体,均已在文中作了明确说明并表示谢意。

作者签名:日期:

毕业论文(设计)授权使用说明

本论文(设计)作者完全了解**学院有关保留、使用毕业论文(设计)的规定,学校有权保留论文(设计)并向相关部门送交论文(设计)的电子版和纸质版。有权将论文(设计)用于非赢利目的的少量复制并允许论文(设计)进入学校图书馆被查阅。学校可以公布论文(设计)的全部或部分内容。保密的论文(设计)在解密后适用本规定。

作者签名:指导教师签名:

日期:日期:

注意事项

1.设计(论文)的内容包括:

1)封面(按教务处制定的标准封面格式制作)

2)原创性声明

3)中文摘要(300字左右)、关键词

4)外文摘要、关键词

5)目次页(附件不统一编入)

6)论文主体部分:引言(或绪论)、正文、结论

7)参考文献

8)致谢

9)附录(对论文支持必要时)

2.论文字数要求:理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。

3.附件包括:任务书、开题报告、外文译文、译文原文(复印件)。

4.文字、图表要求:

1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写

2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画3)毕业论文须用A4单面打印,论文50页以上的双面打印

4)图表应绘制于无格子的页面上

5)软件工程类课题应有程序清单,并提供电子文档

5.装订顺序

1)设计(论文)

2)附件:按照任务书、开题报告、外文译文、译文原文(复印件)次序装订

3)其它

内容摘要

生物特征识别是利用人类特有的生理或行为特征来识别个人身份的技术,它提供了一种高可靠性、高稳定性的身份鉴别途径。人脸检测和识别是目前生物特征识别中最受人们关注的一个分支,是当前图像处理、模式识别和计算机视觉领域内的一个热门研究课题,在公安部门罪犯搜索、安全部门动态监视识别、银行密码系统等许多领域有广泛的研究,本文对此进行了较为深入的研究。

首先描述了人脸识别技术的研究内容、方法、应用前景,对人脸自动检测与识别技术进行了综述。并且详细介绍了人脸识别很重要的一个步骤—“人脸预处理”,文中提到的人脸预处理方法都是从图像处理的角度着手的,主要目的是使人脸图像标准化,并在一定程度上消除光照的影响。本文介绍了几种主要的预处理方法,如几何归一化,灰度归一化。

其次,本文重点描述了人脸识别的经典方法,PCA方法。主成分分析方法(Principal Component Analysis ,PCA),即离散K-L变换,是图像压缩中的一种最优正交变换。它用一个低维子空间来描述人脸图像,同时又能在一定程度上保存所需要的识别信息。其基本原理为:由高维图像空间经K-L变换后得到一组新的正交基,对这些正交基作一定的取舍,保留其中的一部分生成低维的人脸空间,即人脸的特征子空间,识别时将测试图像投影到此空间,得到一组投影系数,通过与各个人脸图像比较进行识别。这种方法使得压缩前后的均方误差最小,且变换后的低维空间有很好的分辨能力。但在这种人脸识别技术中,二维的人脸图像矩阵必须先转化为一维的图像向量,才能进行PCA分析,而在这种转化后,造成图像向量的维数一般较高,使整个特征抽取过程所耗费的计算量相当可观。

关键词

人脸识别;人脸预处理;主成分分析

Research on Face Recognition Based on

Principal Component Analysis

Abstract

Biometrics is a kind of science and technology using individual physiological or behavioral characteristics to verify identity. It provides a highly reliable and robust approach to the identity recognition. Automatic face detection and recognition is one of the most attention branches of biometrics and it is also the one of the most active and challenging tasks for image processing, pattern recognition and computer vision. It is widely applied in commercial and law area, such as mug shots retrieval, real-tine video surveillance in security system and cryptography in bank and so on. The main research works and contributions are as the following.

First, the research content, approach and development are emphasized. The research status is introduced. The technology of the face detection and recognition are summarized. And the paper describes face preprocessing in detail which is and important step in the face recognition. The face preprocessing methods we adopt are based on image processing techniques. The main purpose is to get the standardized facial images, and to eliminate the impact of illumination to some extent. In this paper, several key preprocessing methods are introduced, such as geometry normalization, gray-scale normalization and images binary-conversion.

Principal Component Analysis (PCA) face recognition methods as the foundation of the K-L transformation is the most superior in the image compression .By using PCA, the dimension of the input is reduced while the main components are maintained. The major idea of PCA is to decompose a data space into a linear combination of a small collection of bases.In the

face-recognition literature, the eigenvectors can be referred to as eigenfaces. The probe is identified by first projection to all gallery images. We denote a probe .A probe is comparing the projection to all gallery images, and it causes around the compression the mean error to be youngest. But in the PCA-based face recognition technique, the 2D face image matrices must be previously transformed into 1 D image vectors. The resulting image vectors of faces usually lead to a high dimensional image vector space, where it is difficult to evaluate the covariance matrix accurately due to its large size and the relatively small number of training samples.

Key words

Face recognition ;Face pretreatment;PCA

目录

第一章绪论 (1)

1.1人脸识别研究的目的意义 (1)

1.2人脸识别的定义及主要研究内容 (4)

1.3人脸识别方法综述 (6)

1.3.1人脸识别方法分类 (6)

1.3.2常用的人脸识别方法 (7)

1.3.3基于几何特征的人脸识别方法 (7)

1.3.4基于K-L变换的特征脸方法 (9)

1.3.5神经网络方法 (11)

1.3.6弹性匹配图脸部识别方法 (12)

1.3.7隐马尔可夫模型的识别方法 (13)

1.3.8基于FISHER线性判别式的方法 (14)

1.3.9基于小波包的识别方法 (14)

1.4人脸识别的应用 (15)

1.5人脸识别问题中的难点及发展方向 (16)

1.5.1人脸识别问题中的难点 (16)

1.5.2人脸识别的发展方向 (18)

第二章人脸图像预处理 (18)

2.1引言 (19)

2.2人脸图像库简介 (19)

2.3人脸图像的预处理算法 (20)

2.3.1图像的几何归一化 (20)

2.3.2图像的直方图均衡化 (21)

2.4本章小结 (23)

第三章基于PCA的人脸识别方法 (24)

3.1引言 (24)

3.2 PCA人脸识别方法原理 (24)

3.2.1特征提取的概念 (24)

3.2.2离散K-L变换的原理 (25)

3.2.3特征值的选择 (28)

3.2.4距离函数的选取与分类判别 (28)

3.3经典的PCA人脸识别 (29)

3.3.1特征脸算法 (29)

3.3.2经典PCA人脸识别方法的实现过程 (30)

3.3.3训练过程 (31)

3.3.4识别过程 (34)

第四章实验过程显示及分析 (34)

4.1 引言 (35)

4.2 实验过程 (35)

致谢 (39)

参考文献 (40)

附录 (41)

第一章绪论

1.1人脸识别研究的目的意义

随着信息技术及网络的高速发展,人们的生活及身份日益数字化,信息的安全性和隐蔽性越来越受到人们的重视,身份识别与认证技术也因此得到了较快的发展。而人脸识别作为图像处理在这些领域最成功的应用之一,最近几年来成为广大学者的研究热点,越来越受到关注。

人类社会的发展进入到21世纪的今天,社会的发展促进了人的流动,进而也增加了社会的不稳定性,这就使得安全方面的需求成为当今社会尤为重要的问题。不论是享受各项服务如网上冲浪、还是居家、办公等都涉及到安全,以往这些行为基本上是通过符号密码来进行安全保护,但是随着服务数量的不断增加,密码越来越多以致无法全部记住,而且密码有时也会被他人所窃取,各种密码被破解的概率越来越高。可见在现代社会中,身份识别己经成为人们日常生活中经常遇到的一个基本问题。人们几乎时时刻刻都需要鉴别别人的身份和证明自己的身份,以获得对特定资源的使用权或者制权,同时防止这些权限被他人随意的取得。传统的身份识别方法主要基于身份标识物(如证件、卡片)和身份标识知识(如用户名、密码)来识别身份,这在很长一段时期是非常可靠和方便的识别方法,得到了广泛的应用。但是,随着网络、通信、交通等技的飞速发展,人们活动的现实空间和虚拟空间不断扩大,需要身份认证的场合也变得无不在。密码遗失、资料被盗的时间不断发生,传统的安全技术已暴露出重大的缺陷,就会给个人乃至整个社会带来重大的甚至难以弥补的损失。面临这样的情况,人们对身份识别的安全性、可靠性、准确和实用性提出了更高的要求,必须寻求身份识别的新途径。

于是,近年来人类生物特征越来越广泛地应用于身份识别,而且生物特征可以更好的进行安全控制,世界各国政府都在大力推进生物

识别技术的发展及应用。所谓生物特征认证就是利用人的生理或行为特征对个人身份进行识别或是认证的技术,与传统的身份认证技术不同,基于生物特征的身份认证技术,以人体本身所固有的生理特征或行为特征作为识别媒介,运用图像处理和模式识别等技术,实现身份鉴别或验证。相对传统的身份认证方法而言,生物特征认证技术具有不会因当事人遗忘或他人窃取和伪造而进行错误判定,比传统的身份认证方法更加安全方便、特征唯一、不易伪造、不可窃取。生物特征可分为生理特征和行为特征两大类,人脸、指纹、掌纹、虹膜、视网膜等属于生理特征,语音、步态、笔迹等属于行为特征,生理特征相对行为特征而言更为稳定。人脸识别技术基于生理特征进行识别,是最主要的生物特征身份认证技术之一。在各种生物特征认证技术中,人脸识别技术的市场份额仅次于指纹识别技术。人脸识别技术和其他的生物识别比起来有以下几个优点:

(1)人脸识别可以在隐蔽的条件下进行,适用于安全监控;

(2)数据采集方便,采集设备成本低廉。目前,普通数码相机、数码摄像机和照扫描仪等摄像设备在普通家庭的日益普及进一步增加了其可用性;

(3)人脸识别具有快捷、非接触的特点,对用户友好。人脸是人们在日常生活中辨认他人的最常用的特征。利用人脸特征进行身份验证最易被人们接受;

(4)存在丰富的现有数据。社会上具有各种大型的人脸数据库,如公安部门的身份证照片数据库,学校里的学生学籍数据库等等。在各种身份证明材料中,一般也会含有标准的正面人脸照片;

(5)具有方便、快捷、强大的事后追踪能力。普通人可以对人脸认证系统的结果进行判定,而上述其他生物特征一般只能通过专家认定。

人脸识别技术作为生物识别技术的一种,以其特有的稳足性、方

便性、唯一性等特点被愈来愈多地应用于除安全问题外的各种身份识别领域。

因为其巨大的商业应用前景,受到越来越多的重视。近几十年以来人脸识别技术有了长足的发展,并且逐步走向实际应用阶段。可以预言,在今后的几十年内,随着人脸识别技术进一步发展,人脸识别技术将应用到更多的领域,例如视觉监控、娱乐应用、智能卡、自动身份验证、银行安全、公安系统刑侦破案的罪犯身份识别、身份证及驾驶执照等证件验证、银行及海关的监控、自动门卫系统、视频会议等。

目前,各国都加大力度研究生物识别技术,人脸识别这一最类似人类身份鉴别的方式得到了很多人的关注,很多重要的出入场合都在安装人脸识别系统。这些己有的以及潜在的应用领域将推动人脸识别技术不断发展。根据预计,生物特征识别技术在2009-2012年的增长率将保持30%左右,在国内这一数字会更高。整个生物识别技术市场的规模2010年将达到40亿美元左右,国内市场有可能达到40亿人民币。人脸识别作为一种新兴的生物识别技术将占据整个生物特征识别技术15%-20%左右的份额。就算以15%计算,人脸识别的市场规模也将在2010年达到6亿美元,国内达到40亿人民币左右。作为一种最直接、最自然、最容易被人接受的生物特征识别技术,人脸识别致力于探索如何使机器能够自动地根据用户的人脸图像来鉴别用户的身份。

人脸识别的研究涉及模式识别、计算机视觉、人工智能、图像处理、心理学、机器人的智能化研究、医学、生理学和认知科学等,与计算机人机交互领域和基于其它生物特征的身份识别方法都有密切联系。虽然人们可以毫不费力地通过脸部图像来鉴别互相的身份,然而由于成像过程中各种影响因素的变化常常导致同一个人的人脸图像发生非常大的变化,因此建立自动系统完成识别任务是非常具有挑

战性的。虽然目前国内外己经有许多实用系统问世,但是只有在非常苛刻的成像条件下,才能得到比较令人满意的识别效果。因此,人脸识别研究仍然远远没有到达完善的境地,还有非常大的发展空间。1.2人脸识别的定义及主要研究内容

人脸识别(Face Recognition)是指基于己知的人脸样本库,利用图像处理和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。从广义上来说,人脸识别主要包括人脸检测、人脸表征、人脸鉴别、表情分析和物理分类五个方面。

(1)人脸检测((Face Detection):即从各种不同的场景中检测出人脸的存在并确定其位置、尺度和姿势。这一任务主要受光照、噪声、头部倾斜度以及各种遮挡的影响;

(2)人脸表征(Face Representation):即确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方法有几何特征(如欧氏距离、曲率、角度等)、代数特征(如矩阵特征矢量)、固定特征模板、特征脸等;

(3)人脸鉴别(Face Identification):即通常所说的人脸识别,就是将待识别的人脸与数据库中的己知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式与匹配策略;

(4)表情分析((Facial Expression Analysis):即对待识别人脸的表情进行分析,并对其分类;

(5)物理分类((Physical Classification)即对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息。

狭义的人脸识别就是根据系统新输入的人脸,与己有的人脸数据库进行比对,来判断该人脸是否在人脸库中;如果在该人脸数据库中,则给出所对应的具体的个体信息。一般来说,我们所提的人脸识别指的是狭义的人脸识别。

一个典型的自动人脸识别系统如图1.1所示,分为训练和识别两

个步骤,两个步骤都需要检测和定位人脸、人脸图像的预处理和特征提取和选择。其中训练一般是离线运算的,而识别是在线操作的。

图1.1人脸识别系统的基本框图

(1)人脸的检测和定位,人脸检测与人脸定位是相互联系但又有所区别的两个概念。人脸检测的目的是检测输入的图像中是否含有人脸,而人脸定位是确定输入的图像中人脸位置以及大小,并将人脸从背景中分割出来。检测人脸对于简单背景的同一人的人脸图片是比较容易实现的,但当人脸的背景变得复杂,或者图片中的人脸属于多个人时,检测就会变得相对困难。人脸检测与定位是一项很复杂的工作,这是由于光线、视角、表情、墨镜、遮挡物等各种因素,以及可能出现的图像噪声或干扰,即使是同一人的人脸图像也可能会产生很大的差别,这使得人脸检测与定位工作变得相当困难。作为人脸识别的基础,人脸的检测与定位是人脸识别研究的另一个重要方面。

(2)人脸图像的预处理,人脸检测得到的人脸图像,如有设备条件的差异,可能存在光照、噪声、角度不好等缺陷,一般需要对图像进行几何归一化、灰度归一化及边缘检测等处理。几何归一化主要是指将人脸图像进行一定的处理变为像素大小统一且人脸关键位置一致的图片。灰度归一化则就是对人脸图像进行光照补偿,消除光照对图像的影响,进而提高识别率。

(3)特征提取和选择,对人脸进行识别主要依据人脸的特征,也就是说依据不同个体之间有较大差异而对同一个体则比较稳定的度量。在实际操作中,我们主要是通过各种变换来达到对图像进行降维的效果,如特征脸方法中K-L变换就是特征提取,而主元选取就是特

征选择。除此之外还有DCT, Gabor变换、分数阶傅里叶变换等都是基于人脸的整体特征提取,还有基于人脸局部特征的提取方法,如利用显著器官(眼镜、眉毛、耳朵、嘴巴等)之间的距离关系,以及通过训练学习求得的局部特征。

(4)人脸识别,在识别前对人脸图像库进行处理,得到每个个体的特征信息,单独建立一个新的人脸图像数据库,在识别过程中,采用同样的方法得到测试人脸图片的特征信息,并与库中的每个个体信息进行比较。在比较之前需确定相似性尺度,常用的是欧氏距离函数和基于贝叶斯准则的概率尺度。一般情况下,识别可以分为两种:一种是人脸辨认,即需要确认被识别者的具体信息;另一种是身份证实,只需要判断识别对象是否是数据库中个体的一员。

整个人脸识别的研究工作主要是围绕特征向量的提取和特征选择展开的。因为之前的预处理步骤与图像处理的工作是相通的,而之后的识别步骤与一般的模式识别问题是一致的。

1.3人脸识别方法综述

1.3.1人脸识别方法分类

根据研究角度的不同,我们对人脸识别方法可以进行不同的分类方法。根据图像来源途径的不同,可以分为动态和静态的人脸识别;根据输入人脸图像的角度,可以分为基于正面、侧面和倾斜人脸图像识别;根据图像的颜色特点,可以分为彩色图像和灰度图像的人脸识别。本文的人脸识别研究是基于静态、正面的灰度图像的。

根据对人脸图像不同的特征提取方式,我们大致可以人脸识别方法分成两种:一是基于局部特征分析的研究方法;二是基于整体的研究方法,它考虑到模式的整体属性,主要有特征脸方法、弹性图匹配方法、神经网络方法及隐马尔可夫模型方法等等。基于局部特征分析的方法识别结果取决于特征定位算法的准确性,而且要求图像的像素较高,因此要近距离拍摄图片。基于整体的识别方法也各自有自己的

缺陷,所以近年来的研究趋势是将人脸的局部特征分析和整体识别结合起来。

1.3.2常用的人脸识别方法

对人脸识别方法的研究主要有两大方向:一是基于人脸图像局部特征的识别方法;二是基于人脸图像整体特征的识别方法。基于人脸图像局部特征的识别通常抽取人脸器官如眼睛、眉毛、鼻子和嘴等器官的位置,尺度以及彼此间的比率作为特征。进一步地可以用几何形状拟合人脸器官,从而以几何参数作为描述人脸的特征。由于此类方法通常要精确地抽取出位置、尺度、比率或几何参数作为描述人脸的特征,因此对人脸图像的表情变化比较敏感。同时,人脸器官分割的精确度也对人脸特征的提取有一定的影响。另外,该类方法并没有充分利用到人脸图像本身具有的获度信息,该方向已经不是人脸识别技术发展的主流方向。基于人脸图像整体特征的人脸识别方法由于不需要精确提取人脸图像中部件的具体信息,而且可以充分利用到人脸图像本身具有的灰度信息,因此可获得更好的识别性能。目前,绝大部分关于人脸识别方法的文章都是基于人脸图像整体特征的,主要有特征脸法、最佳鉴别向量集法,贝叶斯法,基于傅立叶不变特征法,弹性图匹配法,其他相关方法有线性子空间法,可变形模型法和神经网络法。这些方法中有的侧重于表述人脸图像的特征提取,如弹性图匹配法和傅立叶不变特征法;有的则侧重于分类,如最佳鉴别向量集法、贝叶斯法和神经网络法;而有的则侧重于人脸图像重构,如特征脸法和线性子空间法。所有这些基于人脸图像整体特征的人脸识别方法均取得了一定的识别性能。

1.3.3基于几何特征的人脸识别方法

基于几何特征的人脸识别方法主要源于人脸识别的初期研究阶段。这种方法是以人脸各个器官和几何关系为基础进行算法设计。对于不同人来说,脸上的各个器官,如眼睛、鼻子、嘴巴以及整个脸部

的轮廓具有不同的形状、大小、相对位置和分布情况。

在基于几何特征的人脸识别方法中,可以用一个矢量来表示提取出来的几何参数。如果要获得一个准确、稳定和可靠的识别结果,就要求这些被选出的几何特征参数包含足够丰富的辨识人脸的信息,且能反映不同人脸之间的差别。也就是说对这些矢量要求具有较高的模式分类能力,同时还要有一定的稳健性,能够消除由于时间变迁、光照变化等其他干扰因素所带来的影响。具体来说,这些几何参数一般包括人脸上两个指定特征点之间的欧式距离、边缘曲率、角度等等。

在Brunelli和Poggio的文献中给出了一组典型的人脸几何特征参数:

(1)眉毛的厚度

(2)眉毛与眼睛中心的垂直距离;

(3)描述左眼眉毛弧度的12个数据;

(4)鼻子的宽度;

(5)鼻子在面部上的位置;

(6)嘴巴的垂直位置、嘴巴的宽度和上下嘴唇的亮度;

(7)描述下颚形状的11个半径数据;

(8)以鼻子位置为准的脸部宽度;

(9)颧骨宽度(半脸宽)。

当这些几何特征参数提取出来后,就可以采用最小距离(欧式距离)分类器,将待识别人脸特征向量与数据库中人脸特征矢量进行比较,取距离最近者作为识别结果。

在实际应用过程中,基于几何特征的人脸识别方法存在着两个方面的问题:

(1)如何快速、准确地检测出人脸的重要标志点依然是一个没有很好解决的问题。

(2)脸部几何特征在人脸辨识中的有效性问题,即脸部几何特征

能够提供多少可供识别的信息量。

虽然各人脸的器官在形状、大小及分布上各不相同,但是这种器官上的差异性更多是体现在某些细微的感觉意义上。例如眼睛显得比较小、鼻子显得比较宽,以及皮肤的纹理、颜色上的差异等等。显然,这些特征中的一部分是难以精确测量出来或者是不能用几何参数准确描述的。所以仅靠增加脸上几何参数的数目来提高人脸识别率是不太现实的。由于进一步改善测量精度是十分困难的,因而通过增加脸部几何参数的数量来改善识别率结果,其影响是极小的。因此,基于少量人脸几何特征进行大规模人脸辨识的可靠性是不容乐观的。

1.3.4基于K-L变换的特征脸方法

基于特征脸的人脸识别方法的基础是KL变换。KL变换是图像压缩中的一种最优正交变换。通过KL变换,可以把图像在高维空间表示转换到低维空间表示,而由低维空间恢复的图像和原图像具有最小的均方误差,从而可以以图像在低维空间的变换系数作为人脸图像的描述特征。KL变换用于人脸识别的前提是人脸图像处于低维空间,并且不同人脸是线性可分的。通常情况下,KL变换的变换矩阵由训练样本类间散布矩阵的特征矢量生成。人脸图像在前面的特征矢量上的投影有较大的能量,称为主分量;在后面的特征矢量上的投影具有较小的能量。称为次分量。当舍弃部分次分量时,KL变换也称为主成分分析法(PCA)。由于人脸图像具有相似的形状和结构,人脸图像在主分量上的投影过多地反映了光照变化,因此有人提出舍弃人脸图像在前3个特征矢量上的投影,而用人脸图像在其余特征矢量上的投影作为描述人脸图像的特征。

KL变换是数字图像压缩领域里的一种最优变换,它使从低维空间恢复的人脸图像和原图像的均方误差最小。但KL变换只是从压缩角度来看是最优的,从分类角度来看却不是最优的。虽然它考虑了人脸图像的所有差异(从压缩角度),但没有考虑这些差异是类内差异

(如光照变化,头饰变化或几何变化)还是类间差异(从分类角度)。

K-L变换是图像压缩的一种最优正交变换,人们将它应用于特征提取,形成了子空间法模式识别的基础。将K-L变换用于人脸识别,需要假设人脸处于低维的线性空间,不同人脸具有可分性。高维的图像空间经过K-L变换后得到一组新的正交基,保留其中重要的正交基从而形成了低维的人脸空间。

若将所有子空间的正交基排列成图像阵列,则正交基呈现人脸的形状,因此这些正交基也被称为特征脸。选择那些正交基形成的子空间则有不同的考虑,与较大特征值对应的一些正交基(也称主分量)能够表达人脸的大体形状,而具体细节需要那些小特征值对应的特征向量(也称次分量)来加以补充描述,因此低频成分用主分量表示,高频分量用次分量表示。采用主分量作为新的正交空间的正交基的方法称为主分量_(Principal Component Analysis,简称PCA)方法。

K-L变换在90年代初受到了很大的重视,实际用于人脸识别取得了很好的效果,一般库德大小为100幅左右,识别率在70%-100%之间不等,这主要取决于人脸库图像的质量。从压缩能量的角度来看,K-L变换是最优的,变换后的低维空间对于人脸有很好的表达能力,较好的判别能力。选择训练样本的散布矩阵作为K-L变换的生成矩阵,其最大特征向量反映了该样本集合的最大分布的方向,但这是图像统计方法,而不是人脸统计方法。它查找的是图像之间所有的差异,并根据这些差异来确定不同人脸间的距离,而不管这些差异是由于光线、发型或背景的改变引起的,还是属于人脸本身的内在差异,因此特征脸的方法用于人脸识别存在理论的缺陷。研究表明,特征连的方法随着光线、角度以及人脸的尺寸的引入而识别率急剧下降。主分量的方法使得变换后的表达能力最佳,次分量的方法考虑了高频的人脸区分能力,但是由于外在因素带来图像差异和人脸本身带来的差异对K-L变换而言是不加任何区分的,因此,如何选择正交基并不根本解

决问题。改进的一个思路是针对干扰所在,对输入图像作规范化处理,包括输入图像的均值方差归一化,人脸尺寸归一化。另一种改进是考虑到局部人脸图像受到外在干扰相对较小的情况,除了计算特征脸之外,还利用K-L变换计算出特征眼、特征嘴等。将局部特征向量加权进行匹配得到一些好的效果。

总之,特征脸方法是一种简单、快速、使用的基于变换系数的算法,但由于它在本质上依赖于训练集合测试集图像的灰度相关性,而且要求测试图像与训练集比较接近,所以存在着很大局限。

1.3.5神经网络方法

人工神经网络是一种以大量的处理单元(神经元)为节点,处理单元之间实现加权值互连的拓扑结构。人工神经网络中的处理单元是人类大脑神经单元的简化。处理单元之间的互连则是轴突、树突这些信息传递路径的简化。根据不同的应用场合,现已研究出较多的神经元网络模型及其动态过程的算法。

人工神经元通常采用非线性的作用函数,当大量神经元连接成一个网络并动态运行时,则构成了一个非线性动力学系统。人工神经网络具有自组织性、高维性、模糊性、分布性和冗余性等等特点,较冯-诺依曼体系的计算机更适合模拟人类大脑的思维机理。但总的来说,由于人类对自身思维机理认识的不足,所以对人工神经元作了极度的简化,这种模拟表现为极其肤浅和简单。

很多脸部识别系统都采用了多层感知机(Multi.Layer Perceptor)作为人工神经网络的基本结构。多层感知机由几层全互连的非线性神经组成。神经元之间有权值连接,权值包含了训练模式空间的特征。训练过程就是调整权值的过程,最常用的算法就是BP法则。

采用多层感知机进行面部识别的目的就是建立一个关于脸部的紧凑表示,这相当于面部特征的抽取。因为隐层节点的数目L通常要

远远小于输入层和输出层的节点数目,从而多层感知机将高维德输入数据变换到一个低维子空间中,同时保留了原始数据中最重要的信息。如果隐层神经元采用线性作用函数,则多层感知机张成的降维子空间将与主元分析法张成的子空间一样。主元分析法的方差是由大到小排列的,而多层感知机的方差是均匀分布到每个隐层神经元上。

多层感知机的输入形式有很多种,最简单的就是将整个人脸图像作为输入层,也可以对人脸图像进行采样,然后用低分辨率图像作为输入层。还有的文献采用了二进制图像的等密度区域或多个局部面部特征作为不同多层感知机的输入层。

直接使用BP神经网络进行人脸识别的问题在于网络过于庞大和复杂,例如对于一幅128×128的人脸图像,输入层和输出层的节点数目将达16438。显然,训练这样大的一个网络将花费很长时间,需要的存储量也会很高。由此可以看出,人工神经网络有着与Eigenface 方法非常相似的表达方法。一般来说,BP算法的收敛速度非常缓慢,学习过程可能需要对整个训练集进行上千次反复迭代运算,这是神经网络实际应用的一个问题。此外,BP算法以误差梯度下降的方式达到极小值,但在实际应用中,容易陷入到局部极小中,无法得到全局最优解,这也是有待解决的一个问题。

1.3.6弹性匹配图脸部识别方法

在利用图匹配进行识别的方法中,一个目标(如一个人脸图像)可以采用一张图(Graph)来表示。根据局部化空间频率得到的一系列多分辨率秒数值可以用来表示图中的节点数值。物体内部的空间关系则可以用节点之间的几何距离表示。

Gabor变换是进行时频分析的有效工具,该函数在时间域和频率域上都是局部化的,通常将Gabor特征用到针对脸部识别的弹性图匹配中。Gabor特征在网格节点上提供了一个多尺度边缘强度。一般来说,图像中的关键部位会有较大的Gabor系数。同样的,对于一个待

识别的人脸图像也可以定义一个网格G及网格上的特征矢量。在弹性图匹配(Elastic Graph Matching)方法中,两幅图的距离是通过寻找G与M之间的最优匹配来得到。

在弹性图匹配方法中,将人脸图像库中的图像和待识别图像都用特征矢量图表示。通过对突遇图之间的拓扑结构的匹配以及节点与节点之间的特征矢量值的比较,可以进行人脸识别,这就将模板的图像匹配转化成了模板的图匹配。在寻找最佳匹配方法时,希望能够同时维持特征数值接近和局部几何关系。弹性图匹配方法的最大优点在于对光和表情变化的相对不敏感性。这主要归功于两个原因:

(1)用Gabor变换可提取图像的局部多分辨率特征;

(2)在计算距离或者能量函数时,使用了变形匹配方法。

弹性匹配图方法的主要缺点在于计算量大。

1.3.7隐马尔可夫模型的识别方法

隐马尔可夫模型(Hidden Markov Model)一般应用于非平稳时间序列矢量的统计建模,在语音处理,特别是语音识别中得到广泛的应用。隐马尔可夫模型为一个观测序列提供了一个统计模型n引,该模型由两个互相关联的过程组成:

(1)一个是底层不可观测的马尔可夫链,它由有限个状态、一个概率转移矩阵和一个初始状态概率分布函数组成。

(2)另外是一组联系每一个状态的概率密度函数。

在使用隐马尔可夫模型的面部识别方法中,首先将一个人脸图像采集成一系列的条状图,将一幅二维图像变成一个一维矢量序列,这个序列构成了隐马尔可夫模型的观测矢量。由于人脸的特定构造,在这种抽样方式下,脸部特征带的出现将服从于一定的顺序,所以该模型可以用一个从左到右的隐马尔可夫模型表示,其中状态的转移只能按照从左到右的方式进行。接着是训练该隐马尔夫模型,由以下几个步骤组成:

相关文档
相关文档 最新文档