当前位置：文档库 › (完整版)基于声纹的说话人特征识别毕业设计

(完整版)基于声纹的说话人特征识别毕业设计

JIU JIANG UNIVERSITY

毕业论文（设计）

题目基于声纹的说话人特征识别

英文题目 Speaker feature recognition based on the voiceprint

院系

专业

姓名

年级

指导教师

2013年6月

摘要

说话人识别是一项根据语音波形中反映说话人生理和行为特征的语

音参数，而自动识别说话人身份的技术。它也常被人们称为声纹识别技术，是生物认证技术的一种，其基本思想就是运用某种匹配方法进行特征识别，从而确定说话人的身份。

目前已知的语音特征包括基音周期、语谱图、自相关系数、能量、平均幅度、过零率、共振峰、线谱对、线性预测系数（LPC）、线性预测倒谱（LPCC）、Mel频率倒谱（MFCC）等。

本文介绍了说话人识别的概念、原理及其识别实现的方法，指出了说话人识别技术的应用前景。通过在Matlab7.0平台上对语音的基音周期、线性预测倒谱和Mel频率倒谱等特征参数进行提取、分析、对比、识别实现一个简单的说话人识别系统，实验结果表明实验正确、有效。

关键字：说话人识别；特征参数；基音周期；线性预测倒谱；Mel频率倒谱

Speaker feature recognition based on the voiceprint

Abstract

Speaker recognition is the voice parameters in a speech waveform which reflects the speaker's physiological and behavioral characteristics, and automatic identification technology to speaker identity. It is also often referred to as the voiceprint recognition technology, a biometric authentication technology.The basic idea is to use a matching method for feature recognition, in order to determine the identity of the speaker.

Currently known voice features include pitch, spectrogram, since the correlation coefficient, energy, average magnitude, the zero crossing rate,

formant, the line spectrum of the Linear Prediction Coefficient (LPC), Linear Prediction Cepstrum (LPCC) , Mel Frequency Cepstral (MFCC).

This article describes the speaker identification concepts, principles and implementation methods of identification, and pointed out the prospect of speaker recognition technology. By the Matlab7.0 platform, voice pitch, linear prediction cepstrum and Mel Frequency inverted spectra characteristic parameter extraction, analysis, contrast, identify a simple speaker recognition system, experimental results show that the experiment is correct, effective .

Key Words：Speaker Recognition；Feature Parameter；Pitch；Linear Prediction Cepstral Coefficient；Mel Frequency Cepstral Coefficient

摘要.......................................................................................................................... I Abstract....................................................................................................................... I I 目录....................................................................................................................... IV 引言.. (1)

第一章说话人识别研究 (4)

1.1说话人识别研究的意义 (4)

1.2说话人识别应用领域 (5)

1.3说话人识别的技术优势 (6)

1.4说话人识别研究的难点和热点 (7)

1.4.1说话人识别技术研究的难点 (7)

1.4.2说话人识别研究的热点 (10)

1.5影响说话人识别性能的因素 (11)

1.6论文的内容安排 (13)

第二章说话人识别的基本介绍 (14)

2.1语音的基础知识 (14)

2.1.1语音的产生原理 (14)

2.1.2语音产生模型 (15)

2.1.3语音信号的预处理技术 (17)

2.2说话人识别的分类 (20)

2.3说话人识别的基本原理 (22)

2.4说话人识别的常用特征 (24)

2.5说话人识别系统的结构框架 (25)

2.7说话人识别系统评价标准 (31)

第三章特征参数的提取 (32)

3.1 倒谱 (32)

3.1.1 同态处理基本原理 (32)

3.1.2 复倒谱和倒谱 (34)

3.2线性预测倒谱(LPCC)的提取 (34)

3.2.1 LPCC的介绍 (34)

3.2.2 LPCC的提取过程 (36)

3.2.3 Matlab中实现LPCC的提取 (36)

3.3 Mel频率倒谱(MFCC)的提取 (38)

3.3.1 Mel频率介绍 (38)

3.3.2 MFCC提取过程 (39)

3.3.3 Matlab中实现MFCC的提取 (41)

3.4 基音周期的提取 (43)

3.4.1基音周期的介绍 (43)

3.4.2短时自相关函数 (45)

3.4.3 MATLAB中实现基音周期的提取 (47)

第四章说话人识别系统的实现 (47)

4.1 实验实现的环境 (47)

4.2 WA V声音文件格式分析 (48)

4.3实验平台的选择 (49)

4.4录音 (50)

4.5 预处理和端点检测 (50)

4.7 系统实验框图和步骤 (52)

4.8实验结果和分析 (52)

4.8.1实验结果 (52)

4.8.2 结果分析 (60)

4.9 小结 (60)

参考文献 (60)

附录 (61)

致谢 (85)

引言

语音是人类交流信息的基本手段。随着信息科学飞速发展，如今语音信号处理技术已经拓展为语音学与数字信号处理技术相结合的交叉学科，它和认知科学、心理学、生理学、语言学、计算机科学和模式识别与人工智能等学科联系紧密。语音信号处理技术的发展依赖这些学科发展，而语音信号处理技术的进步也会促进这些学科的进步。因此，语音信号处理成为目前发展最为迅速的信息科学研究领域中的一个重要分支。

语音信号的研究一般都基于语音信号的数字表示，因此语音信号的数字表示是进行语音信号数字处理的基础。语音信号的数字表示基本上可以分为两大类：波形表示和参数表示。波形表示仅仅是通过采样和量化的过程保存模拟语音信号的“波形”，而参数表示则是把语音信号表示成某种语音产生模型输出。为了得到参数表述，首先必须对语音进行采样和量化，然后再进一步处理得到语音产生模型的参数。语音模型的参数一般可分为两大类：一大类是激励参数；另一大类是声道参数。

对语音处理的基础理论及各种处理算法的研究主要包括以下两个方面：1.从语言中产生和听觉感知来研究——语音产生的研究涉及大脑中枢的言语活动如何转换成人发声器官的运动，从而形成声波的传播。听觉感知的研究涉及人耳对声波的收集波并经过初步处理后转换成神经元的活动，然后逐级传递到大脑皮层的语音中枢。2.将语音作为一种信号来处理——早期形成的数字滤波器、FFT等数字信号处理方法广泛应用在语音信号处理领域，后期出现的线性预测编码技术成为语音信号处理最有效的办法之一。到了八十年代，出现了分析合成法、码激励线性预测（CELP）、矢量量化（VQ）以及马尔可夫模型（HMM）等一系列算法和模型在很大

程度上推动了语音编码和语音识别技术的研究。

语音信号处理虽然包括了语音通信、语音合成和语音识别等方面的内容，但其前提是对语音信号进行分析。只有将语音信号表示成其本质特征的参数，才有可能利用这些参数进行高效的语音通信，才能建立用于语音合成的语音库，也才可能建立用于识别模版或知识库。而且语音合成的音质好坏、语音识别率的高低，都取决于对语音信号分析的准确性和精度。例如，利用线性预测分析来进行语音合成，其先决条件是要先用线性预测方法分析语音库，如果线性预测分析获得的语音参数较好，则用此参数合成的语音音质就好。有如，利用带通滤波器组法来进行语音识别，其先决条件是要弄清楚语音共振峰的幅值、个数、频率变化范围及其分布情况。因此，应先对语音信号进行特征分析，得到提高语音识别率的有用数据，并据此来设计语音识别系统的硬件和软件。根据所分析的参数不同，语音信号分析可分为时域、频域、倒谱域等方法。进行语音信号分析时，最先接触到的、最直观的是它的时域波形。语音信号本身就是时域信号，因而时域分析是最早使用的应用范围最广的一种方法。时域分析具有简单直观、清晰易懂、运算量小、物理意义明确等优点；但更为有效的分析多是围绕频域进行的，因为语音中最重要的感知特性反映在其功率谱中，而相位变化只起着很小的作用。常用的频域分析方法有带通滤波器组方法、傅里叶变化法和线性预测分析法等。频谱分析具有如下有点：时域波形较容易随外界环境变化，但语音信号的频谱对外界环境变化具有一定的顽建性。另外，语音信号的频谱具有非常明显的声学特征，利用频域分析获得的语音特征具有实际的物理意义。如共振峰参数、基音周期等参数。倒谱域是将对数功率谱进行反傅里叶变换后得到，它可以进一步将声道特征和激励特征有效的分开，因此可以更好地揭示语音信号的本质特征。

语音信号处理的主要应用包括：语音识别、语音合成、说话人识别、语音编码、语音增强等几个分支。近年来，各个分支都取得了很大的进步，已经深入应用到通信、办公自动化、远程控制、声控电话拨号、计算机语音应答、机器人听觉与口语系统等使用系统中。本文要进行的是语音信号处理在说话人识别中的应用，以完成说话人识别系统的功能实现。

人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理过程，人在讲话时使用的发生器官——舌头、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大，所以任何两个人的声纹图谱都有差异。这就使得每个人的语音声学特征既有相对稳定性，又有变异性，不是绝对、一成不变的。这种差异可能来自生理、病理、心理、模拟、伪装，也可能与环境干扰有关。尽管如此，由于每个人的发音器官都不尽相同，因此在一般情况下，说话人的鉴定仍能区别不同的人或识别是否是同一个人的声音，从而进行个人身份识别。

说话人识别是一项根据语音波形中反映说话人生理和行为特征的语音参数，而自动识别说话人身份的技术，主要包括特征提取和模式匹配两个部分。这项技术自研究发展至今，以其特有的方便性、经济性、安全性和准确性等优点受到特别关注，其研究和应用系统的开发具有重要的现实意义。作为生物特征识别技术的一种，说话人识别技术在声音拨号、电话银行、电话购物、数据库访问、信息服务、语音电子邮箱、安全控制、计算机远程登陆等互联网及通信领域得到广泛应用；在呼叫中心应用上，说话人识别技术同样提供更加个性化的人机交互；在军事领域，说话人识别技术用于战场监听，以辨认出敌方的指挥员；在生物识别技术领域中，说话人识别技术日益成为人们日常生活和工作中重要且普及的安全验证方式。

第一章说话人识别研究

说话人识别(Speaker Recognition，SR)技术，也常被人们称为声纹识别(Voiceprint Recognition，VR)技术，是生物认证技术的一种。其基本思想就是运用某种匹配方法进行特征(本文指说话人的语音特征)识别，从而确定说话人的身份。

1.1说话人识别研究的意义

在生物学和信息学高度发展的今天，生物识别技术已经越来越广泛地应用于人们的工作、学习和生活中，作为一种便捷和先进的信息安全技术，它能满足现代社会对于身份鉴别的准确性、安全性和实用性的更高要求。生物识别技术的崛起得益于信号检测与处理、模式识别、人工智能、机器学习等理论与技术的发展，由于它为身份识别提供了一个可靠的解决方案，其应用前景广阔，并能为构筑21世纪基于自主研究开发的国家信息安全体系提供强有力的技术支持。

生物识别技术是一种根据人体自身的生理特征（指纹、手形、脸部、DNA、虹膜、视网膜、气味等）和行为特征（声音、签名、击键方式等）来识别身份的技术。它是集光学、传感技术、红外扫描和计算机技术于一身的第三代身份验证技术，作为一种更加便捷、先进的信息安全技术，生物识别技术将全球带进了电子商务时代。

说话人识别作为生物识别的一种，是通过由计算机利用语音波形中所包含的反映特定说话人生理、心理和行为特征的语音特征参数来实现自动识别说话人身份的。

由于每个人的声音特征都是唯一的，而且几乎很少会发生变化的。说话人识别技术正式根据这一特性，利用语音信号中说话人特有的“语音个性”，而不考虑语音中的字词意思，通过说话人识别系统对用户进行身份识别。在当今社会，说话人识别几乎可以应用到人们的日常生活的各个角落，成为人们生活中和工作中重要且普及的安全验证方式。

1.2说话人识别应用领域

由于与其他生物识别技术相比，说话人识别技术具有不可遗忘和忘记、不需记忆、使用方便等优点，同时说话人识别还具有更为准确、经济及可扩展性良好等众多优势，因此，说话人识别技术在以下许多方面得到广泛应用。

1.用于银行、证劵系统——目前电话银行，炒股等业务不断增加，为了进一步提高这些实时性高、风险性高的业务操作的安全性，可采用说话人识别技术并结合设定的密码及其他安全措施进行真实、安全、有效地用户身份辨认，从而实现方便、快捷、安全有效地操作。

2.网络安全——在日益频繁的电子商务、电子购物、国际贸易领域中，越来越多的人们依赖于网上各种口令和密码，随着密码在不同场合的频繁使用，这种非特征性的依赖缺陷——安全缺陷，也越发明显。同时，记忆并定期修改众多的密码是非常让人头疼的事情。在说话人识别过程中，每次发音都可由随机产生的提示文本来控制，可有效的防止身份复制和账号、密码的盗窃，并且用户不需要记忆和修改任何东西。因此，在网上交易时采用说话人识别技术要比其他生物识别技术更具有优势，且操作方便、简洁，很容易为广大计算机使用者接受。

3.语音检索——对于大量的录音素材，将说话人识别技术与连续语音识别技术相结合，可以检索出其中我们感兴趣的特定人所说的内容。

4.用于身份鉴别——利用不同人的声纹特征进行身份鉴别，为用户设计声纹打卡系统、声纹锁、声控防盗门、声控车载启动系统等等。如国内的“得意身份证”、“昭德数字”声纹门禁系统等。

5.用于军事安全——随着现代信息技术的发展，现在各国的国防部门也已经逐步采用声纹信息管理系统，并将其应用到军事命令、机密情报等重要信息的获取和鉴别中。

6.医学应用——说话人识别的主要依据是说话人声道结构的差异，从而可知说话人识别技术的研究和医学中生理学的发展是相互促进的，一方面生理学和解剖学的进展可以促进说话人识别问题的研究，另一方面也可借助说话人识别技术进行声道特性的研究。例如为响应病人请求的命令，设计一个针对患者的说话人识别系统，可方便地实现患者需求的控制等。

7.用于司法取证、刑事案件侦破——对于各种电话勒索、绑架、电话人身攻击等案件，说话人识别技术可以在一段录音中查找出嫌疑人，帮助对嫌疑人的查证，1971年美国警方就利用此技术协助破案。另外，现在很多法庭已经使用声纹作为鉴别犯罪的依据。当然，这也需要防止发音伪装的问题。

1.3说话人识别的技术优势

生物识别技术是目前最为方便、安全和环保的识别技术，具有不会遗失、无需记忆等优点。此外，与其他生物认证技术相比，说话人识别技术还有以下几个方面的优势：

（1）用户接受程度高——以说话人的声音作为特征进行识别，用户不需要记住复杂、繁多、易忘的密码，不需要随时准备着携带智能卡、钥匙之类的东西，更不需要像其他生物识别技术一样，刻意的用手触摸传感器或把眼睛凑向摄像头，是一种比较自然的识别技术。

（2）设备成本低——说话人识别是一种比较经济的识别方式，一方面它所用的设备（如PC机、麦克风等）成本要求较低；另一方面声音的采样、量化芯片的要求也不高。而如虹膜、视网膜等技术，虽然识别精确度很高，但设备造价也很高，性价比不高。

（3）可用于移动传输中——随着信息智能化发展，语音特征将成为嵌入式系统和手持移动设备最好的交互手段的可能性越来越明显，因此，以声音作为身份识别特征的技术也越来越受到重视，说话人识别技术也越来越重要。

（4）可实现远程操作——适合远程身份确认，通过麦克风或电话、手机就可以由网络（通讯网络或互联网络）实现远程登陆。

（5）实现算法简单——声纹辨认和确认的算法复杂度低，配合一些其他措施，如通过语音识别进行内容鉴别等，可以提高准确率。

（6）隐私保护性强——说话人识别技术采用语音特征进行身份确认，只需提供语音信号，不涉及隐私问题，用户无任何心理障碍。

1.4说话人识别研究的难点和热点

1.4.1说话人识别技术研究的难点

尽管对说话人识别的研究已长达半个世纪，说话人识别技术也已从实验阶段走向市场，进入是实用阶段。但要使其普遍，并像指纹识别一样成

为十分可靠的生物特征识别技术，得到广泛应用，还有许多尚需进一步探索研究的难题，主要有以下几个方面：

1 .尚未找到简单可靠的说话人语音特征参数。说话人语音信号中既包含了说话人语音内容的信息，也包含了说话人的个人信息，是语义特征和说话人特征的混合体。目前还没有很好的方法把说话人的个性特征从语音特征中分离出来，也没找到简单的声学特征参数能够可靠的识别说话人。

2. 语音信号的变异。即对于同一说话人和同一文本，语音信号也有很大的变异性。因为说话人的发音常常与环境、说话人的情绪、说话人的健康状况有密切关系，说话人的语音特征不是静态的、固定不变的，它具有时变特性。会随时间、年龄和健康状况的变化而变化；另外，传输语音的通信通道的时变效应问题也是语音信号产生变异的重要方面。语音信号的变异性从本质上说是说话人特征空间发生移动，说话人模式发生变异，从而增加识别过程中的不确定性。说话人识别中存在的噪音、多通道、情感等热点研究方向都属于这方面。

3. 声音容易被录音模仿。如何处理故意伪装问题，在法庭的说话人识别应用中，这个问题具有特殊的重要性。比如在法庭查证的识别应用中，罪犯可能会伪装他们的声音或模仿另一个人的声音来逃避罪名。

4. 特征空间有限。在汉语语音识别中，全体音节的集合很小，其数目仅几百个，而全体汉语说话人却有14亿多，对于由同一语音信号组成的特征空间，语音识别要将其划分为M个子空间，M为音节个数，而说话人识别要将其划分为N个子空间，N为说话人个数，由于N远大于M，使得识别说话人要比识别所说的内容复杂，而且当N很大时，说话人识别还在理论上存在将有限特征空间进行无限划分的问题，这是说话人识别所面临的新问题。

5. 噪声问题。鲁棒性问题一直是说话人识别研究的难点，像用麦克风录音时会产生低频干扰噪声，而在移动信道中传送语音时也会有加性或卷积噪声产生，这些噪声都会使得得到的信号产生失真，最终降低识别率。目前说话人识别中存在的去噪、多通道等研究热点都属于这个方面的改善。

另外，说话人识别还存在以下一些实用性的问题需要在将来的研究中加以考虑和解决。

1.说话人识别系统设计的合理化及优化问题。即在一定的应用场合下对系统的功能和指标合理定义、对使用者实行明智的控制以及选择有效而可靠的识别方法等问题，使得既能正确识别说话人，又能拒绝模仿者。

2.如何处理长时间和短时说话人的语音波动，如何区别有意模仿的声音，这点对于说话人识别在司法上应用尤为重要。如何将语音识别和说话人识别有机的结合起来，对于这一点，指定文本型的说话人识别是一个有益的尝试。

3.说话人识别系统的性能评价问题。需要建立与试听人试验对比的方法和指标；由于目前对于说话人识别的性能尚无一致的评价方法，所以这一问题的解决还需长期的努力。

4.可靠性和经济性。和语音识别系统相比，说话人识别的使用者要多几个数量级，例如有信用卡的人可以是几百万或上千万，当然不一定所有的都用同一个系统来处理，但是在把说话人识别系统用于社会以前，必须现设想万位以上的说话人进行可靠的实验。同理，在经济性方面，每一个说话人的标准模型必须使用尽量少的信息，因此样本和特征量的精选也是亟待解决的。

说话人识别的关键步骤可分为：语音的预处理、语音特征提取、识别系统模型的建立、根据相似性准则进行判定等。想要提高说话人识别的正

确率，应从以上几个方面进行研究。其中语音特征提取和识别系统模型的建立是说话人识别技术研究的重点。上述提到的问题主要是这两方面引起的，其系统的优劣性也往往取决于这两方面。

识别模型常用的是高斯混合模型（GMM）、矢量量化模型（VQ）和隐马尔可夫模型（HMM），已有实验表明，对于相同的特征参数的与文本无关的说话人识别系统，GMM的识别率可以达到93.6%，性能也是最好的，其次是HMM，而VQ的识别率最高仅为86.2%，模型处理的主要问题集中在算法的准确度和复杂度上。此外，由于目前大多数研究的说话人识别过程都认为相邻帧间的特征参数是相互独立的，所以如何寻求新的更具个性和更强鲁棒性的动态语音特征，或者对现有的特征参数进行优化的选择、补偿等，仍然是说话人识别技术领域中的研究热点。

1.4.2说话人识别研究的热点

由于应用的需求和数字信号处理技术的飞速发展，说话人识别的研究越来越受到人们的重视。在国际声学、语音和信号处理会议（International Conferrence on Acoustic Speech and Signal Processing，ICASSP）论文集中，每年都有关于说话人识别的专题。说话人识别的研究已经逐渐从实验室走向实际应用。目前，说话人识别的研究主要集中在如下几个方面：

1.语音特征参数的提取和混合。语音特征参数对说话人识别系统的性能至关重要，虽然倒谱参数得到广泛应用，但语音特征参数仍是一个研究热点。寻找新的有效的语音特征参数以及已有特征参数的有效组合是语音特征参数研究的两个方向。

2.在模型训练和识别技术方面：HMM模型与其他模型结合，改善说话人识别系统的性能。如HMM模型与神经网络，HMM模型与支持向量

机SVM（Support Vector Machine）的结合都可以有效地改善系统的性能。

高斯混合模型方面：模型参数估计方法的改进，减少模型运算量及算法复杂度的研究。

矢量量化方面：量化方法的鲁棒性及改进算法。

神经网络方面：大人群识别，级联神经网络。

3.带噪音，特别是电话和移动通信环境中的语音的说话人识别是现今说话人识别的一个热点。

4.文本无关的说话人识别技术是当今说话人识别研究的又一个热点。

1.5影响说话人识别性能的因素

说话人识别技术发展至今已经变的相当成熟，而且在国际上已经有了一些成功的应用。但是在实际的问题中，说话人识别技术仍然有一些弱点。人们常认为说话人识别的难点在于有些人的声音非常相似，以至于有时连我们自己都会弄错。不过这只是原因之一，说话人识别技术中的难点并不局限于此。最关键的问题是语音信号本身的多变性，而不是相似性。也就是说，难度在于要从多变的语音信号中找出每个说话人的特有特征。语音信号的变化是如此错综复杂，其原因之一就在于说话人自身语音的变化。

人与人之间声音存在差异使得自动说话人识别技术能够成为可能，但同时也正是因为人的语音具有多变性使得这个问题变得复杂起来。语音是人的固有生物特征，但同时也是人的一种行为，它同时具有行为和属性两种特点，个人的属性可以不变，而行为却是每一次都不完全相同的。语音产生的变化有些是刻意为之，有些则不然。仅仅依靠发音器官的特点而提取出来的特征不足以表示每个说话人的特点。由于健康状况、紧张程度、

不愿意合作等生理和心理因素会大大降低说话人识别系统的辨识率。

除了说话人自身的因素以外，还有其他方面也会造成说话人识别系统性能表现不稳定。如噪声、传输信道匹配、系统使用时间长短的。

1.噪声——噪声的影响是语音信号处理中最常见也是影响系统性能最关键的因素之一。R.C.Rose等人证明，通常的说话人识别系统在噪声干扰情况下识别效果会严重下降。DOBTOTH等学者从电话交换机上获取的语音信号表示，39.3%的对话过程中都含有其他噪声信号干扰。因此如何解决噪声条件下的说话人识别是第一重要问题。通常研究者会从两个方面来解决：一是如何在噪声环境下提高识别率，另外就是训练时和识别时噪声环境不同的情况下如何保证识别效果。

目前多数说话人识别系统都是在实验室里完成的，其训练和识别的数据结果在实验环境中得到。实际情况中像实验室那种相对安静理想的环境并不是很多，由此带来的问题就是容易造成训练环境和识别环境的不匹配。现有的识别系统在噪声环境中其实别效果下降的很严重。

语音增强技术属于信号级抗噪处理方法，假设在加性噪声环境下，可以根据噪声的短时平稳特征，通过谱减法来处理带噪语音。在进行语音信号提取之前，将语音中噪声部分有效的去除，使去噪后的语音背景和信噪比与训练语音相似，特征提取的时候就能得到较为理想的语音特征。

提取对噪声不敏感的语音特征参数属于特征级抗噪处理方法，如果所提取的特征对噪声免疫，这种语音特征就有了抗噪声的能力。语音信号处理技术和物理学、心理学、医学都有密切联系，任何一门学科的发展都有可能推动语音信号处理技术的进步。随着人们对人耳听觉系统生理特征的认识，这两年语音识别领域提出了一些比较新的抗噪声语音特征，比如基于听觉掩蔽特性的特征参数、基于人耳听觉响度特性的特征参数、基于人

人脸识别毕业设计

摘要人脸识别技术(FRT)是当今模式识别和人工智能领域的一个重要研究方向。虽然人脸识别的研究已有很长的历史，各种人脸识别的技术也很多，但由于人脸属于复杂模式而且容易受表情、肤色和衣着的影响，目前还没有一种人脸识别技术是公认快速有效的．本文主要讨论了人脸识别技术的一些常用方法，对现有的人脸检测与定位、人脸特征提取、人脸识别的方法进行分析和讨论，最后对人脸识别未来的发展和应用做了展望。关键字：人脸识别，特征定位，特征提取

ABSTRACT Nowadays the face recognition technology (FRT) is a hot issue in the field of pattern recognition and artificial intelligence．Although this research already has a long history and many different recognition methods are proposed，there is still no effective method with low cost an d high precision．Human face is a complex pattern an d is easily affected by the expression，complexion and clothes．In this paper，some general research are discussed，including methods of face detection and location，features abstraction，and face recognition．Then we analyze and forecast the face recognition’s application and its prospects． Keywords: Face Recognition Technology, Face location，Features abstraction

语音信号的提取与识别技术——说话人识别系统的研究

毕业设计说明书语音信号的提取与识别技术 ——说话人识别系统的研究作者:学号：学院(系): 专业: 指导教师：评阅人： 20**年6月

中北大学毕业设计（论文）任务书学院、系：专业：学生姓名：学号：设计(论文)题目：语音信号的提取与识别技术起迄日期: 20**年2月15日~20**年6月21日设计(论文)地点: 指导教师: 系主任: 发任务书日期:20**年2月15日

毕业设计（论文）任务书 1．毕业设计（论文）课题的任务和要求： 1.了解声音信号的特征参数，及现阶段研究处理方法。以现阶段信号处理领域比较活跃的语音信号为具体研究对象，进行相关知识的了解与学习。 2.学会在语音信号处理中使用MATLAB软件工具。 3.针对基本的个别个体的特定声音进行与信识别研究。 4.根据研究情况利用MATLAB语言进行相关算法的实现。 2．毕业设计（论文）课题的具体工作内容（包括原始数据、技术要求、工作要求等）： 1.查阅相关资料，利用已学的相关知识进行消化和理解。 2.了解现阶段的语音处理情况，分析研究相关的产品。 3.研究学习基本的识别处理方法。 4.学习相关信号处理软件。。 5.对软件的学习达到能对基本的算法进行软件的处理。 6.完成毕业设计论文。

毕业设计（论文）任务书 3．对毕业设计（论文）课题成果的要求〔包括毕业设计(论文)、图纸、实物样品等)： 1、毕业论文一份； 2、英文文献1份，相应的中文译文1份。 4．毕业设计（论文）课题工作进度计划：起迄日期工作内容 2006年 2月15日~ 3月31日4月 1日~ 5月31日6月 1日~ 6月20日6月20日~ 6月21日系统学习，查阅资料，作开题报告；英文资料翻译；撰写毕业论文；论文答辩。学生所在系审查意见：系主任：年月日

毕业设计外文翻译附原文

外文翻译专业机械设计制造及其自动化学生姓名刘链柱班级机制111 学号1110101102 指导教师葛友华

外文资料名称： Design and performance evaluation of vacuum cleaners using cyclone technology 外文资料出处：Korean J. Chem. Eng., 23(6), (用外文写) 925-930 (2006) 附件： 1.外文资料翻译译文 2.外文原文

应用旋风技术真空吸尘器的设计和性能介绍吉尔泰金，洪城铱昌，宰瑾李，刘链柱译摘要：旋风型分离器技术用于真空吸尘器 - 轴向进流旋风和切向进气道流旋风有效地收集粉尘和降低压力降已被实验研究。优化设计等因素作为集尘效率，压降，并切成尺寸被粒度对应于分级收集的50％的效率进行了研究。颗粒切成大小降低入口面积，体直径，减小涡取景器直径的旋风。切向入口的双流量气旋具有良好的性能考虑的350毫米汞柱的低压降和为1.5μm的质量中位直径在1米3的流量的截止尺寸。一使用切向入口的双流量旋风吸尘器示出了势是一种有效的方法，用于收集在家庭中产生的粉尘。摘要及关键词：吸尘器; 粉尘; 旋风分离器引言我们这个时代的很大一部分都花在了房子，工作场所，或其他建筑，因此，室内空间应该是既舒适情绪和卫生。但室内空气中含有超过室外空气因气密性的二次污染物，毒物，食品气味。这是通过使用产生在建筑中的新材料和设备。真空吸尘器为代表的家电去除有害物质从地板到地毯所用的商用真空吸尘器房子由纸过滤，预过滤器和排气过滤器通过洁净的空气排放到大气中。虽然真空吸尘器是方便在使用中，吸入压力下降说唱空转成比例地清洗的时间，以及纸过滤器也应定期更换，由于压力下降，气味和细菌通过纸过滤器内的残留粉尘。图1示出了大气气溶胶的粒度分布通常是双峰形，在粗颗粒（>2.0微米）模式为主要的外部来源，如风吹尘，海盐喷雾，火山，从工厂直接排放和车辆废气排放，以及那些在细颗粒模式包括燃烧或光化学反应。表1显示模式，典型的大气航空的直径和质量浓度溶胶被许多研究者测量。精细模式在0.18?0.36 在5.7到25微米尺寸范围微米尺寸范围。质量浓度为2?205微克，可直接在大气气溶胶和 3.85至36.3μg/m3柴油气溶胶。

说话人识别研究综述_王书诏

图１说话人识别系统框图识别训练输入语音预处理特性提取相似性准则判决模型存储模型产生文章编号：１００２－８６８４（２００７）０１－００５１－０５说话人识别研究综述王书诏，邱天爽（大连理工大学电子与信息工程学院，辽宁大连１１６０２３）【摘要】说话人识别是语音信号处理中的重要组成部分，是当前的研究热点之一。详细介绍了说话人识别的基本原理，从特征提取、模型训练和分类等几个方面就近年的主要研究情况进行综述和评价，并在此基础上探讨了研究难点和发展前景。【关键词】说话人识别；特征提取；模型训练；分类【中图分类号】ＴＮ９１２【文献标识码】ＡＳｕｒｖｅｙｏｎＳｐｅａｋｅｒＲｅｃｏｇｎｉｔｉｏｎＷＡＮＧＳｈｕ－ｚｈａｏ，ＱＩＵＴｉａｎ－ｓｈｕａｎｇ（ＤｅｐａｒｔｍｅｎｔｏｆＥｌｅｃｔｒｏｎｉｃＥｎｇｉｎｅｅｒｉｎｇ，ＤａｌｉａｎＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，ＤａｌｉａｎＬｉａｏｎｉｎｇ１１６０２３，Ｃｈｉｎａ）【Ａｂｓｔｒａｃｔ】Ｓｐｅａｋｅｒｒｅｃｏｇｎｉｔｉｏｎｉｓａｎｉｍｐｏｒｔａｎｔｐａｒｔｏｆｔｈｅｓｐｅｅｃｈｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇ．Ｉｔｉｓｏｎｅｏｆｔｈｅｃｕｒｒｅｎｔｒｅｓｅａｒｃｈｈｏｔｓｐｏｔｓ．Ｔｈｅｐｒｉｎｃｉｐｌｅｓｏｆｔｈｅｓｐｅａｋｅｒｒｅｃｏｇｎｉｔｉｏｎａｒｅｉｎｔｒｏｄｕｃｅｄｉｎｄｅｔａｉｌ．Ｔｈｅｌａｔｅｓｔｄｅｖｅｌｏｐｍｅｎｔｉｎｔｈｅａｒｅａｓｏｆｔｈｅｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎ，ｍｏｄｅｌｔｒａｉｎｉｎｇａｎｄｃｌａｓｓｉｆｉｃａｔｉｏｎｉｓｒｅｖｉｅｗｅｄａｎｄｔｈｅｔｒｅｎｄａｎｄｒｕｂｓａｒｅａｌｓｏｄｉｓｃｕｓｓｅｄ．【Ｋｅｙｗｏｒｄｓ】ｓｐｅａｋｅｒｒｅｃｏｇｎｉｔｉｏｎ；ｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎ；ｍｏｄｅｌｔｒａｉｎｉｎｇ；ｃｌａｓｓｉｆｉｃａｔｉｏｎ ?综述? １引言说话人识别作为生物认证技术的一种，是根据语音波形中反映说话人生理和行为特征的语音参数自动鉴别说话人身份的一项技术［１］。因此，需要从各个说话人的发音中找出说话人之间的个性差异，这涉及到说话人发音器官、发音通道和发音习惯之间等不同级别上的个性差异。说话人识别是交叉运用心理学、生理学、语音信号处理、模式识别、统计学习理论和人工智能的综合性研究课题。说话人识别根据实现的任务不同，可分为说话人辨认（ｓｐｅａｋｅｒｉｄｅｎｔｉｆｉｃａｔｉｏｎ）和说话人确认（ｓｐｅａｋｅｒｖｅｒｉｆｉｃａｔｉｏｎ）两种类型［２］；说话人识别根据系统对待识别语音内容的不同，又可分为与文本有关（ｔｅｘｔ－ｄｅｐｅｎｄｅｎｔ）和与文本无关（ｔｅｘｔ－ｉｎｄｅｐｅｎｄｅｎｔ）两种方式［３］。２说话人识别的基本理论与前期处理２．１语音产生模型［４］语音信号可以看成是激励信号ＵＧ（ｎ）经过一个线性系统Ｈ（ｚ）而产生的输出［４］。其中，声道模型Ｈ（ｚ）为离散时域的声道传输函数，通常可用全极点函数来近似。不同的说话人其声道形状是不同的，因此具有不同的声道模型。Ｈ（ｚ）表示为Ｈ（ｚ）＝１Ａ（ｚ）＝１１－ｐｉ＝１!ａｉｚ－ｉ（１）其中ｐ为全极点滤波器的阶数；ａｉ（ｉ＝１，２，…，ｐ）为滤波器的系数。ｐ值越大，则模型的传输函数和实际声道传输函数的吻合程度就越高，当然ｐ值也不能取得太大，一般情况下，ｐ的取值范围为８～１２［４］。２．２说话人识别基本原理图１为说话人识别系统框图。和语音识别系统一样，建立和应用这一系统可分为两个阶段：训练阶段和识别阶段。在训练阶段，系统的每个使用者说出若干训练语句，系统据此建立每个使用者的模板或模型参量参考集；而在识别阶段，待识别说话人语音中导出的参量要与训练中的参考参量或模板加以比较，并且根据一定的相似性准则形成判断。２．３预处理［５］通常，输入的语音信号都要进行预处理，预处理过程的好坏在一定程度上也影响系统的识别效果。一般ＶｏｉｃｅｔｅｃｈｎｏｌｏｇＹ语音技术

开题报告：人脸识别

北方工业大学本科毕业设计（论文）开题报告书题目：基于直方图差值比较方法的人脸识别系统指导教师：专业班级：学号：姓名：日期：2013年3月20日

一、选题的目的、意义近些年来，有关人脸的处理已受到广大研究人员越来越多的重视，如人脸识别、人脸定位、面部表情识别、人脸跟踪等。人脸处理系统在安全系统的身份认证、智能人机接口、图像监控、视频检索等领域有着广泛的应用前景。此外在进行人工智能的研究中，人们一直想做的事情就是让机器具有像人类一样的思考能力，以及识别事物、处理事物的能力，因此从解剖学、心理学、行为感知学等各个角度来探求人类的思维机制、以及感知事物、处理事物的机制，并努力将这些机制用于实践，如各种智能机器人的研制。同时，进行人脸图像识别研究也具有很大的使用价依。如同人的指纹一样，人脸也具有唯一性，也可用来鉴别一个人的身份。人脸图像的自动识别系统较之指纹识别系统、DNA鉴定等更具方便性，因为它取样方便，可以不接触目标就进行识别，从而开发研究的实际意义更大。并且与指纹图像不同的是，人脸图像受很多因素的干扰:人脸表情的多样性;以及外在的成像过程中的光照，图像尺寸，旋转，姿势变化等。使得同一个人，在不同的环境下拍摄所得到的人脸图像不同，有时更会有很大的差别，给识别带来很大难度。因此在各种干扰条件下实现人脸图像的识别，也就更具有挑战性。人脸图像识别除了具有重大的理论价值以及极富挑战性外，还其有许多潜在的应用前景，利用人脸图像来进行身份验证，可以不与目标相接触就取得样本图像，而其它的身份验证手段，如指纹、眼睛虹膜等必须通过与目标接触或相当接近来取得样木，在某些场合，这些识别手段就会有不便之处。

人脸识别系统毕业论文

人脸识别系统毕业论文第一节课题背景一课题的来源随着安全入口控制和金融贸易方面应用需要的快速增长，生物统计识别技术得到了新的重视。目前，微电子和视觉系统方面取得的新进展，使该领域中高性能自动识别技术的实现代价降低到了可以接受的程度。而人脸识别是所有的生物识别方法中应用最广泛的技术之一，人脸识别技术是一项近年来兴起的，但不大为人所知的新技术。人们更多的是在电影中看到这种技术的神奇应用：警察将偷拍到的嫌疑犯的脸部照片，输入到电脑中，与警方数据库中的资料进行比对，并找出该嫌犯的详细资料和犯罪记录。这并非虚构的情节。在国外，人脸识别技术早已被大量使用在国家重要部门以及军警等安防部门。在国，对于人脸识别技术的研究始于上世纪90年代，目前主要应用在公安、金融、网络安全、物业管理以及考勤等领域。二人脸识别技术的研究意义 1、富有挑战性的课题 2、面部关键特征定位及人脸2D形状检测技术 3、面部感知系统的重要容基于视觉通道信息的面部感知系统，包括人脸检测和跟踪、面部特征定位、面部识别、人脸归类（年龄、种族、性别等的判别）、表情识别、唇读等分系统，如图1-1所式，可以看出，继人脸检测和跟追之后，面部特征定位通常是面部感知的一个必备环节, 是后续工作的基础，具有重要的意义。尽管人脸识别不能说是其他面部感知模块的必备功能，但是，可以肯定的是，利用已知的身份信息，结合特定人的先验知识，可以提高表情分析、唇读和语音识别、手势识别乃至手写体识别的可靠性。而计算机对使用者身份确认的最直接的应用就是基于特定使用者的环境设置：如使用者的个性化工作环境，信息的共享和隐私保护等等。

图1-1面部感知系统结构图第二章系统的需求分析与方案选择人脸识别系统现在应用于许多领域中，但是人脸识别技术也是一项近年来兴起的，且不大为人所知的新技术。在我国以及其他国家都有大量的学者正在研究之中，不断的更新人脸识别技术，以便系统的识别准确率达到新的高度。第一节可行性分析在开发该人脸识别软件之前，我们查询了前人所写过的诸多论文以及源程序，在开发之时，结合了资料中的算法并揉进了自己的一些思想，使程序可以对人脸图片进行简易识别。一技术可行性图像的处理方法很多，我们可以根据需要，有选择地使用各种方法。在确定脸部区域上，通常使用的方法有肤色提取。肤色提取，则对脸部区域的获取则比较准确，成功率达到95%以上，并且速度快，减少很多工作。图像的亮度变化，由于图像的亮度在不同环境的当中，必然受到不同光线的影响，图像就变得太暗或太亮，我们就要对它的亮度进行调整，主要采取的措施是对图像进行光线补偿。高斯平滑：在图像的采集过程中，由于各种因素的影响，图像中往往会出现一些不规则的随机噪声，如数据在传输、存储时发生的数据丢失和损坏等，这些都会影响图像的质量，因此需要将图片进行平滑操作以此来消除噪声。灰度变换：进行灰度处理，我们要保证图像信息尽可能少的丢失。同样在进行灰度变视频输入㈡

基于说话人声音识别的技术研究语音识别技术

基于说话人声音识别的技术研究语音识别技术基于声音的说话人身份识别技术研究通信1203班成员：艾洲、刘安邦、汪中日余文正、王玉贵、宁文静 xx-12-28 项目背景伴随着全球化、网络化、信息化、数字化时代的到来，我们对高可靠性的身份验证技术与身份识别技术的需求也日益增长。在生物学和信息科学高度发展的今天，根据人体自身的生理特征(指纹、虹膜…)和行为特征(声音…)来识别身份的生物技术认证作为一种便捷、先进的信息安全技术已经在现实生活中得到广泛的应用，它是集光学、传感技术、红外扫描和计算机技术于一身的

第三代身份验证技术，能满足现代社会对于身份鉴别的准确性、安全性与实用性的更高要求。而语音是人的自然属性之一，由于说话人发声器官的生理差异以及后天形成的行为差异，每个人的语音都带有强烈的个人色彩，这使得通过分析语音信号来识别说话人成为可能。设计总体框架 1.语音库的建立 2.声音样本采集 2.1 特征参数提取 2.2 识别模型建立 3.语音识别测试梅尔倒谱系数（MFCC）简述

在话者识别方面，最常用到的语音特征就是梅尔倒谱系数（MFCC）。因为，根据人耳听觉机理的研究发现，人耳对不同频率的声波有不同的听觉敏感度，得出从200Hz到5000Hz的语音信号对语音的清晰度影响最大。所以，人们从低频到高频这一段频带内按临界带宽的大小由密到疏安排一组带通滤波器，对输入信号进行滤波。将每个带通滤波器输出的信号能量作为信号的基本特征，对此特征经过进一步处理后就可以作为语音的输入特征。由于这种特征不依赖于信号的性质，对输入信号不做任何的假设和限制，又利用了听觉模型的研究成果。因此，这种参数比基于声道模型的“线性预测系数LPC”相比更好，更符合人耳的听觉特性，而且当信噪比降低时仍然具有较好的识别性能。 MFCC倒谱特征提取流图 1. 预加重预加重处理其实是将语音信号通过一个高通滤波器：式中μ的值介于0.9-1.0之间，我们通常取0.97。预加重的目的是提升高频部分，使信号的频谱变得平坦，保持在低频到高频的整个频带中，能用

毕业设计英文翻译

使用高级分析法的钢框架创新设计 1．导言在美国，钢结构设计方法包括允许应力设计法(ASD)，塑性设计法(PD)和荷载阻力系数设计法(LRFD)。在允许应力设计中，应力计算基于一阶弹性分析，而几何非线性影响则隐含在细部设计方程中。在塑性设计中，结构分析中使用的是一阶塑性铰分析。塑性设计使整个结构体系的弹性力重新分配。尽管几何非线性和逐步高产效应并不在塑性设计之中，但它们近似细部设计方程。在荷载和阻力系数设计中，含放大系数的一阶弹性分析或单纯的二阶弹性分析被用于几何非线性分析，而梁柱的极限强度隐藏在互动设计方程。所有三个设计方法需要独立进行检查，包括系数K计算。在下面，对荷载抗力系数设计法的特点进行了简要介绍。结构系统内的内力及稳定性和它的构件是相关的，但目前美国钢结构协会（AISC）的荷载抗力系数规范把这种分开来处理的。在目前的实际应用中，结构体系和它构件的相互影响反映在有效长度这一因素上。这一点在社会科学研究技术备忘录第五录摘录中有描述。尽管结构最大内力和构件最大内力是相互依存的（但不一定共存），应当承认，严格考虑这种相互依存关系，很多结构是不实际的。与此同时，众所周知当遇到复杂框架设计中试图在柱设计时自动弥补整个结构的不稳定（例如通过调整柱的有效长度）是很困难的。因此，社会科学研究委员会建议在实际设计中，这两方面应单独考虑单独构件的稳定性和结构的基础及结构整体稳定性。图28.1就是这种方法的间接分析和设计方法。

在目前的美国钢结构协会荷载抗力系数规范中，分析结构体系的方法是一阶弹性分析或二阶弹性分析。在使用一阶弹性分析时，考虑到二阶效果，一阶力矩都是由B1,B2系数放大。在规范中，所有细部都是从结构体系中独立出来，他们通过细部内力曲线和规范给出的那些隐含二阶效应，非弹性，残余应力和挠度的相互作用设计的。理论解答和实验性数据的拟合曲线得到了柱曲线和梁曲线，同时Kanchanalai发现的所谓“精确”塑性区解决方案的拟合曲线确定了梁柱相互作用方程。为了证明单个细部内力对整个结构体系的影响，使用了有效长度系数，如图28.2所示。有效长度方法为框架结构提供了一个良好的设计。然而，有效长度方法的

基于matlab的人脸识别系统设计与仿真(含matlab源程序)毕业论文

人脸识别系统设计与仿真基于matlab的（含matlab源程序）目录第一章绪论 (1) 1.1 研究背景 (4) 1.2 人脸图像识别的应用前景 (5) 1.3 本文研究的问题 (6) 1.4 识别系统构成 (7) 1.5 论文的内容及组织 (9) 第二章图像处理的Matlab实现 (10) 2.1 Matlab简介 (10) 2.2 数字图像处理及过程 (10) 2.2.1图像处理的基本操作 (10) 2.2.2图像类型的转换 (11) 2.2.3图像增强 (11) 2.2.4边缘检测 (12) 2.3图像处理功能的Matlab实现实例 (13) 2.4 本章小结 (17) 第三章人脸图像识别计算机系统 (18) 3.1 引言 (18) 3.2系统基本机构 (19) 3.3 人脸检测定位算法 (20)

3.4 人脸图像的预处理 (27) 3.4.1 仿真系统中实现的人脸图像预处理方法 (28) 第四章基于直方图的人脸识别实现 (31) 4.1识别理论 (31) 4.2 人脸识别的matlab实现 (31) 4.3 本章小结 (32) 第五章总结 (33) 致谢 (34) 参考文献 (35) 附录 (37) 毕业设计（论文）原创性声明和使用授权说明

原创性声明本人郑重承诺：所呈交的毕业设计（论文），是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知，除文中特别加以标注和致谢的地方外，不包含其他人或组织已经发表或公布过的研究成果，也不包含我为获得及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体，均已在文中作了明确的说明并表示了谢意。作者签名：日期：指导教师签名：日期：使用授权说明本人完全了解大学关于收集、保存、使用毕业设计（论文）的规定，即：按照学校要求提交毕业设计（论文）的印刷本和电子版本；学校有权保存毕业设计（论文）的印刷本和电子版，并提供目录检索与阅览服务；学校可以采用影印、缩印、数字化或其它复制手段保存论文；在不以赢利为目的前提下，学校可以公布论文的部分或全部内容。作者签名：日期：

说话人识别系统~

燕山大学专业综合训练说明书题目：说话人识别系统的设计学院（系）：年级专业：学号：学生姓名：指导教师：教师职称：

燕山大学专业综合训练任务书院（系）：电气工程学院基层教学单位：仪器科学与工程系学号学生姓名专业（班级）题目说话人识别系统的设计训练内容应用矢量量化法构建说话人识别系统，编写程序，实现对信号处理方法和仿真实验相结合的全面综合训练。训练要求1.熟练掌握说话人特征参量及特征参数的提取方法。 2.熟练掌握Matlab编程方法。 3.掌握GUI的设计方法。 4.掌握模式匹配方法 5.完成系统构建，编写程序，实现对说话人身份的鉴别。工作计划第一周第二周第三周第四周检索、查阅资料，学习基础知识，构建说话人识别整体系统。学习矢量量化法编写程序。程序调试与撰写报告。参考资料 Matlab方面资料、语音信号处理方面资料答疑地点A203-1 答疑时间周六晚19点至22点；周日晚19点至22点。指导教师签字基层教学单位主任签字 Tel：130******** 2012 年8月27日

目录第1章摘要 (3) 第2章前言 (4) 第3章说话人识别系统设计相关知识 (5) 3.1 说话人识别基本原理 (5) 3.2 设计要求 (5) 3.3 结构设计 (5) 第4章设计方案 (7) 4.1 预处理模块 (7) 4.2 特征参数 (13) 4.3 训练模型 (17) 4.4 识别模型 (21) 第5章实验结果 (22) 第6章应用程序 (25) 心得体会 (28) 参考文献 (29)

说话人识别系统属于生物识别技术的一种，是一项根据语音波形中反映说话人生理和行为特征的语音参数识别说话人身份的技术。它是指通过说话人的语音来自动识别说话人的身份。目前，与文本无关的说话人识别的常用方法有很多，本文应用的是基于非参数模型的矢量量化VQ(VectorQuantization)方法。VQ在孤立词语音识别系统中得到了很好的应用，特别是有限状态矢量量化技术，对于语音识别更为有效。基于VQ的孤立词语音识别系统具有分类准确，存储数据少，实时响应速度快等综合性能好的特点。借助MATLAB工具，设计基于VQ码本训练程序和识别程序，识别特定人的语音。其系统处理过程主要是先对语音进行预加重、端点检测、分帧、加窗处理四个部分的处理，然后提取特征矢量参数（采用MFCC系数），然后对模版语音用矢量量化方法进行训练得到语音模版，最后用测试语音测试系统性能。其中系统的设计要分为预处理模块、特征提取模块、训练模块和识别模块等，各个部分结合在一起实现说话人识别功能。关键词：训练，说话人识别， VQ ，MATLAB

基于ARM9的人脸识别系统嵌入式报告课程设计

嵌入式课程设计报告学院信息电子技术专业通信工程班级学号姓名指导教师 2017年07月01日

基于ARM9的人脸识别系统一、引言人脸识别背景和意义人脸识别系统的研究始于20世纪60年代，80年代后随着计算机技术和光学成像技术的发展得到提高，而真正进入初级的应用阶段则在90年后期，并且以美国、德国和日本的技术实现为主；人脸识别系统成功的关键在于是否拥有尖端的核心算法，并使识别结果具有实用化的识别率和识别速度；“人脸识别系统”集成了人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术，同时需结合中间值处理的理论与实现，是生物特征识别的最新应用，其核心技术的实现，展现了弱人工智能向强人工智能的转化语音识别、体形识别等，而指纹识别、虹膜识别等都不具有自然性，因为人类或者其他生物并不通过此类生物特征区别个体。人脸识别具有这方面的特点，它完全利用可见光获取人脸图像信息，而不同于指纹识别或者虹膜识别，需要利用电子压力传感器采集指纹，或者利用红外线采集虹膜图像，这些特殊的采集方式很容易被人察觉，从而更有可能被伪装欺骗。二、系统设计 1、硬件电路设计（1）ARM9处理器本系统所采用的硬件平台是天嵌公司的TQ2440开发板，该开发板的微处理器采用基于ARM920T内核的S3C2440芯片。 ARM9对比ARM7的优势：虽然ARM7和ARM9内核架构相同，但ARM7处理器采用3级流水线的冯·诺伊曼结构，而ARM9采用5级流水线的哈佛结构。增加的流水线设计提高了时钟频率和并行处理能力。5级流水线能够将每一个指令处理分配到5个时钟周期内，在每一个时钟周期内同时有5个指令在执行。在常用的芯片生产工艺下，ARM7一般运行在100MHz左右，而ARM9则至少在200MHz 以上。指令周期的改进对于处理器性能的提高有很大的帮助。性能提高的幅度依赖于代码执行时指令的重叠，这实际上是程序本身的问题。对于采用最高级的语言，一般来说，性能的提高在30%左右。ARM7一般没有MMU(内存管理单元），（ARM720T有MMU）。（2）液晶显示屏为显示摄像头当前采集图像的预览，系统采用三星的320x240像素的液晶屏，大小为206.68cm。该液晶显示屏的每个像素深度为2bit，采用RGB565色彩空间。（3）摄像头摄像头采用市场上常见的网眼2000摄像头,内部是含CMOS传感器的OV511+芯片。CMOS传感器采用感光元件作为影像捕获的基本手段,核心是1个感光二极

人脸识别系统

鉴别人的身份是一个非常困难的问题，传统的身份鉴别方法把这个问题转化为鉴别一些标识个人身份的事物，这包括两个方面：①身份标识物品，比如钥匙、证件、ATM 卡等； ②身份标识知识，比如用户名和密码。在一些安全性要求严格的系统中，可以将这两者结合起来，比如ATM 机要求用户同时提供ATM 卡和密码。这些传统的身份鉴别方法存在明显的缺点：个人拥有的物品容易丢失或被伪造，个人的密码容易遗忘或记错。更为严重的是这些系统无法区分真正的拥有者和取得身份标识物的冒充者，一旦他人获得了这些身份标识事物，就可以拥有相同针对这一情况，我们可以采取两种措施加以解决。其一，研究新的适用于非完全正立人脸图像的特征检测方法并对人脸特征的提取作相应的调整,这种解决方法在文献[9]已有所尝试；其二，沿用现有的人脸识别系统，但在人脸图像送识别系统进行特征提取和识别之前（即在人脸检测和定位阶段），先进行人脸位置矫正的工作,这种方法在文献[10]中也已有所研究，并取得了较好的效果。与传统的身份鉴定手段相比，基于人脸生物特征信息的身份鉴定技术具有以下优点：● 用户易接受：简单易用，对用户无特殊要求。● 防伪性能好：不易伪造或被盗。● ―随身携带‖：不用担心遗漏或丢失，随时随地可用。除此之外，人脸识别技术还有主动性好，精确性高，性能/成本比高，自学习功能强等优点。河北工程大学毕业论文鉴于人脸识别技术在个人身份鉴定方面的众多优点，这项技术可以在很多领域得到应用：● 国家安全领域。协助公安，海关等国家安全机构加强对可疑人物、罪犯、恐怖分子的追踪、监控和识别。● 公众安全领域。加强交通管制；确认身份证、护照等证件的真伪；验证各类信用卡的持卡人身份。●计算机交互领域。根据计算机使用者人脸特征确定身份，提供个性化服务。Face Pose Adjustment, Facial Feature Extraction , Human Face Recognition , 人脸识别技术在这些领域的充分利用，对于有效地鉴定个人的身份，防止犯罪和诈骗、提高办公效率、节约资源有着重大的社会和经济意义。本章针对大部分人脸识别系统建模中存在的不足，将人脸位置矫正问题引入思考，并根据人脸图像特点设计实现了一种新的基于眼睛定位的人脸位置矫正算法。（为方便叙述起见，我们称人脸在竖直平面内的倾斜角度为平面旋转角度，而称人脸在水平面内的倾斜角度为深度旋转角度。本文中出现的人脸位置矫正说法都是针对平面旋转角度而言的。）Neural Networks , Gray-scale Static Image , Vertical-complexity of Image 作为人类智能的重要体现和个人身份鉴定的重要手段，人脸识别技术具有广泛的应用前景，已成为一项热门研究课题。人脸识别的关键技术之一就是人脸的检测定位。在一个完整的人脸识别系统中，能否对人脸进行正确的检测定位将对整个人脸识别系统的性能优劣产生极其重要的影响，而影响人脸检测定位的一个重要因素就是人脸在图像中的姿势。实际中，由于受到人的行为习惯，生理特征以及图像采集环境等诸多因素的影响，人脸在采集到的人脸图像中的姿势往往并不是完全正立的，而是在水平和竖直平面内都存在一定的倾斜角度（即深度旋转角度和平面旋转角度）。但是大部分的人脸识别系统都是针对正立的正面人脸图像而设计的，没有考虑到人脸图像可能存在的倾斜问题，致使这些人脸识别系统从人脸倾斜的图像中提取的特征数据在一定程度上失效，并有可能进一步导致人脸识别系统在最终识别结果中产生误判。1.2 国内外人脸识别系统的研究现状现在人脸识别技术已经应用在许多领域中，并起到了举足轻重的作用，人脸识别研究开始于1966 年PRI 的Bledsoe 的工作，经过三十多年的发展，人脸识别技术取得了长足的进步，现在就目前国内外的发展情况来进行展述。河北工程大学毕业论文1.2.1 国外的发展概况见诸文献的机器自动人脸识别研究开始于1966年PRI的Bledsoe的工作，1990 年日本研制的人像识别机，可在1秒钟内中从3500人中识别到你要找的人。1993 年，美国国防部高级研究项目署(Advanced Research Projects Agency)和美国陆军研究实验室(Army Research Laboratory)成立了Feret(Face Recognition Technology) 项目组，建立了feret 人脸数据库，用于评价人脸识别算法的性能。美国陆军实验室也是利用vc++开发，通过软件实现的，并

(完整版)基于matlab的人脸识别系统设计毕业设计

毕业设计 [论文] 题目：基于MATLAB的人脸识别系统设计学院：电气与信息工程学院专业：自动化姓名：张迎

指导老师：曹延生完成时间：2013.05.28

摘要人脸识别是模式识别和图像处理等学科的一个研究热点，它广泛应用在身份验证、刑侦破案、视频监视、机器人智能化和医学等领域，具有广阔的应用价值和商用价值。人脸特征作为一种生物特征，与其他生物特征相比，具有有好、直接、方便等特点，因此使用人脸特征进行身份识别更易于被用户所接受。人脸识别技术在过去的几十年得到了很大的发展，但由于人脸的非刚性、表情多变等因素，使得人脸识别技术在实际应用中面临着巨大的困难。本文针对近年来国内外相关学术论文及研究报告进行学习和分析的基础上，利用图像处理的matlab实现人脸识别方法，这种实现简单且识别准确率高，但其缺点是计算量大，当要识别较多人员时，该方法难以胜任。利用MATLAB实现了一个集多种预处理方法于一体的通用的人脸图像预处理仿真系统，将该系统作为图像预处理模块可嵌入在人脸识别系统中，并利用灰度图像的直方图比对来实现人脸图像的识别判定。关键词：图像处理, Matlab, 人脸识别, 模式识别

ABSTRACT Human face recognition focuses on pattern recognition ,image processi ng andother subjects.It is widely used in authentication,investigation,video surveillance,intelligent robots,medicine and other areas.Facerecognition ha s wide application and business value.Facial feature asabiological character istic,compared with others is direct,friendly andconvenient.Facial featuree mployed in authentication are user-friendly. The technology of face recognition in the past few years obtained the v ery big development, but due to the face of nonrigid, expression and chang eablefactors, the face recognition technology in practical application are fa cing great difficulties. This paper aimed at home and abroad in recent year s the relevant papers and researchreports on study and on the basis of the a nalysis, some units within the data sensitivity places need to enter personne l to carry out limitation design and develop a set of identity verification ide ntification system, the system uses PCA face recognition method, therealiza tion is simple and the accuracy rate of recognition is high,but itsdrawback i s that a large amount of calculation, when to identify more staff,this metho d is difficult to do. The realization of a set of various pretreatment methods in one of the generic face image preprocessing simulation system based on MATLAB, the system is used as the image preprocessing module can be embedded in a face recognition system, and using the histogram matching gray image to realize the recognition of human face images to determine.

基于PCA的人脸识别算法实现毕业论文

基于PCA的人脸识别算法实现毕业论文目录前言 (1) 第一章人脸识别系统概述 (2) 第一节人脸识别的研究概况 (2) 第二节人脸识别的发展趋势 (3) 一、多数据融合与方法综合 (4) 二、动态跟踪人脸识别系统 (4) 三、基于小波神经网络的人脸识别 (4) 四、三维人脸识别 (4) 五、适应各种复杂背景的人脸分割技术 (4) 六、全自动人脸识别技术 (4) 第三节人脸识别技术的主要难点 (4) 一、复杂条件下人脸的检测和关键点定位 (5) 二、光照问题 (5) 三、资态问题 (5) 四、表情问题 (5) 五、遮挡问题 (5) 第四节人脸识别流程 (5) 一、人脸图像采集 (6) 二、预处理 (6) 三、特征提取 (6) 第五节本章小结 (7) 第二章人脸图像的获取 (9) 第一节人脸图像获取 (9) 第二节人脸分割 (9) 第三节人脸数据库 (10) 第四节本章小结 (11) 第三章人脸图像的预处理 (12)

第一节人脸图像格式 (12) 一、JPEG格式 (12) 二、JPEG2000格式 (12) 三、BMP格式 (13) 四、GIF格式 (13) 五、PNG格式 (13) 第二节人脸图像常用预处理方法 (14) 一、灰度变化 (14) 二、二值化 (15) 三、直方图均衡 (15) 四、图像滤波 (15) 五、图像锐化 (17) 六、图像归一化 (18) 第三节本章小结 (19) 第四章人脸识别 (20) 第一节主成分分析基本理论 (20) 一、什么是主成分分析？ (20) 二、例子 (20) 三、基变换 (21) 四、方差 (23) 五、PCA求解：特征根分解 (27) 六、PCA的假设 (28) 七、总结： (28) 八、在计算机视觉领域的应用 (30) 第二节基于PCA人脸识别算法的实现 (31) 一、创建数据库 (32) 二、计算特征脸 (32) 三、人脸识别 (34) 第三节本章小结 (36) 结论 (37) 致谢 (38) 参考文献 (39) 附录 (40) 一、英文原文 (40) 二、英文翻译 (53)

毕业设计外文翻译格式实例.

理工学院毕业设计(论文)外文资料翻译专业：热能与动力工程姓名：赵海潮学号：09L0504133 外文出处：Applied Acoustics, 2010(71):701~707 附件： 1.外文资料翻译译文；2.外文原文。

附件1：外文资料翻译译文基于一维CFD模型下汽车排气消声器的实验研究与预测Takeshi Yasuda, Chaoqun Wua, Noritoshi Nakagawa, Kazuteru Nagamura 摘要目前，利用实验和数值分析法对商用汽车消声器在宽开口喉部加速状态下的排气噪声进行了研究。在加热工况下发动机转速从1000转/分钟加速到6000转/分钟需要30秒。假定其排气消声器的瞬时声学特性符合一维计算流体力学模型。为了验证模拟仿真的结果，我们在符合日本工业标准（JIS D 1616）的消声室内测量了排气消声器的瞬态声学特性，结果发现在二阶发动机转速频率下仿真结果和实验结果非常吻合。但在发动机高阶转速下（从5000到6000转每分钟的四阶转速，从4200到6000转每分钟的六阶转速这样的高转速范围内），计算结果和实验结果出现了较大差异。根据结果分析，差异的产生是由于在模拟仿真中忽略了流动噪声的影响。为了满足市场需求，研究者在一维计算流体力学模型的基础上提出了一个具有可靠准确度的简化模型，相对标准化模型而言该模型能节省超过90％的执行时间。关键字消声器排气噪声优化设计瞬态声学性能 1 引言汽车排气消声器广泛用于减小汽车发动机及汽车其他主要部位产生的噪声。一般而言，消声器的设计应该满足以下两个条件：（1）能够衰减高频噪声，这是消声器的最基本要求。排气消声器应该有特定的消声频率范围，尤其是低频率范围，因为我们都知道大部分的噪声被限制在发动机的转动频率和它的前几阶范围内。（2）最小背压，背压代表施加在发动机排气消声器上额外的静压力。最小背压应该保持在最低限度内，因为大的背压会降低容积效率和提高耗油量。对消声器而言，这两个重要的设计要求往往是互相冲突的。对于给定的消声器，利用实验的方法，根据距离尾管500毫米且与尾管轴向成45°处声压等级相近的排气噪声来评估其噪声衰减性能，利用压力传感器可以很容易地检测背压。近几十年来，在预测排气噪声方面广泛应用的方法有：传递矩阵法、有限元法、边界元法和计算流体力学法。其中最常用的方法是传递矩阵法（也叫四端网络法）。该方

基于PCA算法的人脸识别毕业设计论文

太原科技大学毕业设计（论文）设计(论文)题目：基于PCA算法的人脸识别

毕业设计（论文）原创性声明和使用授权说明原创性声明本人郑重承诺：所呈交的毕业设计（论文），是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知，除文中特别加以标注和致谢的地方外，不包含其他人或组织已经发表或公布过的研究成果，也不包含我为获得及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体，均已在文中作了明确的说明并表示了谢意。作者签名：日期：指导教师签名：日期：使用授权说明本人完全了解大学关于收集、保存、使用毕业设计（论文）的规定，即：按照学校要求提交毕业设计（论文）的印刷本和电子版本；学校有权保存毕业设计（论文）的印刷本和电子版，并提供目录检索与阅览服务；学校可以采用影印、缩印、数字化或其它复制手段保存论文；在不以赢利为目的前提下，学校可以公布论文的部分或全部内容。作者签名：日期： Ⅰ

学位论文原创性声明本人郑重声明：所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名：日期：年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定，同意学校保留并向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅。本人授权大学可以将本学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名：日期：年月日导师签名：日期：年月日 Ⅰ

声纹识别

声纹识别系统摘要本文首先通过用层次分析法（AHP ）构建了影响声纹识别的八大因素，并将其进行量化处理，得到了合理的权重比。同时构建Mel 倒谱系统提取说话人的主要特征倒频谱（MFCC 参数），利用提取的 MFCC 参数训练话者的 GMM （高斯混合模型），得到专属某话者的 GMM 声纹模型。接着通过语音数据对构建的声纹识别模型进行评价。发现得到的模型虽然可以接受，但其准确率不是很高。为了使模型的精确率提高，我们通过利用改进的K-means 算法来将模型进行调整。问题一：我们通过层次分析发得出语者的声学特征在语音识别中所占的权重最大，而且限于目前的技术，我们最终将能描绘语者声道结构的Mel 倒频谱系数作为语音的特征向量，该方法能很好的模拟人耳对不同频率的感知特性，具有很好的稳定性和准确度。然后我们利用matlab 编程将提供的语音数据的MFCC 系数提取出来作为声纹识别系统的训练样本。问题二：基于高斯混合模型(GMM),我们用EM 算法来估计GMM 中的未知参数，由K-means 算法来得到EM 算法的初始值，通过不断地迭代EM 算法更新GMM 模型中的权重（w ），均值(u)和方差矩阵,直到最终使 ()*()P X P X λλε-<，ε取10-5。问题三：根据问题一的MFCC 模型和问题二的GMM 模型，利用matlab 编程，用样本语音数据去训练GMM 模型得到样本库，让后用未知的测试语音样本利用模式匹配法去与样本语音库进行匹配，得到一系列的匹配概率，概率最大者对应的语者为测试语音的主人。我们得出的结论是EM 算法的初值对最终的识别率有很大影响，用来确定GMM 初始值的K-means 算法有比较大的误差，需要改进。问题四：基于问题三的测试和查阅的相关资料，我们认为传统的K-means 算法忽略特征矢量各维分量对识别的影响，因而无法得到令人满意的识别结果。由数理统计知，方差是用来衡量样本数据的离散程度的。如果特征矢量的分布稀疏，则它的方差就会很大，反之，那些分布较集中的矢量方差比较小。为此，本文提出了基于方差的加权几何距离，在聚类过程中，对特征矢量的各分量按方差大小进行加权，加权因子为矢量方差的倒数。关键字：声纹识别层次分析法（AHP ）美尓倒频谱系数（MFCC ）高斯混合模型（GMM ）期望值最大化算法（EM ） K-means 算法