文档库 最新最全的文档下载
当前位置:文档库 › 基于MATLAB的语音信号处理教学演示平台的设计

基于MATLAB的语音信号处理教学演示平台的设计

第8卷第12期

2009年12月

南阳师范学院学报

JournalofNanyangNormalUniversity

V01.8No.12Dec.2009

基于MATLAB的语音信号处理教学演示平台的设计

王志鹏,张

(南阳师范学院物理与电子工程学院。河南南阳473061)

摘要:针对“语音信号处理”课程的特点,将MATLAB语言引入课程,介绍了一款语音信号处理教学演示平台.该平

台能够很好地帮助学生理解和掌握课程的基本原理和基本分析方法.

关键词:语音信号处理;MATLAB;时域分析;频域分析;线性预测分析中图分类号:TN912;G642.423

文献标识码:A

文章编号:1671—6132(2009)12—0081—04

0引言

窗函数

“语音信号处理”是本科电子类专业课程,是研究用数字信号处理技术对语音信号进行处理的一门学科.“语音信号处理”课程内容较多,涉及不少数学运算和公式推导,要求掌握《信号与系统》、《数字信号处理》等课程理论,并且语音信号处理的很多概念学生都是第一次接触到,难以理解.如果仅采用课堂讲授的教学方式学生难以接受,无法调动学生的学习主动性和积极性,教学效果差.所以说,淡化理论的推导过程,使理论结果可视化,概念直观化,将是帮助学生理解教学内容,提高教学效果的关键.

MATLAB是MathWorks公司推出的一套高性能的数值计算和可视化软件,它集数值分析、矩阵计算、信号运算和图形显示于一体,构成了一个方便的、界面友好的用户环境,已被广泛用于信号与图形处理、控制系统设计、通信系统仿真等领域.

针对课程特点,在教学实践中利用MATLAB平台,将教学内容中一些比较重要的内容或者难以理解的概念开发成可视化程序.该演示平台包括窗函数分析模块、时域分析模块、频域分析模块、同态分析模块、线性预测分析模块等,基本涵盖了语音信号处理课程的所有内容.在课堂教学过程中使用该演示平台,可以把复杂的数学过程用图形显示出来,使学生对课程的知识有一个更加直观的认识,便于理解.本文就对该教学演示平台进行简要的分析介绍.

贯穿于语音信号分析与应用全过程的是“短

时分析技术”,也就需要利用窗函数对语音信号进行分帧处理,将语音信号分成一帧一帧来分析其特性参数.在语音信号处理中常用的窗函数是矩形窗和哈明窗,它们的表达式分别如下:

矩形窗:

山,=矗。乏竺∥’

哈明窗:

r0.54—0.46cos[2Trn/(N一1)],

埘(//.)=2

0≤n≤(N一1)

10。

n:e/se

窗函数埘(n)的选择(形状和长度),对于短时分析参数的特性影响很大.为此应选择合适的窗El,使其短时参数能更好地反映语音信号的特性变化.这里就可以通过教学演示平台生成这两种窗函数的时域波形以及频谱图,如图1所示.

收稿日期:2009—09—25

作者简介:王志鹏(1982一),河南南阳人,助教,硕士,主要从事无线电导航方面的研究

图1矩形窗和哈明窗

 

万方数据

 万方数据

第12期

王志鹏等:基于MATLAB的语音信号处理教学演示平台的设计

?83?

图2语音信号的时域分析

语音信号的频域分析

傅立叶变换在信号处理中具有十分重要的作

用,然而,语音信号是一个非平稳过程,因此,适用于周期、瞬变或平稳随机信号的标准傅立叶变换不能用来直接表示语音信号.所以说语音信号的频域分析方法就是短时傅立叶变换,相应的频谱称为

“短时谱”.可以对某一帧语音进行傅立叶变换,即

短时傅立叶变换口1,其定义为:

x。(e扣)=∑茹(m)W(,l—m)e巾“.

由定义知,短时傅立叶变换就是窗选信号的标准傅立叶变换.短时傅立叶变换有两个自变量:n和甜;所以它既是关于时间凡的离散函数,又是关于角频率∞的连续函数.

在数字信号处理中,为了便于计算机分析离散信号的频谱,提出了离散傅立叶变换的概念,与之类似,如令∞=2k霄/N,可以得到离散的短时傅立叶变换,它实际上是x。(e”)在频域的取样.其定义

如下:

疋(一簪)=鼍()=∑一

m)-j-抽--g-kx(m)w(n

m)e

疋(一百)=鼍()=∑

(0≤k≤N一1).

与频域分析相关的演示界面如图3所示.

图3

语音信号的频域分析

该演示平台取其中一帧语音信号,对其取离

散的短时傅立叶变换,可以使学生直观地看到语音

信号离散的短时傅立叶变换后得到的频谱形状,以加深对相关概念的理解.同时,该演示程序还生成了该语音信号经过一个低通滤波器以后的波形,可以形象地展示出语音信号经过低通滤波器前后波形和频谱的变化情况.

语音信号的线性预测分析

线性预测作为一种工具,几乎普遍地应用于语

音信号处理的各个方面,是最有效和最流行的语音分析技术之一.线性预测分析的基本概念是:一个语音的抽样能够用过去若干个语音抽样的线性组合来逼近.通过使实际语音抽样与线性预测抽样之间差值的平方和达到最小值,就能够决定唯一的一

组预测系数.

线性预测分析的基本原理是将被分析的信号用一个模型来表示,即将信号看做是某一个模型(即系统)的输出.这样就可以用模型参数来描述信号,如下所示.

1‘(n)叫1日(z)I—s(,I)

根据H(二)的不同,有三种不同的信号模型.其中最常用的是全极点模型,或称为自回归模型.可

以推导出线性预测方程为:

∑口;币(歹,i)=6(J,o)(.『=l,2,…,p),其中,6(J,i)=∑s(n—j)s(n—i).而最小均方误

差为E=6(0,0)一∑ai咖(o,i).具体推导过程省

略.

而线性预测分析的关键就是求解线性预测方

程,得到线性预测系数口;(i=1,2,…,P).这里采

用的解法是自相关法,可以把线性预测方程改写为:

∑air(I.『一iI)=r(J)(1≤J≤p),

其中,r(歹)表示语音信号的自相关函数.而最小均方

误差也变为E=r(o)一∑air(i).对于改写后的线置

性预测方程,可以采用递归方法求解,最常用的递归求解方法是莱文逊一杜宾(Levinson.Durbin)算法.

这个算法的过程和步骤为:

(1)对于i=0时,E。=r(0);

(2)对于第i次递归;

l一1

k。=iL∑《~r(_『一i)(1≤i≤p),

 

万方数据

?84?

南阳师范学院学报

第8卷

a:=k。,_i=qt~一矗。口::

(1≤J≤i—1),

Ei=(1一k;)EH;

(3)最终a,=o;,1≤J≤P.

语音信号的线性预测分析的演示界面如图4

所示.

图4

语音信号的线性预测分析

结语

本文围绕着语音信号的几种分析方法,介绍了

一个利用MATLAB开发的语音信号处理课程教学

演示平台HJ.利用此教学演示平台,可以非常清楚地看到各种演示波形,并可通过改变参数观察其波

形变换过程.在实际的教学过程中可以看到,采用此教学演示平台有助于学生形象化地理解教学内容,极大地调动了学生的学习积极性,取得了比较

好的教学效果.

[2][3]

[4]

参考文献

胡航.语音信号处理[M].哈尔滨:哈尔滨工业大学

出版社,2003.

张力.MATLAB在语音信号处理辅助教学中的应用

[J].电气电子教学学报,2005(2):96—99.蔡莲红,黄德智.现代语音技术基础与应用[M].北京:清华大学出版社,2003.

刘庆华,陈紫强.基于MATLAB和DSP的语音信号处

理课程的建设[J].电气电子教学学报,2006

(4):26—28.

Designofthevoicesignalprocessingteachingplatformbasedon

MATLAB

WANGZhi—peng,ZHANGLei

(SchoolofPhysicsandElectronicEngineering,NanyangNormalUniversity,Nanyang

473061,China)

Abstract:Based01'1

themainfeaturesofthe

course

ofSpeechSignalProcessing,thispaperadoptsMATLAB

to

introduce

teaching

demonstrationplatform.Thisplatformwillenablethestudents

to

understandandmasterthe

basicprinciplesandanalyticalmethodsofthis

course.

Keywords:thespeechsignalprocessing;MATLAB;timedomainanalysis;frequencydomainanalysis;linearprediction

analysis

 

万方数据

基于MATLAB的语音信号处理教学演示平台的设计

作者:王志鹏, 张雷, WANG Zhi-peng, ZHANG Lei

作者单位:南阳师范学院,物理与电子工程学院,河南,南阳,473061

刊名:

南阳师范学院学报

英文刊名:JOURNAL OF NANYANG NORMAL UNIVERSITY

年,卷(期):2009,8(12)

被引用次数:0次

参考文献(4条)

1.胡航语音信号处理 2003

2.张力MATLAB在语音信号处理辅助教学中的应用[期刊论文]-电气电子教学学报 2005(2)

3.蔡莲红.黄德智现代语音技术基础与应用 2003

4.刘庆华.陈紫强基于MATLAB和DSP的语音信号处理课程的建设[期刊论文]-电气电子教学学报 2006(4)

相似文献(10条)

1.期刊论文李爱平.李爱勤.王小娟MATLAB在《语音信号处理》课程教学中的应用-中国科技信息2010(17)

<语音信号处理>主要内容包括语音信号的分析方法及其应用.为了帮助学生理解与掌握课程中的基本原理与基本分析方法,使其具备一定的设计、开发、应用等方面的能力,本文在介绍语音信号处理课程的内容和特点的基础上,阐述了MATLAB软件在这门课程教学中的应用.通过具体的实例分析,说明将MATLAB引入课堂教学可以使学生加深对课堂抽象理论的理解,提高学习的主动性.

2.期刊论文刘庆华.陈紫强.LIU Qing-hua.CHEN Zi-qiang基于MATLAB和DSP的语音信号处理课程的建设-电气电子教学学报2006,28(4)

语音信号处理课程的主要内容包括语音信号的分析方法及其应用.为了帮助学生理解与掌握课程中的基本原理和基本分析方法,具有设计开发应用通信语音系统的基本能力,本文在介绍语音信号处理课程的内容和特点的基础上,结合MATLAB软件和数字信号处理器DSP硬件平台,提出了基于MATLAB和DSP进行语音信号处理课程建设的途径,并阐述了理论教学和实践教学的一些具体做法及实例.结果表明取得了良好的教学效果.

3.学位论文张炳基于改进GMM和韵律联合短时谱的说话人转换2008

说话人转换就是要将源说话人语音信号进行转换,使之听起来像目标说话人的技术。说话人转换是语音信号处理领域的一个较新的分支,它的研究对语音分析,语音编码,语音合成,语音增强,语音识别等语音信号处理的其它各个领域有重要的促进作用,具有广泛的应用前景。本文主要进行的研究工作有以下几个方面:

(1)研究了转换函数的训练模型:基于传统高斯混合模型的方法转换后的语音频谱包络有过平滑现象,导致语音音质下降,为此本文提出基于改进GMM的说话人转换的方法。该方法利用改进的GMM训练得到的转换函数,通过转换线性预测模型的线谱频率参数使源语音的谱包络尽可能地逼近目标语音的谱包络。

(2)研究了基音频率的转换方法:本文在考虑基音频率变换的方法时,采用将基音频率和谱包络参数组成韵律联合短时谱作为代表说话人个性信息的特征矢量,从而更充分的捕捉帧与帧之间的基音变化,并体现出谱包络变化和韵律变化的同步性,避免了将韵律联合短时谱之间的相关性割裂。

(3)通过MATLAB软件实现了整个说话人转换系统,并对实验结果进行主观和客观评测。从实验的ABX和PLSF测试结果来看此方法能够准确地刻画说话人的个性化特征,转换后语音具有更好的倾向性和频谱逼近度,并且可懂度和自然度都较高。另外MOS测试结果表明改进的GMM模型有效地克服了过平滑现象,在保证变换语音目标倾向性的同时,提高了变换语音的音质。

4.学位论文杨春英基于USB与虚拟仪器技术的语音信号处理系统2008

语音是来实现,从价格和灵活性上都不可取。论文基于“硬件的软件化”思想,在对语音信号特征进行的基础上,将虚拟仪器技术与MATLAB软件有机结合,利用通用串行总线(USB)数据采集的优势,设计了基于USB 与虚拟仪器技术的语音信号处理系统。

论文首先对语音信号处理技术的发展及研究现状进行了综述,说明课题研究的重要性;其次,对语音信号分析理论进行了详细的阐述,并对实验室虚拟仪器工程平台(LabVIEW)与MATLAB的有效链接进行了可行性研究。文中,较为系统的介绍了系统的硬件电路设计,包括:信号采集与预处理电路、电源电路、数据采集卡的选择等。系统软件设计部分重点论述了虚拟仪器主界面设计思想,并分章节介绍了各功能模块的设计流程。最后对系统试验结果进行了分析。

结果表明,系统硬件电路设计合理,可以有效地采集语音信号,软件设计界面美观简洁、功能全面、可操作性强、可处理数据能力强、可移植性好,通过相关参数的设置,可移植到其他虚拟器仪器系统设计中。

5.期刊论文张力.ZHANG Li MATLAB在语音信号处理辅助教学中的应用-电气电子教学学报2005,27(2)

本文将MATLAB语言引入语音信号处理教学中,以基音周期估计和端点检测为例,阐述了利用MATLAB语言编程的编程思想、程序的编写及实现.将语音信号处理过程编程开发成可执行的程序,生成可以执行的动画文件.可根据实际的分析需要改变其参数观察变化过程,有助于将语音信号处理中抽象的概念形象化,促进学生对其理论的深刻理解.

6.学位论文王海峰语音降噪实时处理算法研究2009

随着科学技术的进步,人类生产生活的场所不断扩大,噪声对人类的影响也越来越严重。因此为了提高噪声环境下语音的质量,噪声消除问题变得日益重要。近年来,由于DSP技术的快速发展,降噪技术的发展重点已经逐渐由硬件上的改进过渡到了算法上的提高。自适应技术是降噪技术的一个重要方法,其突出的优点在于不基于任何语音模型,语音特征损失小,消噪效果明显,所以被广泛应用。自适应滤波算法是自适应信号处理中最活跃的研究方向之一。寻求收敛速度快、稳态误差小、改善因子高的自适应滤波算法一直是研究人员不断努力追求的目标。本文主要对最小均方自适应滤波算法进行了改进,并对改进的自适应滤波算法进行了理论分析和计算机仿真研究。

文章简要地介绍了谱相减法、小波变换法、子空间法等传统的语音降噪算法,比较了它们的优缺点,给出了基本的自适应噪声抵消系统。对LMS自适应算法的理论与性能进行了分析,在MATLAB平台上仿真检验了该算法对噪声的滤除效果。仿真结果表明,LMS算法能有效消除语音中的噪声,但是算法本身还存在收敛速度较慢的缺陷。因此,对LMS算法进行了改进分析。首先对时域变步长自适应滤波算法进行研究,依据变步长LMS算法应遵循的原则,从S型函数和误差自相关结合估计等不同的角度提出了时域变步长LMS自适应算法的改进算法,并对这些改进算法进行了理论分析和计算机仿真。仿真结果表明,提出的两种时域变步长LMS自适应算法的改进算法均具有较好的收敛速度、稳态误差和改善因子。其次,在经典LMS自适应算法的基础上,对分块自适应算法BLMS以及由此推导出的FBLMS算法进行了研究,并利用MATLAB进行仿真与分析,FBLMS算法比LMS计算复杂度降低、计算时间缩短。因此,文章

提出的几种改进的算法,解决了经典LMS算法收敛速度慢的问题,更加有利于算法实时实现,仿真结果表明用于语音降噪能够收到较好的效果。

论文的最后对所做的工作进行了总结,指出存在的问题和今后继续研究工作的思路。

7.学位论文谢艳萍噪声环境下的说话人识别研究2009

说话人识别是语音信号处理的一项重要技术,是当前研究的热点之一。说话人识别是根据包含在语音中与说话人有关的信息来判定说话人的身份。本文从多个角度对说话人识别进行研究,实现了包括语音增强、特征提取、模型选择、产生识别结果在内的说话人识别系统。本文主要做了以下几个方面的研究:

(1)分析STSA—MMSE算法实时性差的原因,通过引入参数(ω)提高该算法的实时性,同时与听觉掩蔽效应相结合以减小语音的失真,提高语音的信噪比。通过Matlab仿真证明,改进后的算法在实时性和减小语音失真方面均好于原算法。

(2)分析Mel频率倒谱系数各阶(MFCC)的特性,利用高阶参数对噪声的稳定性,对特征参数加正弦窗,提高特征参数的抗噪性。实验证明:加窗后特征参数的鲁棒性好于原特征参数。

(3)研究矢量量化(VQ)理论在说话人识别中的应用,根据不同特征对识别率的贡献不同,在失真测度中对特征参数加权,以此提高系统的识别率。实验结果表明:本文给出的加权矢量量化算法在噪声环境下,性能优于原来的矢量量化算法。

8.学位论文田玉静基于LPC分析的自适应滤波器研究2007

语音信号处理及建模是现代信号处理的一个重要子科课题,论文以提取语音库中的一段语音信号为试验载体,基本完成了较完整的参数提取,根据获得数据对语音信号进行线性预测建立预测模型,文中首先介绍了AR模型,LPC线性预测原理及其参数算法,对实际语音信号进行LPC分析实验,讨论了实际语音信号线性预测时AR模型参数求取及模型阶数确定,MATLAB仿真绘出功谱图,分析实验残差,研究表明LPC分析对短数据的频谱分辨率效果明显。 论文重点研究了基于LPC分析的自适应滤波器,以语音信号进行LPC分析得到AR信号作为输入,采用LMS算法进行训练,MATLAB仿真构造了自适应线性预测器,通过试验对影响算法收敛性的参数进行了分析讨论,研究表明输入信号特征值的分散度越大其收敛性则越差。论文研究将模型法功率谱分析与LMS自适应算法结合起来取长补短,注重信号的先验信息,在先验的基础上训练以改善滤波效果,结合模型参数对LMS算法收敛性进行分析,以求得到良好的滤波效果,文中对自适应噪声抵消技术进行了实验研究,成功地从强干扰信号中提取清晰语音信号,探讨了自适应噪声抵消器的原理、当前应用情况及其前景,并进行了计算机仿真,给出了仿真结果。

论文研究以试验为主,注重理论与试验相结合,以理论为试验指导,以试验对理论进行检验。

9.学位论文赵璟基于麦克风阵列的声源定位与语音增强算法研究2008

基于麦克风阵列的语音信号处理是目前阵列信号处理领域的新兴研究方向之一。采用麦克风阵列进行声源定位和语音增强的优势在于不仅可以利用语音信号的时域和频域信息,而且可以利用其空域信息,提高环境噪声的抑制能力,获得较高的声源定位精度和语音增强性能。

本论文重点研究了在实验室自然环境中基于麦克风阵列的鲁棒声源定位算法和语音增强算法。本论文主要完成了以下四个方面的工作:

1)国内外技术现状分析和主流技术跟踪:在广泛阅读国内外相关文献资料的基础上,完成了对基于麦克风阵列的声源定位算法和语音增强算法技术综述:

2)声源定位算法和语音增强算法的研究和仿真实现:分析研究了主流的基于输出功率的可控波束形成声源定位算法、基于高分辨率谱估计声源定位算法和基于时延估计声源定位算法,以及目前广泛使用的谱相减语音增强算法和波束形成语音增强算法;完成了基于PC机的MATLAB软件仿真以及对算法的性能进行评估和比较;

3)鲁棒声源定位算法研究:针对嘈杂环境中声源定位算法性能下降的问题,针对语音信号的独特语谱特性和语音的声学模型,论文提出了一种改进的融合语音端点检测和声门激励脉冲信息线性预测残差的平均互功率谱相位时延估计声源定位算法(VAD-ESILPR);

4)声源定位和语音增强系统设计和实现:设计和搭建了基于8阵元麦克风阵列和声卡的实时信号采集系统,实现了基于PC机和MATLAB平台的声源定位和语音增强算法处理平台;完成了用户界面设计和算法仿真;在实验室真实噪声环境中对VAD-ESILPR和经典时延估计算法(GCC-PHAT)进行了声源定位性能测试和比较,测试结果表明,论文提出的VAD-ESILPR算法比GCC-PHAT算具有更强的鲁棒性,达到了在5~25dB真实环境中小于2度的定位精度。

本论文开展的工作和取得的成果将为后续声源定位和语音增强技术的进一步研究工作提供平台和参考。

10.期刊论文张力.肖薇薇.纪震.张基宏虚拟实验在"语音信号处理"课程教学中的应用-电气电子教学学报

2004,26(2)

利用软件技术构建虚拟实验是提高计算机教学及实验效率、降低实验成本的一条有效途径.本文介绍虚拟实验在语音信号处理中的应用,可以使学生在自己的PC机上完成各种语音信号处理实验,并对实验过程中出现的问题进行相应的指导,从而可以有效的缓解学生数量的日益增多与实验设备不足之间的矛盾.在语音信号虚拟实验设计过程中主要采用MATLAB来实现,并给出了利用MATLAB实现语音信号处理的例子.针对本科生语音信号处理课程学时少而内容多的特点,为提高教学质量对语音信号处理课程的教学内容进行改革.

本文链接:https://www.wendangku.net/doc/2e18209705.html,/Periodical_nysfxyxb200912024.aspx

授权使用:胡乃志(wfhygcdx),授权号:ba718a02-45a1-4fd4-b042-9ea1014d117d

下载时间:2011年3月9日

相关文档