文档库 最新最全的文档下载
当前位置:文档库 › 语音端点检测方法研究

语音端点检测方法研究

语音端点检测方法研究
语音端点检测方法研究

语音端点检测方法研究

文章在研究语音识别系统中端点检测基本算法的基础上,分别对利用双门限的端点检测方法、利用小波变换的端点检测方法、利用倒谱相关理论的端点检测方法原理进行了阐述和说明,并对几种端点检测方法的特点进行了分析。

标签:端点检测;双门限;小波变换;倒谱

1 概述

就一般情况下来讲,在语音通信过程当中,大多采用有线电话网的方式来进行,但是由于某些地区环境及场合需要等因素,则需要通过无线电台来作为通信方式。与此同时,在其实际应用过程中,整个通话过程由语音控制来实现。具体来讲,有线方说话时本地无线电台则处于发射状态,相对应来讲远端无线电台为接收状态,相反来讲,当有线方沉默的时候,无线电台工作状态发转。其中,语音端点检测方法和技术是关键,基于从某段语音信号当中来准确判断语音位置(起始点与终止点),从而有效地区分是否为语音信号这样的目的。该技术对于减少数据的采集量、降低或者排除噪声段的干扰以及提高系统识别性能等方面具有关键作用。

2 利用双门限进行语音端点检测

首先确定短时能量和短时过零率符合端点起点判定条件的帧,接着再根据短时过零率和短时能量符合端点终点判定条件的帧。除此之外,对于一些突发性噪声检测,比如由于门窗开关所引起的噪声,相对应来讲我们可以通过设置最短时间门限来进行判断。具体来讲,当处于静音这一语音信号端点检测段时,如数值比低门限还低,与此同时最短时间门限大于计时长度,那么我们基本上可以确定这是一段噪音。

双门限的检测算法结合了短时能量和短时过零率的优点,在得到的端点检测结果中,其精确度和浊音检测都能得到很好的保证。现在有很多的端点检测算法都是根据双门限的算法进行不同的改进,能使其各有优劣,从而适应于不同的情况和环境。

3 利用小波变换进行语音端点检测

小波变换属于时频分析的一种,具体来说是空间(时间)和频率的局部变换,因而能有效的从信号中提取信息。小波变换能将信号在时域中表现不了的特征在频域中表现出来。因此,利用小波变换的这一个特性,根据有效的说话人的声音数据和背景噪声数据的频谱存在明显差异的特征来进行端点检测。一般有效的说话人的声音数据的频谱分布范围很大,而且频率的值也很大。而背景噪声的频谱变化不大,而且值也较小。因此先将语音数据分帧,将分帧后的数据进行一次小波变换,再对小波变换后的数据计算方差,如果计算的结果大于一定的阈值,那

数字图像去噪典型算法仿真与分析

数字图像去噪典型算法仿真与分析 个人信息********* 摘要:图像去噪是数字图像处理中的重要环节和步骤。本文首先介绍了常见的图像噪声;然后,在介绍图像去噪的基本方法和原理的基础上,讨论了均值滤波、中值滤波和维纳滤波三种典型的图像去噪方法;最后,对包含有高斯噪声和椒盐等噪声的图像进行去噪,并对其去噪效果进行了仿真和分析比较,得出了三种方法各自的适用性特点。 关键词:图像去噪;均值滤波;中值滤波;维纳滤波 Simulation and Analysis of Image De-noising Methods in Digital Image Name:*** (个人信息****) Abstract: Image denoising is one of the most important parts and steps of image processing. Firstly, the paper introduces the common image noise. Then, based on the principle and methods of eliminating image noise, it discusses mean filtering, median filtering, and Wiener filtering which are typical image donoising. Finally, it uses these methods to eliminate image noise which contains Gaussian noise and salt&pepper noise. And through comparing and analyzing the effect of these methods, it concludes the applicability of each method in different application. Key words: image denoising; mean filtering; median filtering; Wiener filtering 0 引言 数字图像是现代人们获取信息的主要来源。由于成像系统、传输介质和记录设备等的不完善,数字图像在其形成、传输记录过程中往往会收到多种噪声的污染。一般来说,现实中的图像都是带噪图像。噪声使图像变得模糊,甚至淹没图

基于MATLAB的语音信号的基音周期检测

基于MATLAB的语音信号的基音周期检测 摘要:MATLAB是一种科学计算软件,专门以矩阵的形式处理数据。MATLAB将要性能的数值计算和可视化集成在一起,并提供了大量的内置函数,从而被广泛的应用于科学计算、控制系统和信息处理等领域的分析、仿真和设计工作。 MATLAB在信号与系统中的应用主要包括符号运算和数值计算仿真分析。由于信号与系统课程的许多内容都是基于公式演算,而MATLAB 借助符号数学工具箱提供的符号运算功能,基本满足设计需要。例如:解微分方程、傅里叶正反变换、拉普拉斯正反变换和Z正反变换等。MATLAB在信号与系统中的另一主要应用是数值计算与仿真分析,主要包括函数波形绘制、函数运算、冲击响应仿真分析、信号的时域分析、信号的频谱分析、系统的S域分析和零极点图绘制等内容。 本次课程设计为语音信号的基音周期检测,采集语音信号,对语音信号进行处理,区分清音浊音,并通过对采样值进行滤波、分帧、求短时自相关函数,得到浊音的基音周期。 关键字:清音、浊音、基音周期、基音检测、自相关函数

目录 1 概述 (1) 2 AMDF算法原理及实现 (1) 2.1 AMDF算法源程序 (2) 3 ACF算法原理及实现 (4) 3.1 用短时平均能量进行清/浊音的判断 (4) 3.2 自相关函数基音检测的原理 (6) 3.3 算法实现及相关程序 (6) 3.3.1 带通滤波 (7) 3.3.2 取样与分帧 (7) 3.3.3 短时能量分析 (8) 3.3.4 自相关函数分析 (11) 4 总结与心得体会 (13) 参考文献 (13)

1 概述 基音周期检测也称为基频检测(Pitch Detection) ,它的目标是找出和声带振动频率完全一致的基音周期变化轨迹曲线,或者是尽量相吻合的轨 迹曲线。基音周期检测在语音信号的各个处理领域中,如语音分析与合成、有调语音的辨意、低速率语音压缩编码、说话人识别等都是至关重要的,它的准确性及实时性对系统起着非常关键的作用,影响着整个系统的性能。 浊音信号的周期称为基音周期, 它是声带振动频率的倒数, 基音周期的估计称为基音检测。基音检测是语音处理中的一项重要技术之一, 它在有调语音的辨意、低速率语音编码、说话人识别等方面起着非常关键的作用; 但在实现过程中, 由于声门激励波形不是一个完全的周期脉冲串, 而且声道的影响很难去除、基音周期的定位困难、背景噪声的强烈影响等一系列因素, 基音检测面临着很大的困难。而自相关基因检测算法是一种基于语音时域分析理论的较好的算法。 本文在对AMDF、ACF基音检测算法基本原理进行分析的基础上,对此算法进行了深入的探讨,针对以往研究中存在的问题加以改进,给出了一种方便、快捷的检测方案。综合考虑了检测准确度和检测速率两方面的因素,然后通过对一段具体的语音信号进行处理,较准确地得到浊音语音信号的基音周期。 2 AMDF算法原理及实现 语音信号{s(n))的短时平均幅度差函数(AMDF)定义为:

基于短时自相关函数法的基音周期检测

项目总结报告 —基音周期的检测 1. 项目整体框架 1.1目标 了解语音基音周期估计方法,掌握自相关法估计基音周期的原理。 1.2主要内容 本次基音周期的估算,我们选用的是短时自相关函数法,包括四个模块。 第一个模块为基音的端点检测,主要为了区分浊音和清音。第二个模块为基音检测中的带通滤波器,主要为了减少共振峰的干扰。第三个模块为短时自相关函数法做基音检测,主要为了计算出基音周期。第四个模块为平滑处理,主要为了消除偏离值点。 2. 模块一(端点检测) 2.1主要负责工作 利用能熵比法进行语音端点检测,区分语音帧的起点以及终点。 2.2具体实现方法 2.2.1实验步骤 1)取一段语音“tone4.wav ”,该语音内容是“妈妈,好吗,上马,骂人”,语 音长度为3.5秒,采样率Fs=8000. 进行简单的去除直流分量,然后幅值归一化,时域波形如图1所示。 2)设置好分帧参数,帧长wlen=320,帧移inc=80,调用函数y =enframe(x,wlen,inc)'; 对语音信号x 分帧处理。最后帧数Fn=337。 3)设置端点检测门限值T1=0.05,使用能熵比法进行端点检测。对分帧后的 语音y 每一帧进行FFT 运算,然后计算每一帧的能熵比值。从而计算出语音y 中的语音端点。结果如图2所示。 2.2.2能熵比法 设语音信号时域波形为X(n),加窗分帧处理后得到的第i 帧语音信号为Xi(m),则FFT 后表示为Xi(k),其中下标i 表示为第i 帧,而k 表示为第k 条谱线。该语音帧在频域中的短时能量为 Ei =∑Xi (k )?n 2 k=0 Xi(k) 式中,N 为FFT 的长度,只去正频率部分。

语音端点检测方法研究

语音端点检测方法研究1 沈红丽,曾毓敏,李平,王鹏 南京师范大学物理科学与技术学院,南京(210097) E-mail:orange.2009@https://www.wendangku.net/doc/73678957.html, 摘要: 端点检测是语音识别中的一个重要环节。有效的端点检测技术不仅能减少系统的处理时间,增强系统处理的实时性,而且能排除无声段的噪声干扰,增强后续过程的识别性。可以说,语音信号的端点检测至今天为止仍是有待进一步深入的研究课题.鉴于此,本文介绍了语音端点算法的基本研究现状,接着讨论并比较了语音信号端点检测的方法,分析了各种方法的原理及优缺点,如经典的基于短时能量和过零率的检测方法,基于频带方差的检测方法,基于熵的检测方法,基于倒谱距离的检测方法等.并基于这些方法的分析,对端点检测方法做了进行了总结和展望,对语音信号的端点检测的进一步研究具有深远的意义。 关键词:语音信号;端点检测;噪声 中图分类号:TP206. 1 1. 引言 语音信号处理中的端点检测技术,是指从包含语音的一段信号中确定出语音信号的起始点及结束点。语音信号的端点检测是进行其它语音信号处理(如语音识别、讲话人识别等)重要且关键的第一步. 研究表明[1],即使在安静的环境中,语音识别系统一半以上的识别错误来自端点检测器。因此,作为语音识别系统的第一步,端点检测的关键性不容忽视,尤其是噪声环境下语音的端点检测,它的准确性很大程度上直接影响着后续的工作能否有效进行。 确定语音信号的起止点, 从而减小语音信号处理过程中的计算量, 是众多语音信号处理领域中一个基本而且重要的问题。有效的端点检测技术不仅能减少系统的处理时间,增强系统处理的实时性,而且能排除无声段的噪声干扰,增强后续过程的识别性。可以说,语音信号的端点检测至今天为止仍是有待进一步深入的研究课题。 2. 语音端点检测主要方法和分析 在很长一段时间里,语音端点检测算法主要是依据语音信号的时域特性[2].其采用的主要参数有短时能量、短时平均过零率等,即通常说的基于能量的端点检测方法。这些算法在实验室环境下具有良好的性能,但在噪声环境下,则无法达到其应有的效果。近年来,随着通信业的迅猛发展,又出现了很多的语音端点检测算法。它们主要是通过采用各种新的特征参数,以提高算法的抗噪声性能。如基于倒谱系数[3]、频带方差[4]、自相关相似距离[5] 、信息熵[6]等也逐渐的被应用到端点检测中。有时,还通过将信号的几种特征组合成为一个新的特征参数来进行端点检测。 2.1基于短时能量和短时平均过零率的检测方法 该方法也称为双门限比较法,它是在短时能量检测方法的基础上,加上短时平均过零率,利用能量和过零率作为特征来进行检测.在信噪比不是很低的情况下,根据语音信号的能量大于噪声噪声能量的假设,通过比较输入信号的能量与语音能量阈值的大小,可以对语音段和非语音段加以区分[7].输入每帧信号的能量可由下式得到[7-8]: 1本课题得到江苏省普通高校自然科学研究计划资助项目(项目批准号:07KJD510110)的资助。

去噪算法的分析与实现

去噪算法的分析与实现 摘要为了进一步提高一些图像处理效果如边缘检测质量和适用性,也对噪声滤波处理进行了分析,实验结果标明,在去除椒盐噪声方面,中值滤波优于双边滤波;双边滤波对低频的噪声却有很好的效果;高斯滤波对高斯噪声有很好的处理效果;双边滤波用处理时间的代价换取了边缘磨平少的效果,而高斯滤波恰恰相反。 关键词噪声;滤波;图像处理 1 选题背景 图像的滤波重建是图像处理学的一个重要分支,早在20世纪40年代,N.Wiener就阐明了再平稳条件下的线性滤波理论,即Wiener滤波器理论,这些理论在控制领域得到了广泛的应用。但是Wiener要求储量大,计算的复杂度高,在后来的图像处理领域逐渐诞生了双边滤波,高斯滤波,中值滤波等算法。 优化边缘检测算法,加入了各种滤波算法,通过编写一些小的程序实现各种滤波的过程,这是优化图像的一种方式也是图像处理的一般步骤,滤波的目的是减少图像上噪声和失真,但是使用滤波算法或多或少都会减少边缘的强度,因而图像的增强和滤波之间是一个折衷的选择。滤波的图像效果会有些模糊,也称为模糊处理。 实现滤波的算法有很多种,CV_BLUR(简单滤波)、CV_BLUR_NO_SCALE (简单无缩放变换的滤波)、CV_MEDIAN(中值滤波)、CV_GAUSSIAN(高斯滤波)、CV_BILATERAL(双边滤波)。 2 主要滤波算法原理分析 2.1 高斯滤波 滤波算法中,周围局部领域的像素值决定了目标点的像素值。具体实现在2D高斯滤波中分别将不同的高斯权重值也就是加权平均之后得到的当前点的最后结果。然而此处的高斯权重因子是利用了两个像素之间的空间距离得出的。通过高速分布曲线我们可以看出,离目标像素越远的点对最终结果的贡献越小,反之则越大。 2.2 双边滤波 双边滤波是在高斯滤波中加入一部分权重来得到更好的处理效果,应用了卷积原理。先对其进行离散化,这个步骤是在处理前完成的。而且没有必要对每一个局部像素从整张图像上都用加权操作这个过程,从距离上,如果像素超了一定程度,其实实际上对目标像素的影响是非常非常小的,几乎可以忽略不计。

噪声测量三种方法

噪声系数测量的三种方法 本文介绍了测量噪声系数的三种方法:增益法、Y系数法和噪声系数测试仪法。这三种方法的比较以表格的形式给出。 前言 在无线通信系统中,噪声系数(NF)或者相对应的噪声因数(F)定义了噪声性能和对接收机灵敏度的贡献。本篇应用笔记详细阐述这个重要的参数及其不同的测量方法。 噪声指数和噪声系数 噪声系数有时也指噪声因数(F)。两者简单的关系为: NF = 10 * log10 (F) 定义 噪声系数(噪声因数)包含了射频系统噪声性能的重要信息,标准的定义为: 从这个定义可以推导出很多常用的噪声系数(噪声因数)公式。 下表为典型的射频系统噪声系数: *HG=高增益模式,LG=低增益模式

噪声系数的测量方法随应用的不同而不同。从上表可看出,一些应用具有高增益和低噪声系数(低噪声放大器(LNA)在高增益模式下),一些则具有低增益和高噪声系数(混频器和LNA在低增益模式下),一些则具有非常高的增益和宽范围的噪声系数(接收机系统)。因此测量方法必须仔细选择。本文中将讨论噪声系数测试仪法和其他两个方法:增益法和Y系数法。 使用噪声系数测试仪 噪声系数测试/分析仪在图1种给出。 图1. 噪声系数测试仪,如Agilent公司的N8973A噪声系数分析仪,产生28VDC脉冲信号驱动噪声源 (HP346A/B),该噪声源产生噪声驱动待测器件(DUT)。使用噪声系数分析仪测量待测器件的输出。由于分析仪已知噪声源的输入噪声和信噪比,DUT的噪声系数可以在内部计算和在屏幕上显示。对于某些应用(混频器和接收机),可能需要本振(LO)信号,如图1所示。当然,测量之前必须在噪声系数测试仪中设置某些参数,如频率范围、应用(放大器/混频器)等。 使用噪声系数测试仪是测量噪声系数的最直接方法。在大多数情况下也是最准确地。工程师可在特定的频率范围内测量噪声系数,分析仪能够同时显示增益和噪声系数帮助测量。分析仪具有频率限制。例如,Agilent N8973A可工作频率为10MHz至3GHz。当测量很高的噪声系数时,例如噪声系数超过10dB,测量结果非常不准确。这种方法需要非常昂贵的设备。 增益法 前面提到,除了直接使用噪声系数测试仪外还可以采用其他方法测量噪声系数。这些方法需要更多测量和计算,但是在某种条件下,这些方法更加方便和准确。其中一个常用的方法叫做“增益法”,它是基于前面给出的噪声因数的定义:

语音信号基音周期检测的matlab程序

function nmax=find_maxn(r) %寻找峰值最大的n值及基音周期 %r,自相关序列 %maxn,为峰值最大的n zer=find(r==0); %找第一个零点如果存在 jiaocha=0; %找第一近零点 ii=1; while (jiaocha<=0) if(r(ii)>0 && r(ii+1)<0 && (ii+1)0 %检查是否存在零点 if zer(1)

噪音检测报警系统的设计与研究毕业设计DOC.doc

噪音检测报警系统的设计与研究 学生:XX 指导老师:XX 内容摘要:本文以AT89S52 单片机为控制核心,通过播音判断电路寻找广播间歇时段,实时采集噪声环境内的噪音信号,根据A/ D 转换后的噪音电平值计算出复杂环境下噪声信号的平均功率;根据噪声信号的功率大小自适应地控制大厅环境内的广播音量,实现了复杂噪声环境下自适应音量控制系统。该系统的硬、软件设计简单,性能良好,价格低廉。实验结果表明,该系统实现了预期功能,自适应效果良好,性价比较高,具有良好的推广价值。 关键词:语音判断噪音采集自适应音量控 AT89S52单片机

An adaptive volume cont rol AT89S52 MCU system based on noise collection is int Abstract:roduced. By looking forbroadcasting intermittent period using the voice judge circuit ,complicated noise signal at hall environment is sampledreal2time. Through A / D conversion and calculation ,the average power of noise signal can be measured. According tothe average power of noise signal ,an adaptive volume cont rol system at complicated noise environment is designed. Thedesign of hardware and sof tware is simple and cost performance is good. Experimental result s show that the whole system can adaptive adjust s volume according to the environment noise signal , and it s engineering value is good. Keywords:voice detection noise sampling adaptive volume cont rol AT89S52

基于自相关法的语音基音周期估计

综合实验报告 自相关法及其变种 学院电子与信息学院专业信息与信号处理学生 学生学号 提交日期2013年7月10日

一、实验目标 1.1 了解语音基音周期估计方法,掌握自相关法估计基音周期的原理,分析其变种。 二、实验基础知识 2.1 基音与基音周期估计 人在发音时,根据声带是否震动可以将语音信号分为清音跟浊音两种。浊音又称有声语言,携带者语言部分的能量,浊音在时域上呈现出明显的周期性;而清音类似于白噪声,没有明显的周期性。发浊音时,气流通过声门使声带产生弛震荡式振动,产生准周期的激励脉冲串。这种声带振动的频率称为基音频率,相应的周期就成为基音周期。 基音周期的估计称谓基音检测,基音检测的最终目的是为了找出和声带振动频率完全一致或尽可能相吻合的轨迹曲线。 基因周期作为语音信号处理中描述激励源的重要参数之一,在语音合成、语音压缩编码、语音识别和说话人确认等领域都有着广泛而重要的问题,尤其对汉语更是如此。汉语是一种有调语言,而基因周期的变化称为声调,声调对于汉语语音的理解极为重要。因为在汉语的相互交谈中,不但要凭借不同的元音、辅音来辨别这些字词的意义,还需要从不同的声调来区别它,也就是说声调具有辨义作用;另外,汉语中存在着多音字现象,同一个字的不同的语气或不同的词义下具有不同的声调。因此准确可靠地进行基音检测对汉语语音信号的处理显得尤为重要。 2.2 基音周期估计的现有方法 到目前为止,基音检测的方法大致上可以分为三类: 1)时域估计法,直接由语音波形来估计基音周期,常见的有:自相关法、并行处理法、平均幅度差法、数据减少法等; 2)变换法,它是一种将语音信号变换到频域或者时域来估计基音周期的方法,首先利用同态分析方法将声道的影响消除,得到属于激励部分的信息,然后求取基音周期,最常用的就是倒谱法,这种方法的缺点就是算法比较复杂,但是基音估计的效果却很好; 3)混合法,先提取信号声道模型参数,然后利用它对信号进行滤波,得到音源序列,最后再利用自相关法或者平均幅度差法求得基因音周期。 三、实验原理 3.1 自相关函数 能量有限的语音信号x(n)的短时自相关函数定义为: 此公式表示一个信号和延迟m 点后该信号本身的相似性。如果信号x(n)具有周期性,那么它的自相关函数也具有周期性,而且周期与信号x(n)的周期性相同。自相关函数提供了一种获取周期信号周期的方法。在周期信号周期的整数倍上,它的自相关函数可以达到最大()()()n n R m x n x n m =+∞=-∞ =+∑

基于hough变换的防噪声快速圆检测方法研究

基于hough变换的防噪声快速圆检测方法研 究 摘要:传统的hough变换在进行圆检测存在诸多问题,如计算量大、存储空间大、对于需要使用导数或梯度信息的算法而言,往往对图像中的噪声比较敏感等问题。本文针对传统hough变换的缺点提出一种基于hough变换防噪声圆检测方法,本方法在有噪声的图像中也能够快速准确的检测出圆的位置。 关键字:hough变换;圆检测;形态学;防噪声。 1引言 Hough变换是图像处理中的一个经典的检测几何图形的算法,而在一维几何图形其检测上的效果相当明显。但它在检测圆形上,计算量就会变得很大。而且在一定的条件下,不能有效防止噪声的干扰导致检测的鲁棒性低。针对这些问题在秦开怀等提出了一种基于hough变换的圆检测做了一些改进,先利用Canny算子做边缘提取,得到闭合的轮廓曲线,再利用形状角对轮廓曲线进行粗分类,然后再利用hough变换进行圆((x-a)2+(y-b)2=r2)检测,得到不错的效果。但是这种方法在有一定的噪声的图像中,检测的效果并不是很好。本文提出一种基于hough变换的防噪声快速圆检测方法,由于利用Canny算子在有噪声图像上做边缘提取效果并

不好。本文利用形态学防噪声的边缘提取这样在有效防止噪声的提取出有效的图像边缘;而利用传统hough变换进行圆()检测,则需要在三维空间上去求最多个数的交点,这就要求在计算机中申请三维的计数器,从而使得计算量非常之大,对计算机配置要求很高。由于针对一些实际检测中我们大致可以事先预测检测圆的大小,所以本文先给定圆的半径,将三维的计算器变为二维,再来进行检测。这样有效的减少了计算量,并且检测精度也有一定的提高。 2、防噪声的形态学边缘提取 形态变换包括腐蚀与膨胀,形态学的其它运算都是由这两种基本运算复合而得到的,主要有开( Open)、闭( Close),闭- 开和开- 闭等复合形态运算。 又是由膨胀和腐蚀来定义的,而形态学的边缘提取可以通过开闭运算来得到,这样经过多次的开闭运算得到图像的边缘能够有效防止噪声的干扰。本文通过上述的思想提出了一种多尺度结构元抗噪形态边缘检测算法。算法是结合均值的思想,采用多个结构元再结合开闭操作提出了形态学边缘提取,可以在滤除不同类型和大小噪声同时,充分保持图像的各种细节。 3、基于hough变换的防噪声快速圆检测方法 Hough变换对圆的检测的基本思想是将图像空间中满足圆的基本几何条件的边缘点连接起来的一种方法,它将图

图像去噪去噪算法研究 开题报告

图像去噪去噪算法研究论文开题报告 (1)选题的目的、意义 目的: 由于成像系统、传输介质和记录设备等的不完善,数字图像在其形成、传输记录过程中往往会受到多种噪声的污染,影响了图像的视觉效果,甚至妨碍了人们正常识别。另外,在图像处理的某些环节当输入的对象并不如预想时也会在结果图像中引入噪声。这些噪声在图像上常表现为—引起较强视觉效果的孤立象素点或象素块[1]。一般,噪声信号与要研究的对象不相关它以无用的信息形式出现,扰乱图像的可观测信息。要构造一种有效抑制噪声的滤波必须考虑两个基本问题能有效地去除目标和背景中的噪声;同时,也要能很好的保护图像目标的形状、大小及特定的几何和拓扑结构特征。 意义: 噪声的污染直接影响着对图像边缘检测、特征提取、图像分割、模式识别等处理,使人们不得不从各种角度进行探索以提高图像的质量[2] [3]。所以采用适当的方法尽量消除噪声是图像处理中一个非常重要的预处理步骤。现在图像处理技术已深入到科学研究、军事技术、工农业生产、医学、气象及天文学等领域。科学家利用人造卫星可以获得地球资源照片、气象情况;医生可以通过X射线或CT对人体各部位的断层图像进行分析。但在许多情况下图像信息会受到各种各样噪声的影响,严重时会影响图像中的有用信息,所以对图像的噪声处理就显得十分重要[4] [5]。图像去噪作为图像处理的一个重要环节,可以帮助人们更加准确地获得我们所需的图像特征,使其应用到各个研究领域,帮助解决医学、物理、航天、文字等具体问题。如何改进图像去噪算法,以有效地降低噪声对原始图像的干扰程度,并且增强视觉效果,提高图像质量,使图像更逼真,仍存在继续研究的重要意义。 (2)国内外对本课题涉及问题的研究现状 针对图像去噪的经典算法,科学工作者通过努力,提出了一些的改进算法,比如模拟退火法[6]。但是模拟退火法存在的问题是计算过程复杂,计算量大,即使使用计算机代替人工计算也会耗用大量时间。后来在众多研究者的努力下,产生了很多其他不同的方法。而现今已卓有成效的非线性滤波方法有正则化方法、最小能量泛函方法、各向异性扩散法[7] [8]。 目前常用的降噪方法有在空间域进行的,也有将图像数据经过傅里叶等变换以后转到频域中进行的[9]。其中频域里的滤波需要涉及复杂的域转换运算,相对而言硬件实现起来会耗费更多的资源和时间。在空间域进行的方法有均值或加权后均值滤波、中值或加权中值滤波、最小均方差值滤波和均值或中值的多次迭代等。实践证明,这些方法虽有一定的降噪效果,但都有其局限性。比如加权均值在细节损失上非常明显;而中值仅对脉冲干扰有效,对高斯噪声却无能为力[10] [11] [12] [13]。实上,图像噪声总是和有效数据交织在一起,若处理不当,就会使边界轮廓、线条等变得模糊不清,反而降低了图像质量。 对于去除椒盐噪声,主要使用中值滤波算法。中值滤波是在1970年由Tukey提出的一种一维滤波器。它主要是指用实心邻域范围内的所有值的中值代替所作用的点值,但是必须注意的是邻域内的点的个数是正奇数,这是为了保证取中值的便利性,若是偶数,则中值就会产生两个[14] [15]。中值滤波以一种简单的非线性平滑技术。它是以排序统计理论作为基础,有效抑制噪声的非线性处理数字信号技术。中值滤波对消除椒盐噪声非常有效。在图像处理中,常用中值滤波保护图像边缘信息,它是一种经典的去除图像噪声算法[16]。但是它在去除图像噪声过程中,往往会将图像的细节比如细线、棱角的地方破坏掉。后来

华南理工大学_语音信号实验二:基音周期估计

华南理工大学《语音信号处理》实验报告 实验名称:基音周期估计 姓名: 学号: 班级:11级电信6班 日期:2014年3 月

1.实验目的 本次试验的目的是通过matlab编程,验证课本中基音周期估计的方法,本实验采用的方法是自相关法。 2. 实验原理 1、基音周期 基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。 由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。②声道共振峰有时会严重影响激励信号的谐波结构,所以,从语音信号中直接取出仅和声带振动有关的激励信号的信息并不容易。③语音信号本身是准周期性的(即音调是有变化的),而且其波形的峰值点或过零点受共振峰的结构、噪声等的影响。④基音周期变化范围大,从老年男性的50Hz 到儿童和女性的450Hz,接近三个倍频程,给基音检测带来了一定的困难。由于这些困难,所以迄今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应用领域和各种环境条件情况下都能获得满意的检测结果。 尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个研究的课题,为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT、谱图法、小波法等等。 2、自相关函数 对于离散的语音信号x(n),它的自相关函数定义为: R(k)=Σx(n)x(n-k), 如果信号x(n))具有周期性,那么它的自相关函数也具有周期性,而且周期与信号x(n)的周期性相同。自相关函数提供了一种获取周期信号周期的方法。在周期信号周期的整数倍上,它的自相关函数可以达到最大值,因此可以不考虑起始时间,而从自相关函数的第一个最大值的位置估计出信号的基音周期,这使自相关函数成为信号基音周期估计的一种工具。

噪声监测方法

噪声监测方法 环境噪声监测的目的和意义:及时、准确地掌握城市噪声现状,分析其变化趋势和规律;了解各类噪声源的污染程度和范围,为城市噪声管理、治理和科学研究提供系统的监测资料。 一、城市环境噪声测量方法 城市环境噪声监测包括:城市区域环境噪声监测、城市交通噪声监测、城市环境噪声长期监测和城市环境中扰民噪声源的调查测试等。 基本测量仪器为精密声级计或普通声级计。仪器使用前应按规定进行校准,检查电池电压,测量后要求复校一次,前后灵敏度不大于2dB,如有条件,可使用录音机、记录器等。 (一)城市区域环境噪声监测 布点:将要普查测量的城市分成等距离网格(例如500m×500m),测量点设在每个网格中心,若中心点的位置不宜测量(如房顶、污沟、禁区等),可移到旁边能够测量的位置。网格数不应少于100个。 测量:测量时一般应选在无雨、无雪时(特殊情况除外),声级计应加风罩以避免风噪声干扰,同时也可保持传声器清洁。四级以上大风应停止测量。 声级计可以手持或固定在三角架上。传声器离地面高1.2米。放在车内的,要求传声器伸出车外一定距离,尽量避免车体反射的影响,与地面距离仍保持1.2米左右。如固定在车顶上要加以注明,手持声级计应使人体与传声器距离0.5米以上。 测量的量是一定时间间隔(通常为5秒)的A声级瞬时值,动态特性选择慢响应。 测量时间:分为白天(6:00-22:00)和夜间(22:00-6:00)两部分。白天测量一般选在8:00-12:00时或14:00-18:00时,夜间一般选在22:00-5:00时,随地区和季节不同,上述时间可稍作更改。 测点选择:测点选在受影响者的居住或工作建筑物外1米,传声器高于地面1.2m以上的噪声影响敏感处。传声器对准声源方向,附近应没有别的障碍物或反射体,无法避免时应背向反射体,应避免围观人群的干扰。测点附近有什么固定声源或交通噪声干扰时,应加以说明。

语音端点检测方法研究

语音端点检测方法研究 文章在研究语音识别系统中端点检测基本算法的基础上,分别对利用双门限的端点检测方法、利用小波变换的端点检测方法、利用倒谱相关理论的端点检测方法原理进行了阐述和说明,并对几种端点检测方法的特点进行了分析。 标签:端点检测;双门限;小波变换;倒谱 1 概述 就一般情况下来讲,在语音通信过程当中,大多采用有线电话网的方式来进行,但是由于某些地区环境及场合需要等因素,则需要通过无线电台来作为通信方式。与此同时,在其实际应用过程中,整个通话过程由语音控制来实现。具体来讲,有线方说话时本地无线电台则处于发射状态,相对应来讲远端无线电台为接收状态,相反来讲,当有线方沉默的时候,无线电台工作状态发转。其中,语音端点检测方法和技术是关键,基于从某段语音信号当中来准确判断语音位置(起始点与终止点),从而有效地区分是否为语音信号这样的目的。该技术对于减少数据的采集量、降低或者排除噪声段的干扰以及提高系统识别性能等方面具有关键作用。 2 利用双门限进行语音端点检测 首先确定短时能量和短时过零率符合端点起点判定条件的帧,接着再根据短时过零率和短时能量符合端点终点判定条件的帧。除此之外,对于一些突发性噪声检测,比如由于门窗开关所引起的噪声,相对应来讲我们可以通过设置最短时间门限来进行判断。具体来讲,当处于静音这一语音信号端点检测段时,如数值比低门限还低,与此同时最短时间门限大于计时长度,那么我们基本上可以确定这是一段噪音。 双门限的检测算法结合了短时能量和短时过零率的优点,在得到的端点检测结果中,其精确度和浊音检测都能得到很好的保证。现在有很多的端点检测算法都是根据双门限的算法进行不同的改进,能使其各有优劣,从而适应于不同的情况和环境。 3 利用小波变换进行语音端点检测 小波变换属于时频分析的一种,具体来说是空间(时间)和频率的局部变换,因而能有效的从信号中提取信息。小波变换能将信号在时域中表现不了的特征在频域中表现出来。因此,利用小波变换的这一个特性,根据有效的说话人的声音数据和背景噪声数据的频谱存在明显差异的特征来进行端点检测。一般有效的说话人的声音数据的频谱分布范围很大,而且频率的值也很大。而背景噪声的频谱变化不大,而且值也较小。因此先将语音数据分帧,将分帧后的数据进行一次小波变换,再对小波变换后的数据计算方差,如果计算的结果大于一定的阈值,那

图像椒盐噪声与高斯噪声去噪方法研究

德州学院毕业论文开题报告书 2011年3月16日院(系)物理系专业电子信息工程 姓名田程程学号200700802041 论文题目图像椒盐噪声与高斯噪声去噪方法研究 一、选题目的和意义 图像去噪的最终目的是改善给定的图像,解决实际图像由于噪声干扰而导致图像质量下降的问题。通过去噪技术可以有效地提高图像质量,增大信噪比,更好的体现原来图像所携带的信息,作为一种重要的预处理手段,人们对图像去噪算法进行了广泛的研究。在现有的去噪算法中,有的去噪算法在低维信号图像处理中取得较好的效果,却不适用于高维信号图像处理;或者去噪效果较好,却丢失部分图像边缘信息,或者致力于研究检测图像边缘信息,保留图像细节。如何在抵制噪音和保留细节上找到一个较好的平衡点,成为近年来研究的重点。 二、本选题在国内外的研究现状和发展趋势 随着各种数字仪器和数码产品的普及,图像和视频已成为人类活动中最常用的信息载体,它们包含着物体的大量信息,成为人们获取外界原始信息的主要途径。然而在图像的获取、传输和存贮过程中常常会受到各种噪声的干扰和影响而使图像降质,并且图像预处理算法的好坏又直接关系到后续图像处理的效果,如图像分割、目标识别、边缘提取等,所以为了获取高质量数字图像,很有必要对图像进行降噪处理,尽可能的保持原始信息完整性(即主要特征)的同时,又能够去除信号中无用的信息。所以,降噪处理一直是图像处理和计算机视觉研究的热点。

三、课题设计方案 本设计为图像椒盐噪声与高斯噪声去噪方法研究 一、研究高斯噪声和椒盐噪声特性 二、研究去噪算法,提出适合去除高斯噪声和椒盐噪声的算法 三、计算机仿真 四、计划进度安排 第一周至第二周:根据寒假期间针对论文题目收集的有关资料,认真分析和整理资料,形成撰写论文的大体框架。对论文的撰写形成明确地认识,认真书写开题报告,完成开题报告并上交。 第三周至第五周:学习和研究图像椒盐噪声与高斯噪声去噪方法。 第六周至第十一周:对前期的关于图像椒盐噪声与高斯噪声去噪方法的研究进行总结。 第十二周:根据论文指导意见和建议对论文进行修改和完善后形成论文终稿。

语音信号基音检测算法研究

语音信号基音检测算法研究 摘要:本文对倒谱法做了改进,在用倒谱法进行基音检测分析时,提出了一种功率谱二次处理的二次谱减法,该方法克服了倒谱法基音检测的抗噪能力低的弱点,在相同噪声环境下能更加精确地检测出语音信号的基音周期。 关键词:语音信号基音检测倒谱法二次谱减法 1、引言 近年来,基于线性预测和分析频谱的Mel倒谱系数在处理包含情感的语音识别中取得了很大的进步,能否把此种方法应用到相应状态下的基音检测中去,值得广大学者研究。国外很多学者采用实时监控情感变化,并把影响修正基音的轨迹加以平滑或者动态改变窗的宽度,可以明显降低上述影响。基音检测一直是语音信号处理的一大难题,短时自相关函数法、短时平均幅度差函数法、倒谱法、小波变换法等传统的经典基音检测方法,都有各自的用场,但同时也有其相应的不足。其中任一种方法都不能作为通用的方法,但若在基音检测过程中,对预处理和后处理上进行一些改进,且突破传统的语音模型,并适当考虑说话人的个体特征及发音时的情感力度对基音检频带内谱包络测的影响,定能提高基音检测的准确性及健壮性。 本文以语音信号的基音检测为研究对象,着重分析自相关函数法p倒谱法的定义为,时间序列的z变换的模的对数的逆z变换,该序列的倒谱的傅里叶变换形式为。落实到具体实现时,采用DFT来近似傅里叶变换,根据传统语音产生的模型及语音信号的短时性。在其频域内,语音信号短时谱等于激励源的频谱与滤波器的频谱的乘积,浊音信号短时谱中包含的快变化周期性细致结构,则必会对应着周期性脉冲激励的基频以及各次谐波。语音的倒谱是将语音的短时谱取对数后再进行IDFT来得到,所以浊音信号的周期性激励如果反映在倒谱上,便是同样周期的冲激。藉此,我们可从得到的倒谱波形中估计出基音周期。一般我们把倒谱波形中第二个冲激,认为是对应激励源的基频,即基音周期。下面列举出一种倒谱法求基音周期的框图(见图1) 。 3、改进算法的基音检测 当用无噪声的语音信号时,采用倒谱法进行基音检测还是很理想的。但是有加性噪声存在时,对数功率谱中的低电平部分会被噪声填满,从而掩盖了基音谐波的周期性。这也意味着倒谱的输入不再是单纯的周期性成分,而导致倒谱中的基音峰值变宽,而且受到噪声的污染,最终导致倒谱检测方法的灵敏度也随之下降。为此,本文提出了如下改进方法(图2): 此方法避p本文以语音信号的基音检测为研究对像,对短时自相关函数、倒谱法、这两种基音检测的方法的原理进行了分析。在此基础上,深入研究了倒谱法基音检测的算法。通过实验仿真,发现这种测量方法的不足;最后对这种算法进行了改进,在用倒谱法进行基音检测分析时,提出了一种功率谱二次处理的二次谱减法,该方法克服了倒谱法基音检测的抗噪能力低的弱点,在噪声环境相同的情况下能更加准确的检测出语音信号的基音周期,从而有效提高算法在基音检测时的准确性和抗噪性。 参考文献 [1]胡航.语音信号处理[M].哈尔滨:哈尔滨工业大学出版社,2000:116.126. [2]韩纪庆,张磊,郑铁然.语音信号处理[M].北京:清华大学出版社,2004,lO.39.

自相关 基音检测

专业班级 08级信息工程组别 成员 1、引言 人在发浊音时,气流通过声门使声带产生张弛振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音,又称有声语音,它携带着语音中的大部分能量。这种声带振动的频率称为基频,相应的周期就称为基音周期( Pitch) ,它由声带逐渐开启到面积最大(约占基音周期的50% ) 、逐渐关闭到完全闭合(约占基音周期的35% ) 、完全闭合(约占基音周期的15% )三部分组成。 当今主流的基音周期检测技术主要有时域的自相关法、频域的倒谱法、时频结合的小波变换分析方法以及在其基础上的衍生算法。本文所采用的方法是自相关法 2.设计思路 (1)自相关函数 对于离散的语音信号x(n),它的自相关函数定义为: R(k)=Σx(n)x(n-k), 如果信号x(n))具有周期性,那么它的自相关函数也具有周期性,而且周期与信号x(n)的周期性相同。自相关函数提供了一种获取周期信号周期的方法。在周期信号周期的整数倍上,它的自相关函数可以达到最大值,因此可以不考虑起始时间,而从自相关函数的第一个最大值的位置估计出信号的基音周期,这使自相关函数成为信号基音周期估计的一种工具。 (2)短时自相关函数 语音信号是非平稳的信号,所以对信号的处理都使用短时自相关函数。短时自相关函数是在信号的第N个样本点附近用短时窗截取一段信号,做自相关计算所得的结果 Rm(k)=Σx(n)x(n-k) 式中,n表示窗函数是从第n点开始加入。 3、程序代码 function pitch x=wavread('E:\luyin\wkxp.wav');%读取声音文件 figure(1); stem(x,'.'); %显示声音信号的波形 n=160; %取20ms的声音片段,即160个样点 for m=1:length(x)/n; %对每一帧求短时自相关函数 for k=1:n; Rm(k)=0; for i=(k+1):n; Rm(k)=Rm(k)+x(i+(m-1)*n)*x(i-k+(m-1)*n); end end p=Rm(10:n); %防止误判,去掉前边10个数值较大的点 [Rmax,N(m)]=max(p); %读取第一个自相关函数的最大点end %补回前边去掉的10个点 N=N+10;

matlab图像去噪算法设计(精)只是分享

数字图像去噪典型算法及matlab实现 希望得到大家的指点和帮助 图像去噪是数字图像处理中的重要环节和步骤。去噪效果的好坏直接影响到后续的图像处理工作如图像分割、边缘检测等。图像信号在产生、传输过程中都可能会受到噪声的污染,一般数字图像系统中的常见噪声主要有:高斯噪声(主要由阻性元器件内部产生)、椒盐噪声(主要是图像切割引起的黑图像上的白点噪声或光电转换过程中产生的泊松噪声)等; 目前比较经典的图像去噪算法主要有以下三种: 均值滤波算法:也称线性滤波,主要思想为邻域平均法,即用几个像素灰度的平均值来代替每个像素的灰度。有效抑制加性噪声,但容易引起图像模糊,可以对其进行改进,主要避开对景物边缘的平滑处理。 中值滤波:基于排序统计理论的一种能有效抑制噪声的非线性平滑滤波信号处理技术。中值滤波的特点即是首先确定一个以某个像素为中心点的邻域,一般为方形邻域,也可以为圆形、十字形等等,然后将邻域中各像素的灰度值排序,取其中间值作为中心像素灰度的新值,这里领域被称为窗口,当窗口移动时,利用中值滤波可以对图像进行平滑处理。其算法简单,时间复杂度低,但其对点、线和尖顶多的图像不宜采用中值滤波。很容易自适应化。 Wiener维纳滤波:使原始图像和其恢复图像之间的均方误差最小的复原方法,是一种自适应滤波器,根据局部方差来调整滤波器效果。对于去除高斯噪声效果明显。实验一:均值滤波对高斯噪声的效果 I=imread('C:\Documents and Settings\Administrator\桌面\1.gif');%读取图像 J=imnoise(I,'gaussian',0,0.005);%加入均值为0,方差为0.005的高斯噪声 subplot(2,3,1);imshow(I); title('原始图像'); subplot(2,3,2); imshow(J); title('加入高斯噪声之后的图像'); %采用MATLAB中的函数filter2对受噪声干扰的图像进行均值滤波 K1=filter2(fspecial('average',3),J)/255; %模板尺寸为3 K2=filter2(fspecial('average',5),J)/255;% 模板尺寸为5 K3=filter2(fspecial('average',7),J)/255; %模板尺寸为7 K4= filter2(fspecial('average',9),J)/255; %模板尺寸为9 subplot(2,3,3);imshow(K1); title('改进后的图像1'); subplot(2,3,4); imshow(K2); title('改进后的图像2');

相关文档