文档库 最新最全的文档下载
当前位置:文档库 › 自适应控制技术在语音增强中的应用

自适应控制技术在语音增强中的应用

自适应控制技术在语音增强中的应用
自适应控制技术在语音增强中的应用

自适应控制技术在语音增强中的应用研究

摘要:采用自适应控制技术原理,设计自适应滤波器,并估计出通过该滤波器的噪声最佳值,然后从带噪语音中减去该估计值,得到纯净语音信号,实现自适应语音增强效果。

关键词:自适应控制;噪声最佳值;带噪语音。

0 引言

自适应滤波器的算法有很多,有Widrow 等提出的基于LMS (Least Mean Square )最小均方误差准则的算法及改进算法,有基于最小二乘法准则的RLS 算法等。LMS 较RLS 算法

收敛速度慢,但算法简单,计算量小得多(LMS 计算量∝N ,RLS 计算量∝N 2,其中N 为滤

波器加权系数个数),因而易于实现,已被广泛使用。

自适应噪声对消是由自适应滤波器来完成的。自适应滤波器在输入信号和噪声的统计特性未知或变化的情况下,能调整自身参数,以达到最佳滤波效果。自适应滤波器最常用的算法是1965年Widrow 提出的横向结构LMS 算法,该算法运算量小,易于实现。自适应滤波采用FIR 滤波器,从带噪语音中减去噪声的最佳估值,得到纯净的语音。根据LMS 准则来调整滤波器系数的方法中,关键问题是如何得到噪声的最佳估值,使估计出的噪声与实际噪声最接近。

1 噪声最佳值的估计

实现噪声最佳值的估计是利用噪声对消法原理。噪声对消法在实际中有很大的应用。比如坦克车内的噪声很大,坦克车手要与指挥员通话,若用平时普通的耳机和话筒,就会影响通话的质量;现在已经研制出的设备就很好地克服车内噪声的影响,它就应用了噪声对消原理。类似的还有,在飞机驾驶舱内飞行员与地面之间的联络。在飞行编队中飞行员之间的联络等场合,噪声对消也已经成功地得以应用。鉴于噪声对消法在实际中的应用效果,在条件具备的工作环境中,噪声对消法是首选。

1.1 噪声对消法

噪声对消法的基本原理是从带噪语音中减去噪声。这一原理的关键是如何得到噪声的复制品。如果可以用两个话筒(或多个话筒)的采集系统,一个采集带噪语音,另一个(或多个)采集噪声,则这一任务比较容易解决。图1给出了双话筒采集系统的噪声对消法原理框图。图中带噪语音序列y(n)和噪声序列d(n)经傅里叶变换后得到频谱分量)(w Y k 和)(w D k ,|)(|w D k 经数字滤波后与|)(|w Y k 相减,然后加上带噪语音频谱分量的相位,再经过傅里叶反变换恢复为时域信号。在强背景噪声时,这种方法得到很好的消噪声效果[1]。

话筒2话筒

图1 双话筒采集系统的噪声对消法原理框图

以下三式是完整的噪声对消法原理公式:

||])([||)(|)(|w D E w Y w S k k k -= (1)

))(ex p(|)(|)(w Y j w S w S k k k ∠= (2)

)]([)(1w S F n s k k -= (3)

噪声对消法可以用于平稳噪声,也可以用于准平稳噪声。采用噪声对消法时,两个话筒之间必须要有相当的隔离度,但采集到的两路信号之间不可避免地会有时间差,因此实时采集到的两路信号中所包含的噪声段是不同的,回声及其他可变衰减特性也将影响所采集噪声的“纯净性”。因而,采集到的噪声必须经过数字滤波器,以得到尽可能接近带噪语音中的噪声。通常,这就需要采用自适应滤波器,使相减噪声与带噪语音中的噪声一致。

2自适应控制滤波原理

在未知统计特性环境下处理观测信号或数据,要获得所期望结果时,利用自适应滤波器可以获得令人满意的解,其性能远超过用通用方法设计的固定参数的滤波器。

自适应滤波器是这样的处理器,它在统计特性未知或统计特性变化时,能够调整自己的参数,以满足某种最佳准则的要求,当输入信号的统计特性未知时,自适应滤波器调整自己参数的过程称为“学习”过程;而当输入过程的统计特性变化时自适应滤波器调整自己参数过程称为“跟踪”过程。

自适应滤波器由参数可调的数字滤波器和自适应算法两部分组成,数字滤波器既可以是FIR 数字滤波器也可以是IIR 数字滤波器。在维纳滤波器理论发明的早期,人们使用FIR 滤波器。而现在更多的人还使用FIR 滤波器。FIR 滤波器是固有稳定的,因为它的结构只包含正向通路。换句话说,在FIR 滤波器中,输入与输出交互作用的机理只有一个,即通过正向通路从滤波器输入到滤波器输出。正是这种信号传输形式,限制了FIR 滤波器的脉冲响应是有限域的。另一方面,IIR 滤波器同时兼有正向通路和反馈通路。反馈通路的存在,意味着滤波器输出的一部分有可能返回到输入端。显而易见,除非通过特别设计,滤波器内部反馈可能产生不稳定,导致滤波器震荡。当滤波器为自适应时,本身就有不稳定的问题,如果再组合IIR 滤波器的不稳定问题,事情将变得更为复杂,更难处理。因此,在自适应滤波器应用中,一般采用FIR 滤波器。

实际上自适应滤波器是一种能够自动调节本身参数的特殊维纳滤波器,在设计时不需要 事先知道关于输入信号和噪声的统计特性的知识,它能够在自己的工作过程中逐渐“了解” 或估计出所需要的统计特性,并以此为根据自动调整自己的参数,以达到最佳滤波效果。一

旦输入信号的统计特性发生变化,它又能够跟踪这种变化,自动调整参数,使滤波器性能重 新达到最佳[2]。

3自适应滤波器算法

3.1 LMS 算法

自适应横向滤波器具有以下功能:

(l )按照某种自适应算法自动调节滤波系数的横向滤波器:分别以W 1(n)…,W M (n)表示各个滤波器所在时刻的权系数。

(2)调节这些系数的过程:首先自动调节滤波器系数的自适应训练步骤,然后利用滤波系数加权延迟线抽头上的信号来产生输出信号,将输出信号与期望信号进行对比,所得误差值 通过一定的自适应控制算法再来调整权值,以保证滤波器处在最佳状态,达到实现滤波目的。

图2 自适应横向滤波器结构图

令 )](),(),([)(21n w n w n w n W M =

T M n x n x n x n X )]1(),1(),([)(+--=

则输出信号: )()()(n X n W n y T

= (4) 误差序列:

)()()(n y n d n e -= (5) 其中d(n)为期望信号。显然,自适应滤波器控制机理是用误差序列e(n)按照某种准则和自适应算法对其系数M i n w i ,,2,1)},({ =进行调节,最终使自适应滤波器的目标函数最小化,达到最佳滤波状态。按照均方误差(MSE )准则定义: )]([)(2n e E n =ζ (6)

将e(n)=d(n)-y(n)代入上式,均方误差函数重写为:

)]()()()([)]()()([2)]([)(2n w n x n x n w E n x n w n d E n d E n T T T +-=ζ (7) 当滤波器系数固定时,均方误差函数又可以写成:

RW W P W n d E n T T +-=2)]([)(2ζ (8) 其中:)]()([n X n X E R T

=是输入信号的自相关矩阵;)]()([n x n d E P =是期望信号与信号的互相关矢量;将上式对W 求导,并令其等于零,同时假设R 是非奇异的,由此可得到最佳滤波系数W 0为: P R W 10-= (9) 由式可见,均方误差)(n ζ是权矢量M i n w i ,,2,1)},({ =的二次函数它代表以M i n w i ,,2,1)},({ =为自变量的一个“超抛物面”。当权矢量W=W0时,均方误差)(n ζ达到最小值min ζ,几何上这相当于超抛物面的最小点[3]。

LMS 算法是一种很有用且很简单的估计梯度的方法,而梯度值只能根据观察数据进行估计。这种算法自60年代初提出后很快得到广泛的应用。它的突出优点是计算量小,易于实现,且不要求脱线计算。只要自适应滤波器每次迭代运算时都知道输入信号和参考响应,那么,选用LMS 算法是很合适的。

LMS 算法最核心的思想是用平方误差代替均方误差,即梯度矢量用下式来近似: )]([)(2)]([)(?2n e n e n e n ?=?=?

(10) 式中的)]([n e ?为:

)()]()()([)]([k X k X k W k d n e -=-?=?τ (11a ) 于是,LMS 算法最终为:

)()()()](?[2

1)()1(n X n ue n W n n n W n W +=?-+=+ (11b ) 该式说明,LMS 算法实际上是在每次迭代中使用很粗糙的梯度估计值)(?n ?

来代替精确值)(n ?。不难预测,权系数的调整路径不可能精确地沿着理想的最陡下降的路径,因而权系数的调整过程是有噪声的。或者说W(n)不再是确定性函数而变成了随机变量。LMS 算法调 整权系数对不需要进行平方和统计平均运算。因而实现起来很简单。下一时刻权矢量w(n+l) 等于当前权矢量W(n)加上一个修正量,该修正量等于误差信号e(n)的加权值,加权系数为uX(n)。它正比于当前的输入信号。对权矢量的所有分量来说,误差信号e(n)是相同的。即: )

()()()]()(1[)]()()()[()()1(n d n uX n W n X n X n x n w n d n uX n W n W +-=-+=+ττμ (12) 由(12)式得到自适应LMS 算法信号流图如图3[4]。这是一个具有反馈形式的模型。

图3 自适应LMS 算法信号流图

LMS 算法步骤如下:

(1) 根据所处理信号的特征,选取滤波器的阶数M 及收敛因子u 。

(2) 令W(0)=0,W(0)表示一维数为M ,各分量为0的向量。

(3) for(k=M;k<=N:k++)

X=[x(k),…,x(k-M+l)]T

y(k)=W(k)*X

e(k)=x(k)-y(k)

W(k+l)=W(k)+2*u*e(k)*X

4 自适应噪声抵消系统的组成原理

图4给出了采用横向滤波器的基于LMS 算法的自适应滤波器的原理图。

图中自适应算法框中,进行LMS 运算:

)()()()1(n X n ue n W n W +=+ (13) 其中:

)()()()()()(n X n W n d n y n d n e T -=-= (14) T M n W N W n W )](,),([)(1 =

T M n X n X n X )]1(,),([)(+-=

式(13)的纯量形式为:

)1()(2)()1(+-+=+ττττn X n ue n W n W (15)

图4 采用横向滤波器结构的LMS 算法自适应滤波器

对于LMS 自适应滤波器,d(n)如何获得是一个重要问题,为获得d(n),采用了如图5所示的方法。

图5 自适应噪声抵消系统

算法中采用了两个通道:主通道和参考通道。主通道要接收从信号源发来的信号S ,但受到干扰源的干扰,这使得主通道不但收到信号S ,也收到干扰n 0。参考的作用在于检测干扰,并通过自适应滤波调整其输出y ,使y 在最小均方误差意义下最接近主通道干扰。这样,通过相减器,将主通道的噪声分量n 0抵消。设参考通道收到干扰n 1,由于传送路径不同,n 0和n 1是不同的,但因二者都来自同样的干扰源,所以它们是相关的。假设参考通道收到的有用信号为零,且与干扰无关,在图4中,主通道的输入S+n 0成为自适应滤波器的需要信号d ,系统输出则取自误差信号e ,即:

E=d-y=s+n 0 (16) 均方误差均方值:

)}({2}){(}{}

){(}{0202202y n s E y n E s E y n s E e E -+-+=-+= (17)

因为s 和n 0无关,所以s 和n 0,y 无关,则

0)}({0=-y n s E (18) 这样(11)式就成为:

}){(}{}{2022y n E s E e E -+= (19)

自适应滤波器需调整其加权矢量W ,使E{e 2}最小,因S 不再自适应滤波器通道内,所以这种最小化可表示为:

}){(min }{}{min 2022y n E s E e E w

w -+= (20) 从而自适应滤波器调整的结果,将使y 在均方误差最小的情况下,最接近主通道噪声分量n 0,因而使系统输出中的噪声大为降低。再有,由式(19)有:

e-s=n 0-y

所以:

}){(min }){(min 220s e E y n E -=- (21) 上式说明,在最小均方误差意义下,y 最接近n 0等效于e 最接近s 。所以在噪声抵消系统的输出端大大地提高了信号噪声比,而且并未造成大的信号失真。

5 利用延迟建立参考信号的自适应噪声对消

上面研究的自适应噪声对消需要得到与带噪语音信号x(n)中噪声n(n)的相关成分,即需要有一个参考信号,但在大多数语音增强的应用中都没有这样的信号可以利用。在很多场合,只允许一个话筒采集带噪语音。此时,如同语音与噪声相关时一样,必须在语音间歇期间利用采集到的噪声进行估值。如果噪声是平稳的,则可将由此得到的噪声估值用于与带噪语音相减;如果噪声是非平稳的,则会严重影响这种方法的语音增强效果。

在没有参考信号的情况下,也可通过将自适应噪声对消进行变换来解决这一问题。这种方法中不采用参考信号,将带噪语音作为原始信号,而将延迟一个基音周期的同样信号作为参考信号。这实际上是交换了语音和噪声信号的作用。利用浊音相邻基音周期的波形高度相关,而相应的噪声都不相关这一事实,可以估计出x(n)=s(n)+n(n)中的周期性较强或相关性较强的成分,因此这种方法只能在噪声类似白噪声(相关及周期性较弱)的情况下增强周期性或相关较强的语音信号。利用输出(即误差)对滤波器作自适应调整,使噪声输出最小来求出无噪声语音的最佳估计[5],如图6所示。

x(n)=s(n)+n(n)

e(n)

图6 利用延迟来建立参考信号的自适应滤波器

6 结论

基于自适应控制技术的噪声对消中,由于LMS算法具有自适应能力,它与普通的平滑滤波相比区分噪声能力较强。若只用低通滤波器来进行噪声去除,则不可避免地会损失信号的高频成分。用自适应算法可以解决这个问题。

采用自适应滤波进行噪声去除与固定滤波相比具有更强的适应性。谱减法的原理是根据噪声与信号功率谱的不同,在频域上将噪声与信号分离。但是频域分析需要进行FFT,计算量很大,很难实现实时处理。LMS自适应滤波与谱减法相比,运算量小,可以实现实时处理,但是与谱减法一样,增强后的语音也含明显的“音乐噪声”。

参考文献

[1]赵力. 语音信号处理. 北京:机械工业出版社.

[2]刘幺和,宋庭新. 语音识别与控制应用技术. 北京:科学出版社.

[3]胡航. 语音信号处理. 哈尔滨:哈尔滨工业大学出版社.

[4]朱民雄,闻新,黄建群,周露. 计算机语音技术. 北京:北京航空航天大学出版社.

[5]张雄伟,陈亮,杨吉斌. 现代语音处理技术及其应用. 北京:机械工业出版社.

相关文档