文档库 最新最全的文档下载
当前位置:文档库 › dab中心理声学模型算法及matlab仿真

dab中心理声学模型算法及matlab仿真

魁;塑.!垒凰。

D A B中心理声学模型算法及M at l ab仿真

袁洪琳武桐武卫强

(西安工程大学电子信息学院,陕西西安710048)

嘲要】本文介绍了—种教字音频广播(D A B)中信源编码的实现依椐:心理声擎模型。本文针对D A B的信源编码,对心理声学模型的算法做了深入的分析,并运用M a t l a b对其进行了仿真.这对后续的电路设计有重要的指导意义。

口搠】DAB;M PEG l;心理声学模型

数字音频广播(D A B)中信源编码重要的组成部分,厶理声学模型,是通过模拟人耳复杂的声学系统,达到对音频数据压缩的目的,从而使音频信号可进行有效地传输。

图1为D A B信源编码结构:

●l妊垃量嗣

图1D A B信源编码结构圈

子带滤波器组将音频P CM信号从时域映射到频域,分解成等宽的32个子带输出,以近似人耳的听觉系统,由于临界频带不等宽,滤波器组的子带划分与临界带宽不匹配,需要由心理声学模型分析信号的功率密度谱提供更精细的频率分辨率。在进行数据压缩时,对不能被人耳听到的声音信号不予编码,编码时相应于每一帧的样点信号需进行比特分配,32条子带的比特分配均以各子带的信号—掩蔽比率为基础进行计算。也就是说,孵学模型作用是确定每条子带的信号—掩蔽比率。

1心理声学模型算法

1.1FFT分析

掩蔽阈值是由从信号功率密度谱估计得到的,因此需要对输入的

时域音频PC M信号进行FFT变换,一帧的P C M样本为1152个,因此选择对1152个样本做1024点的FF T变换,为了平滑截取信号的两端并减少泄漏,选用汉宁窗。汉宁窗加窗的PC M信号经过FF T变换,得到一帧音频信号的功率密度谱。

信号的频谱密度计算:

1'1-1

×(k)=10l ogI告∑h(1)s(1)e‘州㈣卜

I、1=0

k=O,1。…N,2—1(1)

h(I)=sv"gS-x0.5x(1一c os[2×"IT xi/哪0≤i≤N一1,其中,S

a)是输入信号,h(i)是汉宁窗,N=10240

12确定声压级

子带n中的声压级的确定如下:

Ls b【n)=M A X]X s pl(n),20xl0910(s cf。(n)x32768)一10]

dB(2).

其中,X spl(n)表示子带n的频率范围内幅度最大的谱线,sc f。

(n)表示一帧内子带n中三个比例因子的最大值。

13确定绝时掩蔽阈值

在参考文辅1J中表的C2给出了绝对掩蔽阈值。

1.4找出单音和非单音分量

单音是指该掩蔽成分是有涌丕是无调的,有调的掩蔽成分近似正弦波,无调的类f以白噪声。单音对掩蔽门限有影响,因此为了计算整体掩蔽门限,有必要从频率密度谱中分离出单音和非单音分量。这一步从确定局部最大值开始,继而提取出单音分量,再计算出某一临界频带带宽范围内的非单音分量的强度。

为了减少在计算整体掩蔽门限时考虑的掩蔽信号的数量需要选取单

音和非单音掩蔽分量。这里仅考虑在绝对掩蔽阈值以上的单音与非单音-/t--EI t缶界频带域内使用宽度为0.5bar k的滑动窗口,对两个或更多的单音分量进行抽职保留功率最高的分量。

260丽碎丽耵可

15计算单个掩蔽门限

计算的512条谱线中,在计算整体掩蔽门限时只考虑一个包括126条谱线的子集,它是按不同间隔对512条谱线的采样。单音分量和非单音分量的掩蔽f31I E如下计算:

L T。枉0),Z0)】=×。拓0)hav出m h-vf Iz O),z(.)1dB固L Tf止0),Z(i)k×北0)】+av.j,z m]+vt t z0),z(i)】dB14} LT_和L1■为在临界频带比率z。(单位为ba rk)处的掩蔽分量在临界频带比率Z处的单个掩蔽门限。X。拓0)】表示索引为j,临界频带比率为Z O)的掩蔽分量的声压级。8V为掩蔽指数,vf为掩蔽分量X j,z 0)】的掩蔽函数。临界频带比率Z0)和Z(i)可在标准中表C2查出。

l J6计舅瑾体掩蔽门限

单个掩蔽门限和绝对掩蔽门限的功率之和,就是整体掩蔽门限。

m n

L T=【i)=10l0910(1o哪o+艺10n呻舢o’nol+∑10Ⅱ呻o)4a棚)dB

j-I J-1

(5)

单音、非单音掩蔽信号的总数分别为m、n,对给定的i值,j的范围缩小到只包括那些对i而言在一8到3bar k内的掩蔽分量。此范围外的L T。和L T。为一*。

子带n中的最小掩蔽门限由下式确定:

LT■(n)=M I眦T口(i)】dB(6)

按下式计算每个子带r l的信号—掩蔽比:

S M R女(n)=L s b(n)一LT嘲(n)dB(7)

2算法的M at l ab仿真

在仿真过程中,将48kH z采样率的w ay音频格式中的音频数据作为输入的PC M信号,经FFT变换得到512条谱线,以96dB的声压级作为参考电平进行归一化,使得最大电平值等于96dB。其频率分辨率为48kH z/1024=46875H zo一帧音频PC M信号的时域波形及频率密度谱如图2(a)。

在确定每条子带的声压级时,须找出在相应子带内幅度最大的谱线,这时,需要确定子带的频率范围。每条子带的宽度为48kHz/(23刁=750H z,每条子带间隔16条谱线。绝对掩蔽曲线表示安静状态下,可听到声音声压级的最小值曲线。人耳能听到的声音频率范围为20H z一20K H z,对低频的频率分辨率比高频好,对2kH zr';4K H z附近的声音最敏感,因而在图中看到绝对掩蔽阈值在这—频率范围内较小。

通过确定局部最大值找到单音分量,非单音分量从剩下的谱线找出。在每个临界频带内将非单音分量的功率相加并付最接近l I缶界频带中心的索引。在找出单音和非单音分量后,将考察范围内的所有谱线设成一*。图2(b)中给出了抽取后的单音和非单音掩蔽分量与整体掩蔽曲线,

0音频信号删{嬲图6掩蔽分量与掩蔽阈值

图2音频信号及信号掩蔽曲线图(下转第263页

)

相关文档