文档库 最新最全的文档下载
当前位置:文档库 › matlab音频处理

matlab音频处理

matlab音频处理
matlab音频处理

matlab处理音频信号

https://www.wendangku.net/doc/cb9650467.html,/lxfjiangsu/blog/item/ad0cf106ac43f37c02088180.htm l

一、问题的提出:

数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢?

信号是传递信息的函数。离散时间信号——序列——可以用图形来表示。

按信号特点的不同,信号可表示成一个或几个独立变量的函数。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他参量,习惯上将其看成时间。信号有以下几种:

(1)连续时间信号:在连续时间范围内定义的信号,但信号的幅值可以是连续数值,也可以是离散数值。当幅值为连续这一特点情况下又常称为模拟信号。实际上连续时间信号与模拟信号常常通用,用以说明同一信号。

(2)离时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。

(3)数字信号:时间离散而幅度量化的信号。

语音信号是基于时间轴上的一维数字信号,在这里主要是对语音信号进行频域上的分析。在信号分析中,频域往往包含了更多的信息。对于频域来说,大概有8种波形可以让我们分析:矩形方波,锯齿波,梯形波,临界阻尼指数脉冲波形,三角波,余旋波,余旋平方波,高斯波。对于各种波形,我们都可以用一种方法来分析,就是傅立叶变换:将时域的波形转化到频域来分析。

于是,本课题就从频域的角度对信号进行分析,并通过分析频谱来设计出合适的滤波器。当然,这些过程的实现都是在MATLAB软件上进行的,MATLAB软件在数字信号处理上发挥了相当大的优势。

二、设计方案:

利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波。对于波形图与频谱图(包括滤波前后的对比图)都可以用 MATLAB画出。我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。

选择设计此方案,是对数字信号处理的一次实践。在数字信号处理的课程学习过程中,我们过多的是理论学习,几乎没有进行实践方面的运用。这个课题正好是对数字语音处理的一次有利实践,而且语音处理也可以说是信号处理在实际

应用中很大众化的一方面。

这个方案用到的软件也是在数字信号处理中非常通用的一个软件——MATLAB软件。所以这个课题的设计过程也是一次数字信号处理在MATLAB中应用的学习过程。课题用到了较多的MATLAB语句,而由于课题研究范围所限,真正与数字信号有关的命令函数却并不多。

三、主体部分:

(一)、语音的录入与打开:

[y,fs,bits]=wavread('Blip',[N1 N2]);用于读取语音,采样值放在向量y 中,fs表示采样频率(Hz),bits表示采样位数。[N1 N2]表示读取从N1点到N2点的值(若只有一个N的点则表示读取前N点的采样值)。

sound(x,fs,bits); 用于对声音的回放。向量y则就代表了一个信号(也即一个复杂的“函数表达式”)也就是说可以像处理一个信号表达式一样处理这个声音信号。

FFT的MATLAB实现

在MATLAB的信号处理工具箱中函数FFT和IFFT用于快速傅立叶变换和逆变换。下面介绍这些函数。

函数FFT用于序列快速傅立叶变换。

函数的一种调用格式为 y=fft(x)

其中,x是序列,y是序列的FFT,x可以为一向量或矩阵,若x为一向量,y是x的FFT。且和x相同长度。若x为一矩阵,则y是对矩阵的每一列向量进行FFT。

如果x长度是2的幂次方,函数fft执行高速基-2FFT算法;否则fft执行一种混合基的离散傅立叶变换算法,计算速度较慢。

函数FFT的另一种调用格式为 y=fft(x,N)

式中,x,y意义同前,N为正整数。

函数执行N点的FFT。若x为向量且长度小于N,则函数将x补零至长度N。若向量x的长度大于N,则函数截短x使之长度为N。若x 为矩阵,按相同方法对x进行处理。

经函数fft求得的序列y一般是复序列,通常要求其幅值和相位。MATLAB 提供求复数的幅值和相位函数:abs,angle,这些函数一般和FFT同时使用。

函数abs(x)用于计算复向量x的幅值,函数angle(x)用于计算复向量的相角,介于和之间,以弧度表示。

函数unwrap(p)用于展开弧度相位角p ,当相位角绝对变化超过时,函数把它扩展至。

用MATLAB工具箱函数fft进行频谱分析时需注意:

(1)函数fft返回值y的数据结构对称性

若已知序列x=[4,3,2,6,7,8,9,0],求X(k)=DFT[x(n)]。

利用函数fft计算,用MATLAB编程如下:

N=8;

n=0:N-1;

xn=[4 3 2 6 7 8 9 0]';

XK=fft(xn)

结果为:

XK =

39.0000

-10.7782 + 6.2929i

0 - 5.0000i

4.7782 - 7.7071i

5.0000

4.7782 + 7.7071i

0 + 5.0000i

-10.7782 - 6.2929i

由程序运行所得结果可见,X(k)和x(n)的维数相同,共有8个元素。X(k)的第一行元素对应频率值为0,第五行元素对应频率值为Nyquist频率,即标准频率为1.因此第一行至第五行对应的标准频率为0~1。而第五行至第八行对应的是负频率,其X(k)值是以Nyquist频率为轴对称。(注:通常表示为Nyquist

频率外扩展,标以正值。)

一般而言,对于N点的x(n)序列的FFT是N点的复数序列,其点n=N/2+1对应Nyquist频率,作频谱分析时仅取序列X(k)的前一半,即前N/2点即可。X(k)的后一半序列和前一半序列时对称的。

(2)频率计算

若N点序列x(n)(n=0,1,…,N-1)是在采样频率下获得的。它的FFT也是N点序列,即X(k)(k=0,1,2,…,N-1),则第k点所对应实际频率值为f=k*f /N.

(3)作FFT分析时,幅值大小与FFT选择点数有关,但不影响分析结果。

2、设计内容:

(1)下面的一段程序是语音信号在MATLAB中的最简单表现,它实现了语音的读入打开,以及绘出了语音信号的波形频谱图。

[x,fs,bits]=wavread('ding.wav',[1024 5120]);

sound(x,fs,bits);

X=fft(x,4096);

magX=abs(X);

angX=angle(X);

subplot(221);plot(x);title('原始信号波形');

subplot(222);plot(X); title('原始信号频谱');

subplot(223);plot(magX);title('原始信号幅值');

subplot(224);plot(angX);title('原始信号相位');

程序运行可以听到声音,得到的图形为:

(2)定点分析:已知一个语音信号,数据采样频率为100Hz,试分别绘制N =128点DFT的幅频图和N=1024点DFT幅频图。

编程如下:

x=wavread('ding.wav');

sound(x);

fs=100;N=128;

y=fft(x,N);

magy=abs(y);

f=(0:length(y)-1)'*fs/length(y);

subplot(221);plot(f,magy);

xlabel('频率(Hz)');ylabel('幅值');

title('N=128(a)');grid

subplot(222);plot(f(1:N/2),magy(1:N/2));

xlabel('频率(Hz)');ylabel('幅值');

title('N=128(b)');grid

fs=100;N=1024;

y=fft(x,N);

magy=abs(y);

f=(0:length(y)-1)'*fs/length(y);

subplot(223);plot(f,magy);

xlabel('频率(Hz)');ylabel('幅值');

title('N=1024(c)');grid

subplot(224);plot(f(1:N/2),magy(1:N/2));

xlabel('频率(Hz)');ylabel('幅值');

title('N=1024(d)');grid

运行结果如图:

上图(a)、(b)为N=128点幅频谱图,(c)、(d)为N=1024点幅频谱图。由于采样频率f =100Hz,故Nyquist频率为 50Hz。(a)、(c)是0~100Hz频谱图,

(b)、(d)是0~50Hz频谱图。由(a)或(c)可见,整个频谱图是以Nyquist频率为轴对称的。因此利用fft对信号作频谱分析,只要考察0~Nyquist频率(采样频率一半)范围的幅频特性。比较(a)和(c)或(b)和(d)可见,幅值大小与fft 选用点数N有关,但只要点数N足够不影响研究结果。从上图幅频谱可见,信号中包括15Hz和40Hz的正弦分量。

(3)若信号长度T=25.6s,即抽样后x(n)点数为T/Ts=256,所得频率分辨率为 Hz,以此观察数据长度N的变化对DTFT分辨率的影响:

编程如下:

[x,fs,bits]=wavread('ding.wav');

N=256;

f=0:fs/N:fs/2-1/N;

X=fft(x);

X=abs(X);

subplot(211)

plot(f(45:60),X(45:60));grid

xlabel('Hz'),ylabel('|H(ejw)|')

%数据长度N扩大4倍后观察信号频谱

N=N*4;

f=0:fs/N:fs/2-1/N;

X=fft(x);

X=abs(X);

subplot(212)

plot(f(45*4:4*60),X(4*45:4*60));grid

xlabel('Hz'),ylabel('|H(ejw)|')

结果如图:

(三)、滤波器设计:

1、相关原理:

设计数字滤波器的任务就是寻求一个因果稳定的线性时不变系统,并使系统函数H(z)具有指定的频率特性。

数字滤波器从实现的网络结构或者从单位冲激响应分类,可以分成无限长单位冲激响应(IIR)数字滤波器和有限长单位冲激响应(FIR)数字滤波器。

数字滤波器频率响应的三个参数:

(1)幅度平方响应:

(2)相位响应

其中,相位响应

(3)群时延响应

IIR数字滤波器:

IIR数字滤波器的系统函数为的有理分数,即

IIR数字滤波器的逼近问题就是求解滤波器的系数和,使得在规定的物理意义上逼近所要求的特性的问题。如果是在s平面上逼近,就得到模拟滤波器,如果是在z平面上逼近,则得到数字滤波器。

FIR数字滤波器:

设FIR的单位脉冲响应h(n)为实数,长度为N,则其z变换和频率响应分别为

按频域采样定理FIR数字滤波器的传输函数H(z)和单位脉冲响应h(n)可由它的N个频域采样值H(k)唯一确定。

MATLAB中提供了几个函数,分别用于实现IIR滤波器和FIR滤波器。

(1)卷积函数conv

卷积函数conv的调用格式为 c=conv(a,b)

该格式可以计算两向量a和b的卷积,可以直接用于对有限长信号采用FIR 滤波器的滤波。

(2)函数filter

函数filter的调用格式为 y=filter(b,a,x)

该格式采用数字滤波器对数据进行滤波,既可以用于IIR滤波器,也可以用于FIR滤波器。其中向量b和a分别表示系统函数的分子、分母多项式的系数,若a=1,此时表示FIR滤波器,否则就是IIR滤波器。该函数是利用给出的向量b和a,对x中的数据进行滤波,结果放入向量y。

(3)函数fftfilt

函数fftfilt的调用格式为 y=fftfilt(b,x)

该格式是利用基于FFT的重叠相加法对数据进行滤波,这种频域滤波技术只对FIR滤波器有效。该函数是通过向量b描述的滤波器对x数据进行滤波。

关于用butter函数求系统函数分子与分母系数的几种形式。

[b,a]=butter(N,wc,'high'):设计N阶高通滤波器,wc为它的3dB边缘频率,以为单位,故。

[b,a]=butter(N,wc):当wc为具有两个元素的矢量wc=[w1,w2]时,它设计2N阶带通滤波器,3dB通带为,w的单位为。

[b,a]=butter(N,wc,'stop'):若wc=[w1,w2],则它设计2N阶带阻滤波器,3dB通带为,w的单位为。

如果在这个函数输入变元的最后,加一个变元“s”,表示设计的是模拟滤波器。这里不作讨论。

为了设计任意的选项巴特沃斯滤波器,必须知道阶数N和3dB边缘频率矢量wc。这可以直接利用信号处理工具箱中的buttord函数来计算。如果已知滤波器指标,,和,则调用格式为

[N,wc]=buttord(wp,ws,Rp,As)

对于不同类型的滤波器,参数wp和ws有一些限制:对于低通滤波器,wpws;对于带通滤波器,wp和ws分别为具有两个元素的矢量,wp=[wp1,wp2]和ws=[ws1,ws2],并且 ws1

2、设计内容:

(1)滤波器示例:

在这里为了说明如何用MATLAB来实现滤波,特举出一个简单的函数信号滤

波实例(对信号x(n)=sin( n/4)+5cos( n/2)进行滤波,信号长度为500点),从中了解滤波的实现过程。程序如下:

Wn=0.2*pi;

N=5;

[b,a]=butter(N,Wn/pi);

n=0:499;

x=sin(pi*n/4)+5*cos(pi*n/2);

X=fft(x,4096);

subplot(221);plot(x);title('滤波前信号的波形');

subplot(222);plot(X);title('滤波前信号的频谱');

y=filter(b,a,x);

Y=fft(y,4096);

subplot(223);plot(y);title('滤波后信号的波形');

subplot(224);plot(Y);title('滤波后信号的频谱');

在这里,是采用了butter命令,设计出一个巴特沃斯低通滤波器,从频谱图中可以很明显的看出来。下面,也就是本课题的主要内容,也都是运用到了butter函数,以便容易的得到系统函数的分子与分母系数,最终以此来实现信号的滤波。

(2)N阶高通滤波器的设计(在这里,以5阶为例,其中wc为其3dB边缘频率,以为单位),程序设计如下:

x=wavread('ding.wav');

sound(x);

N=5;wc=0.3;

[b,a]=butter(N,wc,'high');

X=fft(x);

subplot(321);plot(x);title('滤波前信号的波形');

subplot(322);plot(X);title('滤波前信号的频谱');

y=filter(b,a,x);

Y=fft(y);

subplot(323);plot(y);title('IIR滤波后信号的波形');

subplot(324);plot(Y);title('IIR滤波后信号的频谱');

z=fftfilt(b,x);

Z=fft(z);

subplot(325);plot(z);title('FIR滤波后信号的波形');

subplot(326);plot(Z);title('FIR滤波后信号的频谱');

得到结果如图:

(3)N阶低通滤波器的设计(在这里,同样以5阶为例,其中wc为其3dB 边缘频率,以为单位),程序设计如下:

x=wavread('ding.wav');

sound(x);

N=5;wc=0.3;

[b,a]=butter(N,wc);

X=fft(x);

subplot(321);plot(x);title('滤波前信号的波形');

subplot(322);plot(X);title('滤波前信号的频谱');

y=filter(b,a,x);

Y=fft(y);

subplot(323);plot(y);title('IIR滤波后信号的波形');

subplot(324);plot(Y);title('IIR滤波后信号的频谱');

z=fftfilt(b,x);

Z=fft(z);

subplot(325);plot(z);title('FIR滤波后信号的波形');

subplot(326);plot(Z);title('FIR滤波后信号的频谱');

得到结果如图:

(4)2N阶带通滤波器的设计(在这里,以10阶为例,其中wc为其3dB边缘频率,以为单位,wc=[w1,w2],w1 wc w2),程序设计如下:

x=wavread('ding.wav');

sound(x);

N=5;wc=[0.3,0.6];

[b,a]=butter(N,wc);

X=fft(x);

subplot(321);plot(x);title('滤波前信号的波形');

subplot(322);plot(X);title('滤波前信号的频谱');

y=filter(b,a,x);

Y=fft(y);

subplot(323);plot(y);title('IIR滤波后信号的波形');

subplot(324);plot(Y);title('IIR滤波后信号的频谱');

z=fftfilt(b,x);

Z=fft(z);

subplot(325);plot(z);title('FIR滤波后信号的波形');

subplot(326);plot(Z);title('FIR滤波后信号的频谱');

得到结果如图:

(5)2N阶带阻滤波器的设计(在这里,以10阶为例,其中wc为其3dB边缘频率,以为单位,wc=[w1,w2],w1 wc w2),程序设计如下:

x=wavread('ding.wav');

sound(x);

N=5;wc=[0.2,0.7];

[b,a]=butter(N,wc,'stop');

X=fft(x);

subplot(321);plot(x);title('滤波前信号的波形');

subplot(322);plot(X);title('滤波前信号的频谱');

y=filter(b,a,x);

Y=fft(y);

subplot(323);plot(y);title('IIR滤波后信号的波形');

subplot(324);plot(Y);title('IIR滤波后信号的频谱');

z=fftfilt(b,x);

Z=fft(z);

subplot(325);plot(z);title('FIR滤波后信号的波形');

subplot(326);plot(Z);title('FIR滤波后信号的频谱');

得到结果如图:

(6)小结:以上几种滤波,我们都可以从信号滤波前后的波形图以及频谱图上看出变化。当然,也可以用sound()函数来播放滤波后的语音,从听觉上直接感受语音信号的变化,但由于人耳听力的限制,有些情况下我们是很难听出异同的。

同样,通过函数的调用,也可以将信号的频谱进行“分离观察”,如显出信号的幅值或相位。下面,通过改变系统函数的分子与分母系数比,来观察信号滤波前后的幅值与相位。并且使结果更加明显,使人耳得以很容易的辨听。

x=wavread('ding.wav');

sound(x);

b=100;a=5;

y=filter(b,a,x);

X=fft(x,4096);

subplot(221);plot(x);title('滤波前信号的波形');

subplot(222);plot(abs(X));title('滤波前信号的幅值');

Y=fft(y,4096);

subplot(223);plot(y);title('滤波后信号的波形');

subplot(224);plot(abs(Y));title('滤波后信号的幅值');

结果如图:

>> sound(y);

可以听到声音明显变得高亢了。从上面的波形与幅值(即幅频)图,也可看出,滤波后的幅值变成了滤波前的20倍。

>> figure,

subplot(211);plot(angle(X));title('滤波前信号相位');

subplot(212);plot(angle(Y));title('滤波后信号相位');

得图:

可以看到相位谱没什么变化。

(四)、界面设计:

直接用M文件编写GUI程序很繁琐,而使用GUIDE设计工具可以大大提高工作效率。GUIDE相当于一个控制面板,从中可以调用各种设计工具以辅助完成界面设计任务,例如控件的创建和布局、控件属性的编辑和菜单设计等。

使用GUIDE设计GUI程序的一般步骤如下:

1. 将所需控件从控件面板拖拽到GUIDE的设计区域;

2. 利用工具条中的工具(或相应的菜单和现场菜单),快速完成界面布局;

3. 设置控件的属性。尤其是tag属性,它是控件在程序内部的唯一标识;

4. 如果需要,打开菜单编辑器为界面添加菜单或现场菜单;

5. 保存设计。GUIDE默认把GUI程序保存为两个同名文件:一个是.fig 文件,用来保存窗体布局和所有控件的界面信息;一个是.m文件,该文件的初始内容是GUIDE自动产生的程序框架,其中包括了各个控件回调函数的定义。该M文件与一般的M文件没有本质区别,但是鉴于它的特殊性,MATALAB把这类文件统称为GUI-M文件。保存完后GUI-M文件自动在编辑调试器中打开以供编辑。

6. 为每个回调函数添加代码以实现GUI程序的具体功能。这一步与一般函数文件的编辑调试过程相同。

设计过程及内容:

在MATLAB版面上,通过键入GUIDE弹出一个菜单栏进入gui制作界面(或者在File到new来进入gui),从而开始应用界面的制作。

该界面主要实现了以下几个功能:

①打开wav格式的音频文件,并将该音频信号的值读取并赋予某一向量;

②播放音频文件,可以选择性的显示该音频信号的波形、频谱、幅值以及相位;

③对音频信号进行IIR与FIR的5阶固定滤波处理,可以选择性的显示滤波前后信号的波形、频谱、幅值以及相位,以及播放滤波后的声音。

界面如图所示:

通过该界面,可以方便用户进行语音信号的处理。

界面主程序见附件。

(五)、校验:

1、本设计圆满的完成了对语音信号的读取与打开,与课题的要求十分相符;

2、本设计也较好的完成了对语音信号的频谱分析,通过fft变换,得出了

语音信号的频谱图;

3、在滤波这一块,课题主要是从巴特沃斯滤波器入手来设计滤波器,也从一方面基本实现了滤波;

4、初略的完成了界面的设计,但也存在相当的不足,只是很勉强的达到了打开语音文件、显示已定滤波前后的波形等图。

四、结论:

语音信号处理是语音学与数字信号处理技术相结合的交叉学科,课题在这里不讨论语音学,而是将语音当做一种特殊的信号,即一种“复杂向量”来看待。也就是说,课题更多的还是体现了数字信号处理技术。

从课题的中心来看,课题是希望将数字信号处理技术应用于某一实际领域,这里就是指对语音的处理。作为存储于计算机中的语音信号,其本身就是离散化了的向量,我们只需将这些离散的量提取出来,就可以对其进行处理了。

在这里,用到了处理数字信号的强有力工具MATLAB,通过MATLAB里几个命令函数的调用,很轻易的在实际化语音与数字信号的理论之间搭了一座桥。

课题的特色在于它将语音看作了一个向量,于是语音数字化了,则可以完全利用数字信号处理的知识来解决。我们可以像给一般信号做频谱分析一样,来给语音信号做频谱分析,也可以较容易的用数字滤波器来对语音进行滤波处理。

最后,还利用了MATLAB的另一强大功能——gui界面设计。设计出了一个简易的用户应用界面,可以让人实现界面操作。更加方便的进行语音的频谱分析与滤波处理。

matlab声音处理

读取音乐信号并将信号转换为单声道的,并输出信号的波形图和频谱图,播放音乐信号,注意不同抽样率下的音调变化。 1. 源程序 [w,fs,bit]=wavread('天路.wav');//获取音乐信号 wav=(w(:,1))';//获取单声道信号 sound(w,fs)//播放音乐信号 figure;//画音乐信号波形 subplot(2,1,1);plot(wav); fwav=fft(wav);%对音乐信号做傅里叶变换 lwav=round(length(fwav)/2);%信号长度去一半 nwav=[0:lwav-1]; wwav=nwav/(lwav);f=wwav/2*fs; subplot(2,1,2);%画频谱图 plot(wwav,abs(fwav(1:lwav))); 3,输出波形 2 4 6 8 10 12x 10 4 -0.4 -0.200.2 0.40 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 050010001500 2000

音乐信号的滤波去噪 1,实验内容 读取音乐信号,输出原始信号的波形和频谱,将三余弦的混合噪声加在音乐信号上,用巴特沃斯IIR滤波器进行滤波,观察滤波后的音乐信号;再将白噪声加在原始的音乐信号上,用矩形窗进行滤波,观察滤波后的音乐信号。 2,源程序 [w,fs,bit]=wavread('天路.wav'); wav=(w(:,1))'; sound(w,fs) figure; subplot(2,1,1);plot(wav); fwav=fft(wav); lwav=round(length(fwav)/2); nwav=[0:lwav-1]; wwav=nwav/(lwav);f=wwav/2*fs; subplot(2,1,2); plot(wwav,abs(fwav(1:lwav))); sf1=3000;l=length(wav);T=1/fs; t=0:T:(l-1)*T; s1=0.05*cos(2*pi*sf1*t); wav_s1=wav+s1; sound(wav_s1,fs) fwav_s1=fft(wav_s1);f_s1=fft(s1); figure;title('余弦噪声') subplot(2,1,1);plot(s1); subplot(2,1,2);plot(wwav,abs(f_s1(1:lwav))); figure;title('加噪信号') subplot(2,1,1);plot(wav_s1); subplot(2,1,2);plot(wwav,abs(fwav_s1(1:lwav))); T=1; Wp=2/T*tan(0.2*pi/2);Ws=2/T*tan(0.3*pi/2); Rp=1;Rs=60; [N,Wc]=buttord(Wp,Ws,Rp,Rs,'s'); [B,A]=butter(N,Wc,'s'); [C,D]=bilinear(B,A,1/T); W=0:0.001*pi:0.5*pi; H=freqs(B,A,W); Hd=freqz(C,D,W); figure; subplot(3,1,1);plot(W/pi,abs(H)); title('模拟巴特沃斯滤波器'); xlabel('Frequency/Hz');

音频处理器调试教程

音频处理器调试教程 音频处理器调试教程 第一步:先用处理器成功地连接系统,并对输出通道分别控制哪个音箱做好备注,例如你用3、4通道来连接超低音音箱,就要为其接好线,并进入到处理器的EDIT 页面开始进行接下来的设置。关于如何进入编辑页面,方式各有不同,我们可根据音频处理器的说明书,按照图示一步步进行操作,其中一步若有错误,按返回键即可。 第二步:利用处理器常用的ROUNT功能来决定输出通道的信号来自于哪里,如果你想要用立体声的形式来进行扩音,那么完全可以选择经典的1、3通道信号进入A,另外两个信号进B。信号往往会被分配在同一个产品的不同位置,因此我们此时同样可以参考说明书去找到正确的位置。 第三步:这也是最关键的一步,我们可以依据所购买的音箱特性或者具体的工作环境来对音箱的频段进行合理的设置,人们常说的“分频点”就是指该种行为。它的具体步骤为:设定工作频段-设置滤波器 -设置分频斜率。 第四步:当以上的参数全部设置完毕之后,此时我们就要对通道的初始电平进行细致的查看了,在这一个步骤里,要确保所有参数电平都已调到0。 第五步:接通信号发声,在这里我们还需要用到一个相对专业的仪器——极性相位仪,通过这个工具的帮助我们可以把音箱的极性有机地统一起来,必要时甚至可以利用极性翻转功能进行操作。 第六步:最后一步还是要借助STA等工具测量相关的传输时间和距离量,同时对EQ进行均衡调节调好之后就要小心保存数据,以备调用。 音频处理器对音频处理的基本原则 1、音频处理设备,主要借助减小动态范围的方法来抑制噪声,其中包括对节目信号的压缩、峰值限制与削波、多频段压缩和频率可选择的限制及均衡功效。压缩的主要目的是缩小节目动态范围,增加声音的密度,尽量使音频信号峰点幅度

Matlab处理声音文件

Matlab处理声音文件 摘要:《信号与系统》这门课是大多数工程类课表中的一个重要组成部分,在学 习《信号与系统》这门课时,我们需要熟练地应用Matlab来采集和处理音频信号,图像信号等并绘出它们的波形和频谱。利用Matlab我们可以灵活方便地分析和处理声音文件。本文介绍了用Matlab处理声音文件的基本流程,并绘制了音频信号的相关波形和频谱。 关键词:Matlab 音量标准化声道分离数字滤波数据转换 引言:MA TLAB是美国Math Works公司推出的一种面向工程和科学计算的交互 式计算软件。它以矩阵运算为基础,把计算、可视化、程序设计融合在一个简单易用的交互式工作环境中,是一款数据分析和处理功能都非常强大的工程实用软件。本文主要介绍Matlab在处理简单声音文件方面的使用。 正文: 1.设计要求:(1)了解语音信号的特点; (2)掌握数字滤波器的参数选择及设计方法; (3)掌握数字滤波器的应用方法及应用效果; (4)提高Matlab下的程序设计能力及综合应用能力。 2.系统的组成及工作原理 分析和处理声音文件,首先要对声音信号进行采集,MATLAB 的数据采集工具箱提供了一整套命令和函数,通过调用这些函数和命令,可直接控制声卡进行数据采集。Windows自带的录音机程序也可驱动声卡来采集语音信号,并能保存为W A V格式文件,供MATLAB相关函数直接读取、写入或播放。本文以W A V格式语音信号作为分析处理的输入数据,用MA TLAB处理声音文件的基本流程是:先将W A V格式语音信号经wavread 函数转换成MA TLAB列数组变量;再用MA TLAB强大的运算能力进行数据分析和处理,如时域分析、频域分析、数字滤波、信号合成、信号变换、识别和增强等等;处理后的数据如是音频数据,则可用wavwrite转换成W A V格式文件或用sound、wavplay等函数直接回放。 3.实验内容,调试及测试结果 (1)音量标准化 在实际录制语音信号的过程中常有音轻问题,因此在录制声音过程中需要对声音电平进行量化处理,使音量实现标准化。利用Matlab很容易实现音量标准化,即最大电平对应最高量化比特。基本步骤是:1.利用wavread函数将W A V文件转换成列数组变量:2.求出数组变量的极值并对所有元素作归一化处理;3.用wavwrite函数还原成音量标准化的WA V文件。 以微软自带的“Windows 拨出电话声.wav”语音信号为例,先将其复制另存到文件名为XPexit.wav的Matlab当前目录中,再通过音量标准化后保存为XPquit.wav文件。以下为其实现程序: clear; close all; clc; [Y,FS,NBITS]=wavread('XPexit.W A V');% 将WA V文件转换成变量 FS,NBITS,% 显示采样频率和量化比特

音频处理的一些技巧

一、正常对话两个人的音量大小在-15到-6之间会很河蟹 二、场景切换时间长度不要少于3秒,不然会感觉很赶。 三、淡入淡出时间长度不要少于2秒,不然会完全没感觉。 四、声音层次的分布:人声> 音效> BGM > 环境音效。 五、人物脚步声除非特定,不要多于4秒,不然会很拖节奏。 首先说一下:波形振幅处理 1、波形振幅—动态处理: 这个是一个用来做音量的动态处理的一般来说很少用到。。因为它用起来不如C4那么直观。 2、波形振幅--渐变: 渐变里面有很多的预制项,大多数时候我们只需要用到正常的预制就好了 前面6个10 3 6DB CUT或则是BOOST就是音量波形减小或则增大。 CENTE WAVE 就是调整直流偏移。。就是调波形中线的东西 FADE IN和FADE OUT就是淡入淡出,这个记得你要先选一段,不然直接处理就变全干音淡入或则淡出了。也可以通过调整那个-240的数值做出声音慢慢接近或则慢慢走远的效果。 然后是4个PAN开头的,意思是第一个,左边没声音,第二个,声音从左到右,第三个,声音从右到左,第四个,右边没声音。。这四个带耳机做一次就会听的很明显。 接下来4个和上面四个差不多,第一个是右声道淡入,第二个是右边衰减3,第三个是左声道淡入,第四个是左边衰减3。我们可用2 和4做出声音偏左或偏右的感觉!调整那个-3DB 数值可以让感觉更偏或更中间。 3、波形振幅--空间回旋: 就是立体声回旋啦,自己试听下就明白了 4、波形振幅--强硬限制: 这是一个限幅器,就是用来限制增幅强度的。类似音量标准化,不过不同的地方在于这个是增加是加法。而音量标准化是乘法即按比例放大。 5、波形振幅—声道重混缩: 这个就是混缩左右波形的让它重新生成的一个东西,比如说有一些干音左边大右边小,我们就声道重混缩一下,它就一样了。这个还有一个用处就是做伴奏带,消人声里面的VOCAL CUT 就是了。 6、波形振幅—声相/声场: 就是声音位置处理和加强立体声感觉的一个东西,试着做1、2下就明白了,大多数时候用不到。 7、波形振幅—音量包络:

Cool Edit Pro2.1 编辑音频教程

Cool Edit Pro数字音乐编辑器MP3制作软件 Cool Edit Pro是一个集录音、混音、编辑于一体的多轨数字音频编辑软件,是一个非常出色的数字音乐编辑器和MP3制作软件。不少人把Cool Edit形容为音频“绘画”程序。你可以用声音来“绘”制:音调、歌曲的一部分、声音、弦乐、颤音、噪音或是调整静音。而且它还提供有多种特效为你的作品增色:放大、降低噪音、压缩、扩展、回声、失真、延迟等。你可以同时处理多个文件,轻松地在几个文件中进行剪切、粘贴、合并、重叠声音操作。使用它可以生成的声音有:噪音、低音、静音、电话信号等。该软件还包含有CD播放器。其他功能包括:支持可选的插件;崩溃恢复;支持多文件;自动静音检测和删除;自动节拍查找;录制等。另外,它还可以在AIF、AU、MP3、Raw PCM、SAM、VOC、VOX、WAV等文件格式之间进行转换,并且能够保存为RealAudio格式! 参考: 先下载一个汉化注册版,手把手教你录歌的教程: https://www.wendangku.net/doc/cb9650467.html,/publicforum/Content/it/1/297476.shtml 软件下载完后内有安装说明,一定要按说明一步一步安装 使用说明:

1.运行cep_v 2.0 setup.exe安装Cool Edit Pro v2.0! 一般都会安装到默认的路径 2.运行破解注册程序 cep2reg.exe程序注册,输入注册码: Name: mydaj Code: 200-00-NKL YUBNZ 3.运行cep_v2.1 setup.exe程序安装Cool Edit Pro v2.1! 4.运行汉化程序 Cool2chinese 汉化包安装到上面安装程序的路径下 5.下面是三个效果插件,这些效果插件都有破解和注册码。按默认路径就可以了。请一个一个安装: BBE Sonic Maximizer ultrafunk2 wave3.0 6,最好安装在默认的C盘,使用默认的设置,不然有可能不能完成安装过程。 7,安装完一个程序后会自动打开程序。要把这一程序关闭再安装下一程序。 Cool Edit Pro 2.1软件如何操作

MATLAB数字音频处理

音频信号的处理 一、问题的提出:数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢?信号是传递信息的函数。 一、问题的提出: 数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢? 信号是传递信息的函数。离散时间信号%26mdash;%26mdash;序 列%26mdash;%26mdash;可以用图形来表示。 按信号特点的不同,信号可表示成一个或几个独立变量的函数。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他参量,习惯上将其看成时间。信号有以下几种: (1)连续时间信号:在连续时间范围内定义的信号,但信号的幅值可以是连续数值,也可以是离散数值。当幅值为连续这一特点情况下又常称为模拟信号。实际上连续时间信号与模拟信号常常通用,用以说明同一信号。 (2)离时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。 (3)数字信号:时间离散而幅度量化的信号。 语音信号是基于时间轴上的一维数字信号,在这里主要是对语音信号进行频域上的分析。在信号分析中,频域往往包含了更多的信息。对于频域来说,大概有8种波形可以让我们分析:矩形方波,锯齿波,梯形波,临界阻尼指数脉冲波形,三角波,余旋波,余旋平方波,高斯波。对于各种波形,我们都可以用一种方法来分析,就是傅立叶变换:将时域的波形转化到频域来分析。 于是,本课题就从频域的角度对信号进行分析,并通过分析频谱来设计出合适的滤波

器。当然,这些过程的实现都是在MATLAB软件上进行的,MATLAB软件在数字信号处理上发挥了相当大的优势。 二、设计方案: 利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波。对于波形图与频谱图(包括滤波前后的对比图)都可以用MATLAB画出。我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 选择设计此方案,是对数字信号处理的一次实践。在数字信号处理的课程学习过程中,我们过多的是理论学习,几乎没有进行实践方面的运用。这个课题正好是对数字语音处理的一次有利实践,而且语音处理也可以说是信号处理在实际应用中很大众化的一方面。 这个方案用到的软件也是在数字信号处理中非常通用的一个软 件%26mdash;%26mdash;MATLAB软件。所以这个课题的设计过程也是一次数字信号处理在MATLAB中应用的学习过程。课题用到了较多的MATLAB语句,而由于课题研究范围所限,真正与数字信号有关的命令函数却并不多。 三、主体部分: (一)、语音的录入与打开: [y,fs,bits]=wavread('Blip',[N1 N2]);用于读取语音,采样值放在向量y中,fs表示采样频率(Hz),bits表示采样位数。[N1 N2]表示读取从N1点到N2点的值(若只有一个N的点则表示读取前N点的采样值)。 sound(x,fs,bits); 用于对声音的回放。向量y则就代表了一个信号(也即一个复杂的%26ldquo;函数表达式%26rdquo;)也就是说可以像处理一个信号表达式一样处理这个声音信号。 FFT的MATLAB实现 在MATLAB的信号处理工具箱中函数FFT和IFFT用于快速傅立叶变换和逆变换。下

浦喆科技音频处理器

音频处理器 品牌:浦喆 是一款高性能、多种音频处理技术高集成的8路输入8路输出的数字音频处理器,采用DSP 音频处理技术,为用户提供卓越的声音品质;内置反馈抑制、回声消除、噪声消除等功能,还原高品质声音。主要应用于中大型场所,可以满足远程视频会议、体育场馆、会议中心、礼堂、宴会厅、展厅、多媒体会议、指挥中心等公共扩声系统等多方面的应用需求。 功能特点: 1. 输入每通道:8路平衡式话筒/线路,采用裸线接口端子,平衡接法。 2. 输出每通道:8路平衡式线路输出,采用裸线接口端子,平衡接法。 3. 提供24bit/48KHz卓越的高品质声音。 4. 全功能矩阵混音,提供用户灵活、简单的信号路由操作,路由路径和电平大小可在一个按钮上完成。 5. 面板具备USB接口,支持多媒体存储,可进行播放或存储录播 6. 配置双向RS-232接口,可用于控制外部设备。 7. 配置RS-485接口,可实现自动摄像跟踪功能。 8. 配置8通道可编程GPIO控制接口(可自定义输入输出)。 9. 支持断电自动保护记忆功能。 10. 支持通道拷贝、粘贴、联控功能。 11. Enternet多用途数据传输及控制端口,可以支持实时管理单台及多台设备。 12. 支持通过浏览器访问设备,下载自带管理控制软件;软件界面直观、图形化,可工作在XP/Windows7、8、10等系统环境下。 13. 支持iOS、iPad、Android的手机/平板APP进行操作控制。 技术参数: 1. 输入通道:前级放大、信号发生器、扩展器、压缩器、5段参量均衡、AM自动混音功能、AFC自适应反馈消除、AEC回声消除、ANC噪声消除 2. 输出通道:31段参量均衡器、延时器、分频器、高低通滤波器、限幅器 3. 采样率:48K 4. 幻像供电:DC 48V 5. 频率响应:20Hz-20KHz 6. 总谐波失真+噪声:<0.002% @1KHz ,4dBu 7. 数/模动态范围(A-计权):120dB 8. 模/数动态范围(A-计权):120dB 9. 输入阻抗(平衡式):20KΩ; 10. 最大输出阻抗(平衡式):100Ω; 11. 通道隔离度:1kHz,100dB 12. 输入共模抑制:60Hz,80dB 13. 最大输出电平:+24dBu,平衡 14. 最大输入电平:+24dBu,平衡 15. 工作温度:0℃-40℃ 16. 工作电源:AC110V-220V,50Hz/60Hz 17. 电源功耗:<40W 18. 尺寸(宽x深x高):482×258×45(mm)

(完整版)audition人声处理技巧

audition人声处理技巧 人声音源的频谱分布比较特殊,就其发音方式而言,他有三个部分:一个是由声带震动所产生的乐音,此部分的发音最为灵活,不同音高、不同发音方式所产生的频谱变化也很大;二是鼻腔的形状较为稳定,因而其共鸣所产生的谐音频谱分布变化不大;三是口腔气流在齿缝间的摩擦声,这种齿音与声带震动所产生的乐音基本无关。 频率均衡可以大致的将这三部分频谱分离出来。用于调节鼻音的频率段在500Hz,以下均衡的中点频率一般在80~150Hz,均衡带宽为4个倍频程。例如,可以将100Hz定为频率均衡的中点,均衡曲线应从100~400Hz平缓的过渡,均衡增益的调节范围可以为+10Db~ -6dB。这里应提醒大家的是:进行此项调整的监听音箱不得使用低频发音很弱的小箱子,以避免鼻音被无意过分加重。 人声乐音的频谱随音调的变化也很大,所以调节乐音的均衡曲线应非常平缓,均衡的中点频率可在1000~3400Hz,均衡带宽为六个倍频程。此一频段控制着歌唱发音的明亮感,向上调节可温和地提升人声的亮度。然而如需降低人声的明亮度,情况就会更复杂一些。一般音感过分明亮的人声大多都是2500Hz附近的频谱较强,这里我们可用均衡带宽为1/2倍频程,均衡增益为-4dB左右的均衡处理,在2500Hz附近寻找一个效果最好的频点即可。 人声齿音的频谱分布在4kHz以上。由于此频段亦包含部分乐音频谱,所以建议调节齿音的频段应为6~16KHz,均衡带宽为3个倍频程,均衡中点频率一般在10~12KHz,均衡增益最大向上可调至+10Db;如需向下降低人声齿音的响度,则应使用均衡带宽为1/2倍频程,均衡中点频率为6800Hz的均衡处理,其均衡增益最低可向下降至-10Db。 由以上分析可以看出,对人声进行频率均衡处理时,为突出某一音感而进行的频段提升,都尽量使用曲线平缓的宽频带均衡。这是为了使人声鼻音、乐音、齿音三部分的频谱分布均匀连贯,以使其发音自然、顺畅。从理论上讲,应使人声在发任何音时,其响度都保持恒定。 为了在不破坏人生自然感的基础上对其进行特定效果的处理可以使用1/5倍频程的均衡处理,具体有以下几种情形: (1)音感狭窄,缺乏厚度,可在800Hz处使用1/5倍频程的衰减处理,衰减的最大值可以在-3dB。 (2)卷舌齿音的音感尖啸,"嘘"音缺乏清澈感,可在2500Hz处使用1/5倍频程的衰减处理,衰减的最大值可以在-6Db。 对音源的均衡处理,最好是使用能显示均衡曲线的均衡器。一般数字调音台均衡器上的均衡增益调节钮用"G"来标识,均衡频率调节钮用"F"来标识,均衡带宽调节钮用"F"或"Q"来标识。 延时反馈 延时反馈是效果处理当中应用最为广泛,但也是最为复杂的方式。其中,混响、合唱、镶边、回声等效果,其基本处理方式都是延时反馈。 1、混响 混响效果主要是用于增加音源的融合感。自然音源的延时声阵列非常密集、复杂,所以模拟混响效果的程序也复杂多变。常见参数有以下几种: 混响时间:能逼真的模拟自然混响的数码混响器上都有一套复杂的程序,其上虽然有很多技术参数可调,然而对这些技术参数的调整都不会比原有的效果更为自然,尤其是混响时间。 高频滚降:此项参数用于模拟自然混响当中,空气对高频的吸收效应,以产生较为自然的混响效果。一般高频混降的可调范围为0.1~1.0。此值较高时,混响效果也较接近自然混

Premiere对音频效果处理详细教程

第10章 加入音频

一个好的视频剧本离不开一段好的背景音乐,音乐和声音的效果给影像节目带来的冲击力是令人震撼的。音频效果是用Premiere 编辑节目不可或缺的效果。一般的节目都是视频和音频的合成,传统的节目在后期编辑的时候,根据剧情都要配上声音效果,叫做混合音频,生成的节目电影带叫做双带。胶片上有特定的声音轨道存储声音,当电影带在放映机上播放的时候,视频和声音以同样的速度播放,实现了画面和声音的同步。 在Premiere 中可以很方便地处理音频。同时还提供了一些较好的声音处理方法,例如声音的摇移(Pan ),声音的渐变等。本章主要介绍Premiere 处理音频的方法。通过与视频的处理方法比较,可以进一步了解计算机处理节目的方法。 本章主要内容: (1)关于音频效果; (2)在Timeline 窗口中编辑音频; (3)如何使用Audio Mixer 窗口编辑音频; (4)如何使用音频滤镜。 10.1 关于音频效果 10.1.1 Premiere 对音频效果的处理方式 首先了解一下Premiere 中使用的音频素材到底有哪些效果。扩展Timeline 中的音频轨道,它将分成2个通道,即左右声道(L 和R 通道)。如果一个音频的声音使用单声道,则Premiere 可以改变这一个声道的效果。如果音频素材使用立体声道,Premiere 可以在2个声道间实现音频特有的效果,例如摇移,在一个声道的声音转移到另一个声道,在实现声音环绕效果时就特别的有用,而更多音频轨道效果的合成处理(支持99轨)控制使用Premiere 6.0新增的Audio Mixer 来控制是最方便不过的了。 同时,Premiere 提供了处理音频的滤镜。音频滤镜和视频滤镜相似,Premiere 6.0将这些滤镜封装成插件,提供给,选择不同的滤镜可以实现不同的音频效果。项目中使用的音频素材可能在文件形式上有不同,但是一旦添加入项目中,Premiere 将自动地把它转化成在音频设置框中设置的帧,所以可以像处理视频帧一样方便地处理它。 10.1.2 Premiere 处理音频的顺序 Premiere 处理音频有一定的顺序,添加音频效果的时候就要考虑添加的次序。Premiere 首先对任何应用的音频滤镜进行处理,紧接着是在Timeline 的音频轨道中添加的任何摇移或者增益调整,它们是最后处理的效果。要对素材调整增益,可以选择Clip/Audio Options/Audio Gains …命令。 音频素材最后的效果包含在预览的节目或输出的节目中。 10.2 在Timeline 窗口中合成音频 10.2.1 音频持续时间和速度的调整 音频的持续时间就是指音频的入、出点之间的素材持续时间,因此,对于音频持续时间

基于Matlab的语音信号处理与分析

系(院)物理与电子工程学院专业电子信息工程题目语音信号的处理与分析 学生姓名 指导教师 班级 学号 完成日期:2013 年5 月 目录 1 绪论 (3) 1.1课题背景及意义 (3) 1.2国内外研究现状 (3) 1.3本课题的研究内容和方法 (4) 1.3.1 研究内容 (4) 1.3.2 开发环境 (4) 2 语音信号处理的总体方案 (4) 2.1 系统基本概述 (4) 2.2 系统基本要求与目的 (4) 2.3 系统框架及实现 (5) 2.3.1 语音信号的采样 (5) 2.3.2 语音信号的频谱分析 (5) 2.3.3 音乐信号的抽取 (5) 2.3.4 音乐信号的AM调制 (5) 2.3.5 AM调制音乐信号的同步解调 (5) 2.4系统设计流程图 (6) 3 语音信号处理基本知识 (6) 3.1语音的录入与打开 (6)

3.2采样位数和采样频率 (6) 3.3时域信号的FFT分析 (7) 3.4切比雪夫滤波器 (7) 3.5数字滤波器设计原理 (8) 4 语音信号实例处理设计 (8) 4.1语音信号的采集 (8) 4.3.1高频调制与低频调制 (10) 4.3.2切比雪夫滤波 (11) 4.3.3 FIR滤波 (11) 5 总结 (12) 参考文献 (13) 语音信号的处理与分析 【摘要】语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。 本设计针对现在大部分语音处理软件内容繁多、操作不便等问题,采用MATLAB7.0综合运用GUI界面设计、各种函数调用等来实现语音信号的变频、变幅、傅里叶变换及滤波,程序界面简练,操作简便,具有一定的实际应用意义。 最后,本文对语音信号处理的进一步发展方向提出了自己的看法。 【关键词】Matlab 语音信号傅里叶变换低通滤波器

MATLAB 与 音频处理 相关内容摘记

MATLAB 与音频处理相关内容摘记MATLAB音频相关函数 声音数据输入输出函数: 可以方便地读写au和way文件,并可控制其中的位及频率。 wavread()和wavwriteO。 声音播放: wavplay():播放wav声音文件。当然,也可以把处理后的 wav文件保存后再用其它工具播放。 wavrecordO:可以对处理后的wav文件进行录音。 PS:在日常生活中,我们听到的声音一般都属于复音,其声音信号由不同的振幅与频率的波合成而得到 MATLAB处理音频信号的流程 分析和处理音频信号首先要对声音信号进行采集MATLAB 的数据采集工具箱提供了一整套命令和函数,通过调用这些函数和命令,可直接控制声卡进行数据采集[1] Windows 自带的录音机程序也可驱动声卡来采集语音信号并能保存 为WAV 格式文件供MATLAB 相关函数直接读取写入或播放本文 以WAV格式音频信号作为分析处理的输入数据用MATLAB 处理音频信号的基本流程是先将WAV 格式音频信号经wavread 函数转换 成MATLAB 列数组变量再用MATLAB 强大的运算能力进行数据分析和处理如时域分析频域分析数字滤波信号合成信号变换识别和增强等等处理后的数据如是音频数据则可用wavwrite 转换成WAV 格式文件或用sound wavplay 等函数直接回放下面分别介绍MATLAB 在音量标准化声道分离合并与组合数字滤波数 据转换等音频信号处理方面的技术实现 音量标准化

录制声音过程中需对声音电平进行量化处理最理想的量化是最大电平对应最高量化比特但实际却很难做到常有音轻问题利用MATLAB 很容易实现音量标准化即最大电平对应最高量化比特基本步骤是先用wavread 函数 将WAV 文件转换成列数组变量再求出数组变量的极值并对所有元素作归一化处理最后用wavwrite 函数还原成音量标准化的WAV 文件 例 1 现以微软自带的Windows XP 关机.wav 音频信号为例先将其复制另存到文件名为XPexit.wav 的MATLAB 当前目录中 再通过音量标准化处理后保存为XPquit.wav 文件实现程序如下 clear; close all; clc; [Y,FS,NBITS]=wavread('XPexit.WAV'); % 将WAV 文件转换成变量 FS,NBITS, % 显示采样频率和量化比特 Ym=max(max(max(Y)),max(abs(min(Y)))), % 找出双声道极值 X=Y/Ym; % 归一化处理 wavwrite(X,FS,NBITS,'XPquit.wav') % 将变量转换成WAV 文件 试听可知标准化处理后音量稍大 声道分离合并与组合 立体声或双声道音频信号有左右两个声道利用MATLAB 实现双声道分离两路声道合并和两个单声道组合成一个双声道等效果实际上是利用 了MATLAB 的矩阵抽取矩阵相加和矩阵重组运算 例 2 现以例 1 生成的XPquit.wav 为例实现分离合并和组合处理的程序如下 clear; close all; clc; [x,FS,NBITS]=wavread('XPquit.WAV'); % 将WAV 文件转换成变量 x1=x(:,1); % 抽取第 1 声道 x2=x(:,2); % 抽取第 2 声道 wavwrite(x1,FS,NBITS,'XPquit1.WAV'); % 实现 1 声道分离 wavwrite(x2,FS,NBITS,'XPquit2.WAV'); % 实现 2 声道分离 %如果合并位置不对前面补0 %声道长度不对后面补0 x12=x1+x2; % 两路单声道列向量矩阵变量合并 x12m=max(max(x12),abs(min(x12))), % 找出极值 y12=x12./x12m; % 归一化处理 wavwrite(y12,FS,NBITS,'XPquit12.WAV'); % 实现两路声道合并 %如果组合位置不对前面补0--声道长度不对后面补0 x3=[x1,x2]; % 两路单声道变量组合 wavwrite(x3,FS,NBITS,'XPquit3.WAV'); % 实现两路声道组合 可以试听声道分离合并与组合的效果也可对各文件大小进行比较 数字滤波 数字滤波是常用的音频处理技术可根据技术指标先利用FDATool 工具设计一个数字滤波器[2] 再用Filter 或Filter2 函数即可实现滤波处理调用 的Filter 函数格式是Y = filte (B,A,X) 其中 B 和 A 是滤波器传输函数的分子和分母系数X 是输入变量Y是实现滤波后的输出变量如果处理立体声音频信号可分开处理但用FIR 滤波器时调用Filter2 函数更方便

音频处理

使用技巧 不管你的MP3歌曲的简单剪接或者音频格式的转换,还是更加高级的后期加工GoldWave都可以令你轻松胜,甚至你自己录一首卡拉OK,也可以经过GoldWave的修饰成为像歌星一样水晶般的动人声音! 快速入门GoldWave是标准的绿色软件,不需要安装且体积小巧(压缩后只有0.7M),将压缩包的几个文件释放到硬盘下的任意目录里,直接点击GoldWave.exe就开始运行了。既然是音频编辑软件,我就先得用音频文件来"开刀"!选择文件菜单的打开命令,指定一个将要进行编辑的文件,然后按回车。在毫无等待的时间相应内,GoldWave马上显示出这个文件的波形状态和软件运行主界面,让我吃惊它的运行反应速度。整个主界面从上到下被分为3个大部分,最上面是菜单命令和快捷工具栏,中间是波形显示,下面是文件属性。我的主要操作集中在占屏幕比例最大的波形显示区域内,如果是立体声文件则分为上下两个声道,可以分别或统一对它们进行操作。选择音频事件要对文件进行各种音频处理之前,必须先从中选择一段出来(选择的部分称为一段音频事件)。GoldWave的选择方法很简单,充分利用了鼠标的左右键配合进行,在某一位置上左击鼠标就确定了选择部

分的起始点,在另一位置上右击鼠标就确定了选择部分的终止点,这样选择的音频事件就将以高亮度显示,现在我们的所有操作都只会对这个高亮度区域进行,其它的阴影部分不会受到影响。选择的部分以高亮度显示当然如果选择位置有误或者更换选择区域可以使用编辑菜单下的选择查看命令(或使用快捷键Ctrl+W),然后再重新进行音频事件的选择。剪切、复制、粘贴、删除音频编辑与Windows其它应用软件一样,其操作中也大量使用剪切、复制、粘贴、删除等基础操作命令,因此牢固掌握这些命令能够更有助于我们的快速入门。GoldWave的这些常用操作命令实现起来十分容易,除了使用编辑菜单下的命令选项外,快捷键也和其他Windows应用软件差不多。要进行一段音频事件的剪切,首先要对剪切的部分进行选择,然后按Ctrl+X就行了,稍事等待之后这段高亮度的选择部分就消失了,只剩下其他未被选择的阴影部分。用选择查看命令并重新设定指针的位置到将要粘贴的地方,用Ctrl+V就能将刚才剪掉的部分还原出来,真是太方便了,和普通软件使用方法完全相同!同理,用Ctrl+C 进行复制、用Del进行删除。如果在删除或其他操作中出现了失误,用Ctrl+Z就能够进行恢复,所以在操作中尽可以放心大胆的使用,任何错误都可以挽回嘛!

音频处理教程(全)

音频处理教程 ——从最基础的入门知识开始 音乐格式介绍 通常我们在制作课件的时候,在图文并茂的基础上,加上一些音、视频,以利于教学。但是我们在课件中需使用到的素材,有时并没有现成的,这时就需我们自己来动手进行处理。本次课程我们就着重谈谈一些音、视频的处理方法。 一、各类音频格式简介: CD格式:天籁之音 当今世界上音质最好的音频格式是什么?当然是CD了。因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。它会让你感受到天籁之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。注意:不能直接的复制CD格式的*.cda文件到硬盘上播放,需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WA V,这个转换过程如果光盘驱动器质量过关而且EAC的参数设置得当的话,可以说是基本上无损抓音频。推荐大家使用这种方法。 WAV:无损的音乐 是微软公司开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K 的采样频率,速率88K/秒,16位量化位数,看到了吧,WAV格式的声音文件质量和CD相差无几,也是目前PC 机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV格式。 MP3:流行的风尚 MP3格式诞生于八十年代的德国,所谓的MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1"/“*.mp2”/“*.mp3”这3种声音文件。需要提醒大家注意的地方是:MPEG音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而音质要次于CD格式或WAV格式的声音文件。 MIDI:作曲家的最爱 经常玩音乐的人应该常听到MIDI(Musical Instrument Digital Interface)这个词,MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来。MID文件并不是一段录制好的声音,而是记录声音的信息,然后在告诉声卡如何再现音乐的一组指令。这样一个MIDI文件每存1分钟的音乐只用大约5~10KB。今天,MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声卡的档次。*.mid格式的最大用处是在电脑作曲领域。*.mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成*.mid文件。

基于MATLAB的语音信号采集与处理

工程设计论文 题目:基于MATLAB的语音信号采集与处理 姓名: 班级: 学号: 指导老师:

一.选题背景 1、实践意义: 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。所以理解并掌握语音信号的时域和频域特性是非常重要的。 通过语音相互传递信息是人类最重要的基本功能之一.语言是人类特有的功能.声音是人类常用工具,是相互传递信息的最重要的手段.虽然,人可以通过多种手段获得外界信息,但最重要,最精细的信息源只有语言,图像和文字三种.与用声音传递信息相比,显然用视觉和文字相互传递信息,其效果要差得多.这是因为语音中除包含实际发音容的话言信息外,还包括发音者是谁及喜怒哀乐等各种信息.所以,语音是人类最重要,最有效,最常用和最方便的交换信息的形式.另一方面,语言和语音与人的智力活动密切相关,与文化和社会的进步紧密相连,它具有最大的信息容量和最高的智能水平。 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,处理的目的是用于得到某些参数以便高效传输或存储;或者是用于某种应用,如人工合成出语音,辨识出讲话者,识别出讲话容,进行语音增强等. 语音信号处理是一门新兴的学科,同时又是综合性的多学科领域,

是一门涉及面很广的交叉学科.虽然从事达一领域研究的人员主要来自信息处理及计算机等学科.但是它与语音学,语言学,声学,认知科学,生理学,心理学及数理统计等许多学科也有非常密切的联系. 语音信号处理是许多信息领域应用的核心技术之一,是目前发展最为迅速的信息科学研究领域中的一个.语音处理是目前极为活跃和热门的研究领域,其研究涉及一系列前沿科研课题,巳处于迅速发展之中;其研究成果具有重要的学术及应用价值. 数字信号处理是利用计算机或专用处理设备,以数值计算的方法对信号进行采集、抽样、变换、综合、估值与识别等加工处理,借以达到提取信息和便于应用的目的。它在语音、雷达、图像、系统控制、通信、航空航天、生物医学等众多领域都获得了极其广泛的应用。具有灵活、精确、抗干扰强、度快等优点。 数字滤波器, 是数字信号处理中及其重要的一部分。随着信息时代和数字技术的发展,受到人们越来越多的重视。数字滤波器可以通过数值运算实现滤波,所以数字滤波器处理精度高、稳定、体积小、重量轻、灵活不存在阻抗匹配问题,可以实现模拟滤波器无法实现的特殊功能。数字滤波器种类很多,根据其实现的网络结构或者其冲激响应函数的时域特性,可分为两种,即有限冲激响应( FIR,Finite Impulse Response)滤波器和无限冲激响应( IIR,Infinite Impulse Response)滤波器。 FIR滤波器结构上主要是非递归结构,没有输出到输入的反馈,系统函数H (z)在处收敛,极点全部在z = 0处(因果系统),因而只能

音频处理器的调节方法

现在数字音频处理器越来越多地运用到工程当中了,对于有基础有经验的人来说,处理器是一个很好用的工具,但是,对于一些经验比较欠缺的朋友来说,看着一台处理器,又是一大堆英文,不免有点无从下手。其实不用慌,我来介绍一下处理器使用步骤。/ J( E: b) J3 }0 ^! _ a9 U 以一个2进4出的处理器控制全频音箱+超低音音箱的系统为例:# a- X* J3 A1 _9 r/ ^ 1、首先是用处理器连接系统,先确定好哪个输出通道用来控制全频音箱,哪个输出通道用来控制超低音音箱,比如你用输出1、2通道控制超低音,用输出3、4通道控制全频。接好线了,就首先进入处理器的编辑(EDIT)界面来进行设置,进入编辑界面不同的产品的方法不同,具体怎么进入,去看说明书。& F5 r/ N5 p! S* I1 A 2、利用处理器的路由(ROUNT)功能来确定输出通道的信号来自哪个输入通道,比如你用立体声方式扩声形式,你可以选择输出通道1、3的信号来自输入A,输出通道的2、4的信号来自输入B。信号分配功能不同的产品所处的位置不同,有些是在分频模块里,有些是在增益控制模块里,这个根据说明书的指示去找。7 m. z) | a8 P1 d+ f6 ~& E 3、根据音箱的技术特性或实际要求来对音箱的工作频段进行设置,也就是设置分频点。处理器上的分频模块一般用CROSSOVER或X-OVER表示,进入后有下限频率选择(HPF)和上限频率选择(LPF),还要滤波器模式和斜率的选择。首先先确定工作频段,比如超低音的频段是40-120赫兹,你就把超低音通道的HPF设置为40,LPF设置为120。全频音箱如果你要控制下限,就根据它的低音单元口径,设置它的HPF大约在50-100Hz,。处理器滤波器形式选择一般有三种,bessel,butterworth和linky-raily,我以前有帖子专门说明过三种滤波器的不同之处,这里不赘述。常用的是butterworth和linky-raily两种,然后是分频斜率的选择,一般你选24dB/oct就可以满足大部分的用途了。 4、这个时候你需要检查一下每个通道的初始电平是不是都在0dB位置,如果有不是0的,先把它们都调到0位置上,这个电平控制一般在GAIN功能里,DBX的处理器电平是在分频器里面的,用G表示。 5、现在就可以接通信号让系统先发出声音了,然后用极性相位仪检查一下音箱的极性是否统一,有不统一的,先检查一下线路有没有接反。如果线路没接反,而全频音箱和超低音的极性相反了,可以利用处理器输出通道的极性翻转功能(polarity或pol)把信号的极性反转,一般用Nomal或“+”表示正极性,用INV或“-”表示负极性。6 e0 u% [% V% E% p 6、接下来就要借助SIA这类工具测量一下全频音箱和超低音的传输时间,一般来说是会有差异的,比如测到全频的传输时间是10ms,超低音是18ms,这个时候就要利用处理器的延时功能对全频进行延时,让全频和低音的传输时间相同。处理器的延时用DELAY或DL Y 表示,有些用m(米)有些用MS(毫秒)来显示延时量,SIA软件也同时提供了时间和距离的量,你可以选择你需要的数据值来进行延时。 7、接下来就该进行均衡的调节了,可以配合测试工具也可以用耳朵来调,处理器的均衡用EQ来表示,一般都是参量均衡(PEQ),参量均衡有3个调节量,频率(F),带宽(Q或OCT),增益(GAIN或G)。具体怎么调,就根据产品特性、房间特性和主观听觉来调了,这个就自己去想了。1 i# v# n ?; ^, B 8、均衡调好后,就要进行限幅器的设置了,处理器的限幅器用LIMIT来表示,进去以后一般有限幅电平(THRESHOLD),压缩比(RATIO)的选项,你要做限幅就要先把压缩比RA TIO 设置为无穷大(INF),然后配合功放来设置限幅电平,变成限幅器后,启动时间ATTACK 和恢复时间RELEASE就不用去理了。DBX处理器的限幅器用PEAKSTOP来表示,启动后,直接设置限幅电平就可以了,至于怎么调限幅器,我有专门的帖子,自己去看。/ W( y9 c' h- o6 v+ ~( X 9、都调好了就要保存数据,处理器的保存一般用STORE或SA VE表示,怎么存,就看产

相关文档