文档库 最新最全的文档下载
当前位置:文档库 › 第三章 音频获取与处理

第三章 音频获取与处理

第三章 音频获取与处理
第三章 音频获取与处理

第三章音频获取与处理

声音是由于空气振动而引起耳膜的振动,由人耳所感知的信息。

声音特性:

●人的听觉器官能感知的频率:20~20000Hz (这也是音频信号的频率范围)

●人的听觉器官能感知的声音幅度:0~120dB (话音信号的频率范围在300~3000Hz)

●声波具有普通波特性:反射、折射、衍射

●声波频率< 20Hz 为次声波

●声波频率〉20000Hz 为超声波

声音的分类

不规则声音:一般指不携带信息的噪音。

规则声音:语音是指具有语言内涵的人类约定俗成的特殊媒体

音乐是指规范的符号化了的声音

音效是指人类熟悉的其他声音,如动物发声等

声音的三要素

音调:频率是指信号每秒钟变化的次数。人对声音频率的感觉表现为音调的高低。

音色:音色是由混入基音的泛音所决定的,高次谐波越丰富,音色就越有明亮感和穿透力。音强:常用音量来描述音强,以分贝为单位。

声音信号的指标

频带宽度:声音信号的频带宽度越宽,所包含的声音信号分量就越丰富,音质越好。

动态范围:动态范围越大,信号强度的相对变化范围越大,则音响效果越好。

信噪比:信噪比是有用信号与噪声之比的简称。噪音可以分为环境噪音和设备噪音。信噪比越大,声音质量越好。

主观度量法:感觉上的、主观上的测试是评价声音质量不可缺少的部分。

由于计算机只能处理和记录二进制的数字信号,因此,由自然音源而得的声音信号必须通过一定的变化和处理,变成二进制数据后才能送到计算机进行再编辑和储存。

数字化

把时间和幅度连续的模拟信号转换成离散的数字信号,称为数字化。

模拟信号

模拟信号是指信息参数在给定范围内表现为连续的信号。或在一段连续的时间间隔内,其代表信息的特征量可以在任意瞬间呈现为任意数值的信号。

数字信号

以一定最小量值为量化单位,用被测量构成此量化单位多少倍的数字所表示的信号。

数字化音频

数字化音频就是通过采样和量化,对模拟量表示的声音信号进行编码后转换成有许多二进制数1和0组成的数字音频文件。

数字化音频的获取

采样:在时间轴上对信号数字化在进行模拟/数字信号的转换过程中,当采样频率fs.max 大于信号中最高频率fmax的2倍时(fs.max>=2fmax),采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍;采样定理又称奈奎斯特定理。

量化:在幅度轴上对信号数字化量化精度是指可以将模拟信号分成多少个等级,量化精度越高,音乐的声压振幅越接近原音乐.

编码:按一定格式记录采样和量化后的数字数据。

影响音频文件数据量的因素

如果是压缩音频文件,如MP3、WMA等,数据量与编码速率相关,如果是非压缩文件,如WA V,则与采样速率、采样值等相关;不管压缩与非压缩,数据量都与通道有关。

MIDI

MIDI仅仅是一个通信标准,它是由电子乐器制造商们建立起来的,用以确定电脑音乐程序、合成器和其他电子音响的设备互相交换信息与控制信号

的方法。

MIDI文件与WAV文件的不同

wav就是最原始的声音文件。音质最好,所有格式的音频都是通过wav转的,俗称音源。

midi是单声道文件,一种无损压缩。。压缩比例很高,但压的不成样子。一般手机的铃声都是midi的

音频信号分析与处理

实验三音频信号的分析与处理1 一、实验目的 1.掌握音频信号的采集以及运用Matlab软件实现音频回放的方 法; 2.掌握运用Matlab实现对音频信号的时域、频谱分析方法; 3.掌握运用Matlab设计RC滤波系统的方法; 4.掌握运用Matlab实现对加干扰后的音频信号的进行滤波处理 的方法; 5.锻炼学生运用所学知识独立分析问题解决问题的能力,培养学 生创新能力。 二、实验性质 设计性实验 三、实验任务 1.音频信号的采集 音频信号的采集可以通过Windows自带的录音机也可以用专用的录制软件录制一段音频信号(尽量保证无噪音、干扰小),也可以直接复制一段音频信号,但必须保证音频信号保存为.wav的文件。 2.音频信号的时域、频域分析 运用Matlab软件实现对音频信号的打开操作、时域分析和频域分析,并画出相应的图形(要求图形有标题),并打印在实验报告中(注意:把打印好的图形剪裁下来,粘贴到实验报告纸上)。 3.引入干扰信号 在原有的音频信号上,叠加一个频率为100KHz的正弦波干扰信号(幅度自定,可根据音频信号的情况而定)。 4.滤波系统的设计 运用Matlab实现RC滤波系统,要求加入干扰的音频信号经过RC滤波系统后,能够滤除100KHz的干扰信号,同时保留原有的音频信号,要求绘制出RC滤波系统的冲激响应波形,并分析其频谱。

% 音频信号分析与处理 %% 打开和读取音频文件 clear all; % 清除工作区缓存 [y, Fs] = audioread('jyly.wav'); % 读取音频文件 VoiceWav = y(300000 : 400000, 1); % 截取音频中的一段波形 clear y; % 清除缓存 hAudio = audioplayer(VoiceWav, Fs); % 将音频文件载入audioplayer SampleRate = get(hAudio, 'SampleRate'); % 获取音频文件的采样率KHz T = 1/SampleRate; % 计算每个点的时间,即采样周期SampLen = size(VoiceWav,1); % 单声道采样长度 %% 绘制时域分析图 hFig1 = figure('Units', 'normalized', 'Position', [0 0.05 0.49 0.85]); t = T: T: (SampLen* T); subplot(2, 1, 1); % 绘制音频波形 plot(t, VoiceWav); % 绘制波形 title('音频时域波形图'); axis([0, 2.3, -0.5, 0.5]); xlabel('时间(s)'); ylabel('幅值(V)'); % 显示标题 %% 傅里叶变换 subplot(2, 1, 2); % 绘制波形 myfft(VoiceWav, SampleRate, 'plot'); % 傅里叶变换 title('单声道频谱振幅'); % 显示标题 xlabel('Frequency (Hz)'); ylabel('|Y(f)|'); play(hAudio); % 播放添加噪声前的声音 pause(3); %% 引入100KHz的噪声干扰 t = (0: SampLen-1)* T; noise = sin(2 * pi * 10000 * t); % 噪声频率100Khz,幅值-1V到+1V hFig2 = figure('Units', 'normalized', 'Position', [0.5 0.05 0.5 0.85]); subplot(2, 1, 1); % 绘制波形 plot(t(1: 1000), noise(1: 1000)); title('100KHz噪声信号'); % 显示标题 noiseVoice = VoiceWav+ noise'; % 将噪声加到声音里面 hAudio = audioplayer(noiseVoice, Fs); % 将音频文件载入audioplayer subplot(2, 1, 2); % 绘制波形 [fftNoiseVoice, f] = myfft(noiseVoice, SampleRate, 'plot'); title('音乐和噪声频谱'); % 显示标题 play(hAudio); % 播放添加噪声后的声音 pause(3);

实验13、CoolEdit数字音频处理剖析

实验13、CoolEdit数字音频处理 实验课时: 课内:2课时;课外:1课时 实验目的: 了解音频数据的特性及其获取和处理的方法,学会使用音频编辑工具CoolEdit进行音频数据的录制、编辑和播放 实验内容: 操作准备 1.在D:或E:分区创建一个以你的“完整学号+姓名”命名的文件夹(名称应类似: 198009010001文立斌),我们把这个文件夹简称为“你的文件夹” 2.以下操作步骤中所涉及的198009010001、文立斌均应替换成你的学号、姓名 3.准备好音频实验环境,个别人物需要准备麦克风、音箱(或耳机) 任务一、音频提取 1.打开CoolEditPro软件 2.如下图所示,单击工具栏最左边的按钮切换到波形编辑界面 → 3.依次执行菜单命令【文件】→【从视频文件中提取】,通过系统显示的“选择视频文件” 对话框选定“说唱脸谱.dat”文件后单击【打开】按钮,系统开始从“说唱脸谱.dat” 中提取音频 4.等待系统提取音频结束后,执行菜单命令【文件】→【另存为】,将提取到的波形保存 为类似“文立斌A.wma”(.wma格式)的文件 任务二、淡入淡出 1.打开CoolEditPro软件 2.如下图所示,单击工具栏最左边的按钮切换到波形编辑界面 → 3.依次执行菜单命令【文件】→【打开】,通过系统显示的“打开波形文件”对话框选定 “最炫民族风.mp3”文件后单击【打开】按钮打开该文件,原始波形编辑面板类似:

4.单击视窗左下角录播工具面板中的播放按钮,试听歌曲,确定演唱(人声)从何时(第 几秒)开始——大约是第23秒! 5.如下图所示,在波形编辑面板中以鼠标拖拽的方式选定最前面23秒波形: 如果需要精确选定波形区域,您还可以借助视窗右下角的如下面板,直接输入始末时间: 6.依次执行菜单命令【效果】→【波形振幅】→【渐变】,如下图所示,在“波形振幅” 对话框中,选择“Fade in”(淡入),然后单击【确定】按钮: 7.系统进行淡入处理后的波形类似: 您应该对照一下处理前后的前23秒波形的异同 8.试听,您应该能听到淡入处理的效果(音量越来越大)才对! 9.从4分20秒位置开始选定直到音频结束处的波形,为选定的波形添加淡出效果,处理 第2页

基于MATLAB的语音信号采集与处理

工程设计论文 题目:基于MATLAB的语音信号采集与处理 姓名: 班级: 学号: 指导老师:

一.选题背景 1、实践意义: 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。所以理解并掌握语音信号的时域和频域特性是非常重要的。 通过语音相互传递信息是人类最重要的基本功能之一.语言是人类特有的功能.声音是人类常用工具,是相互传递信息的最重要的手段.虽然,人可以通过多种手段获得外界信息,但最重要,最精细的信息源只有语言,图像和文字三种.与用声音传递信息相比,显然用视觉和文字相互传递信息,其效果要差得多.这是因为语音中除包含实际发音容的话言信息外,还包括发音者是谁及喜怒哀乐等各种信息.所以,语音是人类最重要,最有效,最常用和最方便的交换信息的形式.另一方面,语言和语音与人的智力活动密切相关,与文化和社会的进步紧密相连,它具有最大的信息容量和最高的智能水平。 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,处理的目的是用于得到某些参数以便高效传输或存储;或者是用于某种应用,如人工合成出语音,辨识出讲话者,识别出讲话容,进行语音增强等. 语音信号处理是一门新兴的学科,同时又是综合性的多学科领域,

是一门涉及面很广的交叉学科.虽然从事达一领域研究的人员主要来自信息处理及计算机等学科.但是它与语音学,语言学,声学,认知科学,生理学,心理学及数理统计等许多学科也有非常密切的联系. 语音信号处理是许多信息领域应用的核心技术之一,是目前发展最为迅速的信息科学研究领域中的一个.语音处理是目前极为活跃和热门的研究领域,其研究涉及一系列前沿科研课题,巳处于迅速发展之中;其研究成果具有重要的学术及应用价值. 数字信号处理是利用计算机或专用处理设备,以数值计算的方法对信号进行采集、抽样、变换、综合、估值与识别等加工处理,借以达到提取信息和便于应用的目的。它在语音、雷达、图像、系统控制、通信、航空航天、生物医学等众多领域都获得了极其广泛的应用。具有灵活、精确、抗干扰强、度快等优点。 数字滤波器, 是数字信号处理中及其重要的一部分。随着信息时代和数字技术的发展,受到人们越来越多的重视。数字滤波器可以通过数值运算实现滤波,所以数字滤波器处理精度高、稳定、体积小、重量轻、灵活不存在阻抗匹配问题,可以实现模拟滤波器无法实现的特殊功能。数字滤波器种类很多,根据其实现的网络结构或者其冲激响应函数的时域特性,可分为两种,即有限冲激响应( FIR,Finite Impulse Response)滤波器和无限冲激响应( IIR,Infinite Impulse Response)滤波器。 FIR滤波器结构上主要是非递归结构,没有输出到输入的反馈,系统函数H (z)在处收敛,极点全部在z = 0处(因果系统),因而只能

基于Matlab的语音信号处理与分析

系(院)物理与电子工程学院专业电子信息工程题目语音信号的处理与分析 学生姓名 指导教师 班级 学号 完成日期:2013 年5 月 目录 1 绪论 (3) 1.1课题背景及意义 (3) 1.2国内外研究现状 (3) 1.3本课题的研究内容和方法 (4) 1.3.1 研究内容 (4) 1.3.2 开发环境 (4) 2 语音信号处理的总体方案 (4) 2.1 系统基本概述 (4) 2.2 系统基本要求与目的 (4) 2.3 系统框架及实现 (5) 2.3.1 语音信号的采样 (5) 2.3.2 语音信号的频谱分析 (5) 2.3.3 音乐信号的抽取 (5) 2.3.4 音乐信号的AM调制 (5) 2.3.5 AM调制音乐信号的同步解调 (5) 2.4系统设计流程图 (6) 3 语音信号处理基本知识 (6) 3.1语音的录入与打开 (6)

3.2采样位数和采样频率 (6) 3.3时域信号的FFT分析 (7) 3.4切比雪夫滤波器 (7) 3.5数字滤波器设计原理 (8) 4 语音信号实例处理设计 (8) 4.1语音信号的采集 (8) 4.3.1高频调制与低频调制 (10) 4.3.2切比雪夫滤波 (11) 4.3.3 FIR滤波 (11) 5 总结 (12) 参考文献 (13) 语音信号的处理与分析 【摘要】语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。 本设计针对现在大部分语音处理软件内容繁多、操作不便等问题,采用MATLAB7.0综合运用GUI界面设计、各种函数调用等来实现语音信号的变频、变幅、傅里叶变换及滤波,程序界面简练,操作简便,具有一定的实际应用意义。 最后,本文对语音信号处理的进一步发展方向提出了自己的看法。 【关键词】Matlab 语音信号傅里叶变换低通滤波器

实验九 音频信号采集及处理

音频信号采集及处理程序代码及实验结果图: [voice,fs]=audioread('notify.wav');%声音读取 sound(voice,fs); %声音回放 n=length(voice);%计算长度 voice1=fft(voice,n); %快速傅里叶变换 figure(1);subplot(2,1,1);plot(voice); %绘出时域波 xlabel('t');ylabel('amp');%坐标名称 title('初始音频信号时域波形');grid on; subplot(2,1,2);plot(abs(fftshift(voice1))); %绘出原始音频信号频谱 title('初始音频信号频域波形'); xlabel('f');ylabel('amp');grid on; t=0:1/fs:(n-1)/fs; noise=0.05*sin(2*pi*100000*t');%100kHz正弦波噪声 s=voice+noise;%加噪后的音频信号 pause;sound(s,fs); %播放加噪的语音 n=length(s); S=fft(s,n);%计算频谱 figure(2);subplot(2,1,1);plot(s);%画出加噪之后的音频信号时域波 形 title('加噪声后的音频信号时域波形'); xlabel('t');ylabel('amp');grid on; subplot(2,1,2);plot(abs(fftshift(S)));%零频移到频谱中心后,绘制加噪 之后的音频信号频谱 xlabel('f');ylabel('amp'); title('加噪声后的音频信号频域波形');grid on; pause; rp=2; rs=80; Ft=8000;Fp=1000;Fs=1300; wp=2*pi*Fp/Ft; ws=2*pi*Fs/Ft; %求出待设计的模拟滤波器的边界频率 [n,wn]=buttord(wp,ws,rp,rs,'s'); %低通滤波器的阶数和截止频率 [b,a]=butter(n,wn,'s'); %S域频率响应的参数即:滤波器的传输函数 [bz,az]=bilinear(b,a,0.5); %利用双线性变换实现频率响应S域到Z域的变换 [h,w]=freqz(bz,az); figure(3);plot(w*fs/(2*pi),abs(h));%绘制IIR低通滤波器特性曲线 title('IIR低通滤波器特性曲线');grid on; z=filter(bz,az,s); %滤波 pause;sound(z,fs); %回放滤波后的信号 Z=fft(z); %滤波后的信号频谱 figure(4);subplot(2,2,2);plot(z);%绘制低通滤波后的音频信号时域

数字音视频处理

实验报告 课程名称数字音视频原理 实验题目MATLAB音频文件处理 专业电子信息工程 班级3班 学号09080323 学生姓名王志愿 实验成绩 指导教师吴娱 2012年3月 一、实验目的 1、掌握录制语音信号的基本过程; 2、掌握MATLAB编程对语音信号进行简单处理的方法并分析结果。 二、实验要求

上机完成实验题目,独立完成实验报告。 三、实验内容 1、问题的提出:数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢? 信号是传递信息的函数。离散时间信号(序列)——可以用图形来表示。 按信号特点的不同,信号可表示成一个或几个独立变量的函数。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他参量,习惯上将其看成时间。信号有以下几种: (1)连续时间信号:在连续时间范围内定义的信号,但信号的幅值可以是连续数值,也可以是离散数值。当幅值为连续这一特点情况下又常称为模拟信号。实际上连续时间信号与模拟信号常常通用,用以说明同一信号。 (2)离散时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。 (3)数字信号:时间离散而幅度量化的信号。 语音信号是基于时间轴上的一维数字信号,在这里主要是对语音信号进行频域上的分析。在信号分析中,频域往往包含了更多的信息。对于频域来说,大概有8种波形可以让我们分析:矩形方波,锯齿波,梯形波,临界阻尼指数脉冲波形,三角波,余弦波,余弦平方波,高斯波。对于各种波形,我们都可以用一种方法来分析,就是傅立叶变换:将时域的波形转化到频域来分析。 2、设计方案: 首先要对声音信号进行采集,Windows自带的录音机程序可驱动声卡来采集语音信号,并能保存成.WAV格式文件,供MATLAB相关函数直接读取、写入或播放。 利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波。对于波形图与频谱图(包括滤波前后的对比图)都可以用MATLAB画出。我们还可以通过sound/wavplay命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 3、主体部分: (1)语音的录入与打开: [x,fs,bits]=wavread('d:\1.wav');%用于读取语音,采样值放在向量x中,fs 表示采样频率(Hz),bits表示量化位数。

对语音信号进行分析及处理资料

一、设计目的 1.进一步巩固数字信号处理的基本概念、理论、分析方法和实现方法;使自身对信号的采集、处理、传输、显示和存储等有一个系统的掌握和理解; 2.增强应用Matlab语言编写数字信号处理的应用程序及分析、解决实际问题的能力; 3.培养自我学习的能力和对相关课程的兴趣; 二、设计过程 1、语音信号的采集 采样频率,也称为采样速度或者采样率,定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。 采样位数可以理解为声卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实 采样定理又称奈奎斯特定理,在进行模拟/数字信号的转换过程中,当采样频率fs不小于信号中最高频率fm的2倍时,采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍。 利用Windows下的录音机,录制了一段发出的声音,内容是“数字信号”,时间在3 s内。接着在D盘保存为WAV格式,然后在Matlab软件平台下.利用函数wavread对语音信号进行采样,并记录下了采样频率和采样点数,在这里我们还通过函数sound引入听到采样后自己所录的一段声音。 [x1,fs,bits]=wavread('E:\数字信号.wav'); %读取语音信号的数据,赋给变量x1,返回频率fs 44100Hz,比特率为16 。 2 、语音信号的频谱分析 (1)首先画出语音信号的时域波形; 程序段: x=x1(60001:1:120000); %截取原始信号60000个采样点

plot(x) %做截取原始信号的时域图形 title('原始语音采样后时域信号'); xlabel('时间轴 n'); ylabel('幅值 A'); (2)然后用函数fft 对语音号进行快速傅里叶变换,得到信号的频谱特性; y1=fft(x,6000); %对信号做N=6000点FFT 变换 figure(2) subplot(2,1,1),plot(k,abs(y1)); title('|X(k)|'); ylabel('幅度谱'); subplot(2,1,2),plot(k,angle(y1)); title('arg|X(k)|'); ylabel('相位谱'); (3)产生高斯白噪声,并且对噪声进行一定的衰减,然后把噪声加到信号中,再次对信号进行频谱特性分析,从而加深对频谱特性的理解; d=randn(1,60000); %产生高斯白噪声 d=d/100; %对噪声进行衰减 x2=x+d; %加入高斯白噪声 3、设计数字滤波器 (1)IIR 低通滤波器性能指标通带截止频Hz f c 1000=,阻带截止频率 Hz f st 1200=,通带最大衰减dB 11=δ,阻带最小衰减dB 1002=δ。 (2)FIR 低通滤波器性能指标通带截止频率Hz f c 1000=,阻带截止频率 Hz f st 1200=, 通带衰减1δ≤1dB ,阻带衰减 2δ≥ 100dB 。 (3)IIR 高通滤波器的设计指标,Hz f z 1000=,Hz f p 2000=,阻带最小衰减dB A s 30=,通带最大衰减dB A P 1=。 (4)(4)FIR 高通滤波器的设计指标,Hz f z 1000=,Hz f p 2000=,阻带最小衰减dB A s 50=,通带最大衰减dB A P 1=。 (5)用自己设计的各滤波器分别对采集的信号进行滤波,在Matlab 中,FIR 滤波器利用函数fftfilt 对信号进行滤波,IIR 滤波器利用函数filter 对信号进行滤波。比较滤波前后语音信号的波形及频谱,在一个窗口同时画出滤波前后

数字信号处理综合分析报告--数字音频信号的分析与处理

数字信号处理综合报告--数字音频信号的分析与处理

————————————————————————————————作者:————————————————————————————————日期:

数字信号处理实验 题目数字音频信号的分析与处理 班级 姓名 学号 日期 2013.06.10-2013.06.24

一、实验目的 1.复习巩固数字信号处理的基本理论; 2.利用所学知识研究并设计工程应用方案。 二、实验原理 数字信号处理技术在音频信号处理中的应用日益增多,其灵活方便的优点得到体现。分频器即为其中一种音频工程中常用的设备。 人耳能听到的声音频率范围为20Hz~20000Hz,但由于技术所限,扬声器难以做到在此频率范围内都有很好的特性,因此一般采用两个以上的扬声器来组成一个系统,不同的扬声器播放不同频带的声音,将声音分成不同频带的设备就是分频器。下图是一个二分频的示例。 图8.1 二分频示意图 高通滤波器和低通滤波器可以是FIR或IIR类型,其中FIR易做到线性相位,但阶数太高, 不仅需要耗费较多资源,且会带来较长的延时;IIR阶数低,但易出现相位失真及稳定性问题。 对分频器的特性,考虑最多的还是两个滤波器合成的幅度特性,希望其是平坦的,如图8.2所示: 图8.2 分频器幅度特性 分频 低频放 高频放 声 音 High Low-

由于IIR 的延时短,因此目前工程中大量应用的还是Butterworth 、Bessel 、Linkwitz-Riley 三种IIR 滤波器。其幅频特性如图8.3所示: 图8.3 三种常用IIR 分频器的幅度特性 巴特沃斯、切比雪夫、椭圆等类型的数字滤波器系数可通过调用MATLAB 函数很方便的计算得到,但Bessel 、Linkwitz-Riley 数字滤波器均无现成的Matlab 函数。 并联系统的系统函数为 级联系统的系统函数为 宁可瑞滤波器(Linkwitz-Riley ),由两个巴特沃斯滤波器级联而成。 N 阶巴特沃夫滤波器等效宁可瑞滤波器的设计 l h h l l h ()()()()()()()()()()()()()()()B=conv(B ,A )+conv(B ,A )A=conv(A ,A ) l h l h l h l h h l l h B z B z H z H z H z A z A z B z A z B z A z B z A z A z A z =+=++==????121212l 212()()()()()()()()() B=conv(B ,B )A=conv(A ,A ) B z B z B z H z H z H z A z A z A z ===?????

数字信处理实验内容音频信分析与处理

数字信处理实验内容音频信分析与处理 Document number【SA80SAB-SAA9SYT-SAATC-SA6UT-SA18】

数字信号处理实验内容—— 音频信号采集、分析及处理 一、实验目的 1.以音频信号为例,熟悉模拟信号数字处理过程,进一步理解数字信 号处理概念。 2.掌握运用Matlab实现对音频信号的时频分析方法; 3.初步掌握数字音频信号合成的方法。 4.掌握运用Matlab设计IIR和FIR滤波系统的方法; 5.掌握运用Matlab实现对加噪的音频信号进行去噪滤波的方法。锻 炼学生运用所学知识独立分析问题解决问题的能力,培养学生创新能力。 二、实验性质 综合分析、设计性实验 三、实验任务 实验内容一:windows系统中的“ding”音频信号的采集、分析、合成

1.音频信号的采集 编写Matlab程序,采集windows系统中的“ding”声,得到*.wav 音频文件,而后实现音频信号回放。 2.音频信号的频谱分析 运用Matlab软件实现对音频信号的时域分析和频域分析,并打印相应的图形,完成在实验报告中。 注意:此音频信号的频谱包含两条主要谱线,在进行频谱分析时,注意频谱的完整性,利用MATLAB实现对两条主要谱线的定位并计算谱线所对应的模拟频率。 3.音频信号的分解和合成 运用Matlab软件实现音频信号的分解与合成,将音频信号的频谱中两部分频谱成分进行分解,分别绘制出分解后的两个信号的频谱图;然后将分解后的两个信号再合成为一个新的信号,将合成后的新信号的时域、频域图与原来的信号时域、频域图相比较,绘制出对比效果图。4.音频信号的回放 运用Matlab软件实现音频信号的回放,将合成后的新信号和原音频信号分别进行回放,对比两个信号的声音效果。

如何利用matlab处理音频信号

Matlab处理音频信号 一、问题的提出:数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢?信号是传递信息的函数。 一、问题的提出: 数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢? 信号是传递信息的函数。离散时间信号%26mdash;%26mdash;序 列%26mdash;%26mdash;可以用图形来表示。 按信号特点的不同,信号可表示成一个或几个独立变量的函数。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他参量,习惯上将其看成时间。信号有以下几种: (1)连续时间信号:在连续时间范围内定义的信号,但信号的幅值可以是连续数值,也可以是离散数值。当幅值为连续这一特点情况下又常称为模拟信号。实际上连续时间信号与模拟信号常常通用,用以说明同一信号。 (2)离时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。 (3)数字信号:时间离散而幅度量化的信号。 语音信号是基于时间轴上的一维数字信号,在这里主要是对语音信号进行频域上的分析。在信号分析中,频域往往包含了更多的信息。对于频域来说,大概有8种波形可以让我们分析:矩形方波,锯齿波,梯形波,临界阻尼指数脉冲波形,三角波,余旋波,余旋平方波,高斯波。对于各种波形,我们都可以用一种方法来分析,就是傅立叶变换:将时域的波形转化到频域来分析。 于是,本课题就从频域的角度对信号进行分析,并通过分析频谱来设计出合适的滤波器。当然,这些过程的实现都是在MATLAB软件上进行的,MATLAB软件在数字信号处理上发挥了相当大的优势。

教你怎样使用数字音频处理器

怎样使用数字音频处理器现在数字音频处理器越来越多地运用到工程当中了,对于有基础有经验的人来说,处理器是一个很好用的工具,但是,对于一些经验比较欠缺的朋友来说,看着一台处理器,又是一大堆英文,不免有点无从下手。其实不用慌,我来介绍一下处理器使用步骤,以一个2进4出的处理器控制全频音箱+超低音音箱的系统为例 1、首先是用处理器连接系统,先确定好哪个输出通道用来控制全频音箱,哪个输出通道用来控制超低音音箱,比如你用输出1、2通道控制超低音,用输出3、4通道控制全频。接好线了,就首先进入处理器的编辑(EDIT)界面来进行设置,进入编辑界面不同的产品的方法不同,具体怎么进入,去看说明书。 2、利用处理器的路由(ROUNT)功能来确定输出通道的信号来自哪个输入通道,比如你用立体声方式扩声形式,你可以选择输出通道1、3的信号来自输入A,输出通道的2、4的信号来自输入B。信号分配功能不同的产品所处的位置不同,有些是在分频模块里,有些是在增益控制模块里,这个根据说明书的指示去找。 3、根据音箱的技术特性或实际要求来对音箱的工作频段进行设置,也就是设置分频点。处理器上的分频模块一般用CROSSOVER或X-OVER表示,进入后有下限频率选择(HPF)和上限频率选择(LPF),还要滤波器模式和斜率的选择。首先先确定工作频段,比如超低音的频段是40-120赫兹,你就把超低音通道的HPF设置为40,LPF设置为120。全频音箱如果你要控制下限,就根据它的低音单元口径,设置它的HPF大约在50-100Hz,。处理器滤波器形式选择一般有三种,bessel,butterworth和linky-raily,我以前有帖子专门说明过三种滤波器的不同之处,这里不赘述。常用的是butterworth和linky-raily两种,然后是分频斜率的选择,一般你选24dB/oct就可以满足大部分的用途了。 4、这个时候你需要检查一下每个通道的初始电平是不是都在0dB位置,如果有不是0的,先把它们都调到0位置上,这个电平控制一般在GAIN功能里,DBX的处理器电平是在分频器里面的,用G表示。 5、现在就可以接通信号让系统先发出声音了,然后用极性相位仪检查一下音箱的极性是否统一,有不统一的,先检查一下线路有没有接反。如果线路没接反,而全频音箱和超低音的极性相反了,可以利用处理器输出通道的极性翻转功能(polarity或pol)把信号的极性反转,一般用Nomal或“+”表示正极性,用INV或“-”表示负极性。 6、接下来就要借助SIA这类工具测量一下全频音箱和超低音的传输时间,一般来说是会有差异的,比如测到全频的传输时间是10ms,超低音是18ms,这个时候就要利用处理器的延时功能对全频进行延时,让全频和低音的传输时间相同。处理器的延时用DELAY或DLY表示,有些用m(米)有些用MS(毫秒)来显示延时量,SIA软件也同时提供了时间和距离的量,你可以选择你需要的数据值来进行延时 7、接下来就该进行均衡的调节了,可以配合测试工具也可以用耳朵来调,处理器的均衡用EQ来表示,一般都是参量均衡(PEQ),参量均衡有3个调节量,频率(F),带宽(Q 或OCT),增益(GAIN或G)。具体怎么调,就根据产品特性、房间特性和主观听觉来调了,这个就自己去想了。 8、均衡调好后,就要进行限幅器的设置了,处理器的限幅器用LIMIT来表示,进去以后一般有限幅电平(THRESHOLD),压缩比(RA TIO)的选项,你要做限幅就要先把压缩比RA TIO设置为无穷大(INF),然后配合功放来设置限幅电平,变成限幅器后,启动时间A TTACK和恢复时间RELEASE就不用去理了。DBX处理器的限幅器用PEAKSTOP来表示,启动后,直接设置限幅电平就可以了,至于怎么调限幅器,我有专门的帖子,自己去看。 9、都调好了就要保存数据,处理器的保存一般用STORE或SA VE表示,怎么存,就看产品说明书了。

音频、视频采集与处理知识点整理

音频、视频采集与处理相关知识点 知识点整理: 1.音频数字化及存储量的计算 数字化音频是指通过采样和量化把模拟音频信号转换成由二进制数码“0”或“1”组成的数字化音频文件。 采样频率是指将单位时间的音频波形分隔成的点数,单位为赫兹(HZ)。采样频率决定了声音采集的质量,采样频率越高,声音的质量越好,存储容量越大。 量化位数是指将采样得到的点实现用二进制编码表示。量化位数越大,其量化值越接近采样值,即精度越高,所以存储量也越大。 常见的wave文件所占存储量的计算公式: 存储量(字节)=采样频率*量化位数*声道数*时间(秒)、8 2.声音素材的采集 声音素材的获取途径:成品声音文件的使用、声音素材的截取等。 声音文件的录制分硬件设备和软件录制两个部分。硬件设备主要需要声卡、话筒等。常用的声音录制与编辑软件有:GoldWave、录音机、Cool Edit、Wave Edit等。 3.声音的基本处理 通过GoldWave软件的状态栏,观察打开声音文件的采样频率、量化位数、声道数、声音长度、文件格式等信息。利用GoldWave软件可以对音频文件进行删除、剪裁、设置静音、淡入、淡出、音量调整、合成等操作。 (1)用GoldWave软件进行声音素材的处理: ①打开的音频文件在状态栏显示的参数信息:

②选取音频文件中的部分音轨信息 方法一:通过“设标”按钮,设置基于时间位置的“开始”和“结束”的时间参数。 如下图所示: 方法二:借助“开始标记线”和“结束标记线”。这种方法对音频区间的选取在时间不是很准确,要做好相对准确,可以事先将音频文件放大。 注意:如果需要选择立体声音频中某一声道的音轨信息,需要先进行声道选择。如需选择“左声道”中1:00分钟——3:00分钟的音轨信息,则可以先通过“编辑”菜单中的“声道”去指定处理的音频是左声道还是右声道。 ③选中的音频信息的执行删除、剪裁操作 :“开始标记”和“结束标记”之间的这段音频素材被删除。 :“开始标记”和“结束标记”之间的这段音频素材被保留下来。 ④选中的音频信息淡入、淡出效果的设置 淡入:实现声音音量由小到大的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡入”,并设置好初始音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 淡出:实现声音音量由大到小的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡出”,并设置好最终音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 ⑤选中的音频信息更改音量效果的设置 选中音频信息,选择“效果”菜单中的“音量”→“更改音量”,并设置好音量或预设的参数。其中音量单位为分贝(dB),正值为音量增加,负值为音量减少。

(完整版)数字音频处理

数字语音实验 吕佩壕 10024134 一、实验要求 1.编程实现一句话语音的短时能量曲线,并比较窗长、窗口形状(以直 角窗和和哈明窗为例)对短时平均能量的影响 ; 2. 编程分析语音信号的短时谱特性,并比较窗长、窗口形状(以直角窗 和和哈明窗为例)对语音短时谱的影响 ; 3. 运用低通滤波器、中心削波和自相关技术估计一段男性和女性语音信 号的基音周期,画出基音轨迹曲线,给出估计准确率。 二、实验原理及实验结果 1.窗口的选择 通过对发声机理的认识,语音信号可以认为是短时平稳的。在5~50ms 的范围内,语音频谱特性和一些物理特性参数基本保持不变。我们将每个短时的语音称为一个分析帧。一般帧长取10~30ms 。我们采用一个长度有限的窗函数来截取语音信号形成分析帧。通常会采用矩形窗和汉明窗。图1.1给出了这两种窗函数在窗长N=50时的时域波形。 图1.1 矩形窗和hamming 窗的时域波形 矩形窗的定义:一个N 点的矩形窗函数定义为如下: {1,00,()n N w n ≤<=其他 Hamming 窗的定义:一个N 点的hamming 窗函数定义为如下: 0.540.46cos(2),010,()n n N N w n π-≤<-??? 其他 = 这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发 0.2 0.40.60.811.2 1.41.61.82矩形窗 sample w (n ) 0.1 0.20.30.40.50.6 0.70.80.91hanming 窗 sample w (n )

现(如图1.2):矩形窗的主瓣宽度小(4*pi/N ),具有较高的频率分辨率,旁瓣峰值大(-13.3dB ),会导致泄漏现象;汉明窗的主瓣宽8*pi/N ,旁瓣峰值低(-42.7dB ),可以有效的克服泄漏现象,具有更平滑的低通特性。因此在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。表1.1对比了这两种窗函数的主瓣宽度和旁瓣峰值。 图1.2 矩形窗和Hamming 窗的频率响应 2.短时能量 由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为: 2 2 1 [()()] [()()]n n m m n N E x m w n m x m w n m ∞ =-∞ =-+= -= -∑∑ ,其中N 为窗长 特殊地,当采用矩形窗时,可简化为: 2 () n m E x m ∞ =-∞ = ∑ 图2.1和图2.2给出了不同矩形窗和hamming 窗长,对所录的语音“我是吕佩壕”的短时能量函数: (1)矩形窗(从上至下依次为“我是吕佩壕”波形图,窗长分别为32,64,128,256,512的矩形窗的短时能量函数): 00.10.20.3 0.40.50.60.70.80.91 -80 -60-40-20 0矩形窗频率响应 归一化频率(f/fs)幅度/d B 00.10.20.3 0.40.50.60.70.80.91 -100 -50 Hamming 窗频率响应 归一化频率(f/fs) 幅度/d B

数字音频处理器参数

1. 扩声系统升级改造 (1)新增2台数字音频处理器。该处理器需要和原有视频会议系统、数字会议系统、讲台话筒、现场图传背包TVU系统、无线麦克风、控制室电脑、有线电视等信号源(原调音台连接图附件1图1所示)和新增录播系统进行音频集成,实现各系统音频信号的任意路由和控制。处理器具备12进8出,12路输入通道带AEC回声消除功能,拥有AVB网络接口,支持多达128X128AVB网络,具备 Speech Sense (语音触发技术)和 Sona AEC (回声消除技术)的新型处理算法,信号处理可通过软件直观的配置和控制,如:信号路由和混音、均衡、滤波、动态处理、延迟等。 (2)新增会场前后方音箱。在大厅前方选用2只柱状线列阵音箱,铰接列阵与线性列阵技术的结合,在大厅中后场两侧柱子上壁挂两只补声音箱,以满足中后场的声压级。 整个扩声系统改造后需要符合会场声学环境要求,声音清楚无回声,声音大小符合会场扩声需求。声学特性指标按中华人民共和国国家标准GB50371-2006《厅堂扩声系统设计规范》要求,列表如下: 2. 中控系统升级改造 新购一套中控系统,系统需具有双网卡功能,局域网端口用于连接主机到外部网络,ICSLAN端口连接AMX设备或其他第三方A/V设备使其独立于主要网络;同时支持IPv6和802.1X网络标准和特性;支持灵活的编程应用实现(RPM,NetLinx和Java);具有向后和跨平台的兼容性;具有自动诊断功能,能自动检测断线或连接错误的串口和红外端口;程序文件支持从USB驱动器导入/导出。 中控系统需要和原有及新增系统高度集成,将音频、视频、灯光、升降器、大屏控制等进行集中控制管理,能完成所有原系统控制部分的操作,支持一键式的模式切换,同时可支持此项目新购系统的统一控制。原中控系统连接示意图如下图所示:

(完整版)音频、视频采集与处理知识点整理

音频、视频采集与处理相关知识点 单元知识点考试要求试题类型 音频、视频采集与处理1.音频的数字化和存储容量的计算 b 选择题、填空题 必考+加试2.声音素材的采集 C 3.声音素材的制作 C 4.声音的格式转换 C 5.视频的数字化和存储容量的计算 b 6.视频素材的采集和处理 C 知识点整理: 1.音频数字化及存储量的计算 数字化音频是指通过采样和量化把模拟音频信号转换成由二进制数码“0”或“1”组成的数字化音频文件。 采样频率是指将单位时间的音频波形分隔成的点数,单位为赫兹(HZ)。采样频率决定了声音采集的质量,采样频率越高,声音的质量越好,存储容量越大。 量化位数是指将采样得到的点实现用二进制编码表示。量化位数越大,其量化值越接近采样值,即精度越高,所以存储量也越大。 常见的wave文件所占存储量的计算公式: 存储量(字节)=采样频率*量化位数*声道数*时间(秒)、8 2.声音素材的采集 声音素材的获取途径:成品声音文件的使用、声音素材的截取等。 声音文件的录制分硬件设备和软件录制两个部分。硬件设备主要需要声卡、话筒等。常用的声音录制与编辑软件有:GoldWave、录音机、Cool Edit、Wave Edit等。 3.声音的基本处理 通过GoldWave软件的状态栏,观察打开声音文件的采样频率、量化位数、声道数、声音长度、文件格式等信息。利用GoldWave软件可以对音频文件进行删除、剪裁、设置静音、淡入、淡出、音量调整、合成等操作。 (1)用GoldWave软件进行声音素材的处理: ①打开的音频文件在状态栏显示的参数信息:

②选取音频文件中的部分音轨信息 方法一:通过“设标”按钮,设置基于时间位置的“开始”和“结束”的时间参数。 如下图所示: 方法二:借助“开始标记线”和“结束标记线”。这种方法对音频区间的选取在时间不是很准确,要做好相对准确,可以事先将音频文件放大。 注意:如果需要选择立体声音频中某一声道的音轨信息,需要先进行声道选择。如需选择“左声道”中1:00分钟——3:00分钟的音轨信息,则可以先通过“编辑”菜单中的“声道”去指定处理的音频是左声道还是右声道。 ③选中的音频信息的执行删除、剪裁操作 :“开始标记”和“结束标记”之间的这段音频素材被删除。 :“开始标记”和“结束标记”之间的这段音频素材被保留下来。 ④选中的音频信息淡入、淡出效果的设置 淡入:实现声音音量由小到大的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡入”,并设置好初始音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 淡出:实现声音音量由大到小的效果。实现操作:选中音频信息,选择“效果”菜单中的“音量”→“淡出”,并设置好最终音量、淡化曲线等参数。其中初始音量参数在-160到时0之间。 ⑤选中的音频信息更改音量效果的设置 选中音频信息,选择“效果”菜单中的“音量”→“更改音量”,并设置好音量或预设的参数。其中音量单位为分贝(dB),正值为音量增加,负值为音量减少。

音频信号处理

摘要 在机器人技术领域,由于嵌入式处理器的运算能力有限,在某些情况下,尤其是在处理音频信号时,可将一些运算转移至一个远程桌面或服务器上完成。例如,在一个远程处理器上完成话语识别往往效率更高,更加迅速、准确。大多数现代智能手机均以远程方式处理语音识别。 此外,用户可能会希望在机器人上直接使用自己的信号处理算法。例如,用户会希望通过分析输入信号来探测诸如音乐、铃声、语音等不同发声事件。 本文将介绍机器人NAO 上的音频模块的组织方式、如何访问NAO 扩音器声音数据以及如何以本地或远程方式将数据输送至NAO 的扬声器。相关研究成果 ● 随着互联网的不断发展,研究人员成功实现了 众多研究项目,使人们可以通过网络传送大量(音频或视频)数据。为此开发出的许多使用协议还可优化数据传输质量。NAOqi 框架使用的正是其中的一种协议(即“SOAP ”,全称为“Simple Object Access Protocol ”),可以通过网络收发音频信号。● 在NAO 上生成和记录声音时,使用的是ALSA (Advanced Linux Sound Architecture )库。 原理 目前,NAOqi 中包含六个相互关联的音频模块。其组织方式如图1所示。 ALAudioDevice 模块管理音频输入与输出。 因此,所有试图向NAO 的扬声器发送声音的模块,或是处理来自NAO 扩音器声音的模块,都必须与ALAudioDevice 模块交流信息。 图1NAOqi 音频模块 构架 关键性能音频信号处理

实时声音处理 为了实时处理扩音器输入信号,首先需要创建一个“Aud io in”模块。随后,该模块必须订阅至ALAudioDevice 模块。后者将通过一个调回函数发送输入缓冲。ALAudioDevice 按顺序发送缓冲,即输入缓冲首先发送至第一个订阅模块,待第一个模块完成处理后再发送至第二个订阅模块,以此类推。该工作模式请见图2。 ALAudioDevice 模块按照由inputBufferSize 的设定值及输入样本率(48kHz )确定的时间间隔定期读取输入缓冲。因此,订阅模块的总处理用时不得超过这一时间间隔,否则会错失音频缓冲,从而无法实现实时处理。优点 远程处理声音信号的优点在于用户可较为轻松地调试或优化其声音处理算法,而且,与在机器人上运行相比,这些算法可占用更多CPU 负荷。然而,如果用户的模块直接在NAO 上运行,音频缓冲的输送速度会较快。局限 ● 通过ALAudioDevice 模块可获得的最大输入缓冲大小为65536(每个扩音器频道为16384个16位样本)。 因此,一个缓冲的最长处理时间为341ms 。 ● 通过ALAudioDevice 模块可发送的最大缓冲大小为32768(16384个16位立体声样本)。 ● 由于输入样本率为48kHz ,远程声音处理所需的最低链接比特率为384kBits/s 。如果用户使用的网络链接速度过低,或链接质量不佳,就会导致错失音频缓冲。 图2输入缓冲 发送与处理的工作模式

相关文档
相关文档 最新文档