文档库 最新最全的文档下载
当前位置:文档库 › 《多媒体技术》实验一 声音信号的获取与处理

《多媒体技术》实验一 声音信号的获取与处理

《多媒体技术》实验一  声音信号的获取与处理
《多媒体技术》实验一  声音信号的获取与处理

实验一声音信号的获取与处理

预备知识

1.数字音频和模拟音频

模拟音频和数字音频在声音的录制和播放方面有很大不同。模拟声音的录制是将代表声音波形的电信号转换到适当的媒体上,如磁带或唱片。播放时将纪录在媒体上的信号还原为波形。数字音频就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理,主要包括采样和量化两个方面。

2.数字音频的质量

数字音频的质量取决于采样频率和量化位数这两个重要参数。采样频率是对声音波形每秒钟进行采样的次数。人耳听觉的频率上限在20kHz左右,根据采样理论,为了保证声音不失真,采样频率应在4OkHz左右。经常使用的采样频率有11.025kHz、22.05kHz和44.lkHz等。采样频率越高,声音失真越小、音频数据量越大。量化数据位数(也称量化级)是每个采样点能够表示的数据范围,经常采用的有8位、12位和16位。例如,8位量化级表示每个采样点可以表示256个(0-255)不同量化值,而16位量化级则可表示65536个不同量化值。量化位数越高音质越好,数据量也越大。反映数字音频质量的另一个因素是通道(或声道)个数。单声道是比较原始的声音复制形式, 每次只能生成一个声波数据。立体声(双声道)技术是每次生成二个声波数据,并在录制过程中分别分配到两个独立的声道出输出,从而达到了很好的声音定位效果。Dolby AC-3音效(5.1声道)是由5个全频声道和一个超重低音声道组成的环绕立体声。

在多媒体音频技术中,存储声音信息的文件有多种格式,如Wav、Midi、Mp3、Rm等等。1)Wav格式

Wav格式的文件又称波形文件,是用不同的采样率对声音的模拟波形进行采样得到的一系列离散的采样点,以不同的量化位数(16位、32位或64位)把这些采样点的值转换成二进制数得到的。Wav是数字音频技术中最常用的格式,它还原的音质较好,但所需存储空间较大。

2)Midi格式

Midi是Musical Instrument Digital Interface(乐器数字接口)的缩写。它是由世界上主要电子乐器制造厂商建立起来的一个通信标准,并于1988年正式提交给MIDI制造商协会,便成为数字音乐的一个国际标准。MIDI标准规定了电子乐器与计算机连接的电缆硬件以及电子乐器之间、乐器与计算机之间传送数据的通信协议等规范。MIDI标准使不同厂家生产的电子合成乐器可以互相发送和接收音乐数据。Midi文件纪录的是一系列指令而不是数字化后的波形数据,所以它占用存储空间比Wav文件要小很多。

3)MP3格式

MP3是对MPEG Layer 3的简称,是目前最热门的音乐文件。其技术采用MPEG Layer 3标准对W A VE音频文件进行压缩而成,特点是能以较小的比特率、较大的压缩率达到近乎CD 音质。其压缩率可达1:12,每分钟CD音乐大约需要1兆的磁盘空间。

4)Rm格式

Rm是RealMedia文件的简称。Real Networks公司所制定的音频视频压缩规范称为RealMedia,是目前在Internet上相当流行的跨平台的客户/服务器结构多媒体应用标准,它采用音频/视频流和同步回放技术来实现在Intranet上全带宽地提供最优质的多媒体,同时也能够在Internet上以28.8Kbps的传输速率提供立体声和连续视频。

实验一声音信号的获取与处理

一、实验目的和要求

1. 掌握使用Goldwave进行使用文件格式的转换方法;

2. 掌握使用Goldwave进行声音的录制方法;

3.掌握Goldwave的基本操作方法,掌握声音素材编辑的一般过程;

4.掌握使用Goldwave进行声音的合成方法。

二、实验环境

1. 硬件环境:麦克风,耳机。

2. 软件环境:Windows 2000/XP,Goldwave。

三、实验内容与步骤

一、音频编辑

1、启动Goldwave,导入音频素材“晚秋.mp3”

2、制作淡入效果。把乐曲开始部分设置成选区,时长18秒,单击“淡入”工具按钮,制作淡入效果。

3、制作淡出效果。把乐曲结尾部分设置成选区,时长20秒,单击“淡出”工具按钮,制作淡出效果。

4、采用mp3格式保存,文件名为“晚秋_淡入淡出.mp3”,保留该文件,不要关闭。

二、音频合成

1、打开音频素材“海浪海鸥.wav”和“鸟鸣.wav”,按照下图进行3个音频素材的合成。

2、以“海浪海鸥.wav”作为背景音乐,选取合适插入点,对合成音频“晚秋_淡入淡出.mp3”作“复制”、“混音”处理。

3、将第一次合成处理后的音频素材作为背景音乐,选取合适插入点,对“鸟鸣.wav”作“复制”、“混音”处理。

保存文件。采用mp3格式,文件名为“实验1+合成.mp3”。

四、总结

注:包括制作过程中出现的问题,实验心得体会及改进意见等

语音信号处理实验指导书

语音信号处理实验指导书 实验一 语音信号采集与简单处理 一、 实验目的、要求 (1)掌握语音信号采集的方法 (2)掌握一种语音信号基音周期提取方法 (3)掌握短时过零率计算方法 (4)了解Matlab 的编程方法 二、 实验原理 基本概念: (a )短时过零率: 短时内,信号跨越横轴的情况,对于连续信号,观察语音时域波形通过横轴的情况;对于离散信号,相邻的采样值具有不同的代数符号,也就是样点改变符号的次数。 对于语音信号,是宽带非平稳信号,应考察其短时平均过零率。 其中sgn[.]为符号函数 ?? ?? ?<=>=0 x(n)-1sgn(x(n))0 x(n)1sgn(x(n)) 短时平均过零的作用 1.区分清/浊音: 浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。 2.从背景噪声中找出是否有语音,以及语音的起点。 (b )基音周期 基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。 ∑--= -=1 )]1(sgn[)](sgn[21N m n n n m x m x Z

由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。②声道共振峰有时会严重影响激励信号的谐波结构,所以,从语音信号中直接取出仅和声带振动有关的激励信号的信息并不容 易。③语音信号本身是准周期性的(即音调是有变化的),而且其波形的峰值点或过零点受共振峰的结构、噪声等的影响。④基音周期变化范围大,从老年男性的50Hz 到儿童和女性的450Hz ,接近三个倍频程,给基音检测带来了一定的困难。由于这些困难,所以迄今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应用领域和各种环境条件情况下都能获得满意的检测结果。 尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个研究的课题,为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT 、谱图法、小波法等等。 三、使用仪器、材料 微机(带声卡)、耳机,话筒。 四、 实验步骤 (1)语音信号的采集 利用Windows 语音采集工具采集语音信号,将数据保存wav 格式。 采集一组浊音信号和一组清音信号,信号的长度大于3s 。 (2)采用短时相关函数计算语音信号浊音基音周期,考虑窗长度对基音周期计算的影响。采用倒谱法求语音信号基音周期。 (3)计算短时过零率,清音和浊音的短时过零率有何区别。 五、实验过程原始记录(数据,图表,计算) 短时过零率 短时相关函数 P j j n s n s j R N j n n n n ,,1) ()()(1 =-=∑-= ∑--=-=10 )]1(sgn[)](sgn[21N m n n n m x m x Z

音频编辑实验报告

音频编辑实验报告 姓名:戴俏波班级:机电1113班学号:11223064 一.实验内容及任务要求 1. 内容:学习audition的使用 2. 要求:广播剧的设计与制作 二.实验步骤 1、选好广播剧剧本《卖火柴的小女孩》 2、在多轨视图界面用Audition完成素材的录音,步骤如下: (1)执行【选项】|【Windows录音控制台】,打开【录音控制】对 话框,进行相关设置。 (2)设置完毕后关闭【录音控制】对话框。 (3)打开剧本。 (4)单击【传送器】面板中的【录音】按钮,并切换到剧本,使用麦克 风进行剧本表演。完毕后,再次单击【录音】按钮,结束声音的录制。 (5)单击【传送器】面板的【播放】按钮,试听录制的效果。 (6)执行【文件】|【另存为】命令,保存录制的音频文件 3、对录制的音频在编辑模式下进行处理 (1)删减空白音频波形 (2)增加间隔时间 (3)对音频进行降噪处理 (4)修复破音 (5)增大音频音量

(6)为声音添加混响效果 (7)对处理后的音频进行局部修整,或调整局部的音量大小,或去除局部的噪音,使得整个音频听起来更加与谐。 4、给录制的音频添加背景音乐 (1)在网上下载背景音乐《卖火柴的小女孩》与其她配合使用的音乐素材,如风声,铃铛声,马蹄声,马啸声。 (2)将音乐添加到第二个音轨上,配合录制的音频的情境适当删减音频的长度或增加音频的长度。 (3)适当减小背景音乐声音的大小,使得二者相匹配。 5、试听录制的音频与背景音乐一起的效果,根据视听效果局部修整音频。 6、将修改后的广播剧保存成mp3格式。 三.实验感悟 1、由于音频实验就是几周前完成的,开始不知道要写实验报告,所以就没有截屏,只简单地介绍了一下具体进行的音频编辑操作,请老师谅解。 2、在进行音频编辑操作时,只选中自己想编辑的区域进行编辑,不要全部选择。比方说用降噪器效果,如果将音频全部选中,则全部降噪,不能达到预想的效果。 3、录音时不要离话筒太近,也不要太大声,否则波形振幅过大,不容易编辑而且容易失真。录音时尽量保持周围无噪音。 4、要及时保存,否则很容易丢失音频。

音频技术实验报告

实验编号:四川师大《声音媒体技术》实验报告 2017年11月5日计算机科学学院级班实验名称:声音信号的编辑处理 姓名:学号:指导老师:实验成绩: 实验录音系统的连接和使用 一.实验目的及要求 (1)掌握录音系统的连接方法; (2)熟悉录音系统相应设备的功能,并熟练使用; (3)掌握录音系统功率匹配、阻抗匹配的原理; 二.实验内容 (1)利用阻抗匹配、功率匹配原理,实现录音系统连接; (2)熟练掌握阻抗匹配、功率匹配实现录音系统连接的工作原理; (3)熟悉录音系统各类设备的操作使用; 三.实验主要流程、步骤(该部分如不够填写,请另加附页) 1.利用阻抗匹配、功率匹配原理,实现录音系统连接。 (1)老师介绍调音台的各输入与输出端子的功能,以及其控制按钮的名称和作用。 (2)用转换头将电容式话筒连接到调音台,电容式话筒的插头插在1和2路录音孔中,(遵循阻抗匹配原理,一定要注意传输线的特性阻抗与所接负载阻抗的大小相等且相位相同,即传输线的输入端或输出端处于阻抗匹配状态); (3)再把监听耳机的插头插在监听插口。 (4)把调音台的输出端用连接线与电脑的主机连接,给电脑传送音频信号,(遵循阻抗匹配原理,电脑的功率要和传输线的输出功率匹配); (5)最后连接电源线 (6)MONITOR是总监听音量旋钮,调节该通路在监听线路中的音量大小。.通过调节HIGH、MIDDLE、LOW三段均衡器旋钮来调节声音大小打开电脑进行调试,测试录音能否正常工作。 2.熟练掌握阻抗匹配、功率匹配实现录音系统连接的工作原理。 (1)阻抗匹配是指负载阻抗与激励源内部阻抗相适配,得到最大功率输出的一种工作状态,阻抗匹配则传输功率大,内阻等于负载时,输出功率最大,此时阻抗匹配。 (2)设备输出功率要与负载阻抗一致。 3.熟悉录音系统各类设备的操作使用。 (1)POWER ON是调音台开关,当 ON 的一边被按下时,调音台便接通电源; (2)MIC是麦克风输入接口,LINE是高电平输入接口,MONITOR是监听输出接口; (3)电容式话筒的敏感度及其高,在录制声音史应该对准说话的人; (4)在调音台每一路输入通道上都有一组均衡旋钮,HIGH是高频,MID是中频,LOW是低频,高中低频率旋钮向左(顺时针)旋时,对应的频段就会得到提升,反之衰减。 四.实验结果的分析与评价(该部分如不够填写,请另加附页 1.阻抗匹配的方法有两种,一种是改变阻抗力,另一种是调整传输线的长度。 2.调音台可对输入的不同电平不同阻抗的音源信号进行放大、衰减、动态调整等,用附 带的均衡器对信号各频段进行处理,调整各通道信号的混合比例后,对各通道进行分配并送至各个接收端,控制现场扩声信号及录制信号。 3.调音台的输入信号大体上分为低阻话筒信号输入和高阻线路信号输入两种。 4.调音台输入插口基本可以分为3种:TRS,XLR,RCA。

语音信号处理实验报告

语音信号处理实验 班级: 学号: 姓名: 实验一基于MATLAB的语音信号时域特征分析(2学时)

1)短时能量 (1)加矩形窗 a=wavread('mike.wav'); a=a(:,1); subplot(6,1,1),plot(a); N=32; for i=2:6 h=linspace(1,1,2.^(i-2)*N);%形成一个矩形窗,长度为2.^(i-2)*N En=conv(h,a.*a);% 求短时能量函数En subplot(6,1,i),plot(En); if(i==2) ,legend('N=32'); elseif(i==3), legend('N=64'); elseif(i==4) ,legend('N=128'); elseif(i==5) ,legend('N=256'); elseif(i==6) ,legend('N=512'); end end

00.51 1.52 2.5 3 x 10 4 -1 1 x 10 4 024 x 10 4 05 x 10 4 0510 x 10 4 01020 x 10 4 02040 (2)加汉明窗 a=wavread('mike.wav'); a=a(:,1); subplot(6,1,1),plot(a); N=32; for i=2:6 h=hanning(2.^(i-2)*N);%形成一个汉明窗,长度为2.^(i-2)*N En=conv(h,a.*a);% 求短时能量函数En subplot(6,1,i),plot(En); if(i==2), legend('N=32'); elseif(i==3), legend('N=64'); elseif(i==4) ,legend('N=128');

音频功率放大器实验报告

一、实验目的 1)了解音频功率放大器的电路组成,多级放大器级联的特点与性能; 2)学会通过综合运用所学知识,设计符合要求的电路,分析并解决设计过程中遇到的问题,掌握设计的基本过程与分析方法; 3)学会使用Multisim、Pspice等软件对电路进行仿真测试,学会Altium Designer使用进行PCB制版,最后焊接做成实物,学会对实际功放的测试调试方法,达到理想的效果。 4)培养设计开发过程中分析处理问题的能力、团队合作的能力。 二、实验要求 1)设计要求 设计并制作一个音频功率放大电路(电路形式不限),负载为扬声器,阻抗8Ω。要求直流稳压电源供电,多级电压、功率放大,所设计的电路满足以下基本指标: (1)频带宽度50Hz~20kHz,输出波形基本不失真; (2)电路输出功率大于8W; (3)输入阻抗:≥10kΩ; (4)放大倍数:≥40dB; (5)具有音调控制功能:低音100Hz处有±12dB的调节范围,高音10kHz 处有±12dB的调节范围; (6)所设计的电路具有一定的抗干扰能力; (7)具有合适频响宽度、保真度要好、动态特性好。 发挥部分: (1)增加电路输出短路保护功能; (2)尽量提高放大器效率; (3)尽量降低放大器电源电压; (4)采用交流220V,50Hz电源供电。 2)实物要求 正确理解有关要求,完成系统设计,具体要求如下: (1)画出电路原理图; (2)确定元器件及元件参数; (3)进行电路模拟仿真; (4)SCH文件生成与打印输出;

(5)PCB文件生成与打印输出; (6)PCB版图制作与焊接; (7)电路调试及参数测量。 三、实验内容与原理 音频功率放大器是一种应用广泛、实用性强的电子音响设备,它主要应用于对弱音频信号的放大以及音频信号的传输增强和处理。按其构成可分为前置放大级、音调控制级和功率放大级三部分,如图1所示。 v 图1 音频功率放大器的组成框图 1)前置放大级 音频功率放大器的作用是将声音源输入的信号进行放大,然后输出驱动扬声器。声音源的种类有多种,如传声器(话筒)、电唱机、录音机(放音磁头)、CD 唱机及线路传输等,这些声音源的输出信号的电压差别很大,从零点几毫伏到几百毫伏。一般功率放大器的输入灵敏度是一定的,这些不同的声音源信号如果直接输入到功率放大器中的话,对于输入过低的信号,功率放大器输出功率不足,不能充分发挥功放的作用;假如输入信号的幅值过大,功率放大器的输出信号将严重过载失真,这样将失去了音频放大的意义。所以一个实用的音频功率放大系统必须设置前置放大器,以便使放大器适应不同的输入信号,或放大,或衰减,或进行阻抗变换,使其与功率放大器的输入灵敏度相匹配。另外在各种声音源中,除了信号的幅度差别外,它们的频率特性有的也不同,如电唱机输出信号和磁带放音的输出信号频率特性曲线呈上翘形,即低音被衰减,高音被提升。对于这样的输入信号,在进行功率放大器之前,需要进行频率补偿,使其频率特性曲线恢复到接近平坦的状态,即加入频率均衡网络放大器。 对于话筒和线路输入信号,一般只需将输入信号进行放大和衰减,不需要进行频率均衡。前置放大器的主要功能一是使话筒的输出阻抗与前置放大器的输入阻抗相匹配;二是使前置放大器的输出电压幅度与功率放大器的输入灵敏度相匹配。由于话筒输出信号非常微弱,一般只有100μV~几毫伏,所以前置放大器输入级的噪声对整个放大器的信噪比影响很大。前置放大器的输入级首先采用低噪声电路,对于由晶体管组成的分立元件组成的前置放大器,首先要选择低噪声的晶体管,另外还要设置合适的静态工作点。由于场效应管的噪声系数一般比晶体管小,而且它几乎与静态工作点无关,在要求高输入阻抗的前置放大器的情况下,

语音信号处理实验报告

通信与信息工程学院 信息处理综合实验报告 班级:电子信息工程1502班 指导教师: 设计时间:2018/10/22-2018/11/23 评语: 通信与信息工程学院 二〇一八年 实验题目:语音信号分析与处理 一、实验内容 1. 设计内容 利用MATLAB对采集的原始语音信号及加入人为干扰后的信号进行频谱分析,使用窗函数法设计滤波器滤除噪声、并恢复信号。 2.设计任务与要求 1. 基本部分

(1)录制语音信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。 (2)对所录制的语音信号加入干扰噪声,并对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。 (3)分别利用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman 窗几种函数设计数字滤波器滤除噪声,并画出各种函数所设计的滤波器的频率响应。 (4)画出使用几种滤波器滤波后信号时域波形和频谱,对滤波前后的信号、几种滤波器滤波后的信号进行对比,分析信号处理前后及使用不同滤波器的变化;回放语音信号。 2. 提高部分 (5)录制一段音乐信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。 (6)利用MATLAB产生一个不同于以上频段的信号;画出信号频谱图。 (7)将上述两段信号叠加,并加入干扰噪声,尝试多次逐渐加大噪声功率,对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。 (8)选用一种合适的窗函数设计数字滤波器,画出滤波后音乐信号时域波形和频谱,对滤波前后的信号进行对比,回放音乐信号。 二、实验原理 1.设计原理分析 本设计主要是对语音信号的时频进行分析,并对语音信号加噪后设计滤波器对其进行滤波处理,对语音信号加噪声前后的频谱进行比较分析,对合成语音信号滤波前后进行频谱的分析比较。 首先用PC机WINDOWS下的录音机录制一段语音信号,并保存入MATLAB软件的根目录下,再运行MATLAB仿真软件把录制好的语音信号用audioread函数加载入MATLAB仿真软件的工作环境中,输入命令对语音信号进行时域,频谱变换。 对该段合成的语音信号,分别用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman窗几种函数在MATLAB中设计滤波器对其进行滤波处理,滤波后用命令可以绘制出其频谱图,回放语音信号。对原始语音信号、合成的语音信号和经过滤波器处理的语音信号进行频谱的比较分析。 2.语音信号的时域频域分析 在Matlab软件平台下可以利用函数audioread对语音信号进行采样,得到了声音数据变量y,同时把y的采样频率Fs=44100Hz放进了MATALB的工作空间。

多媒体实验报告:声音的采集与处理

深圳大学实验报告 课程名称:多媒体技术及应用 实验项目名称:声音采集与处理 学院:传播学院 专业: 指导教师:王志强 报告人:刘立娜学号: 2012080286 班 级:4 实验报告提交时间: 2013.03.30 教务处制

一、实验目的与要求 1.通过实验加深对声音数字化的理解。 2.学会正确连接耳麦以及设置录音和放音的方法。 3.掌握声音录制方法并从网上下载音频文件。 4.掌握一种数字音频编辑软件的使用方法。 二、实验方法及步骤 1.实验方法:运用以前了解到的知识内容,在通过阅读书上的实验步骤进行操作。 2.实验步骤 ①Audition的启动与退出 ②录制音频、播放音频、导入音频 ③音频的剪辑 ④音频的特效 三、实验过程及内容 1.Audition的启动与退出 Audition是集声音录制、音频混合和编辑于一身的音频处理软件,它的主要功能包括录音、混音、音频编辑、效果处理、降噪、音频压缩与刻录音乐CD等,还可以与其它音频软件或视频软件协同合作。 Audition提供广泛的、灵活的工具箱,完全能够满足专业录音和专业视频用户的需求。利用Audition,可以录制多轨文件、编辑音频文件、创建原始音乐文件、混缩无限的音频轨道。 启动计算机进入Windows后,可以用鼠标单击任务栏中的“开始”在弹出的开始菜单中,将鼠标指针移到“所有程序—Adobe Audition3.0”菜单命令上,单击即可启动。或把 Audition快捷方式一到桌面上来,单击即可。

图2.1Audition应用程序窗口 如果要退出Audition,可以选择“文件—退出”菜单命令,或按Ctrl+Q组合键,也可以直接单击Audition应用程序窗口右上角的“关闭”在退出之前,如果有已修改的但未存盘的文件,系统会提示保存它。或者点击左上角的“文件—保存”。 图2.2保存提示图2.3 “另存为“对话框 2.录音、播放音频、导入音频 1)录音的操作过程:(单轨录音) 1.选择“文件—新建”菜单命令,这时会出现“新建波形”会话框,如图 2.4所示。选择适当的采样频率、采样分辨率和声道数,如选取44100Hz,16-bit和立体声就可以到达CD 音频效果。 图2.4“新建波形”对话框 2.单击“传送器”控制面板中的红色“录音”按钮,开始录音。对准话筒进行录音,完成后单击“传送器”控制面板的“停止”按钮即可。我们还可以通过控制时间长短来录音,在编辑视图中,选择“选项”菜单中的“时间录音模式”命令。在“传送器”控制面板中单击“录音”这时会出现“定时录音模式”对话框,如图2.5所示。在该对话框中,可以设置录制的时间长短和开始录音。设置完毕,单击“确定”开始按设置进行录音。 图2.5“定时录音模式”对话框

大学本科语音信号处理实验讲义8学时

语音信号处理实验讲义 时间:2011-12

目录 实验一语音信号生成模型分析 (3) 实验二语音信号时域特征分析 (7) 实验三语音信号频域特征分析 (12) 实验四语音信号的同态处理和倒谱分析 (16)

实验一 语音信号生成模型分析 一、实验目的 1、了解语音信号的生成机理,了解由声门产生的激励函数、由声道产生的调制函数和由嘴唇产生的辐射函数。 2、编程实现声门激励波函数波形及频谱,与理论值进行比较。 3、编程实现已知语音信号的语谱图,区分浊音信号和清音信号在语谱图上的差别。 二、实验原理 语音生成系统包含三部分:由声门产生的激励函数()G z 、由声道产生的调制函数()V z 和由嘴唇产生的辐射函数()R z 。语音生成系统的传递函数由这三个函数级联而成,即 ()()()()H z G z V z R z = 1、激励模型 发浊音时,由于声门不断开启和关闭,产生间隙的脉冲。经仪器测试它类似于斜三角波的脉冲。也就是说,这时的激励波是一个以基音周期为周期的斜三角脉冲串。单个斜三角波的频谱表现出一个低通滤波器的特性。可以把它表示成z 变换的全极点形式 12 1()(1) cT G z e z --= -? 这里c 是一个常数,T 是脉冲持续时间。周期的三角波脉冲还得跟单位脉冲串的z 变换相乘: 112 1 ()()()1(1)v cT A U z E z G z z e z ---=?= ?--? 这就是整个激励模型,v A 是一个幅值因子。 2、声道模型 当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,把它称为共振峰。 一个二阶谐振器的传输函数可以写成 12 ()1i i i i A V z B z C z --= -- 实践表明,用前3个共振峰代表一个元音足够了。对于较复杂的辅音或鼻音共振峰要到5个以上。多个()i V z 叠加可以得到声道的共振峰模型 12 1 11 ()()11R r r M M i r i N k i i i i k k b z A V z V z B z C z a z -=---======---∑∑∑ ∑ 3、辐射模型 从声道模型输出的是速度波,而语音信号是声压波。二者倒比称为辐射阻抗,它表征了

《语音信号处理》实验报告材料

实用 中南大学 信息科学与工程学院 语音信号处理 实验报告 指导老师:覃爱娜 学生班级:信息0704 学生名称:阮光武 学生学好:0903070430 提交日期:2010年6月18日

实验一 语音波形文件的分析和读取 一、实验的任务、性质与目的 本实验是选修《语音信号处理》课的电子信息类专业学生的基础实验。通过实验: (1)掌握语音信号的基本特性理论:随机性,时变特性,短时平稳性,相关性等; (2)掌握语音信号的录入方式和*.WAV音波文件的存储结构; (3)使学生初步掌握语音信号处理的一般实验方法。 二、实验原理和步骤: WAV文件格式简介 WAV文件是多媒体中使用了声波文件的格式之一,它是以RIFF格式为标准。每个WAV文件的头四个字节就是“RIFF”。WAV文件由文件头和数据体两大部分组成,其中文件头又分为RIFF/WAV文件标识段和声音数据格式说明段两部分。常见的WAV声音文件有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指声音信号在“模拟→数字”转换过程中,单位时间内采样的次数;采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为8位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。WAV文件数据块包含以脉冲编码调制(PCM)格式表示的样本。在单声道WAV文件中,道0代表左声道,声道1代表右声道;在多声道WAV文件中,样本是交替出现的。WAV文件的格式见表1。

声音处理实验报告

沈阳师范大学 现代教育技术实验报告 实验题目音频资源的处理 学号姓名张慧专业英语年级10级 指导教师薛峰提交时间2013-04-03 一、实验目的 1. 掌握声音文件的基本剪辑方法 2.掌握录音的方法 3. 掌握调整音量的方法 4.掌握降噪的方法 5.掌握混音的方法 二、实验内容及要求 1、打开“音频实践课”文件夹中的“剪辑.mp3”文件,将声音的57秒-1分15秒内的波形复制到一个新的文件中,然后,将新文件的音量降低3分贝,最后给声音的开头和结尾分别作淡入和淡出的操作,最后保存声音,文件名为“基本剪辑.mp3”(要求写出处理的步骤并且提供相应的操作截图) 2、将“音频实践课”文件夹中的“伊利优酸乳-极限自行车篇15秒.wmv”视频文件中的声音录制出来,保存为mp3格式,文件名为“录音.mp3”(要求写出处理的步骤并且提供相应的操作截图) 3、将“音频实践课”文件夹中的“噪音.mp3”文件中噪音去掉,然后直接保存(要求写出处理的步骤并且提供相应的操作截图) 4、使用多轨界面将“音频实践课”文件夹中的“背影.wav”和“春风.wav”混缩为一段配乐得朗诵,注意:背景音乐长度和音量要适当。最后将文件混缩另存为“配乐朗诵.mp3”(要求写出处理的步骤并且提供相应的操作截图) 三、实验过程和具体步骤 第一题 1.启动audition,文件--打开文件“剪辑.mp3”,单击确定。 2.再新建一个音频“未命名”,单击确定。 3.在选择中输入开始和结束的时间,再单击选择框。在选中的区域单击右键复制 4.打开未命名,在音频栏中单击右键,粘贴。 5.在选中的区域中的音量调节钮向下拖拽,调小3分贝 6.在开始和结尾选择淡入淡出选项,做淡入淡出处理 7.将声音保存为“音频剪辑.MP3”。 第二题 打开音量控制面板,选择“选项-属性”菜单,选择录音,勾选Stereo Mix选项,然后单击确定。调整完成后,转为录音控制菜单,勾选Stereo Mix选项,然后将其最小化。打开audition软件,创建一个新波形,按下“录音”按钮,然后打开“伊利优酸乳-极限自行车篇15秒.wmv”进行播放,此时则开始录制视频中声音,产生波形,单击“文件-另存为”弹

语音信号处理实验报告实验二

通信工程学院12级1班 罗恒 2012101032 实验二 基于MATLAB 的语音信号频域特征分析 一、 实验要求 要求根据已有语音信号,自己设计程序,给出其倒谱、语谱图的分析结果,并根据频域分析方法检测所分析语音信号的基音周期或共振峰。 二、 实验目的 信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明信号的各项红物理现象。 由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出。输出频谱是声道系统频率响应与激励源频谱的乘积。声道系统的频率响应及激励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信号的表示,但不能直接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而可以采用短时分析法。 三、 实验设备 1.PC 机; 2.MATLAB 软件环境; 四、 实验内容 1.上机前用Matlab 语言完成程序编写工作。 2.程序应具有加窗(分帧)、绘制曲线等功能。 3.上机实验时先调试程序,通过后进行信号处理。 4.对录入的语音数据进行处理,并显示运行结果。 5.依次给出其倒谱、语谱图的分析结果。 6. 根据频域分析方法检测所分析语音信号的基音周期或共振峰。 五、 实验原理及方法 1、短时傅立叶变换 由于语音信号是短时平稳的随机信号,某一语音信号帧的短时傅立叶变换的定义为: 其中w(n -m)是实窗口函数序列,n 表示某一语音信号帧。令n -m=k',则得到 ()()()jw jwm n m X e x m w n m e ∞-=-∞= -∑

实验四 数字音频处理实验报告

云南大学软件学院 实验报告 序号:姓名:学号:指导教师:刘春花,刘宇成绩: 实验四数字音频处理 一、实验目的 1、熟悉并掌握MATLAB工具的使用; 2、实现音频文件的生成、读取、播放和转换的基本操作。 二、实验环境 MATLAB 6.5以上版本、WIN XP或WIN2000计算机 三、实验内容 1、用matlab 产生音乐。在matlab命令窗口执行下列命令,并回答问题 cf = 220; sf = 22050; d = 0.5; n = sf * d; t = (1:n)/sf; s0 = sin(2*pi*cf*t); sound(s0, sf); 1)信号的频率是多少? 采样频率是多少?采样间隔是多少?一共有

多少个采样点?声音有多少秒? 频率:220 采样频率:22050 采样间隔: (1:n)/sf采样点: sin(2*pi*cf*t) 时长:0.5s 2)请解释sound(s, sf)函数的参数和实现的功能。如果把 sound(s0,sf)改为sound(s0,2*sf)听起来会有什么不同,为什么?时间更短,因为频率发生改变,变成了原来的2倍 3)执行sound1.m,听一听,能否在此程序基础上做修改,实现一小段音乐旋律,时间不少于10秒。并保存为为wav文件。 文件。获取相应参数,填空wav )读取1、2. 执行语句: [B, fs, nbits]=wavread('C:\TEMP\hootie.wav'); % loads the clip size(B); % the size of B sound(B,fs) % plays the sound. 采样频率:44100

语音信号处理试验教程

语音信号处理试验 实验一:语音信号时域分析 实验目的: (1)录制两段语音信号,内容是“语音信号处理”,分男女声。 (2)对语音信号进行采样,观察采样后语音信号的时域波形。 实验步骤: 1、使用window自带录音工具录制声音片段 使用windows自带录音机录制语音文件,进行数字信号的采集。启动录音机。录制一段录音,录音停止后,文件存储器的后缀默认为.Wav。将录制好文件保存,记录保存路径。男生女生各录一段保存为test1.wav和test2.wav。 图1基于PC机语音信号采集过程。 2、读取语音信号 在MATLAB软件平台下,利用wavread函数对语音信号进行采样,记住采样频率和采样点数。通过使用wavread函数,理解采样、采样频率、采样位数等概念! Wavread函数调用格式: y=wavread(file),读取file所规定的wav文件,返回采样值放在向量y中。

[y,fs,nbits]=wavread(file),采样值放在向量y中,fs表示采样频率(hz),nbits表示采样位数。 y=wavread(file,N),读取前N点的采样值放在向量y中。 y=wavread(file,[N1,N2]),读取从N1到N2点的采样值放在向量y中。 3、编程获取语音信号的抽样频率和采样位数。 语音信号为test1.wav和test2.wav,内容为“语音信号处理”,两端语音保存到工作空间work文件夹下。在M文件中分别输入以下程序,可以分两次输入便于观察。 [y1,fs1,nbits1]=wavread('test1.wav') [y2,fs2,nbits2]=wavread('test2.wav') 结果如下图所示 根据结果可知:两端语音信号的采样频率为44100HZ,采样位数为16。 4、语音信号的时域分析 语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析时,最先接触到并且夜市最直观的是它的时域波形。语音信

音频实验报告

一.实验目的 1.学会CoolEdit Pro软件的使用,并会简单音频编辑 2.加深对数字音频原理的理解 3.掌握音频编辑基本原理 二.实验设备 1.带有声卡的电脑一台 2.音质良好的耳麦 3.CoolEdit Pro软件 三.实验内容 自己录制“太原理工大学”五遍,去噪。 添加背景音乐,并在间隔出加入其他音效。 混合后形成一段新的音频片段。 四.实验步骤 1.录制添加原声并去噪 用电脑自带的录音工具录制“太原理工大学”五遍,并保存为WAV格式,在音轨1处单击鼠标右键,选“插入>音频文件”,从硬盘上选择录制的原声。在我们录音的时候,周围的环境或话筒等都会产生一些噪音,因此录完了音第一步要做的就是降噪,我们可以双击

音轨1中的人声进入单轨模式,点击菜单栏的“效果>噪音消除>降噪器”来进行降噪处理。 选择噪音级别,一般不要高于80,级别过高会使人声失真,选择噪音级别后点击“噪音采样”,然后勾选对话框下端的“直通”选项,点击下面的“预览/停止”按钮,这样就可以听到降噪后的声音了,如果效果不满意的话再调整降噪级别,不断重复以调至最令人满意的效果。 对于歌曲头尾处没有人声的地方可能产生的噪音,可以用鼠标左键选中该段波形后单击鼠标右键,选择“静音”。

降噪结果 2.高音激励 为了调节所录人声的高音和低音部分,使声音显得更加清晰明亮或是厚重,我们要对人声进行高音激励处理。在按装了BBE插件后,单击菜单栏“效果>DirectX”,在右边会出现“BBESonicMaximizer”选项。 点击BBESonicMaximizer,会弹出如下图所示的对话框,在软件预置里选择您需要的一种预设效果,通过对话框中央的3个按钮进行效果调节,点击右下角的“预览/停止”按钮听效果,反复试听至满意的效果,点击确定。

语音信号处理实验报告11

实验一 语音信号的时域分析 一、 实验目的、要求 (1)掌握语音信号采集的方法 (2)掌握一种语音信号基音周期提取方法 (3)掌握语音信号短时能量和短时过零率计算方法 (4)了解Matlab 的编程方法 二、 实验原理 语音是一时变的、非平稳的随机过程,但由于一段时间内(10-30ms)人的声带和声道形状的相对稳定性,可认为其特征是不变的,因而语音的短时谱具有相对稳定性。在语音分析中可以利用短时谱的这种平稳性,将语音信号分帧。 10~30ms 相对平稳,分析帧长一般为20ms 。 语音信号的分帧是通过可移动的有限长度窗口进行加权的方法来实现的。几种典型的窗函数有:矩形窗、汉明窗、哈宁窗、布莱克曼窗。 语音信号的能量分析是基于语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。定义短时平均能量 [][]∑∑+-=∞-∞=-=-= n N n m m n m n w m x m n w m x E 122)()()()( 下图说明了短时能量序列的计算方法,其中窗口采用的是直角窗。 过零就是信号通过零值。对于连续语音信号,可以考察其时域波形通过时间轴的情况。而对于离散时间信号,如果相邻的取样值改变符号则称为过零。由此可以计算过零数,过零数就是样本改变符号的次数。单位时间内的过零数称为平

均过零数。 语音信号x (n )的短时平均过零数定义为 ()[]()[]()()[]()[]() n w n x n x m n w m x m x Z m n *--=---= ∑∞ -∞=1sgn sgn 1sgn sgn 式中,[]?sgn 是符号函数,即 ()[]()()()()???<-≥=01 01sgn n x n x n x 短时平均过零数可应用于语音信号分析中。发浊音时,尽管声道有若干个共振峰,但由于声门波引起了谱的高频跌落,所以其语音能量约集中干3kHz 以下。而发清音时.多数能量出现在较高频率上。既然高频率意味着高的平均过零数,低频率意味着低的平均过零数,那么可以认为浊音时具有较低的平均过零数,而清音时具有较高的平均过零数。然而这种高低仅是相对而言,没有精确的数值关系。 短时平均过零的作用 1.区分清/浊音: 浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。 2.从背景噪声中找出是否有语音,以及语音的起点。 基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。 由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的

声音媒体技术实验报告

《声音媒体技术》课程实验报告 实验名称声波信号处理(二)声波特性了解 姓名陈燕学号2010110603 班级计算机科学学院6班实验地点西102 实验日期成绩 实验目的了解声音信号的幅度、频率的基本特征和听觉感受,了解纯音、复合音的区别和基波、谐波的概念。 实验设备AG-HMC73MC 数字摄录一体机 实验内容与实验记录 1、对比男声、女声语言朗诵的听觉感受 1)打开Audition 3.0,点击“编辑”工作区,进入单轨视图。 2)分别打开导入的“再别康桥(男声)”、“再别康桥(女声)”音频文件。 3)将“再别康桥(男声)”音频文件的一个音轨删除,以“再别康桥(男声)-1”保存。 4)将“再别康桥(女声)”音频文件的一个音轨删除,以“再别康桥(女声)-1”保存。 5)打开“再别康桥(女声)-1”音频文件,将“再别康桥(男声)”音频文件的留存音轨复制,粘贴在“再别康桥(女声)-1”的空白音轨。 6)将“再别康桥(男声)-1”、“再别康桥(女声)-1”合成的音频文件以“再别康桥-1”保存。

7)调整“再别康桥-1”两个音轨的信号幅度,进行两个单轨轮换播放,对比两个音轨信号的听觉特征和听觉感受。 2、对比不同频率纯音的听觉感受 1)打开Audition 3.0,点击“编辑”菜单工作区,进入单轨视图。 2)点击“新建波形”按钮,选择“新建波形”对话框中“取样频率”为44.1KHz、“声道数”为立体声“分辨率”为16位,并进行确认。 3)选择菜单栏的“生成”按钮,打开下拉菜单,点击“音调”选项。 4)在“生成音调”对话框中,在“基准频率”栏目添入261.63Hz,将“锁定设置”选中,将“调制”、“调制频率”设置为0,在“常规”栏目选择“正弦波”,信号长度“时值”栏目添入波形长度3秒,“dB 音量”栏设置成-6 dB(半满幅),其余项目选择默认,点击“确认”将信号波形存入音轨。

哈尔滨工程大学 语音信号处理实验报告

实 验 报 告 实验课程名称: 语音信号处理实验 姓名: 班级: 20120811 学号: 指导教师 张磊 实验教室 21B#293 实验时间 2015年4月12日 实验成绩 实验序号 实验名称 实验过程 实验结果 实验成绩 实验一 语音信号的端点检测 实验二 语音信号的特征提取 实验三 语音信号的基频提取

实验一 语音信号的端点检测 一、实验目的 1、掌握短时能量的求解方法 2、掌握短时平均过零率的求解方法 3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检测。 二、实验设备 HP 计算机、Matlab 软件 三、实验原理 1、短时能量 语音信号的短时能量分析给出了反应这些幅度变化的一个合适的描述方法。对于信号)}({n x ,短时能量的定义如下: ∑ ∑∞ -∞ =∞ -∞ =*=-= -= m m n n h n x m n h m x m n w m x E )()()()()]()([222 2、短时平均过零率 短时平均过零率是指每帧内信号通过零值的次数。对于连续语音信号,可以 考察其时域波形通过时间轴的情况。对于离散信号,实质上就是信号采样点符号变化的次数。过零率在一定程度上可以反映出频率的信息。短时平均过零率的公式为: ∑∑-+=∞ -∞=--= ---=1)] 1(sgn[)](sgn[2 1 ) ()]1(sgn[)](sgn[21N n n m w w m n m x m x m n w m x m x Z 其中,sgn[.]是符号函数,即 ? ? ?<-≥=0)(10)(1 )](sgn[n x n x n x

语音信号处理实验报告实验一

通信工程学院12级1班罗恒2012101032 实验一语音信号的低通滤波和短时分析综合实验 一、实验要求 1、根据已有语音信号,设计一个低通滤波器,带宽为采样频率的四分之一,求输出信号; 2、辨别原始语音信号与滤波器输出信号有何区别,说明原因; 3、改变滤波器带宽,重复滤波实验,辨别语音信号的变化,说明原因; 4、利用矩形窗和汉明窗对语音信号进行短时傅立叶分析,绘制语谱图并估计基音周期,分析两种窗函数对基音估计的影响; 5、改变窗口长度,重复上一步,说明窗口长度对基音估计的影响。 二、实验目的 1.在理论学习的基础上,进一步地理解和掌握语音信号低通滤波的意义,低通滤波分析的基本方法。 2.进一步理解和掌握语音信号不同的窗函数傅里叶变化对基音估计的影响。 三、实验设备 1.PC机; 2.MATLAB软件环境; 四、实验内容 1.上机前用Matlab语言完成程序编写工作。 2.程序应具有加窗(分帧)、绘制曲线等功能。 3.上机实验时先调试程序,通过后进行信号处理。 4.对录入的语音数据进行处理,并显示运行结果。 5. 改变滤波带宽,辨别与原始信号的区别。 6.依据曲线对该语音段进行所需要的分析,并且作出结论。 7.改变窗的宽度(帧长),重复上面的分析内容。 五、实验原理及方法 利用双线性变换设计IIR滤波器(巴特沃斯数字低通滤波器的设计),首先要设计出满足指标要求的模拟滤波器的传递函数Ha(s),然后由Ha(s)通过双线性变换可得所要设计的IIR滤波器的系统函数H(z)。如果给定的指标为数字滤波器的指标,则首先要转换成模拟滤波器的技术指标,这里主要是边界频率Wp和Ws 的转换,对ap和as指标不作变化。边界频率的转换关系为∩=2/T tan(w/2)。接着,按照模拟低通滤波器的技术指标根据相应设计公式求出滤波器的阶数N和3dB截止频率∩c ;根据阶数N查巴特沃斯归一化低通滤波器参数表,得到归一化传输函数Ha(p);最后,将p=s/ ∩c 代入Ha(p)去归一,得到实际的模拟滤波器传输函数Ha(s)。之后,通过双线性变换法转换公式s=2/T((1-1/z)/(1+1/z))得到所要设计的IIR滤波器的系统函数H(z)。

语音信号处理实验一采集和预处理

实验一语音信号的采集及预处理 一、实验目的 在理论学习的基础上,进一步地理解和掌握语音信号预处理及短时加窗的意义及基于matlab的实现方法。 二、实验原理 1.语音信号的录音、读入、放音等:练习matlab中几个音频处理函数,利用函数wavread 对语音信号进行采样,记住采样频率和采样点数,给出以下语音的波形图(2.wav)。利用wavplay或soundview放音。也可以利用wavrecord自己录制一段语音,并进行以上操作(需要话筒)。 2.语音信号的分帧:对语音信号进行分帧,可以利用voicebox工具箱中的函数enframe。 voicebox工具箱是基于GNU协议的自由软件,其中包含了很多语音信号相关的函数。3.语音信号的加窗:本步要求利用window函数设计窗口长度为256(N=256)的矩形窗(rectwin)、汉明窗(hamming)及汉宁窗(hann)),利用wvtool函数观察其时域波形图及频谱特性,比较得出结论。观察整个信号加矩形窗及汉明窗后的波形,利用subplot与reshape函数将分帧后波形、加矩形窗波形及加汉明窗波形画在一张图上比较。取出其中一帧,利用subplot与reshape函数将一帧语音的波形、加矩形窗波形及加汉明窗波形画在一张图上比较将得出结论。 4.预加重:即语音信号通过一个一阶高通滤波器1 9375 1- -z。 .0 三、实验步骤、实验程序、图形及结论 1.语音信号的录音、读入、放音等 程序: [x,fs,nbit]=wavread('D:\2.wav'); %fs=10000,nbit=16 y=soundview('D:\2.wav') 2.语音信号的分帧 程序: [x,fs,nbit]=wavread('D:\2.wav'); len=256; inc=128; y=enframe(x,len,inc); figure; subplot(2,1,1),plot(x) subplot(2,1,2),plot(y)

相关文档