文档库 最新最全的文档下载
当前位置:文档库 › 【开题报告】基于DSP的语音采集与分析系统

【开题报告】基于DSP的语音采集与分析系统

【开题报告】基于DSP的语音采集与分析系统
【开题报告】基于DSP的语音采集与分析系统

开题报告

电子信息科学与技术

基于DSP的语音采集与分析系统

一、选题的背景与意义

1.1 研究的目的与意义

随着计算机技术和语音信号处理技术的日益发展,语音信号在越来越多的领域发挥着巨大作用.所以研究语音信号采集、处理的实时实现有着其重要的现实意义.而语音信号数据量较大,信号较为复杂,这就要求语音信号处理系统具有实时采集,大容量存储和实时处理的特点.传统的语音信号处理系统多采用计算机加软件、单片机、FPGA等来实现.这些方法要么在应用场合受到限制,特别是便携式、脱机设计中,要么难以实现实时处理的要求.为了改善以上各方面的限制要求,本文采用基于TMS320DM6437DSP系统平台,进行语音信号的采集与处理分析。DSP利用专门或通用的数字信号处理芯片,以数字计算的方法对信号进行处理,具有处理速度快、灵活、精确、抗干扰能力强、体积小及可靠性高等优点,满足了对信号快速、精确、实时处理及控制的要求。高性能的TMS320DM6437是由美国TI公司生产的,处理器采用达芬奇(DaVinci)技术,适用于车载视觉、视频安全监控系统以及视频电话等特定应用市场。

1.2国内外发展现状

随着语音处理算法的日益复杂,许多语音处理器的速度有很高的要求,一些理论上性能优良的语处理器在实际应用中还面临着诸如体积大、成本高、功耗高的一系列问题。对于绝大多数的编码器而言,音编码远比解码复杂,是非对称的。因此语音编码算法的实现一直是一个重要的研究课题。我们国家正在这一方面做大量的努力工作。IBM、Philips、Motorola、Intel、L&H、Dragon System等公司都投入了大量的研发资金和技术,积极推动了语音处理技术的发展。目前比较成功的语音处理系统有:IBM的ViaVoice和Microsoft的SAPI,它们都是面向非特定人、大词汇量的连续语音处理系统,在充分训练情况下,Vi-aVoice处理率可高达93%;特定任务的语音处理系统成为市场应用的主流,Dragon System公司的医用听写机、Bell实验室为AT&T电话公司开发的自动系统都是成功的典范:美国CMU的SPHINX系统、英国剑桥大学的IITK系统都是基于HMM理论的语音处理开发平台,语音处理的应用前景无限。

1.3 语音处理发展前景

基于DSP的语音处理系统具备了其他电子设备和处理技术无可比拟的优越性,该系统可以用于舰

艇武器控制系统、指控系统、车载导航系统、信息家电、楼宇自动化、工业控制等领域。由于国内国际语音处理技术的不断突破,我们可以想象,语音合成、语音识别、语音翻译的共同运用将使人类步入一个崭新的电子领域。

二、研究的基本内容与拟解决的主要问题:

2.1 语音录放系统设计

语音录放实验主要是通过T1的McBSP 接口实现。McBSP 在结构上可以分为一个数据通道和一个控制通道,数据通道完成数据的发送和接收,控制通道完成的任务包括内部时钟的产生,帧同步信号的产生,对这些信号的控制以及多通道的选择等。音频信号经过TLV320AIC23高精度、高速的AIX ;转换后得到一串数字信号,输入到输入缓冲区RAM 。然后由处理算法将音频信号调入TMS320VC6437的内部进行高速运算处理。经过处理的音频信号可以进行存储,再输入到高精度高速的AIC23DAC 转换器中,还原成模拟的声音信号输出。

2.2 回声的强弱和质量。另外,生活中的回声的成分比较复杂,有反射、漫反射、折射,还有回声的多次反、折射效果。当已知一个数字音源后,可以利用计算机的处理能力,用数字的方式通过计算模拟回声效果。

简单地讲,可以在原声音流中叠加延迟一段时间后的声流,实现回声效果。当然通过复杂运算,可以计算各种效应的混响效果。如此产生的回声,我们称之为数字回声。初始化配置:DSP 通过

I2C 总线将配置命令发送到AIC23,配置完成后AIC23 工作。语音信号的输入:AIC23 通过其中的AD 转换采集输入的语音信号,每采集完一个信号后,将数据发送到DSP 的McBSP 接口上,DSP 可以读取到语音数据,每个数据为16位无符号整数,左右通道各有一个数值。语音信号的输出:DSP 可以将语音数据通过McBSP 接口发送给AIC23,AIC23 的DA 器件将他们变成模拟信号输出。

图 2.2 回声部分框图

2.3 系统硬件设计

2.3.1 语音采集处理整体硬件设计

语音处理系统中DSP作为主处理器,负责完成语音处理以及整个系统控制。系统选择专门的音频Codec芯片来实现语音采集和语音输出。文中选择TI公司的TMS320VC6437作为主处理器,

TLV320AIC23B作为Codec芯片,系统的结构如图

图 2.3 语音采集与处理结构框图

TMS320DM6437,专用于数字媒体应用的高性能定点32-位处理器,工作主频最高达

700MHz,处理性能可达5600MIPS;McBSP是Multichannel Buffered Serial Port 的缩写,即多通道缓冲串行接口。它是一种功能很强的同步串行接口,具有很强的可编程能力,可以直接配置成多种同步串口标准,直接与各种器件无缝接口。McBSP 主要包括以下机组功能引脚:位时钟:CLKX,CLKR;帧同步:FSX,FSR;数据:DR,DX。TLV320AIC23B是TI 推出的一款高性能立体声音频Codec 芯片,内置耳机输出放大器,支持MIC 和LINE

IN 两种输入方式(二选一),且对输入和输出都具有可编程增益。

2.3.2 DSP与AIC23接口连接

DSP 与AIC23B 的连接可以采用DSP 模式与IIS 模式,区别仅在于DSP 的McBSP 帧

同步信号的宽度。后者的帧同步信号宽度必须为一个字(16 位)长,而前者的帧宽度可以为一个位长,帧长为32 位的情况下,如果采用IIS,帧同步信号宽度应为16 位;而采用DSP Mode 帧信号宽度1 位即可.连接示意图如下:

图 2.4 DSP 与AIC23B 的连接图

2.4 软件系统设计

2.4.1 语音采集中的编解码设计

对语音通信的压缩和解压,国际电信联盟(ITU—T)以及其他机构制定了一系列的语音压缩算法

的标准。较著名的有PCM、ADPCM、CELP、LCP等算法。为节省系统带宽资源,同时保证系统的实时性,尽可能减少DSP执行算法的时间,语音数据压缩解压首先考虑采用比较简单的ADPCM算法。经典的ADPCM 算法可实现40k/s,32k/s,24k/s,16k/s压缩速率。但该算法中有大量浮点乘运算,并且不适用于定点DSP处理。我们采用一种更为简便的语音编解码算法IMA_AD-PCM,它是一种由Interactive Multimedia Association推荐,广泛用于提高多媒体系统语音数据兼容性的32k/s ADPCM 压缩算法。IMA_AD-PCM 利用语音采样信号的高度相关性,不对信号本身进行编码,而是对预测信号和真实信号之间的差值进行编码,其自适应预测器采用固定预测,减少了数据存储量和指令周期数。

2.4.2 数字滤波器算法设计

本文的自适应算法是最小均方误差算法,即LMS算法,该算法是一种易于实现、性能稳定、应用广泛的算法。自适应滤波器控制机理是误差序列e(n)按照某种准则和算法对系数{Wi}i=l,2,?,M进行调整,设法使y(n)接近d(n),最终使目标函数e(n)=d(n)-y(n)的均方值最小化,并且根据这个来修改权系数。

2.5 拟解决的主要问题

通过以上语音处理的总体框架图与硬件的连接情况,以下几个问题需要深入的研究。

(1)语音采集部分的设计问题

(2)滤波器类型的选择问题

(3)滤波器设计的算法问题

三、研究的方法与技术路线:

通过以上有理论的研究,下面我们这种分析以下问题的分析思路与解决方案。

3.1 语音采集部分设计

语音采集与处理系统主要包括三部分:以TMS320C6437为核心的数据处理与控制模块;以

TLV320AIC23B为核心的语音采集与编解码模块;用户可扩展模块;AIC23为语音采集的关键部分,我们对AIC23的操作可以分为以下几步:

(1)初始化配置:DSP 通过I2C 总线将配置命令发送到AIC23,配置完成后AIC23 工作。

(2)语音信号的输入:AIC23 通过其中的AD 转换采集输入的语音信号,每采集完一个信号后,将数据发送到DSP 的McBSP 接口上,DSP 可以读取到语音数据,每个数据为16

位无符号整数,左右通道各有一个数值。

(3)语音信号的输出:DSP 可以将语音数据通过McBSP 接口发送给AIC23,AIC23 的

DA 器件将他们变成模拟信号输出。

图 3.1 语音采集基本流程图 3.2 滤波器类型的选择问题

语音去噪在语音信号上应用较多,使用滤波器和各种算法均可以实现语音信号的去噪,使得含有噪声的信号更加清晰。 但语音信号的去噪和一般的数字信号去噪又存在着很大的差别, 因为语音信号的频谱覆盖在100Hz-3.4KHz ,较为丰富的信号主要集中在1KHz 附近, 所以一般的滤波去噪时必须考虑语音信号的自身特征。因此,要用DSP 进行编程设计一个软件可实现高通滤波器, 由处理器来完成信号的去噪,自适应滤波是仅需对当前观察的数据做处理的滤波算法。它能自动调节本身冲激响应的特性,或者说自动调节数字滤波器的系数,以适应信号变化的特性,从而达到最佳滤波。由于自适应滤波不需要关于输入信号的先验知识,计算量小,特别适合于实时处理。因此,本次设计选择自适应滤波器作为除噪的核心结构,利用其工作环境变化而自动更改自适应算法中的时变系数,从而改变滤波器的性能。 3.3 滤波器设计的算法问题

自适应滤波算法采用易于实现的LMS 算法,采用C 语言进行算法的编程。由DSK 自带的代码编译软件(CCS)进行编译、连接生成可执行文件,通过USB 口下载到DSK 。LMS 算法的主要参数是滤波器权系数矢量W (n )的阶数和自适应步长u ,它们影响着滤波器的收敛速度和稳态误差。滤波器权系数矢量W(n)的阶数和运算量有关。 LMS 算法在一次迭代中需要2N+1次复数乘法和2N 次加法。欲使算法收敛,步长必须满足:0<< ,=

u max u max u max

1λ(是临界稳定步长,是输入信号 X(n)相关矩阵的最大特值。) max u max λ

图 3.2 DSP算法的实现流程图

四、研究的总体安排与进度:

1、2010年11月26日——2010年12月5日:深入研究课题,了解课题的具体任务要求,制定详

细的计划安排。

2、2010年12月5日——2010年12月26日:查阅语音信号采集与基于DSP的滤波器设计的相关

资料,弄清有关概念及相关技术问题,撰写文献综述和开题报告。

3、2010年12月26日——2011年1月13日:熟悉TMS320VC6437试验箱组成及各部分的功能,了

解各部分端口的连接情况。

4、2011年1月14日——2011年2月16日:完成语音回放系统的硬件调试工作,为接下来整个设

计框架的设计做准备。

5、2011年2月17日——2011年3月2日:了解LMS算法的实现原理与编写方法,完成语音滤波

算法程序的编写工作。

6、2011年3月3日——2011年3月20日:硬件实现语音采集与滤波功能,进行必要的滤波效果

的频谱分析。

7、2011年3月21日——2011年4月20日:完成所有项目与毕业论文书面工作,等待毕业答辩。

五、主要参考文献:

[1]汪兴贤单片机语音采集与合成技术[J]南昌大学学报(工科版),1996,18(2):34-36.

[2]张晓东,卢源陵.香农采样理论的扩展与应用[J]赣南师范学院学报,1996(6):12-15.

[3]李占辉,刘晓强,李柏岩.小波域降噪方法及在历史音频保护中的应用[J]东华大学,

2010,8(4):77-79.

[4]杜可越,李辉,戴蓓倩,陆伟.一种改进的LPC语音编码方法[D]中国科技大学学报,

2003,1(23):18-21.

[5]涂奇雄, 梁维谦.基于HMM 的语音合成系统的模型压缩[D]清华大学电子工程系,清华大学微电子所,2010(7):86-89.

[6]张凯,皮之军,张树团,李静.基于DSP/BIOS的FIR 数字滤波器设计与实现[M]海军航空工程学院山东烟台,2009,10:46-49.

[7]伍永锋,王国金.基于MATLAB的IIR数字滤波器的设计及DSP实现[M]宁夏大学物理电气信息学

院,2010(2):56-59.

[8]王丽芳,陈益平.基于DSP的自适应滤波器的实现[M]南昌航空大学,2009,9:23-25.

[9]袁见,李国辉,徐新文.基于倒谱分析的被动水声目标原始信号重构方法[J]计算机工程与科

学,2009,29(8):152-156.

[10]KUO S M,VUAYAN A secondary path modeling technique for active noise control systems [J]IEEE Trans.Speech and Audio Processing,1997,5(4):374-377.

[11] ZHANG M,LAN H,SER W.Cross-updated active noise eontrol system with online second -ary path modeling[J] Speech and Audio Processing,2001,9(5):598-602.

[12] ZHANG M,LAN H,SER W.On comparison of online secondary path modeling methods with auxiliary noise[J] IEEE Trans.Speech and Audio Processing,2005,13(4):618-628.

语音识别系统实验报告材料

语音识别系统实验报告 专业班级:信息安全 学号: 姓名:

目录 一、设计任务及要求 (1) 二、语音识别的简单介绍 2.1语者识别的概念 (2) 2.2特征参数的提取 (3) 2.3用矢量量化聚类法生成码本 (3) 2.4VQ的说话人识别 (4) 三、算法程序分析 3.1函数关系 (4) 3.2代码说明 (5) 3.2.1函数mfcc (5) 3.2.2函数disteu (5) 3.2.3函数vqlbg (6)

3.2.4函数test (6) 3.2.5函数testDB (7) 3.2.6 函数train (8) 3.2.7函数melfb (8) 四、演示分析 (9) 五、心得体会 (11) 附:GUI程序代码 (12) 一、设计任务及要求 实现语音识别功能。 二、语音识别的简单介绍

基于VQ的说话人识别系统,矢量量化起着双重作用。在训练阶段,把每一个说话者所提取的特征参数进行分类,产生不同码字所组成的码本。在识别(匹配)阶段,我们用VQ方法计算平均失真测度(本系统在计算距离d时,采用欧氏距离测度),从而判断说话人是谁。 语音识别系统结构框图如图1所示。 图1 语音识别系统结构框图 2.1语者识别的概念 语者识别就是根据说话人的语音信号来判别说话人的身份。语音是人的自然属性之一,由于说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这就使得通过分析语音信号来识别说话人成为可能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有的特征,不会丢失或遗忘;语音信号的采集方便,系统设备成本低;利用电话网络还可实现远程客户服务等。因此,近几年来,说话人识别越来越多的受到人们的重视。与其他生物识别技术如指纹识别、手形识别等相比较,说话人识别不仅使用方便,而且属于非接触性,容易被用户接受,并且在已有的各种生物特征识别技术中,

语音识别机器人实验报告

开放实验项目报告 项目名称:语音识别机器人 专业 学生姓名 班级学号 指导教师 指导单位 2012/2013学年第一学期 一.设计背景

在科学日新月异的今天,电子设备的便捷化,人性化,智能化已成为不可逆转的潮流,而语音控制智能,更是其中研究发展的热点。凌阳SPCE061以其便捷的操作,可靠的性能,成为了各位电子爱好者的首选。本实验采用凌阳61板和运动小车(迷你型)模组设计的语音控制小车。凌阳板嵌入小车模型顶部。语音处理技术不仅包括语音的录制和播放,还涉及语音的压缩编码和解码、语音的识别等各种处理技术。本设计的语音控制小车,借助于SPCE061A在语音处理方面的特色,不仅具有前进、后退、左转、右转、停止等基本程序控制功能,而且还具备语音控制功能。 二.总流程图

三.主要模块 1、凌阳SPCE061是继μ’nSP?系列产品SPCE500A等之后凌阳科技推出的又一款16 位结构的微控制器。与SPCE500A不同的是,在存储器资源方面考虑到用户的较少资源的需求以及便于程序调试等功能,SPCE061A里只内嵌32K字的闪存(FLASH )。较高的处理速度使μ’nSP?能够非常容易地、快速地处理复杂的数字信号。因此,与SPCE500A相比,以μ’nSP?为核心的SPCE061A 微控制器是适用于数字语音识别应用领域产品的一种最经济的选择。 其性能如下: A、16 位μ’nSP?微处理器; B、工作电压(CPU) VDD 为2.4~3.6V (I/O) VDDH 为2.4~5.5V C、CPU 时钟:0.32MHz~49.152MHz ; D、内置2K 字SRAM; E、内置32K FLASH; F、可编程音频处理; G、晶体振荡器; H、系统处于备用状态下(时钟处于停止状态),耗电仅为2μA@3.6V ; I、2 个16 位可编程定时器/计数器(可自动预置初始计数值); J、2 个10 位DAC(数-模转换)输出通道; K、32 位通用可编程输入/输出端口; L、14 个中断源可来自定时器A / B ,时基,2 个外部时钟源输入,键唤醒;

语音信号处理实验报告11

实验一 语音信号的时域分析 一、 实验目的、要求 (1)掌握语音信号采集的方法 (2)掌握一种语音信号基音周期提取方法 (3)掌握语音信号短时能量和短时过零率计算方法 (4)了解Matlab 的编程方法 二、 实验原理 语音是一时变的、非平稳的随机过程,但由于一段时间内(10-30ms)人的声带和声道形状的相对稳定性,可认为其特征是不变的,因而语音的短时谱具有相对稳定性。在语音分析中可以利用短时谱的这种平稳性,将语音信号分帧。 10~30ms 相对平稳,分析帧长一般为20ms 。 语音信号的分帧是通过可移动的有限长度窗口进行加权的方法来实现的。几种典型的窗函数有:矩形窗、汉明窗、哈宁窗、布莱克曼窗。 语音信号的能量分析是基于语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。定义短时平均能量 [][]∑∑+-=∞-∞=-=-= n N n m m n m n w m x m n w m x E 122)()()()( 下图说明了短时能量序列的计算方法,其中窗口采用的是直角窗。 过零就是信号通过零值。对于连续语音信号,可以考察其时域波形通过时间轴的情况。而对于离散时间信号,如果相邻的取样值改变符号则称为过零。由此可以计算过零数,过零数就是样本改变符号的次数。单位时间内的过零数称为平

均过零数。 语音信号x (n )的短时平均过零数定义为 ()[]()[]()()[]()[]() n w n x n x m n w m x m x Z m n *--=---= ∑∞ -∞=1sgn sgn 1sgn sgn 式中,[]?sgn 是符号函数,即 ()[]()()()()???<-≥=01 01sgn n x n x n x 短时平均过零数可应用于语音信号分析中。发浊音时,尽管声道有若干个共振峰,但由于声门波引起了谱的高频跌落,所以其语音能量约集中干3kHz 以下。而发清音时.多数能量出现在较高频率上。既然高频率意味着高的平均过零数,低频率意味着低的平均过零数,那么可以认为浊音时具有较低的平均过零数,而清音时具有较高的平均过零数。然而这种高低仅是相对而言,没有精确的数值关系。 短时平均过零的作用 1.区分清/浊音: 浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。 2.从背景噪声中找出是否有语音,以及语音的起点。 基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。 由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的

语音信号处理实验报告实验一

通信工程学院12级1班罗恒2012101032 实验一语音信号的低通滤波和短时分析综合实验 一、实验要求 1、根据已有语音信号,设计一个低通滤波器,带宽为采样频率的四分之一,求输出信号; 2、辨别原始语音信号与滤波器输出信号有何区别,说明原因; 3、改变滤波器带宽,重复滤波实验,辨别语音信号的变化,说明原因; 4、利用矩形窗和汉明窗对语音信号进行短时傅立叶分析,绘制语谱图并估计基音周期,分析两种窗函数对基音估计的影响; 5、改变窗口长度,重复上一步,说明窗口长度对基音估计的影响。 二、实验目的 1.在理论学习的基础上,进一步地理解和掌握语音信号低通滤波的意义,低通滤波分析的基本方法。 2.进一步理解和掌握语音信号不同的窗函数傅里叶变化对基音估计的影响。 三、实验设备 1.PC机; 2.MATLAB软件环境; 四、实验内容 1.上机前用Matlab语言完成程序编写工作。 2.程序应具有加窗(分帧)、绘制曲线等功能。 3.上机实验时先调试程序,通过后进行信号处理。 4.对录入的语音数据进行处理,并显示运行结果。 5. 改变滤波带宽,辨别与原始信号的区别。 6.依据曲线对该语音段进行所需要的分析,并且作出结论。 7.改变窗的宽度(帧长),重复上面的分析内容。 五、实验原理及方法 利用双线性变换设计IIR滤波器(巴特沃斯数字低通滤波器的设计),首先要设计出满足指标要求的模拟滤波器的传递函数Ha(s),然后由Ha(s)通过双线性变换可得所要设计的IIR滤波器的系统函数H(z)。如果给定的指标为数字滤波器的指标,则首先要转换成模拟滤波器的技术指标,这里主要是边界频率Wp和Ws 的转换,对ap和as指标不作变化。边界频率的转换关系为∩=2/T tan(w/2)。接着,按照模拟低通滤波器的技术指标根据相应设计公式求出滤波器的阶数N和3dB截止频率∩c ;根据阶数N查巴特沃斯归一化低通滤波器参数表,得到归一化传输函数Ha(p);最后,将p=s/ ∩c 代入Ha(p)去归一,得到实际的模拟滤波器传输函数Ha(s)。之后,通过双线性变换法转换公式s=2/T((1-1/z)/(1+1/z))得到所要设计的IIR滤波器的系统函数H(z)。

语音控制小车实验报告

语音控制小车实验报告 专业: 学号: 姓名: 2014年01月12日

一、实验目的 语音控制小车以SPCE061A单片机为核心,采用语音识别技术,可通过语音命令对其行驶状态进行控制。本次实验的主要目的: 1.通过简单的I/O 操作实现小车的前进、后退、左转、右转功能; 2.配合SPCE061A 的语音特色,利用系统的语音播放和语音识别资源,实现语音控制的功能; 3.在行走过程中声控改变小车运动状态; 4.在超出语音控制范围时使小车停车。 二、实验内容 1、SPCE061A简介 SPCE061A是一款性价比很高的十六位单片机,使用它可以非常方便灵活的实现语音的录放,该芯片拥有8路10位精度的ADC,其中一路为音频转换通道,并且内置有自动增益电路。这为实现语音录入提供了方便的硬件条件。两路10位精度的DAC,只需要外接功放(SPY0030A)即可完成语音的播放。该单片机具有一套易学易用的指令系统和集成开发环境,在此环境中,它支持标准 C 语言编程,也支持 C 语言与汇编语言的互相调用。另外还提供了语音录放的库函数,只要了解库函数的使用,就可以很容易的完成语音的录放、识别等功能,这些都为软件开发提供了方便的条件。 SPCE061A特性: 16位μ’nSP微处理器; 工作电压:内核工作电压VDD为 3.0V~3.6V(CPU),I/O口工作电压VDDH为VDD~5.5V(I/O); CPU时钟:0.32MHz~49.152MHz; 内置2K 字 SRAM; 内置32K 闪存 ROM; 可编程音频处理; 晶体振荡器; 系统处于备用状态下(时钟处于停止状态),耗电小于 2μA@3.6V; 2 个 16 位可编程定时器/计数器(可自动预置初始计数值); 2 个 10 位 DAC(数-模转换)输出通道; 32 位通用可编程输入/输出端口;

语音放大器设计实验报告

模拟电子技术课程设计 语 音 放 大 器 姓名:伍慧兰 学号:2015550828 班级:15通信工程1班 指导老师:罗光明 目录 一、设计目的 (2) 二、知识点和设计内容 (2) 三、设计方案 (3) 四、实验原理与参考电路 (4) (一)实验原理图如图1-2 (4) (二)实验原理 (5) 1) 前置放大器 (5) 2) 有源带通滤波器 (5) 3) 功率放大器 (6)

五、实验的主要元器件 (7) (一)元器件清单 (7) (二)部分器件的使用介绍 (8) 1) LM324芯片 (8) 2) TDA2030引脚图与应用电路参数 (12) 六、实验步骤 (13) (一)电路仿真实验 (13) (二)硬件实物实验 (19) 1) 前置放大器的焊接与调试 (19) 2) 有源带通滤波器 (20) 七、实验中的问题提出与解决方法 (24) 八、注意事项 (25) 九、实验感想 (26) 参考资料 (27) 语音放大器设计 一、设计目的 1、了解语音识别知识; 2、掌握集成运算放大器的工作原理及其应用; 3、掌握低频小信号放大电路、带通滤波器和功放电路的设计方法; 4、培养应用现代工具对模拟电子系统进行仿真测试、制作调试、故障检查及分析的能力; 5、培养市场素质、工艺素质、自主学习能力、分析问题解决问题的能力以及团队精神; 6、培养文献查阅与综述和撰写课程设计报告的能力。 二、知识点和设计内容 本实验的知识点为分立元件放大器或集成运放、有源滤波器、集

成功率放大器;涉及电子电路各个模块之间的联合调试技术。 三、设计方案 语音放大器设计的基本设计思路 分析可知本语音放大器应包括输入电路、前置放大器、有源带通滤波器、功率放大器、扬声器等几部分组成,如图1-1所示。 前置放大器可采用集成运算放大器,有源带通滤波器可采用LPF 和HPF 串联构成,功率放大电路选用集成功放。 设计的性能指标 通常语音信号非常微弱,需要经过放大、滤波、功率放大后才能驱动扬声器发声。假设语音信号为峰峰值不大于10mV 频率范围100Hz~3kHz 的正弦波,要求驱动8Ω1W 的扬声器。具体性能指标如下: 1、前置放大器:输入信号Uid ≤10mV ;输入阻抗Ri ≥100k Ω 2、有源带通滤波器:通带100Hz~3kHz ;增益Au=1 3、功放:最大不失真输出功率Pomax ≥1W ;负载阻抗R L =8Ω 4、输出功率连续可调;直流输出电压≤50mV ;静态电源电流≤100mA 输入 电路 前置 放大 带通 滤波 功率 放大 图1-1 语音放大电路原理框图

人机交互实验报告

实验一: 实验名称最新人机交互技术 实验目的了解最新人机交互的研究内容。 实验内容通过网络查询最新人机交互相关知识。 1、在百度中找到“最新人机交互视频”的相关网页,查看视频。 2、什么是eTable 。 3、人机交互技术在各个领域的应用。 实验二: 实验名称立体视觉 实验目的掌握立体视觉的原理。 实验内容通过网络查询立体视觉相关知识。 1、在虚拟环境是如何实现立体视觉? 2、3D和4D电影的工作原理。 实验三: 实验名称交互设备 实验目的掌握常用的交互设备的工作原理如键盘、鼠标、显示器、扫描仪。 实验内容通过网络查询人机交互设备相关知识。 1、重点查找液晶显示器和扫描仪的工作原理和方法 2、什么是数字纸?工作原理是什么? 实验四: 实验名称虚拟现实系统中的交互设备 实验目的掌握虚拟现实系统中人机交互设备的工作原理和方法。 实验内容通过网络查询人机交互设备相关知识。重点查找虚拟现实中使用的交互设备和较新的交互设备的工作原理和方法,如:数据手套、三维鼠标、空间跟踪定位器、触觉和力反馈器、头盔式显示器等。(实验报告中写出3种以上) 实验五: 实验名称人机交互界面表示模型 实验目的掌握人机交互界面表示模型中的GOMS、LOTOS和UAN的方法。 实验内容1、简述GOMS和LOTOS表示模型的方法。 2、结合GOMS和LOTOS对任务“中国象棋对弈”进行描述。 3、UAN描述“文件拖入垃圾箱”。 实验六: 实验名称WEB界面设计 实验目的掌握WEB界面设计的原则,了解页面内容、风格、布局、色彩设计的方法。

实验内容1、找到三种类型的网站:旅游景区、购物网站、政府部门网站,每种类型找三个以上网站,总结功能、布局、风格、色彩设计有什么相同和不同。 实验七: 实验名称移动界面设计 实验目的掌握移动界面设计的原则。 实验内容比较移动界面设计与WEB界面设计有什么相同和不同。 实验八: 实验名称可用性分析与评估 实验目的掌握可用性分析与评估的方法。 实验内容对某个网上银行进行可用性分析与评估(银行自定)。 辅导教师成绩

语音信处理实验报告

语音信处理实验报告文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

语音信号处理实验报告——语音信号分析实验一.实验目的及原理 语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理,并且语音合成的音质好坏和语音识别率的高低,都取决于对语音信号分析的准确性和精确性。 贯穿语音分析全过程的是“短时分析技术”。因为从整体来看,语音信号的特性及表征其本质特征的参数均是随时间变化的,所以它是一个非平稳态过程,但是在一个短时间范围内(一般认为在10~30ms的时间内),其特性基本保持不变,即相对稳定,可将其看做一个准稳态过程,即语音信号具有短时平稳性。所以要将语音信号分帧来分析其特征参数,帧长一般取为10ms~30ms。 二.实验过程 (1)时域分析 男声及女声(蓝色为时域信号,红色为每一帧的能量,绿色为每一帧的过零

率) 某一帧的自相关函数 3. 频域分析 ①一帧信号的倒谱分析和FFT 及LPC 分析 -1-0.5 0.5 1 -500 50 100 150 -1-0.500.51-40-2002040 ②男声和女声的倒谱分析 ③浊音和清音的倒谱分析 ④浊音和清音的FFT 分析和LPC 分析(红色为FFT 图像,绿色为LPC 图像) 三. 实验结果分析 1. 时域分析 实验中采用的是汉明窗,窗的长度对能否由短时能量反应语音信号的 对应的倒谱系数:,,…… 对应的LPC 预测系数:1,,,,,…… 原语音 一帧语音波形 一帧语音的倒

数字语音处理课程实验报告

数字语音处理课程报告

语音信号的采集与分析 摘要 语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。 关键词:语音信号,采集与分析,时域,频域 0 引言 通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。 让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。作为高科技应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并不断朝更高目标而努力。 语音信号采集与分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系.并且一起发展。语音信号采集与分析是以语音语言学和数字

人脸识别系统-开放实验报告范文

开放性实验报告《人脸识别系统》 小组成员: 姓名李宏利 学号 109021075 指导老师:彭艳斌2011 年12 月

【实验名称】人脸识别系统 【实验目的】 1.对人脸识别系统的图像预处理有一定的掌握; 2.对后续操作只简单了解; 3.通过功能模块实现人脸识别系统。 【实验内容】 1.系统需求分析; 2.系统设计; 3.系统实现。 【实验步骤】 一、系统需求分析 1、目的与背景 当前社会上频繁出现的入室偷盗、抢劫、伤人等案件的不断发生,鉴于此种原因,防盗门开始走进千家万户,给家庭带来安宁;然而,随着社会的发展,技术的进步,生活节奏的加速,消费水平的提高,人们对于家居的期望也越来越高,对便捷的要求也越来越迫切,基于传统的纯粹机械设计的防盗门,除了坚固耐用外,很难快速满足这些新兴的需求:便捷,开门记录等功能。 广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。

人脸识别 生物特征识别技术所研究的生物特征包括脸、指纹、手掌纹、虹膜、视网膜、声音(语音)、体形、个人习惯(例如敲击键盘的力度和频率、签字)等,相应的识别技术就有人脸识别、指纹识别、掌纹识别、虹膜识别、视网膜识别、语音识别(用语音识别可以进行身份识别,也可以进行语音内容的识别,只有前者属于生物特征识别技术)、体形识别、键盘敲击识别、签字识别等。人脸识别主要用于身份识别。由于视频监控正在快速普及,众多的视频监控应用迫切需要一种远距离、用户非配合状态下的快速身份识别技术,以求远距离快速确认人员身份,实现智能预警。人脸识别技术无疑是最佳的选择,采用快速人脸检测技术可以从监控视频图象中实时查找人脸,并与人脸数据库进行实时比对,从而实现快速身份识别

人机交互实验报告

中北大学软件学院 实验报告 专业软件工程 课程名称人机交互技术 学号 姓名

辅导教师成绩 实验日期2012年3月日实验时间时至时1实验名称:最新人机交互技术 2、实验目的 了解最新人机交互的研究内容。 3、实验内容 通过网络查询最新人机交互相关知识。 1、在百度中找到“最新人机交互视频”的相关网页,查看视频。 2、什么是eTable 。 3、人机交互技术在各个领域的应用。 4、实验原理或流程图 1.用搜索引擎搜索“最新人机交互视频” 2.了解什么是eTable 3.查询人机交互技术在各领域的应用

5、实验过程或源代码 1.观看“人机交互方法的革命--微软Natal计划” 在E3 2009大展上,微软公布了“Natal”计划。透过一个集成了各种感应组件(包括摄像头、深度传感器、多点阵列麦克风以及一个可处理专用软件的处理器)的装置,用户可以用头、手、足、躯干来控制游戏中的角色,从而更酣畅地投身于虚拟世界。这样“人性化”的人机交互方式将带来又一次深刻的产业变革。 2.eTable是一种非常新颖的人机交互技术,与微软“Natal”计划类似,是一个集成了各种感应组件的,类似于多功能桌面的装置(如图),其操作方法类似于触屏电脑,简单方便。 3.人机交互技术在各领域的应用 1)工作事故,健康与安全 事故调查;事故改造;健康人机工程;危险分析;健康与安全课题;健康与安全规则的应用;工业工作压力;机器防护;安全文化与安全管理;安全文化评价与改进;警示与提醒技术;安全概率分析; 2)人体工作行为解剖学和人体测量 解剖学;人体测量;人体测量和工作空间设计;生物力学;残疾人设计;姿势和生物力学负荷研究;工作中的滑倒、差错研究;背部疼痛;听觉障碍研究; 3)计算机终端:设计与布局 计算机产品和外设的设计与布局;计算机终端工作站;显示屏设备与规则;显示屏健康与安全;DSE和手动操作;顺从测量;DSE人机评价;VDUs 和办公环境人机工程研究;等…… 8、心得 通过实验,我们了解了人机交互技术在现今阶段的发展状况及发展趋势,其广阔的应用领域和人性化的操作方式将回带我们走入一个全新的环境。

语音放大器实验报告

(1)掌握分立或集成运算放大器的工作原理及其应用。 (2)掌握低频小信号放大电路和功放电路的设计方法。 (3)了解语音识别知识。 (4)通过实验培养学生的市场素质、工艺素质、自主学习的能力、分析问题解决问题的能力以及团队精神。 (5)通过实验总结回顾所学的模拟电子技术基础理论和基础实验,掌握模拟电子电路的设计与调试方法。 二.设计任务与要求 (一)设计任务: 1)已知条件: 语音放大电路由“前置放大器”、“有源带通滤波器”、“功率放大器”、“扬声器”几部分构成。 2)性能指标: 各基本单元电路的设计条件分别为: (1)前置放大器:输入信号:U id≤10mV;输入阻抗:R i≥100k 。 (2)有源带通滤波器:带通频率范围:300Hz~3kHz;增益:A u=1。

(3)功率放大器:最大不失真输出功率:P om ≥1W;负载阻抗:R L=8 。 (4)输出功率连续可调:静态噪声:≤50mV。 ( 二) 要求 (1)选取单元电路及元件 根据设计要求和已知条件,确定前置放大电路、有源带通滤波电路、功率放大电路的方案,计算和选取单元电路的元件参数。 (2)置放大电路的组装与调试 测量前置放大电路的差模电压增益A Ud、共模电压增益A Uc、共模抑制比K CMR、带宽BW1、输入电压R i等各项技术指标,并与设计要求值行比较。 (3)有源带通滤波电路的组装与调试 测量有源带通滤波电路的差模电压增益A Ud、带通BW1,并与设计要求进行比较。 (4)功率放大电路的组装与调试 测量功率放大电路的最大不失真输出功率P o,max、电源供给功率P DC、输出效率η、直流输出电压、静态电源电流等技术指标。 (5)整体电路的联调与试听 (6)应用EWB软件对电路进行仿真分析 三.实验仪器

用于孤立词识别的语音识别系统实验报告

用于孤立词识别的语音识别系统实验报告 语音是人际交流的最习惯、最自然的方式,它将成为让计算机智能化地与人通信,人机自然地交互的理想选择。让说话代替键盘输入汉字,其技术基础是语音识别和理解。语音识别将人发出的声音、音节、或短语转换成文字和符号,或给出响应执行控制,作出回答。 该系统用于数字0~9的识别,系统主要包括训练和识别两个阶段。实现过程包括对原始语音进行预加重、分帧、加窗等处理,提取语音对应的特征参数。在得到了特征参数的基础上,采用模式识别理论的模板匹配技术进行相似度度量,来进行训练和识别。在进行相似度度量时,采用DTW 算法对特征参数序列重新进行时间的对准。 一、 特征提取 1、端点检测 利用短时平均幅度和短时过零率进行端点检测,以确定语音有效范围 的开始和结束位置。 首先利用短时平均幅度定位语音的大致位置。做法为:(1)确定一个 较高的阈值MH,短时平均幅度大于MH 的部分一定是语音段。(2)分别沿这一语音段向两端搜索,大于某个阈值ML 的部分还是语音段,这样能较为准确地确定语音的起始点,将清音与无声段分开。因为清音的过零率远远高于无声段,确定一个过零率的阈值Z min , 从ML 确定的语音段向前搜 索不超过一帧的长度,短时过零率突然低于Z min 三倍的点被认为是语音的 起始点。 2、预加重 对输入的原始语音进行预加重,其目的是为了对语音的高频部分进行加重,增加语音的高频分辨率。假设在n 时刻的语音采样值为x(n),则经过预加重处理后的结果为: y(n)=x(n)+αx(n-1) α=0.98 3、分帧及加窗 语音具有短时平稳的特点,通过对语音进行分帧操作,可以提取其短时特性,便于模型的建立。帧长取为30ms ,帧移取为10ms ,然后将每帧信号用Hamming 窗相乘,以减小帧起始和结束处的信号不连续性。Hamming 窗函数为: w(n)=0.54-0.46cos(1 2-N n π) (0≤n ≤N-1) 该系统中,hamming 窗的窗长N 取为240。 设原始信号为s(n),加窗后为:

实验三语音信号的特征提取最终实验报告

实验三语音信号的特征提取 一、实验目的 1、熟练运用MATLAB软件进行语音信号实验。 2、熟悉短时分析原理、MFCC、LPC的原理。 3、学习运用MATLAB编程进行MFCC、LPC的提取。 4、学会利用短时分析原理提取MFCC、LPC特征序列。 二、实验仪器设备及软件 HP D538、MATLAB 三、实验原理 1、MFCC 语音识别和说话人识别中,常用的语音特征是基于Mel频率的倒谱系数(即MFCC)。MFCC参数是将人耳的听觉感知特性和语音的产生机制相结合。 Mel频率可以用如下公式表示: ) 700 / 1 log( 2595f f Mel+ ? = 在实际应用中,MFCC倒谱系数计算过程如下; ①将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换并得到其频谱。 ②求出频谱平方,即能量谱,并用M个Mel带通滤波器进行滤波;由于每一个频带中 分量的作用在人耳中是叠加的。因此将每个滤波器频带内的能量进行叠加,这时第k 个滤波器输出功率谱) ('k x。 ③将每个滤波器的输出取对数,得到相应频带的对数功率谱;并进行反离散余弦变换, 得到L个MFCC系数,一般L取12~16个左右。MFCC系数为 ∑=- = M k M n k k x Cn 1 '] / )5.0 ( cos[ ) ( logπ,n=1,2,...,L ④将这种直接得到的MFCC特征作为静态特征,再将这种静态特征做一阶和二阶差分,得到相应的动态特征。 2、LPC 由于频率响应) (jw e H反映声道的频率响应和被分析信号的谱包络,因此用

|)(|log jw e H 做反傅里叶变换求出的LPC 倒谱系数。 通过线性预测分析得到的合成滤波器的系统函数为)1/(1)(1 ∑=--=p i i i z a z H ,其冲激响 应为h(n)。h(n)的倒谱为)(^ n h ,∑+∞ =-= 1 ^ ^ )()(n n z n h z H 就是说)(^z H 的逆变换)(^ n h 是存在的。 设0)0(^=h ,将式 ∑+∞ =-= 1 ^ ^ )()(n n z n h z H 两边同时对1 -z 求导,得 ∑∑+∞ =--=--??= -??1 ^ 1 1 1 1 )(]11 log[ n n p i i z n h z z a z 得到∑∑∑∞ +==-=+-+--= 1 1 1 1 1 ^ 1)(n p i i i p i i i n z a z ia z n h n ,于是有 ∑∑ ∑+∞ =+∞ =+-+-=-= -1 1 1 1 ^ 1 1 )()1(n n i i n p i i z ia z n h n z a 令其左右两边z 的各次幂前系数分别相等,得 到)(^ n h 和i a 间的递推关系 ?? ? ? ??? ?? >--=≤≤--+==∑∑=-=p i i n i i n p n n h a n i n h p n k n h a n i a n h a h 1^ ^11^ ^ 1 ^ ),1()1()(1),()1()()1( ,按其可直接从预测系数{i a }求得倒谱)(^ n h 。这个倒谱是根据线性预测模型得到的,又称为LPC 倒谱。LPC 倒谱由于利用线性预 测中声道系统函数H (z )的最小相位特性,因此避免了一般同态处理中求复对数的麻烦。 四、实验步骤及程序 1、MFCC (1)、实验步骤 ① 输入样本音频 ② 给样本音频预加重、分帧、加窗 ③ 将处理好的样本音频做傅里叶变换 ④ 进行Mel 频率滤波 ⑤ 进行Log 对数能量

DSP语音识别实验报告

DSP课程设计 实验报告 语音识别 院(系):电子信息工程学院自动化系 设计人员:李彬学号:07212072设计人员:宋淦泉学号:07212077 评语: 指导教师签字: 日期:

目录 一、设计任务书 1、实验概述 2、实验目的 二、设计内容 三、设计方案、算法原理说明 1、设计步骤 2、算法原理说明 四、程序设计、调试与结果分析 1、算法流程图 2、主程序 3、测试过程及结果分析 五、设计(安装)与调试的体会 1、编程及程序运行中遇到的问题及解决办法 2、本次实验的心得体会 六、参考文献

一、设计任务书 实验概述: 语言是人类特有的功能,声音是人类最常用的工具。通过语音传递信息是人类最重要最有效最常用和最方便的信息交换形式。语音信号是人类进行思想沟通和情感交流的最主要的途径。让计算机能听懂人类的语言,是自计算机诞生以来人类梦寐以求的想法。在本实验中,将针对DTW算法,实现对最简单的单音信号进行语音识别的问题。 语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(例如人在说话时的表情、手势等细微动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。 语音识别技术主要包括特征提取技术、模式匹配准则及模训练技术三个方面。此外,还涉及到语音识别单元的选取。 语音识别系统的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等多种学科领域,是一个多学科综合性研究领域。 语音识别系统的分类---根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统、连接字语音识别系统以及连续字语音识别系统。根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇

基于语音信号的说话人识别实验报告 李力

课程设计说明书 设计题目:基于语音信号的说话人识别专业:电子信息工程班级:2008-1 设计人李力 同组人:侯超、李源基、褚召旭李泽磊学号:200801100413 山东科技大学 2010年7月1日

摘要 语音是人类相互交流和通信最方便快捷的手段。如何高效地实现语音传输存储或通过语音实现人机交互,是语音信号处理领域中的重要研究课题。语音信号处理涉及数字信号处理、语音学、语言学、生理学、心理学、计算机科学以及模式识别、人工智能等诸多学科领域,是目前信息科学技术学科中发展最为迅速的一个领域。 关键字:语音识别、清音、浊音、短时平均能量、倒谱、短时平均过零率

目录 第一章绪论 (1) 1.1语音识别技术的发展历史…………………………………………………… 1.2语音识别研究的现况与难点…………………………………………………………第二章方案比较………………………………………………………………… 第三章软件介绍…………………………………………………………………… 3.1 Cool Edit Pro 2.1 3.2 MATLAB 介绍 第四章模块设计………………………………………………………………………………… 4.1语音端点检测…………………………………………………………………… 4.1.1 原理 4.1.2 源程序 4.2短时能量 4.2.1 用途 4.2.3 问题 4.2.3 解决方法 4.2.4 程序 4.3 短时平均过零率 4.3.1 原理 4.3.2 程序 4.4 短时平均过零率 4.5 倒谱 4.6主程序 4.7 实验结果 第五章设计中的问题 第六章收获与体会……………………………………………………………. 第七章参考文献……………………………………………………………… 第八章附录…………………………………………………………………

人脸识别系统-开放实验报告范文.doc

开放性实验报告 《人脸识别系统》 小组成员: 姓名李宏利 学号 109021075 指导老师:彭艳斌 2011 年12 月 【实验名称】人脸识别系统

【实验目的】 1.对人脸识别系统的图像预处理有一定的掌握; 2.对后续操作只简单了解; 3.通过功能模块实现人脸识别系统。 【实验内容】 1.系统需求分析; 2.系统设计; 3.系统实现。 【实验步骤】 一、系统需求分析 1、目的与背景 当前社会上频繁出现的入室偷盗、抢劫、伤人等案件的不断发生,鉴于此种原因,防盗门开始走进千家万户,给家庭带来安宁;然而,随着社会的发展,技术的进步,生活节奏的加速,消费水平的提高,人们对于家居的期望也越来越高,对便捷的要求也越来越迫切,基于传统的纯粹机械设计的防盗门,除了坚固耐用外,很难快速满足这些新兴的需求:便捷,开门记录等功能。 广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。

人脸识别 生物特征识别技术所研究的生物特征包括脸、指纹、手掌纹、虹膜、视网膜、声音(语音)、体形、个人习惯(例如敲击键盘的力度和频率、签字)等,相应的识别技术就有人脸识别、指纹识别、掌纹识别、虹膜识别、视网膜识别、语音识别(用语音识别可以进行身份识别,也可以进行语音内容的识别,只有前者属于生物特征识别技术)、体形识别、键盘敲击识别、签字识别等。人脸识别主要用于身份识别。由于视频监控正在快速普及,众多的视频监控应用迫切需要一种远距离、用户非配合状态下的快速身份识别技术,以求远距离快速确认人员身份,实现智能预警。人脸识别技术无疑是最佳的选择,采用快速人脸检测技术可以从监控视频图象中实时查找人脸,并与人脸数据库进行实时比对,从而实现快速身份识别

树莓派实验报告

实验名称:实验12-PIR传感器和语音识别实验 专业班级:姓名:学号:实验日期: 一、实验目的: (1)熟悉人体红外传感器、语音识别和文本转语音(TTS)。 (2)掌握在Windows 10 IoT Core中使用GPIO读取人体红外传感器输出的方法。 (3)掌握在Windows 10 IoT Core中使用SpeechRecognition和SpeechSynthesis进行语音识别和语音合成的方法。 二、实验内容: (1)将人体红外传感器PIR、LED灯分别连接到树莓派的GPIO5和GPIO6,运行程序12-1后,先点击初始化PIR按钮,若附近有人活动时,即程序检测到上升沿,指示的LED灯亮;没有人活动时,即程序检测到下降沿,LED灯熄灭,与应用程序界面上的状态同步。 如下图所示。 在实验12-1的基础上,使用树莓派、人体红外传感器PIR、LED灯、电阻、面包板和跳线,实现Security Camera。即检测到附近有人活动时,程序自动拍照,存储到本地。 (2)使用树莓派(IoT Core系统烧写版本为14986)、USB声卡、耳机、麦克风、LED灯、电阻、面包板和跳线,实现本地的语音合成和语音识别,从而达到控制LED灯的目的。 程序12-2给出了语音控制一个LED的场景,即使用语音turn on bedroom led或者turn off bedroom led来控制GPIO5引脚连接的LED灯。同时,可以在Visual Studio的Output 窗口看到语音识别的实时结果。如下图所示。 用户可以在应用程序界面输入文字,点击按钮,可以让系统读出该内容,如下图所示。 请在此基础上,添加LED灯,修改语音定义文件和程序,从而达到控制两个不同的LED 的功能。 三、实验结果(注意:所有截图需要加注自己的姓名+学号水印): 1. 利用Fritzing软件画出硬件连接图,给出实验内容1对应的所有关键代码,给出测 试结果和说明,附调试截图。

实验报告_基于GMM-HMM的语音识别

多媒体技术实验报告——基于GMM-HMM的语音识别 姓名: 学号: 2015年5 月24 日

目录 ——基于GMM-HMM的语音识别 (1) 一、马尔科夫初步概念理解 (3) (一)两个重要的图 (3) (二)问题:马尔科夫的开始状态如何确定? (4) 二、马尔科夫的三种问题,以及解法 (4) (一)解码, (4) 解法一:最大似然路径 (4) 解法二 : Viterbi algorithm (4) (二)已知A,B,根据骰子掷出的结果,求出掷出这个结果的 概率(模型检验) (6) 解法一:穷举 (6) 解法二:前向算法 (6) (三)知道骰子状态有几种,不知道A,知道B,观察到很多次 投骰子的结果(可见状态链),我想反推出A。 (6) 三、HMM算法使用条件 (6) (一)隐性状态的转移必须满足马尔可夫性 (6) (二)隐性状态必须能够大概被估计。 (6) 四、EM算法GMM(高斯混合模型)。 (7) (一)单高斯分布模型GSM (8) (三)样本分类已知情况下的GMM (9) (四)样本分类未知情况下的GMM (9) 五、HMM-GMM模型在语音识别中的应用 (11) (一)语言识别的过程 (11) (二)其中HMM与GMM的作用 (12)

六、实验结果 (12) (一)代码阅读以及注释 (12) (二)实验结果对比 (12) (三)与DTW结果对比 (13) (四)实验感想与收获.............................. 错误!未定义书签。 (五)困难与改进 .................................... 错误!未定义书签。 一、马尔科夫初步概念理解 (一)两个重要的图

数字语音处理实验报告

学院:信息与通信工程学院专业:通信工程 班级:通信144 学号:10 姓名:刘新雨 指导教师:崔艳秋

1.实验目的 观察并验证语音信号的时域特性,理解并掌握典型的语音信号时域分析方法和时域特征,为深入学习语音信号处理的各种应用奠定基础。 2.MATLAB程序代码 (1)由麦克风采集语音数据,将采集的数据存成WAV文件(采样率为8000Hz),存在本人的文件夹中。所用程序代码为: clear; close all; Fs=11025; y=wavrecord(5*Fs,Fs,'double'); wavwrite(y,'D:\\lxy'); soundview(y,Fs); (2)读取WAV文件,显示语音信号的波形。所用程序代码为: clear; close all; x = wavread('D:\\'); figure; plot(x); axis([0,size(x,1),,]); title('语音信号时域波形');xlabel('样点数'); ylabel('幅度'); (3)读取WAV文件,计算并显示语音的短时能量(窗函数为矩形窗,帧长为50,200,400,600)。所用程序代码为: clear; close all; x = wavread('d:\\'); x = double(x); f1= enframe(x,50, 50); energy1 = sum(abs(f1), 2); subplot(2,2,1);plot(energy1); title('语音信号的短时能量'); legend('帧长LEN =50'); f2= enframe(x,200, 200); energy2 = sum(abs(f2), 2); subplot(2,2,2);plot(energy2); title('语音信号的短时能量'); legend('帧长LEN = 200'); f3= enframe(x,400, 400); energy3 = sum(abs(f3), 2); subplot(2,2,3);plot(energy3); title('语音信号的短时能量'); legend('帧长LEN = 400');

相关文档