文档库 最新最全的文档下载
当前位置:文档库 › 基于DSP的实时语音处理系统的设计

基于DSP的实时语音处理系统的设计

基于DSP的实时语音处理系统的设计
基于DSP的实时语音处理系统的设计

目录

摘要 (Ⅲ)

ABSTRACT (Ⅳ)

1绪论

1.1语音处理研究状况 (1)

1.2语音处理的硬件基础和应用 (4)

2系统硬件部分概述

2.1 DSP系统设计概述 (6)

2.2 系统的总体构成 (7)

2.3 硬件系统核心芯片的选择 (8)

2.4 实时语音处理的基本要求 (9)

3设计部分

3.1 设计目的和要求 (10)

3.2 设计原理 (10)

3.3 设计内容 (11)

3.3.1 理论依据 (11)

3.3.2 信号特征分析 (11)

3.3.3 方案设计 (11)

3.3.4 方案论证 (12)

3.3.5 器件选型(硬件电路的设计) (13)

4 软件设计

4.1 DSP软件开发工具和编程特点 (25)

4.2 软件设计 (26)

4.3 DSP初始化 (27)

4.4 音频采集程序 (30)

4.5 TMS320VC5402的并行引导装载分析和设计 (32)

总结与致谢 (34)

参考文献 (35)

附录 (36)

摘要

提出一个基于TMS320VC5402的音频信号采集与处理系统。介绍了该系统的总体方案和硬软件设计。讨论了模/数(A/D)和数/模(D/A)转换电路的设计方法以及如何利用TMS320VC5402的多通道缓冲同步串口(McBSP)和PCM1800及PCM1744芯片接口来实现音频信号的采集和输出。实验证明:所设计的基于DSP的硬件和软件系统是一个很好的音频信号采集与处理系统。

关键词:多通道缓冲同步串口;音频信号;TMS320VC5402;采集与处理

DSP-based real-time voice processing system

Abstract

Abstract: A TMS320VC5402-based audio signal acquisition and processing system. Describes the general scheme of the system and the hardware and software design. Discussed the analog / digital (A / D) and digital / analog (D / A) converter circuit design and how to use TMS320VC5402 multi-channel synchronous serial port buffer (McBSP) and the PCM1800 and PCM1744 chip interface for audio signal acquisition and Output. Experimental results show: the designed DSP-based hardware and software system is a good audio signal acquisition and processing system.

Keywords: Simultaneous multi-channel buffered serial port;audio signal;TMS320VC5402;acquisition and processing

1 绪论

1.1语音处理的研究状况

语音是人类进行信息交流最直接、最方便、最有效的工具,语音信号是携带语音信息的语音声波。在信息化时代,人们也期望用这种最便捷的信息交流工具和各种信息存储、处理的设备和终端进行信息交互。语音信号处理研究如何能更加有效地产生、传输和获取语音信息的一门学科。它涉及数字信号处理、语言学、语音学,生理学、心理学、模式识别以及人工智能等多个学科的知识,是信息技术学科中发展最为迅速的一个领域。语音信号处理内容非常广泛,它包含语音识别语音合成,此外还有语音压缩编码、语音理解、说话人识别、语音增强等各个分支,总的来说语音信号处理包含了语音信号的数字表示方法,语音信号处理的各种方法和技术以及语音处理理论和技术在各个领域中的实际应用。

语音信号的处理最早可以追溯到1874年电话的发明,电话的理论基础是尽可能不失真地传送语音波形。直到1939年Dudley发明声码器,通道声码器技术取代了“波形原则”的处理方法,它的理论基础认为语音是由人的声带振动产生的声源(载波)受到不断变化的声道的控制(调制)而产生的,这一概念就是以后迅速发展起来,并广泛应用到各种理论研究和应用实际过程中的语音参数模型的雏形,由此人们开始了语音合成和语音压缩编码的研究。上个世纪60年代中期数字信号处理的方法和技术取得突破性进展,主要是快速傅立叶变换算法的成功应用。出现了第一台以数字计算机为基础的孤立词语音识别器,随后又成功研制出第一台有限连续语音识别器。70年代初,Flanagan出版的重要著作《语音分析合成和感知》,奠定了数字语音处理的系统理论基础。与此同时,倒谱分析技术和线性预测技术在语音处理中得到成功应用,微电子和集成电路技术取得新的进展,高性价比的微处理器芯片和性能优异的专用信号处理芯片不断问世,再次推动了

语音信号处理技术的发展和应用。

语音识别ASR以语音为研究对象,它是语音信号处理的一个重要研究领域,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终日标是实现人与机器进行自然语言通信,让人机交互界面更加自然和容易使用。语音识别是语音处理中的难点,对它的研究开始的比较晚,但它的一些研究方法和结果可以运用到另外的研究分支中去,因此也是语音处理研究中的重点。1952年

贝尔实验室的Davis等人首次研制成功能识别十个英语数字的特定人孤立数字识别系统,该系统的成功研制标志着人们开始语音识别的研究工作。此后很长的时间里,语音识别的研究方法主要是用特殊的硬件获取语音信号的特征参数,再在计算机上进行模板匹配和判决,由于受当时计算机技术和信息处理理论的限制,语音识别一直未取得突破性进展。直到上个世纪70年代,动态时间归正技术(DTW)算法、线性预测分析技术(LPC)理论、LPC频谱分析、隐马尔可夫模型(HMM)、人工神经元网络(ANN)、矢量量化(V-Q)等理论,并在语音识别中成功运用,开创了语音识别研究的新局面,语音识别系统的识别率得到了显著的提高。此后语音识别系统由原来的特定人小词汇量孤立词的系统发展到能进行非特定人、大词汇量、连续语音识别。1988年美国卡内基-梅隆大学运用VQ 和HMM技术研制出了非特定人、大词汇量、连续语音识别系统.SPHINX系统,它可以理解由1000个单词构成的4200个句子,是语音识别历史的一个里程碑。

我国语音识别理论研究和应用起步较晚,但由于汉语具有音节种类较少的特点,汉语是单音节语言,汉语中音节数只有400个,加上音调才1200个,词是由音节组合成,便予以音节识别为基础实现大词汇的语音识别,因此,进展较快。清华大学、中国科学院声学所和西安电子科技大学相继成功研制出无限词汇的汉语听写机。四达公司在90年代初推出首批汉语听写机之后,与哈尔滨工业大学合作研制出具有自然理解能力的新产品。模识科技公司PattekASR中文语音识别产品,它面向不同计算平台和应用,具有国际先进水准,是我国第一个拥有完全自主知识产权的语音识别技术产品。模识科技公司此次推出的产品具有识别率高、对环境噪声和不同口音适应能力强、系统占用资源少等特点,PattekASR 对方言的识别率在95%以上。只要对现有的手机、家电、电话总机稍作改装,就可以用语音命令上网查阅资料、控制电视、接通电话分机,国外一些著名的大公司纷纷加大对汉语语音识别研究的投入。

进入上个世纪90年代,随着多媒体时代的来临,语音识别系统由实验室走向实用。许多发达国家和一些公司如美国、日本、韩国以及IBM、Apple、AT&T、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资,其中语音识别软件的发展最为迅速。语音识别软件是语音识别理论和计算机技术相结合的产物。IBM公司于1997年开发汉语Via Voice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统Via Voice‘98,平均识别率可达到95%。该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统。IBM宣布,为增强网络浏览和语音电子邮件的功能,将推出其新一代语音识别软件。可使用户通过语音,而不是使用键盘来浏览网络、切换应用程序、执行命令、口授邮件和文本文件等操作。Microsoft

也在语音识别研究领域进行了投资,其开发的windows xp语音识别技术,可以在包括word在内的所有应用程序的文本信息的区域——记事本、Internet Explorer地址栏和Outlook Express ——内使用口述输入方式,来替代传统的键盘、鼠标按钮输入方式。Speech Work公司的代表产品SpeechWork6,利用该产品,用户可以在没服务人员介入的情况下,用自然语言同系统进行信息交互.完成诸如旅游预约、股票交易、银行服务、订票服务等。市场上还出现了语音识别电话、语音识别记事本等产品,如美国VPTC 公司的Voice Organizer和法国的Parrot等。

语音合成是最早被研究的语音处理分支,它研究的主要内容是让人们通过听觉来获取以其他形式表示的信息。最早的语音合成是用机械的方式模拟人的发声过程而产生声音。1939年Dudley发明的声码器,用电子线路产生语音的声源,并构成滤波器模拟声道的滤波作用。现代的语音合成都是基于计算机技术的语音处理过程。由D.Klatt设计的串、并联混合,是语音合成研究中最具代表性的工作。20世纪90年代末,日本的一些研究学者提出一种少样本、不等长语音拼接合成技术—PS0LA,该方法来源于利用短时傅立叶变换重构信号的叠接相加法。当前汉语语音合成系统中,合成效果较好的都是采用波形拼接的合成技术,文本--语音转换系统(TTS)是语音合成的一个重要应用形式。语音合成的应用领域十分广泛,如:自动报警、报时、车站机场广播、电话查询业务以及各种电子出版物的语音朗读等。

语音压缩编码是伴随语音的数字化而产生的,它的研究和语音合成一样起源于1939年Dudley发明的声码器,若简单地由连续语音信号抽样量化得到的数字语音信号传输和存储,就会占用太多的信道资源和存储空间。研究表明语音信号中含有大量的冗余信息,如何采用各种编码技术,在保证尽量少的失真并具有一定的可懂度和自然度的情况下,减少语音信号的冗余度,成为语音压缩编码的主要内容。最早研究和使用的编码方法是不依赖语音产生模型假定,以PCM和ADPCM为代表的波形编码技术,它的编码数率较高,一般在16kb/s~64kb/s,具有语音音质高、抗躁能力强的特点。1974年,LPC 编码首次用于分组语音通信,传输数率达到3.5kb/s,实现了低速的编码。一些以LPC 以及由其改进和演变的混合编码为代表的基于模型假定的编码方法,可以更大程度上减少语音信号的冗余度,使低速率传输、存储语音信息成为可能。美国在1980年公布了一种2.4kb/s的线性预测编码技术后,于1988年又公布一个4.8kb/s的码激励线性预测编码(CELP)语音编码算法,随后欧洲也推出了16kb/s的规则脉冲激励(RELP)线性预测编码算法。这些语音编码算法具有较好的可懂度和自然度。随着对低速率语音编码算法研究的深入和计算机网络技术的迅速发展,语音信号经过压缩后在互联网上以数据

包的形式传输,就形成了IP电话,它用VOIP技术实现的通过TCP/IP网络以不同于传统的电话网来传输语音信号。由此衍生出在网络环境下的语音识别和语音压缩编码,成为语音处理新的发展方向。20世纪90年代,针对不同的应用,国际电联和一些地区标准协会制定一系列语音压缩编码标准,如数码率为5.3-6.4kb/s的G.723.1,以及数码率为8kb/s的G.729.等,这些标准的制订保证了应用在通信网中的各种语音编码具有良好的兼容性。

语音处理的研究取得很大的成绩,一些应用也取得突破性的进展,有很多有关的研究成果已实现商品化生产并投放市场,取得较好的经济效益和社会效益。一些信息科学中的新出现的理论和处理方法引入语音处理的研究中,如小波分析、分形理论以及语音信号的非线性处理方法。由于语音本身和应用环境的复杂多变,语音处理系统的性能还是有很多不尽人意的地方,用它来解决实际问题还是有很多困难,如无限词汇汉语合成中连续语流中各基音轮廓的平滑过渡问题,语音识别系统的适应性差,主要体现在对环境依赖性强,高噪声环境下语音处理的进展缓慢。

1.2语音处理的硬件基础和应用

绝大多数语音信号数字处理系统有很高的实时性要求,要对输入的语音信号做出快速的反应,因此系统工作在实时方式(在线方式)下,就对系统所采用硬件的性能要求很高,包括处理速度和存储容量等。语音处理所要完成的任务越来越复杂,处理效果的要求不断提高,语音处理算法也随之日益复杂,它会要求语音处理器件以及其辅助器件在几十个毫秒或更短的时间内处理、存储大量的语音数据。需要语音处理器的运算速度达到10—20MIPS,在应用中会根据任务的要求不同处理速度甚至要达到50MIPS。语音识别与合成等领域对处理系统的内存容量往往要求达到若干MB。实时语音信号数字处理系统通常以两种方式实现:第一种是用一台计算机作为主机,插上一块或若干块数字信号处理板来构成,后者由通用或专用的数字信号处理器芯片(DSP芯片)及相应的存储芯片、接口芯片和语音信号的转换芯片组成。第二种则由专用或通用的DSP芯片及其它辅助芯片构成一个独立工作的系统。前者通常称为非脱机工作系统,用于语音识别、合成、增强或模拟实验中。后者称为脱机工作系统,用于编码、小词汇表识别与合成等场合。通用DSP芯片的出现及其性能价格比的迅速提高为各种实用化语音信号处理系统的应用实现提供了硬件基础。自从1980年以来,DSP芯片得到了迅猛发展,很多运算速度达到几MIPS。生产DSP芯片的公司有80多家,其中以美国的TI公司为代表,出产了一系列种类齐全可用于不同行业的DSP芯片,一些型号的芯片的运算速度和功能完全满足实时语音信号处理的要求,本文在硬件系统中采用TI公司的TMS320VC5402通用DSP

处理芯片。

随着微电子集成技术的发展,很多公司相继研制出了专用的语音处理芯片。语音处理芯片外接一些控制器,构成一个语音处理系统就可完成特定的语音处理任务。如TI 公司、Votrax公司、ISD公司等生产的语音存储与再生芯片,以ISD 公司的ISD系列芯片为代表。语音合成芯片有TI公司的TMS5220,语音识别芯片有东芝公司的T6658A,语音编码芯片有Digital Voice System.1nc推出的AMBE-1000以及美国国家半导体公司生产的CMX639。

2 系统硬件部分概述

本章首先对DSP系统进行介绍,围绕以TMS320C5402为核心,给出一个DSP系统硬件部分的设计方案,重点分析了系统各组成模块的功能,给出了具体实现方法。

2.1 DSP系统设计概述

一个数字信号处理系统是电子技术、信号处理技术与计算机技术相结合的产物。其设计通常分为两个方面的内容:信号处理部分和非信号处理部分。信号处理部分包括系统的输入和输出、数据的编排和处理、各种算法的实现、数据结果的显示和传输等;非信号处理部分包括电源、硬件结构、成本、体积、可靠性和可维护性等。一个应用系统的设计大致可分为7个部分:

(1)确定系统性能指标

(2)信号分析

(3)核心算法模拟与验证

(4) DSP芯片和系统外围器件的选型

(5)硬件设计和调试

(6)软件设计和调试

(7)系统集成与测试

下面对每个部分的内容给予简要的说明:

(1)确定系统性能指标:它主要根据用户对应用系统的要求,给出系统级的技术要求和相关说明。这些要求和说明包括处理的项目和方式、处理系统的所有性能指标(包含系统非信号处理的性能)以及系统的测试和验证方式等。

(2)信号分析:这部分主要定义输入/输出信号的类型,即将分析的信号是随机或确定信号,模拟信号或数字信号,是一维还是多维信号。分析信号的频率范围和系统的带宽,估计信号的最大和最小电平,是否需要进行预处理。确定输出信号使用的方式、数据的吞吐率和对实时性的要求。信号分析的结果是进行信号处理算法设计的基础。(3)核心算法模拟和验证:在这部分依据第1部分提出的要求和第2部分对信号分析的结果,对不同类型的信号和要求的处理方式确定相应的算法。在编写信号处理算法时,首先可利用一些软件如MATLAB,对其进行仿真计算,保证算法的正确性,还要结合系统的硬件资源考虑这些算法程序的可行性,如系统的处理能力、存储容量、工作速度等。

(4)DSP芯片和系统外围器件的选型:在选择系统所要用到的器件前,需要先分析系统

数据吞吐率、存储容量以及输入/输出带宽,它们决定了系统使用的主控处理器和一些外围器件,如DSP芯片的处理速率、和外围器件进行数据交互的速率、存储器空间的大小,扩展存储器件的工作速度和容量等,根据分析的结果选择满足系统性能要求的DSP 芯片、信号转换芯片、逻辑控制器件和接口以及外部扩展存储器芯片。

(5)硬件设计和调试;硬件设计主要包括数据和程序存储器的配置、数据交互通道的设计、控制和显示电路设计、电源转换电路设计和其他外围扩展器件的硬件接口电路设计。以DSP芯片为核心的信号处理系统,可分成2大类。一类是DSP器件处从属地位,受主机控制,主要完成数据的处理并将结果返回给主机工作。另一类是系统在上电后独立运行自成一个系统,系统所有的控制和处理工作都由DSP器件完成。这类系统利用了DSP 器件的自举引导功能,将存储在外部的存储芯片的控制和处理程序引导加载到DSP的程序空间,使系统按预定方式工作。系统的硬件设计是软件设计的基础。

(6)软件设计与调试:用DSP汇编语言或C语言或两者混合使用编写系统和各种应用程序,软件设计包括系统软件和信号处理(一般应用)软件。系统软件根据实际需要可包括系统控制软件、人机接口、数据输入,输出管理以及和主机的接口等。信号处理软件主要是编写一些信号处理算法的程序,完成特定的处理功能。DSP系统和主机的接口主要用高级语言编写。软件设计和初步的调试是结合一些开发工具和开发环境来完成的。大多数DSP器件都提供了完善的开发环境,CCS(Code Composef Studio)是本次设计中所用到的DSP开发环境,它是一种TI公司推出的为开发TMS320 系列DSP系统的集成开发环境。

(7)系统集成与测试:完成上述工作,就剩系统的集成和实际的功能测试。DSP系统,涉及到电子电路、各种硬件和软件等各个方面,设计的系统能否达到预期的要求还有待实际测试和检验

典型的DSP系统它的输入信号可以是电信号、声音信号、物理信号、化学信

号、连续信号、数字信号、强信号、弱信号。在前向通道中,经过滤波和采样,

然后通过A/D信号变换成为数字比特流。根据香浓采样定律,采样频率至少必须

是输入信号最低频率2倍。

DSP芯片系统可由一个DSP处理器和外围总线组成,也可以由多个DSP处理器组成,这完全取决于DSP处理器的要求。DSP芯片系统的主要任务是将前向通道输出的信号按照一定的算法进行处理,然后将处理的结果以数据流的形式输给后向通道。

2.2 系统的总体构成

声音信号经A/D转换器采样变成PCM数据,由串口输入DSP芯片内按语言处理算

法高速处理。处理结果可由LCD显示出来,或输入到D/A转换器中转换成模拟信号,经出扬声器还原成声音信号。为了适合处理,在语音信号处理之前,先对输入的语音信号进行放大。DSP芯片构成本系统的控制和处理核心,由它来协调各功能模块的工作,利用其快速的运算能力完成语音信号的运算。考虑到需要存放语音处理数据和程序,有必要扩充存储器。用闪速存储器存放语音处理程序和主控制程序。用CPLD实现系统的逻辑控制和DSP芯片的I/O空间的扩展。

2.3硬件系统核心芯片的选择

本系统采用了TI公司于1999年10月推出的一款定点数字信号处理器TMS320C5402,作为系统的主控芯片。美国德州仪器(11)公司子1982年推出通用可编程DSP芯片以来,DSP技术获得突破性发展,已从最初只用于实时大数据量的处理,发展到其应用已覆盖全球各行各业。近年来,随着低价格、高性能DSP 芯片的出现,DSP已越来越多地被应用于高速信号采集、语音处理、图像分析处理等领域中,并且其优越性日益突显。当前业界中应用最广泛的是TI公司的TMS320系列的DSP芯片,其中TMS320VC5402(简称VC5402) ,主要的特点如下:操作速率达100MIPS,单周期指令执行时间是IOms;具有先进的多总线结构,三条16位的数据存储器总线和一条20位的程序存储器总线;40位算术逻辑单元(ALU),包括一个40位桶形移位器和两个40位累加器;一个17x17乘法器和一个40位专用加法器,允许16位带/不带符号的乘法;单周期正规化及指数译码;8个辅助寄存器及一个软件栈,允许使用业界最先进的C语言编译器;数据/程序寻址空间分别为64K×16bit,1Mxl6bit,内置4Kxl6bit ROM和16Kxl6bit RAM,64K×16bit的I/O空间寻址能力;内置可编程等待状态发生器、锁相环(PLL) 时钟产生器、两个多通道缓冲串行口、一个8位并行与外部处理器通信的HPI口、2个16位定时器以及6通道DMA控制器;低功耗,工作电源有3.3v(I/O)和1.8v (内核),O.32MW/MIPS,特别适合电池供电设备。

与TMS320C54X系列的其他芯片相比,它以其独有的运算速度快、低功耗、和高性价比的特点。已在无线调制解调器、机顶盒、下一代个人数字助理、集群电话、局域网电话、各种语音应用等单信道通信客服终端,个人移动通信、信号与信息处理以及自动控制等领域得到了广泛的应用。

VC5402有访问64K×16bit的数据空间、I/O空间以及1M×16bit的程序空间的能力,其内部自带有一定数量的物理存储空间,有16KXl6bit的片内RAM和4Kx 16bit的ROM,对于经常要用到的程序和数据可在系统上电之初由自举引导程序加载放到片内的RAM存储区,提高系统运行速度。DSP对(片内、片外)物理存储器的访问都是通过访问

映射存储器来实现的,DSP的映射存储器分为程序区、数据区和I/O区三个区域。I/O区,一般是和片外资源联系在一起才能建立起来,数据区可由片内或片外存储器映射构成。DSP的映射存储器代表了DSP芯片的寻址能力和可访问空间的大小,在没对这些映射存储器配置前,映射存储空间是虚拟的,物理存储器也不可访问。物理存储器和存储空间区域的映射关系的建立,主要通过VC5402的管脚MP/MC、处理器模式状态寄存器PMST的OⅥ位和DROM位,并配合存储器配置文件完成的。

2.4实时语音处理的基本要求

(1)适合乘加操作的算术逻辑单元

(2)高效率的算法代码和执行硬件

(3)方便快捷的并行存储结构

(4)便利的片内外部设备和通用接口

3 设计部分

3.1设计目的和要求

3.1.1 输入信号为2路语音信号,要求系统能对2路输入信号进行实时采集、数字化处理、压缩、存储(录音),要保证一定的录音质量,录音时间不少于10小时。

3.1.2 根据已知参数对输入信号特征进行分析、需求分析,采用DSP作为控制器,设计实时语音处理系统。

3.1.3 选择确定DSP芯片型号、语音采集芯片型号,完成系统硬件设计。实现对语音信号的实时采集,处理(压缩,编码等)。

3.1.4 给出实时语音处理系统的设计方案,并对所设计的控制程序进行详细说明和描述。

3.2设计原理

近年来,随着DSP技术的普及和低价格、高性能DSP芯片的出现,DSP已越来越多地被广大的工程师所接受,并越来越广泛地被应用于各个领域,例如:语音处理、图像处理、模式识别及工业控制等,并且已日益显示出其巨大的优越性。DSP是利用专门或通用的数字信号处理芯片,以数字计算的方法对信号进行处理,具有处理速度快、灵活、精确、抗干扰能力强、体积小及可靠性高等优点,满足了对信号快速、精确、实时处理及控制的要求。对实时数字信号处理的应用需求和超大规模集成电路技术水平的飞速发展,推动着DSP性能不断提高。DSP是一种专用的数字信号处理器。随着超大规模集成电路技术上取得的突破进展,高度集成化的DSP数字信号处理器具有体积小、功耗低和运算速度快等诸多优点,因此非常适用于语音信号的压缩处理。基于DSP的实时语音处理系统,它具有可选择的信号采样速率和高性能的数字信号处理能力,不仅可以用来对立体音频信号进行实时编解码处理,还可以用来作为高速的实时信号采集与处理板使用。它包括多路语音实时采集,压缩处理,存储功能等基本功能。

实时语音处理系统中,由于语音的数据量大,运算复杂,对处理器性能提出了很高的要求,适于采用高速DSP实现。虽然DSP提供了高速和灵活的硬件设计,但是在实时处理系统中,还需结合DSP器件的结构及工作方式,针对语音处理的特点,对软件进行反复优化,以缩短识别时间,满足实时的需求。因此如何对DSP进行优化编程,解决算法的复杂性和硬件存储容量及速度之间的矛盾,成为实现系统性能的关键。

3.3设计内容

3.3.1理论依据

根据设计要求中的要点,所要设计的基于DSP的实时语音处理系统功能是,它能同时输入至少两路音频信号,而且能够对两路输入信号进行实时采集并将模拟信号数字化,然后对信号进行数字信号处理,并能够根据要求存储不少于10小时的录音,最后输出音频信号。那么在设计系统过程中,为满足要求要有信号采集,模/数及数/模转换,数字信号处理部分,包括数据压缩等,电源电路,复位电路,时钟电路。

3.3.2信号特征分析

音频信号经过高精度高速的ADC转换后得到一串数字信号,分帧输入到波形输入缓冲区RAM。然后由手动控制一种或几种处理算法将音频信号调入TMS320C5402的内部进行高速运算。经过处理的音频信号,再输入到高精度高速的DAC转换器中,还原成模拟的声音信号,经音箱功率放大电路放大输出。

3.3.3方案设计

系统结构框图:

输入信号:2路语音信号。音频系统应该具有较宽的动态范围,选择8-16位放大

信号能完全捕获或恢复高保真的音频信号。系统的核心芯片(DSP)选用美国TI公司的

TMS320VC5402[1](以下简称'C5402)。

DSP芯片模块是整个实时语音处理系统的核心部分,它对经数字化的信号进行压缩,编解码等。

框图分析:模拟音频信号输入,经过放大,滤波之后,由A/D转换器转换后得到一串数字信号,由手动控制或几种处理算法将音频信号调入DSP芯片的内部高速运算。经过处理的音频信号,再输入到高精度高速的D/A转换器中,经过滤波放大,还原成模拟的声音信号,经音箱功率放大电路放大输出。系统中各模块是同时进行处理,一部分信号正在A/D转换器进行转换,而另一部分信号则在DSP处理器中同时进行算法处理,即整个系统是以流水线的方式进行工作的。

框图各模块功能分析:

(1)语音信号:输入2路语音信号(8-16位放大信号,要去能完全捕获或恢复高保真的音频信号)

(2)音频信号放大:经放大电路放大输入的语音信号

(3)A/D转换器:放大后的音频信号在滤波之后由A/D转换器转换为一串数字信号

(4)DAP芯片处理器:系统的核心芯片(DSP)选用美国TI公司的TMS320VC5402。是整个实时语音处理系统的核心部分,它对经数字化的信号进行压缩,编解码。在其内部进行高速运算,处理

(5)D/A转换器:由DSP芯片处理好的信号由D/A转换器进行转换,经滤波输入到音频信号放大器

(6)音频处理程序存储区EPROM:存储音频处理程序

(7)音量、音效等的选择、控制:选择适当的音量、音效的控制方法

(8)功率放大电路模拟音频信号输出:还原成的模拟声音信号,经音箱功率放大电路放大输出

(9)电源模块;为内部芯片及周边系统电路提供能量来源

(10)复位电路:确保此方案的电路稳定工作,复位电路必不可少。功能:上电复位

3.3.4方案论证

本设计的系统采用DSP芯片作为控制器,要求输入信号为2路语音信号,保证一定的录音质量,录音时间不少于10小时,实现对语音信号的实时采集、处理(压缩,

编码)等,编写DSP控制程序,实现对语音信号的实时。

具体实现过程:首先,模拟音频信号输入,经过放大滤波之后,由A/D转换器转换后得到一串数字信号,由手动控制或几种处理算法将音频信号调入DSP芯片的内部高速运算。经过处理的音频信号,再输入到高精度高速的D/A转换器中,经过滤波放大还原成模拟的声音信号,经音箱功率放大电路放大输出。

DSP芯片采用美国TI公司的TMS320VC5402作为核心芯片,复位电路所用芯片为74HC14.

软件设计主要包括DSP编程和PC编程。DSP编程主要任务是初始化。管理板上的资源和完成音频的处理算法。PC编程则是管理DSP操作和应用层软件的编写。语音的传输过程涉及到了采样、编码、分割、压缩、打包、传送、重组、合成、回放等处理,每种处理都需要相关的设备和具体的应用程序,每种处理涉及到的语音数据形式不尽相同。语音信号的输出和存储是语音信号的基本要求。对语音信号的传输,希望是传输的速度尽量快,传输质量尽量高;对语音信号的存储,希望存储的空间尽量小,存储的信息尽量多。语音信号具有信号频谱较全、采样速率较低、随机性强、应用场合多、实时性要求高等特点。语音信号的处理包括信号采集、处理、存储和播放这一系列的处理过程。其中,语音信号的采集、传输和播放属于对语音信号的控制,其处理过程满足一定的标准操作即可;而语音信号的处理和存储与应用对象有很大的联系,不同的应用对象所要求的处理算法和存储算法不同。

3.3.5 器件选型(硬件电路的设计)

高保真的音频系统应具有较宽的动态范围。选择8-16位的A/D,D/A能完全捕获或恢复高保真的音频信号。

系统的核心芯片(DSP)选用美国TI公司的TMS320VC5402(以下简称C5402)。(1)DSP芯片:

作为DSP家族高性价比代表的16位定点DSP芯片,C5402适用于语音通信等实时嵌入应用场合。与其它C54X芯片一样,C5402具有高度灵活的可操作性和高速的处理能力。其性能特点如下:操作速率可达100MIPS;具有先进的多总线结构,三条16位数据存储器总线和一条程序存储器总线;40位算术逻辑单元(ALU),包括一个40位桶形移位器和两个40位累加器;一个17×17乘法器和一个40位专用加法器,允许16位带/不带符号的乘法;整合维特比加速器,用于提高维特比编译码的速度;单周期正规化及指数译码;8个辅助寄存器及一个软件栈,允许使用业界最先进的定点DSP C语言

编译器;数据/程序寻址空间为1M×16bit,内置4K×16bit ROM和16k×16bit RAM;内置可编程等待状态发生器、锁相环(PLL)时钟产生器、两个多通道缓冲串口、一个与外部处理器通信的8位并行HPI口、两个16位定时器以及6通道DMA控制器且低功耗。与C54X系列的其它芯片相比,5402具有高性能、低功耗和低价格等特点。它采用6级流水线,且当RPT(重复指令)时,一些多周期的指令就变成了单周期的指令;芯片内部RAM和ROM可根据PMST寄存器中的OVLY和DROM位灵活设置。这些都有利于算法的优化。

C5402采用3.3V和1.8V电源供电,其中I/O采用3.3V电源供电,芯片的核采用1.8V电源供电。而实际常用的只有5V电源,所以必须采用电源转换芯片。选用TPS7301和TPS7333两块电源转换芯片(它们都是TI公司为配合DSP而设计的电源转换芯片),分别接上适当的外围电阻,构成电阻分压器,即可调整两块芯片的输出电压分别为3.3V 和1.8V。

(2)音频转换模块(音频信号放大)

音频放大电路是本模块也是系统的前端单元电路。本模块用到了运算放大器TLC2272芯片和音频功率放大芯片LM386分别对音频信号做输入放大,输出放大,再经音频转换芯片TLCAD50的高精度高速ADC转换后得到一串数字信号,输入到TMS320VC5402中,在系统内部由各种处理算法将录进的音频信号进行快速的运算和处理。经过处理的数字音频信号,再输入到高精度高速的DAC转换器中,还原成模拟的声音信号,经音频功率放大电路放大输出。外界模拟的音频信号经过音频转换模块后,变成易于DSP、SCM和PC机处理的数字信号。

1)TLC2272

TLC2272芯片内部具有双放大器,双运放可以级连应用,也可以划分为两个独立的应用单元。TLC227X系列提供了2MHz带宽的应用范围,与现在的大部分CMOS工艺的运放相比,TLC2272具有更好的低噪音特性、输入偏差电压、能耗。该芯片具有高的输入阻抗,在对放大高阻抗的微弱信号时,表现出的更好的性能。由于该芯片是微电压低能耗器件,使得该芯片在手持设备和远程遥感方面应用的计较多。

2)LM386

LM386是美国国家半导体公司生产的音频功率放大器,该芯片适合应用在低电压、低功耗系统中的低电压消费类产品。为使外围元件最少,电压增益内置为20。只需在1脚和8脚之间增加一只外接电阻和电容,便可将电压增益调为20-200间的任意值,低失真度。广泛应用于无线电放大、手持式音频播放器放大电路、对讲机、电视系统、线

性驱动器、小的伺服系统驱动、功率转换等领域。

3)TLC320AD50

本系统用到TLC320AD50,它内部集成了A/D和D/A转换通道,彼此独立工作,使得系统的ADC和DAC可以同时进行,提高了系统的集成度。一部分信号正在A/D通道中进行ADC转换,而另一部分信号则在DSP处理器中同时进行算法处理,已经处理的信号在D/A通道里进行DAC转换,整个系统是流水线的方式进行工作。TLC320AD50(AD50)是TI公司推出的一款将A/D和D/A转换功能集合在一起的16位、音频范围(2K-22.05KHz)、内含抗混叠滤波器和重构滤波器的模拟转换接口芯片,它有一个能与DSP芯片相连的同步串行通信接口。片内还包括一个定时器(调整采样率和帧同步延时)和7个控制寄存器,用户可以根据需要对各个寄存器写控制字来设置它的工作方式(调整采用频率,滤波器带宽,数据格式,编程放大增益,锁相环PLL)。AD50体积较小,适应于便携设备。可为其模拟部分和数字部分分别配置5V和3.3V的电源,工作时的最大功耗为120mW。

AD50有两种方式可供选择,M/S(主、从设备选择信号)引脚的电平低电平时,AD50工作在设备方式下,FS(帧同步信号)和SCLK(移位时钟信号)为输入信号,由与之相连的主设备给出。当M/S引脚为高电平时,AD50工作在主设备方式下,FS和SCLK为输出信号,由AD50给出。通常AD50外接有源时钟源,将其设置在主设备工作方式下,AD50与VC5402的多通道缓冲串口(McBSP)进行串行通信的控制信号FS和SCLK由AD50提供,McBSP作为AD50的从设备,工作在从方式下。

AD50会传输两种不同性质的数据信息,即一般的ADC、DAC数据信息和设置寄存器的控制信息,设置了两种通信模式,主通信模式和辅助通信模式(二次通信)。主通信主要用于ADC、DAC数据传输,辅助通信模式用于读出、写入控制寄存器中的控制信息。大多数的时间工作在AD50主通信模式下,但是对AD50进行初始化时,它必须工作在辅助通信模式下。可由硬件或软件方式产生辅助通信模式请求的信号,当用于产生硬件辅助通信请求信号的引脚FC为高电平时,表示在紧随这次通信之后下一帧数据将采用辅助通信模式进行数据传输,这称为硬件请求辅助通信。外部器件(VC5402)可通过将输送到DIN的数据的最后一位(D0)置1,表示在紧随这次通信之后下一帧数据采用辅助通信模式进行数据传输,以此产生软件辅助通信请求信号。当AD50采用软件的方式来产生辅助通信请求信号时,D0作为软件辅助通信请求信号,是一个特殊的控制位,剩余的高15位用来传输ADC、DAC数据,即AD50用软件的方式来产生辅助通信请求信号时,采用15+1的数据格式传输数据。D0在不同的数据流向时,代表不同的含义。

接受数据,即数据从DIN输入到AD50,D0可表示下次通信是否为辅助通信,数据采用15+1的数据格式:而发送数据,即从DOUT输出数据,数据的最低位(D0)可表示当前的数据是来自主设备还是从设备,若主控器件只带一个AD50不分主从设备时,就将ADC 数据设置成16比特的数据格式。AD50同VC5402的多通道缓冲串口0连接,M/S#经10K 的电阻接到+3.3V,AD50工作在主机模式,提供SCLK(数据移位时钟)和FS#(帧同步脉冲)。VC5402的McBSP0工作在从机模式,BCLKX(R)0和BFSX(R)0要配置成输入引脚,接受外部AD50提供的移位脉冲和帧同步脉冲,以完成McBSP0和AD50间的串行数据的通信。AD50和DSP连接示意图如图所示。

AD50有四个用户可编程的控制寄存器,每个都是16位的。当DSP对AD50写控制是将要读、写的控制信息,如下表所示。为了简化硬件设计,将FC管脚接地,用软件的方式产生辅助通信的请求信号,则DAC数据的数据格式,一种是15+1位的形式,传送DAC数据或DSP对它的控制字。D0如前所述表示下一帧DSP传送给AD50数据的控制信息还是DAC数据。辅助通信用于DSP通过McBSP0对AD50进行初始化。本系统中,AD50工作在主机模式下,由外部的8.192MHz有源晶振提供AD50的工作时钟,采样频率为8KHz,选用15+1的数据格式DSP的McBSP0作为它的从机设备。

数字信号处理 语音信号分析与处理及其MATLAB实现..

摘要 (2) 1 设计目的与要求 (3) 2 设计步骤 (4) 3 设计原理及内容 (5) 3.1 理论依据 (5) 3.2 信号采集 (6) 3.3 构造受干扰信号并对其FFT频谱分析 (8) 3.4 数字滤波器设计 (9) 3.5 信号处理 (10) 总结 (12) 致谢 (13) 参考文献 (14)

用MATLAB对语音信号进行分析与处理,采集语音信号后,在MATLAB软件平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。 数字滤波器是数字信号处理的基础,用来对信号进行过滤、检测和参数估计等处理。IIR数字滤波器最大的优点是给定一组指标时,它的阶数要比相同组的FIR滤波器的低的多。信号处理中和频谱分析最为密切的理论基础是傅立叶变换(FT)。离散傅立叶变换(DFT)和数字滤波是数字信号处理的最基本内容。 关键词:MATLAB;语音信号;加入噪声;滤波器;滤波

1. 设计目的与要求 (1)待处理的语音信号是一个在20Hz~20kHz频段的低频信号 (2)要求MATLAB对语音信号进行分析和处理,采集语音信号后,在MATLAB平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器进行滤除噪声,恢复原信号。

2. 设计步骤 (1)选择一个语音信号或者自己录制一段语音文件作为分析对象; (2)对语音信号进行采样,并对语音信号进行FFT频谱分析,画出信号的时域波形图和频谱图; (3)利用MATLAB自带的随机函数产生噪声加入到语音信号中,对语音信号进行回放,对其进行FFT频谱分析; (4)设计合适滤波器,对带有噪声的语音信号进行滤波,画出滤波前后的时域波形图和频谱图,比较加噪前后的语音信号,分析发生的变化; (5)对语音信号进行回放,感觉声音变化。

基于单片机的语音识别系统 毕业设计

基于单片机的语音识别系统毕业设计 目录 摘要..................................... 错误!未定义书签。Abstract ................................. 错误!未定义书签。目录..................................................... I 前言.. (1) 1 方案介绍及设计简介 (2) 1.1小车的控制要求及设计方案 (2) 1.1.1小车的控制要求 (2) 1.1.2方案设计与论证 (2) 1.2SPCE061A 简介 (3) 1.2.1SPCE061A单片机概述 (5) 1.2.2SPCE061A的介绍 (7) 1.2.3SPCE061A的结构 (7) 1.3SPCE061A 单片机强大的语音功能 (7) 1.3.1语音识别的原理 (8) 1.3.2系统的结构框图 (9) 1.4语音控制小车设计要求 (10) 1.4.1功能要求 (10) 1.4.2语音控制小车的主要功能 (10) 1.4.3参数说明 (10) 1.4.4注意事项 (10) 2电路设计及程序设计 (11) 2.1电路设计基础知识 (11) 2.2电路方框图及说明 (13) 2.3各部分电路设计 (13) 2.3.1电机的选择 (14)

2.3.2继电器驱动电路的设计 (14) 2.3.3行驶状态控制电路设计 (15) 2.3.4麦克录音输入及AGC电路 (16) 2.3.5语音播报电路 (18) 3软件设计 (19) 3.1软件流程图及设计思路说明 (19) 3.1.1程序设计 (20) 3.2模块设计 (20) 3.2.1中断流程图部分 (20) 3.2.2语音识别部分 (22) 4连接和操作说明 (25) 4.1硬件模块连接图 (25) 4.1.1功能说明 (25) 4.1.2代码下载 (26) 4.1.3训练小车 (27) 4.1.4声控小车 (28) 4.1.5重新训练 (28) 总结 (30) 致谢 (31) 参考文献 (32) 附件1 系统程序说明 (33)

数字信号处理课设+语音信号的数字滤波

语音信号的数字滤波 ——利用双线性变换法实现IIR数字滤波器的设计一.课程设计的目的 通过对常用数字滤波器的设计和实现,掌握数字信号处理的工作原理及设计方法;熟悉用双线性变换法设计 IIR 数字滤波器的原理与方法,掌握利用数字滤波器对信号进行滤波的方法,掌握数字滤波器的计算机仿真方法,并能够对设计结果加以分析。 二.设计方案论证 1.IIR数字滤波器设计方法 IIR数字滤波器是一种离散时间系统,其系统函数为 假设M≤N,当M>N时,系统函数可以看作一个IIR的子系统和一个(M-N)的FIR子系统的级联。IIR数字滤波器的设计实际上是求解滤波器的系数和,它 是数学上的一种逼近问题,即在规定意义上(通常采用最小均方误差准则)去逼近系统的特性。如果在S平面上去逼近,就得到模拟滤波器;如果在z平面上去逼近,就得到数字滤波器。 2.用双线性变换法设计IIR数字滤波器 脉冲响应不变法的主要缺点是产生频率响应的混叠失真。这是因为从S平面到Z平面是多值的映射关系所造成的。为了克服这一缺点,可以采用非线性频率压缩方法,将整个频率轴上的频率范围压缩到-π/T~π/T之间,再用z=e sT转换 平面的-π/T~π到Z平面上。也就是说,第一步先将整个S平面压缩映射到S 1 /T一条横带里;第二步再通过标准变换关系z=e s1T将此横带变换到整个Z平面上去。这样就使S平面与Z平面建立了一一对应的单值关系,消除了多值变换性,也就消除了频谱混叠现象,映射关系如图1所示。 图1双线性变换的映射关系 为了将S平面的整个虚轴jΩ压缩到S1平面jΩ1轴上的-π/T到π/T段上,可以通过以下的正切变换实现

语音识别基本知识及单元模块方案设计

语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 1语音识别的基本原理 语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元,它的基本结构如下图所示: 未知语音经过话筒变换成电信号后加在识别系统的输入端,首先经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型的好坏、模板是否准确都有直接的关系。2语音识别的方法 目前具有代表性的语音识别方法主要有动态时间规整技术(DTW)、隐马尔可夫模型(HMM)、矢量量化(VQ)、人工神经网络(ANN)、支持向量机(SVM)等方法。 动态时间规整算法(Dynamic Time Warping,DTW)是在非特定人语音识别中一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别技术中出现较早、较常用的一种算法。在应用DTW算法进行语音识别时,就是将已经预处理和分帧过的语音测试信号和参考语音模板进行比较以获取他们之间的相似度,按照某种距离测度得出两模板间的相似程度并选择最佳路径。 隐马尔可夫模型(HMM)是语音信号处理中的一种统计模型,是由Markov链演变来的,所以它是基于参数模型的统计识别方法。由于其模式库是通过反复训练形成的与训练输出信号吻合概率最大的最佳模型参数而不是预先储存好的模式样本,且其识别过程中运用待识别语音序列与HMM参数之间的似然概率达到最大值所对应的最佳状态序列作为识别输出,因此是较理想的语音识别模型。 矢量量化(Vector Quantization)是一种重要的信号压缩方法。与HMM相比,矢量量化主要适用于小词汇量、孤立词的语音识别中。其过程是将若干个语音信号波形或特征参数的标量数据组成一个矢量在多维空间进行整体量化。把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替。矢量量化器的设计就是从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最佳的矢量量化系统,用最少的搜索和计算失真的运算量实现最大可能的平均信噪比。在实际的应用过程中,人们还研究了多种降低复杂度的方法,包括无记忆的矢量量化、有记忆的矢量量化和模糊矢量量化方法。 人工神经网络(ANN)是20世纪80年代末期提出的一种新的语音识别方法。其本质上是一

【完整版】基于Matlab的语音识别系统的设计本科毕业论文设计

摘要 语音识别主要是让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息执行人的各种意图。语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。本文基于语音信号产生的数学模型,从时域、频域出发对语音信号进行分析,论述了语音识别的基本理论。在此基础上讨论了语音识别的五种算法:动态时间伸缩算法(Dynamic Time Warping,DTW)、基于规则的人工智能方法、人工神经网络(Artificial Neural Network,ANN)方法、隐马尔可夫(Hidden Markov Model,HMM)方法、HMM和ANN的混合模型。重点是从理论上研究隐马尔可夫(HMM)模型算法,对经典的HMM模型算法进行改进。 语音识别算法有多种实现方案,本文采取的方法是利用Matlab强大的数学运算能力,实现孤立语音信号的识别。Matlab 是一款功能强大的数学软件,它附带大量的信号处理工具箱为信号分析研究,特别是文中主要探讨的声波分析研究带来极大便利。本文应用隐马尔科夫模型(HMM) 为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语数字语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练、识别匹配算法;同时,提出利用Matlab图形用户界面开发环境设计语音识别系统界面,设计简单,使用方便,系统界面友好。经过统计,识别效果明显达到了预期目标。 关键词:语音识别算法;HMM模型;Matlab;GUI ABSTRACT Speech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of people.Speech recognition technology is not only an important internationally competed technology,but also an indispensable foundational technology for the national economic development.Based on the mathematical model from the speech signal,this paper analyze audio signal from the time

数字信号处理期末实验-语音信号分析与处理

语音信号分析与处理 摘要 用MATLAB对语音信号进行分析与处理,采集语音信号后,在MATLAB软件平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。 数字滤波器是数字信号处理的基础,用来对信号进行过滤、检测和参数估计等处理。IIR数字滤波器最大的优点是给定一组指标时,它的阶数要比相同组的FIR滤波器的低的多。信号处理中和频谱分析最为密切的理论基础是傅立叶变换(FT)。离散傅立叶变换(DFT)和数字滤波是数字信号处理的最基本内容。 关键词:MATLAB;语音信号;加入噪声;滤波器;滤波 1. 设计目的与要求 (1)待处理的语音信号是一个在20Hz~20kHz频段的低频信号。 (2)要求MATLAB对语音信号进行分析和处理,采集语音信号后,在MATLAB平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器进行滤除噪声,恢复原信号。

2. 设计步骤 (1)选择一个语音信号或者自己录制一段语音文件作为分析对象; (2)对语音信号进行采样,并对语音信号进行FFT频谱分析,画出信号的时域波形图和频谱图; (3)利用MATLAB自带的随机函数产生噪声加入到语音信号中,对语音信号进行回放,对其进行FFT频谱分析; (4)设计合适滤波器,对带有噪声的语音信号进行滤波,画出滤波前后的时域波形图和频谱图,比较加噪前后的语音信号,分析发生的变化; (5)对语音信号进行回放,感觉声音变化。 3. 设计原理及内容 3.1 理论依据 (1)采样频率:采样频率(也称采样速度或者采样率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率只能用于周期性采样的采样器,对于非周期采样的采样器没有规则限制。通俗的讲,采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位之间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。 (2)采样位数:即采样值或取样值,用来衡量声音波动变化的参数。 (3)采样定理:在进行模拟/数字信号的的转换过程中,当采样频率f s.max大于信号中,最高频率f max的2倍时,即:f s.max>=2f max,则采样之后的数字信号完整的保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍;采样频率又称乃奎斯特定理。 (4)时域信号的FFT分析:信号的频谱分析就是计算信号的傅立叶变换。连续信号与系统的傅立叶分析显然不便于直接用计算机进行计算,使其应用受到限制。而FFT是一种时域和频域均离散化的变换,适合数值计算,成为用计算机分析离

基于matlab的语音识别系统

机电信息工程学院专业综合课程设计 系:信息与通信工程 专业:通信工程 班级:081班 设计题目:基于matlab的语音识别系统 学生姓名: 指导教师: 完成日期:2011年12月27日

一.设计任务及要求 1.1设计任务 作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。以语音识别开发出的产品应用领域非常广泛,有声控电话交换、语音拨号系统、信息网络查询、家庭服务、宾馆服务、旅行社服务系统、订票系统、声控智能玩具、医疗服务、银行服务、股票查询服务、计算机控制、工业控制、语音通信系统、军事监听、信息检索、应急服务、翻译系统等,几乎深入到社会的每个行业、每个方面,其应用和经济社会效益前景非常广泛。本次任务设计一个简单的语音识别系。 1.2设计要求 要求:使用matlab软件编写语音识别程序 二.算法方案选择 2.1设计方案 语音识别属于模式识别范畴,它与人的认知过程一样,其过程分为训练和识别两个阶段。在训练阶段,语音识别系统对输入的语音信号进行学习。学习结束后,把学习内容组成语音模型库存储起来;在识别阶段,根据当前输入的待识别语音信号,在语音模型库中查找出相应的词义或语义。 语音识别系统与常规模式识别系统一样包括特征提取、模式匹配、模型库等3个基本单元,它的基本结构如图1所示。 图1 语音识别系统基本结构图 本次设计主要是基于HMM模型(隐马尔可夫模型)。这是在20世纪80年代引入语音识别领域的一种语音识别算法。该算法通过对大量语音数据进行数据统计,建立识别词条的统计模型,然后从待识别语音信号中提取特征,与这些模

型进行匹配,通过比较匹配分数以获得识别结果。通过大量的语音,就能够获得一个稳健的统计模型,能够适应实际语音中的各种突发情况。并且,HMM算法具有良好的识别性能和抗噪性能。 2.2方案框图 图2 HMM语音识别系统 2.3隐马尔可夫模型 HMM过程是一个双重随机过程:一重用于描述非平稳信号的短时平稳段的统计特征(信号的瞬态特征);另一重随机过程描述了每个短时平稳段如何转变到下一个短时平稳段,即短时统计特征的动态特性(隐含在观察序列中)。人的言语过程本质上也是一个双重随机过程,语音信号本身是一个可观测的时变列。可见,HMM合理地模仿了这一过程,是一种较为理想的语音信号模型。其初始状态概率向量π,状态转移概率矩阵向量A,以及概率输出向量B一起构成了HMM的3个特征参量。HMM 模型通常表示成λ={π,A,B}。 2.4HMM模型的三个基本问题 HMM模型的核心问题就是解决以下三个基本问题: (1)识别问题:在给定的观测序列O和模型λ=(A,B,π)的条件下,如何有效地计算λ产生观测序列O的条件概率P(O︱λ)最大。常用的算法是前后向算法,它可以使其计算量降低到N2T次运算。 (2)最佳状态链的确定:如何选择一个最佳状态序列Q=q1q2…qT,来解释观察序列O。常用的算法是Viterbi算法。 (3)模型参数优化问题:如何调整模型参数λ=(A,B,π),使P(O︱λ)最大:这是三个问题中最难的一个,因为没有解析法可用来求解最大似然模型,所以只能使用迭代法(如Baum-Welch)或使用最佳梯度法。 第一个问题是评估问题,即已知模型λ=(A,B,π)和一个观测序列O,如何计算由该模型λ产生出该观测序列O的概率,问题1的求解能够选择出与给定的观测序列最匹配的HMM模型。 第二个问题力图揭露模型中隐藏着的部分,即找出“正确的”状态序列,这是一个典型的估计问题。

(完整版)基于单片机的语音识别系统好毕业设计论文

基于单片机的语音识别系统

摘要 近几年来,智能化和自动化技术在玩具制造领域中越来越被关注。本文介绍一种智能化小车控制系统的设计——语音控制小车。语音控制小车是基于SPCE061A的代表性兴趣产品,它配合61板推出,综合应用了SPCE061A的众多资源,小车采用语音识别技术,可通过语音命令对其行驶状态进行控制。首先介绍了SPCE061A的主要性能及其引脚的功能;接着完成了电源电路、复位电路、键盘电路、音频输入电路,音频输出电路和无线控制电路等硬件功能模块的设计。软件设计模块能实现智能小车的前进、后退、转向、停止、避障、表演动作以及循线等功能。测试表明,在环境背景噪音不太大,控制者的发音清晰的前提下,语音控制小车的语音识别系统能对特定的语音指令做出智能反应,做出预想中的有限的动作 关键词:spec061a 语音识别驱动电路声控小车智能反应

Abstract In recent years, Intelligent and automation technology in the toy manufacture paid more and more attention.Introduce an intelligent vehicle control system design. SPCE061A program the system to single-chip, based on implementation of the car's voice control, This paper introduces the and implementation. The SPCE061A's main characters and pin function are introduced firstly. Completed the power circuit, reset circuit, keyboard circuitry, audio input circuits, audio output circuit and control circuit of wireless of function modules. Software design module can achieve smart car forward, backward, turn, stop, obstacle avoidance, performing actions, as well as on-line functions. Test showed that the background noise in the environment is not too great, control persons under the premise of clear pronunciation, voice control car speech recognition systems for specific voice commands to make intelligent reaction, limited to the desired action. Keywords: spec061a 、voice recogniton、Driving circuit、Voice control dolly、intelirent response

基于matlab的语音信号滤波处理——数字信号处理课程设计

数字信号处理课程设计 题目:基于matlab的语音信号滤波处理学院:物理与电子信息工程 专业:电子信息工程 班级: B07073041 学号: 200932000066 姓名:高珊 指导教师:任先平

摘要: 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴学科,是目前发展最为迅速的学科之一,通过语音传递信息是人类最重要,最有效,最常用和最方便的交换信息手段,所以对其的研究更显得尤为重要。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换成离散的数据文件,然后用起强大的矩阵运算能力处理数据。这为我们的本次设计提供了强大并良好的环境! 本设计要求自己录制一段自己的语音后,在MATLAB软件中采集语音信号、回放语音信号并画出语音信号的时域波形和频谱图。再在Matlab中分别设计不同形式的FIR数字滤波器。之后对采集的语音信号经过不同的滤波器(低通、高通、带通)后,观察不同的波形,并进行时域和频谱的分析。对比处理前后的时域图和频谱图,分析各种滤波器对于语音信号的影响。最后分别收听进行滤波后的语音信号效果,做到了解在怎么样的情况下该用怎么样的滤波器。

目录 1.设计内容 (4) 2.设计原理 (4) 2.1语音信号的时域分析 (4) 2.2语音信号的频域分析 (5) 3.设计过程 (5) 3.1实验程序源代码 (6) 3.1.1原语音信号时域、频域图 (6) 3.1.2低通滤波器的设计 (6) 3.1.3高通滤波器的设计 (7) 3.1.4带通滤波器的设计 (8) 3.1.5语音信号的回放 (9) 3.2调试结果描述 (10) 3.3所遇问题及结果分析 (15) 3.3.1所遇主要问题 (16) 3.3.2结果分析 (16) 4.体会与收获 (17) 5.参考文献 (17)

数字信号处理教语音信号处理课程设计心得

这次课程设计虽然遇到了很多问题,很多困难,但是也学到了很多东西。不仅学到了书本上的东西,而且学到了很多课本上没有的东西,很多程序里的东西,特别是程序语法,总是有错误,但是总是不知道错在哪里,在细心的检查下,终于找出了错误和警告,排除困难后,程序编译就通过了,心里终于舒了一口气。还有各种各样问题,通过查网络和请教同学来弄明白,这个过程是痛苦的,有时候有些问题不能马上解决,感到很头痛,真想放弃这个问题,但是坚持下来,并且解决这些问题的时候,真的有种苦尽甘来的感觉。 应用MATLAB进行语音信号的处理是与我们所学课程及专业紧密相连的,有着很强的实践性。做这个课程设计的时候,并不是非常的顺利,我也有遇到很多困难。刚开始,我用自己的mp3录制的一个wav文件做语音信号处理,程序始终现实如下错误提示: ??? Error using ==> wavread Error using ==> wavread Data compression format (IMA ADPCM) is not supported. 我在查阅了很多资料,在网上也查阅相关信息,花费了大量时间也没找出结果,最后发现在WAV格式的语音文件有两种格式,即PCM格式和IMA ADPCM格式,而在MATLAB中用wavread函数进行语音处理时,并不能直接处理IMA ADPCM格式的语音信号,经

过格式转换之后(选择PCM格式),我运行出了正确的结果。刚开始由于对滤波器的滤波原理并不是很了解,于是我又翻出学过的数字信号处理课本,认真研究起各种滤波器了,这才使我明白了大多数滤波器是如何工作地,不再单单只是懂理论,理论与实际相结合是很重要的,只有理论知识是远远不够的,只有把所学的理论知识与实践相结合起来,从理论中得出结论。实验过程中,我感觉到初始语音信号和滤波输出后的语音信号在音色上有一定的差别,这说明了信号在处理、传输过程中有损耗。不管对于什么样的课题,其实也是有很多东西可以发掘的,这需要我们在平时多积累,多思考,只有这样,才能取得更大的进步,才能学有所用,学有所长。 通过这次设计,进一步加深了对数字信号处理的了解,让我对它有了更加浓厚的兴趣。通过这次课程设计使我懂得了,平时的理论知识只有通过自己动手做一个课题,从做这个课题的过程中发现问题,解决问题,这个学习的过程,会比我们平时只通过课堂上听讲得到的知识更加生动立体,跟让人记忆深刻。在设计的过程中,我发现同学间的互帮互助真的很重要。当我们有问题的时候,大家一起讨论,将自己的观点表达出来,当发现别人的观点与自己的不同的时候,我们通过查阅资料找到最终正确的答案,这个过程是互利互惠的。这也培养了我们以后走上工作岗位后的团队精神,对我们以后的为人处世都有很大帮助。同时我们在设计的过程中发现了自己的不足之处,对以前所学过的知识理

基于单片机的语音识别智能家居控制系统设计

基于单片机的语音识别智能家居控制系统设计 摘要:“智能家居”主要通过利用先进的单片机技术,蓝牙识别技术和语音识别技术,将家用电器,如电灯,电视,冰箱等联系起来,通过语音来控制各个家用电器设备,是人们的生活更加方便,安全和健康。 关键词:智能家居;单片机;语音识别 传统的家电控制方式主要有开关按键和红外遥控两种。这两种必须需要人去直接触碰,有着极大的安全隐患,而且控制距离短,不能够穿墙控制。我们在日常生活中经常遇到以下情况,躺在床上看书或看电视时,卧室电灯不能方便地控制,还要起来去关掉电灯。类似这种不方便的情况在家庭生活中多有出现。尤其是对于老年人、残疾人来说,家电控制更为不易。因此我设计了一种基于单片机的智能家居语音控制系统,采用了语音指令控制家用电器的开启或关闭,从而使现代家居生活更轻松、更便捷、更安全。 1 系统介绍 系统主要分为以下几个部分:由语音识别模块、51单片机、蓝牙发送模块组成语音遥控;由蓝牙接收模块、主控器、接口电路组成家电语音控制平台。 2 硬件电路 整个系统的硬件电路主要包括核心主控制和语音识别两个部分主控制部分为STC公司STC12LE5A60S2单片机,语音识别部分为LD3320语音识别芯片系统,用户发出声音控制指令时,语音识别部分把指令传送给主控制器,主控制器处理后,发出命令控制外围的家用电器设备。 3 非特定人语音识别模块设计

LD3320主要组成有高精度的语音识别处理器和一些外部电路,包括声音输出接口和麦克风接口。可以真正实现语音识别,声音控制和人际对话的各项功能,另外还有完整的非特征人语音识别特征库和高效的人语言识别搜索引擎模块。 (1)语音识别分三个步骤:频谱分析、特征提取、匹配识别。LD3320已把各部分硬件集成在单芯片上,我们主要对LD3320进行二次开发。 (2)LD3320芯片采用并行方式直接与单片机相接,具有识别率高,识别速度快,多接口,多支持等优点,可以连续快速识别多种语言。 (3)设计步骤:确定寄存器读写操作方式(并行或串行SPI),熟悉寄存器的功能,确定所需寄存器的地址,编写驱动程序(初始化→写入识别列表→开始识别→响應中断)。 4 单片机控制器 51单片机的显著特征是采用超低功耗架构,可显著延长电池使用寿命;在本设计中,单片机的P0口接LD3320的8个数据口,P3口连接RDB、WRB、CSB、RSTB等控制引脚;SIMO0、SOMI0口连接射频模块的SPI数据口;在主控器上还接有一个扬声器,作为信息反馈装置;51单片机系列单片机针对C语言与汇编程序精心优化,我们可以通过简单的C 语言编程对其行控制。 5 无线信息传输——蓝牙通信 利用HC05蓝牙发射/接收模块完成“操作指令”的发送和接收。 为了实现对家电电器的控制,我们采用LED灯和继电器模拟实物电灯或者家电,通过语音识别去控制家电的开关,为了提高系统的识别率,本系统采用两级指令完成对系统的控制。向LD模块添加关键词时,通过编辑程序定义二维数组设定一级语音指令为“小黑”,二级语音指令为“开灯”、“关灯”,设定指令时,添加拼音的输入方式作为关键词数组,例如添加“小黑”命令,则写入“xiaohei”,汉字间的拼音用空格隔开。实现功能为接收语音

数字信号处理在语音信号分析中的应用

数字信号处理在语音信号分析中的应用

《数字信号处理》 课程设计报告 数字信号处理在语音信号分析中的应用 专业班级: 姓名: 学号:

目录 No table of contents entries found.数字信号处理设计任务书 摘要 语音信号滤波处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前 发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。本设计通过录制一段语音,对其进行了时域分析,频谱分析,分析语音信号的特性。并应用matlab平台对语音信号进行加噪然后再除去噪声,进一步设计两种种滤波器即高通滤波器、带通滤波器,基于这两种滤波器设计原理,对含加噪的语音信号进行滤波处理。最后对比滤波前后的语音信号的时域和频域特性,回放含噪语音信号和去噪语音信号。论文从理论和实践上比较了不同数字滤波器的滤波效果。 1.绪论

通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是人类持有的功能,声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。 随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。作为高科鼓应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并不断朝更高目标而努力。数字滤波器是数字信号处理的基础,用来对信号进行过滤、检测和参数估计等处理。IIR数字滤波器最大的优点是给定一组指标时,它的阶数要比相同组的FIR滤波器的低的多。信号处理中和频谱分析最为密切的理论基础是傅立叶变换(FT)。离散傅立叶变换(DFT)和数字滤波是数字信号处理的最基本内

用于智能家居语音识别系统设计

仪器科学与电气工程学院 本科毕业论文(设计)开题报告题目:用于智能家居的语音识别系统设计 学生姓名:学号: 专业:电气工程及其自动化 指导教师:讲师 2015年1月3日

1. 选题依据 1.1选题背景 语言作为人类信息交流中最重要的和最方便的方式,人与机器的交流能否像人与人一样自如,是人们研究的问题。控制论创始人维纳在1950年就曾指出:“通常,我们把语言仅仅看作人与人之间的通信手段,但是,要使人向机器,机器向人以及机器向机器讲话,那也是完全办得到的”。 随着现代科学技术的进一步发展和人民生活水平不断的提高,人们对家庭住宅需求的概念也发生了彻底的改变。人们正在从以往追求房屋空间的宽阔和装饰的亮丽、豪华,向着追求品味、安全、舒适、便捷和智能方向发展。现在的家庭不仅要满足人们生活、工作、娱乐和交流的需要,同时还可以提供充分的安全防护、物业管理等手段。智能家居是建筑艺术、生活理念与信息技术、电子技术等现代高科技手段完美结合的产物,它的出现满足了人们对住宅高性能、智能化的要求21世纪信息时代的到来,IT产业的发展和人们生活水平的提高,“智能家居”、“家庭自动化”、“网络家电”、“家庭网络”等技术的推动,智能家居的生活已经近在咫尺。 在智能家居中传统的家用电器的控制,无外乎两种控制方式:手动或遥控。随着家用电器的增多,开关和遥控越来越多,使用极不方便。这时,我们可以釆用语音识别的方式控制,例如,在观看电视频道时,我们可以很方便地直接说出“中央一套”来,所以语音识别及控制在智能家居中尤其重要。 1.2国内外研究现况 1、语音识别技术的发展 就技术而言,目前国内外对语音识别理论及各种实用算法的研究是一热点。人们普遍关心的问题是不断提高语音识别的识别率、识别更多的词汇量、扩大语音识别的应用等研究。语音识别技术发展到今天,PC 机的语音识别系统己经趋于成熟,而且还出现了一些具有实用价值和市场语音识别前景的语音识别芯片。近几年来,个人消费类电子产品的广泛使用,使大量的识别系统从实验室 PC 平台转移到嵌入式平台设备中,现在嵌入式对特定人语音识别系统的识别精度己经达到 98%以上。嵌入式语音识别系统和 PC 机的语音识别系统相比,虽然其运算速度和内存容量有一些限制,但是它也有各自的特点。嵌入式系统体积小、可靠性高、耗电低、投入小、便于移动等优点,是嵌入式语音识别系统和 PC 机的语音识别系统相比的最大优势。而且嵌入式语音识别系统多为实时系统,当用户讲话后,系统能够立即完成词条识别并作出反应。这些特点决定了嵌入式语音识别系统的应用十分广泛。可以预测在近几年内,嵌入式语音识别系统的应用将更加广泛。各种语音识别系统将出现在市场上。根据美国专家预测,具有语音识别功能的产品可达 50 亿美元。在短期内还不可能具

数字信号处理在语音信号分析中的应用

《数字信号处理》 课程设计报告 数字信号处理在语音信号分析中的应用 专业班级: 姓名: 学号:

目录 摘要 (3) 1、绪论 (3) 2、课程设计的具体内容 (4) 2.1.1、读取语音信号的任务 (4) 2.1.2、任务分析和解决方案 (5) 2.1.4、运行结果和相应的分析 (5) 2.2、IIR滤波器设计和滤波处理 (6) 2.2.1、设计任务 (6) 2.2.2、任务分析和解决方案 (7) 2.2.3、编程得到的MATLAB代码 (7) 2.2.4、运行结果和相应的分析 (7) 2.3、FIR滤波器设计和滤波处理 (9) 2.3.1、设计任务 (9) 2.3.2、任务分析和解决方案 (9) 2.3.3、编程得到的MATLAB代码 (9) 2.3.4、运行结果和相应的分析 (11) 3、总结 (13) 4、存在的不足及建议 (13) 5、参考文献 (13)

数字信号处理设计任务书 摘要 语音信号滤波处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前 发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。本设计通过录制一段语音,对其进行了时域分析,频谱分析,分析语音信号的特性。并应用matlab平台对语音信号进行加噪然后再除去噪声,进一步设计两种种滤波器即高通滤波器、带通滤波器,基于这两种滤波器设计原理,对含加噪的语音信号进行滤波处理。最后对比滤波前后的语音信号的时域和频域特性,回放含噪语音信号和去噪语音信号。论文从理论和实践上比较了不同数字滤波器的滤波效果。 1.绪论 通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是人类持有的功能,声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。 随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。作为高科鼓应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并不断朝更高目标而努力。数字滤波器是数字信号处理的基础,用来对

数字信号处理课程设计报告-语音信号的采集与处理

数字信号处理 课程设计报告 课设题目:语音信号的采集与处理 学院: 专业: 班级: 姓名: 学号: 指导教师: 2011 年7月1日

课程设计报告撰写要求 1、页面设置 纸张大小设置为纵向A4,页边距设置为:上3.8厘米,下 3.5厘米,左3厘米,右3厘米,页眉设置为3厘米,页脚设置为2.7厘米,文档网络设置为指定行和字符网格,每行34字,每页34行。 2、段落及字体设置 除各级标题外,首行缩进2字符;图、表及图题、表题首行不缩进,居中放置;图表不应超出版心范围;行距采用单倍行距。 正文中文采用小四号宋体,英文采用新罗马字体(Times New Roman),段前0磅,断后0磅; 一级标题采用小二号黑体,段前12磅,段后12磅 二级标题采用小三号黑体,段前6磅,段后6磅 三级标题采用四号黑体,段前6磅,段后0磅 3、装订要求 采用左侧装订,订两钉。

目录 一. 课程设计任务 (1) 二. 课程设计原理及设计方案 (2) 三. 课程设计的步骤和结果 (6) 四. 课程设计总结 (39) 五. 设计体会 (40) 六. 参考文献 (41)

一. 课程设计任务 1、语音信号的采集 利用Windows下的录音机,录制一段自己的话音,时间在1s内,然后在Matlab软件平台下,利用函数wavread对语音信号进行采样,记住采样频率和采样点数。 2、语音信号的频谱分析 在Matlab中,可以利用函数fft对信号进行快速傅立叶变换,得到信号的频谱特性,要求学生首先画出语音信号的时域波形,然后对语音信号进行频谱分析。 3、设计数字滤波器和画出其频率响应给出各滤波器的性能指标; 给定滤波器的性能指标如下: (1)低通滤波器的性能指标:fb=1000Hz,fc=1200Hz,As=100dB,Ap=1dB. (2)高通滤波器的性能指标:fc=4800Hz,fb=5000Hz,As=100dB,Ap=1dB. (3)带通滤波器的性能指标:fb1=1200Hz, fb2=3000Hz,fc1=1000Hz, fc2=3200Hz,As=100dB,Ap=1dB. 采用窗函数法和双线性变换法设计上面要求的3种滤波器,并画出滤波器的频率响应; 4、用滤波器对信号进行滤波 然后用自己设计的滤波器对采集到的信号进行滤波,画出滤波后信号的时域波形及频谱,并对滤波前后的信号进行对比,分析信号的变化; 5、回放语音信号,分析滤波前后的语音变化; 6、设计系统界面 为了使编制的程序操作方便,设计处理系统的用户界面,在所设计的系统界面上可以选择滤波器的类型,输入滤波器的参数、显示滤波器的频率响应,选择信号等。 - 1 -

含噪声的语音信号分析与处理设计讲解

课程设计任务书 学生姓名:苗强强专业班级:电信1204 指导教师:阙大顺沈维聪工作单位:信息工程学院 题目: 程控宽带放大器的设计 初始条件: 程控宽带放大器是电子电路中常用模块,在智能仪器设备及嵌入式系统中有广 泛的应用。因此对于电子信息专业的技术人员来说,熟练掌握该项技术很有必要。 要求完成的主要任务:(包括课程设计工作量及其技术要求,以及说明书撰写等具体 要求) (1)输入阻抗>1KΩ,单端输入,单端输出,放大器负载电阻为600Ω; (2)3dB通频带10kHz~6MHz,在20kHz~5MHz频带内增益起伏<1dB。 (3)增益调节范围10 dB~40 dB,(通过键盘操作调节)。 (4)发挥部分:当输入频率或输出负载发生变化时,通过微处理器自动调节,保持 放大器增益不变。 (5)电路通过仿真即可。 时间安排: 1. 任务书下达,查阅资料 1天 2. 制图规范、设计说明书讲解 2天 3. 设计计算说明书的书写 5天 4. 绘制图纸 1天 5. 答辩 1天 指导教师签名:年月日 系主任(或责任教师)签名:年月日

滤波器设计在数字信号处理中占有极其重要的地位,FIR数字滤波器和IIR滤波器是滤波器设计的重要组成部分。利用MATLAB信号处理工具箱可以快速有效地设计各种数字滤波器。课题基于MATLAB有噪音语音信号处理的设计与实现,综合运用数字信号处理的理论知识对加噪声语音信号进行时域、频域分析和滤波。通过理论推导得出相应结论,再利用MATLAB 作为编程工具进行计算机实现。在设计实现的过程中,使用窗函数法来设计FIR数字滤波器,用巴特沃斯、切比雪夫和双线性变法设计IIR数字滤波器,并利用MATLAB 作为辅助工具完成设计中的计算与图形的绘制。通过对对所设计滤波器的仿真和频率特性分析,可知利用MATLAB信号处理工具箱可以有效快捷地设计FIR和IIR数字滤波器,过程简单方便,结果的各项性能指标均达到指定要求。 关键词数字滤波器 MATLAB IIR滤波器 FIR滤波器

相关文档
相关文档 最新文档