文档库 最新最全的文档下载
当前位置:文档库 › 03数字语音自动录放系统的设计

03数字语音自动录放系统的设计

03数字语音自动录放系统的设计
03数字语音自动录放系统的设计

数字语音自动录放系统的设计

摘要

数字语音自动录放系统是用来完成自动应答、信息查询和语音留言等功能的通信类产品。它的出现是伴随着电话机的推广和普及而来的。从早期的基于磁带录音机的答录器到后来基于语音合成和数字存储的数字语音自动录放系统,可以笼统的划分为两代产品,它们各有鲜明的优缺点。第一代磁带机的答录器结构简单,可以存储很长时间的语音信息。但由于是使用需要大量机械装置的磁带录音机,它的机械故障率较高,磨损严重,音质也不佳。并且由于磁带属于顺序存储介质,它的信息定位非常困难,因此功能较为单一,一般来说只能作为留言机来使用。第二代数字语音自动录放系统是基于语音合成技术和数字存储方式的,这种数字语音自动录放系统较磁带答录器的性能有很大的提高,语音音质好,信息定位方便,可以使用于更多的用途。但由于采用了大量的数/模、模/数转换,导致语音的自然度有所损失,同时语音存储长度也不够理想,不能满足长时间录放音的需要。

基于此,本文提出了一种新型的数字语音自动录放系统的设计方法,它采用单片机作为核心控制单元,T6668语音芯片作为语音合成及存储器件。这种数字语音自动录放系统的语音存储不需要A/D、D/A转换器件,因此音质十分自然。此外还具有体积小,录放时间长,使用范围广等许多优点。

关键词数字语音自动录放系统;T6668语音芯片;AT89C51

The design of automatical record and answer system of digital voice

Abstract

The automatical record and answer system of digital voice is a kind of device that can be used in automatic answerer or message query systems or telephone leave word machine. It is often used accompanied with a telephone. The earlier equipment is based on a tape recorder. So it can store long time voice message, but this kind of device is made of many mechanical equipments, which often make it into troubles. And when it has been used for many times, the quality of voice would be bad. Because the tape recorder is a sequential storage device, the orientation of message is very difficult.The other kind of device is based on voice synthetic chip and digital storage chip. Comparing to the earlier device, it is a big improvement. It has better voice quality, and the orientation of message is very fast. But it uses many D/A and A/D converters, so some natural qualities have lost. And its volume of storage is too small.

In this paper, we supply a new method to design the automatical record and answer system of digital voice .It uses a micro-controller unit as the center controller, and T6668 voice chip as the voice synthetic chip and storage chip. This kind of device has good voice quality and big storage

volume. It can be used in many ways.

Key words the automatical record and answer system of digital voice ;T6668 voice chip;AT89C51

目录

摘要……I

Abstract II

第1章绪论1

1.1课题背景及意义 1

1.2语音合成技术在人机交互中的重要地位 1

1.3语音合成技术的发展 2

1.4语音合成技术的应用 3

1.5课题的研究内容与方法4

第2章语音合成应用及其综合应用系统评述5

2.1概述5

2.2语音合成的各种方法 5

2.3具有合成语音输出系统的构成 6

2.4常用语音合成技术在典型芯片中的应用 6

2.4.1 TC8830AF 6

2.4.2 TMS5220 7

2.4.3 T6668 7

2.5语音信号存储器7

2.6合成语音输出的综合应用系统评述9

第3章T6668语音芯片介绍及与单片机接口技术10

3.1系统特性10

3.2语音合成芯片T6668简介10

3.2.1常见语音芯片比较10

3.2.2芯片特点11

3.2.3 T6868应用的局限性12

3.3 T6668的引脚功能及内部结构介绍12

3.3.1 T6668的引脚功能12

3.3.2 T6668的内部结构14

3.4 探索T6668索引区的秘密16

3.4.1 T6668的索引区16

3.4.2 索引区内记录起止地址的方法17

3.5 T6668主要工作方式18

3.5.1手动操作模式18

3.5.2 CPU操作模式18

3.5.3 T6668能执行的九条命令18

3.5.4状态寄存器19

3.5.5 CPU操作模式下控制的两种模式20

3.6 A T89C51单片机介绍20

3.6.1 A T89C51单片机综合特性介绍21

3.6.2 A T89C51单片机引脚介绍22

3.7 T6668与微处理器的接口技术25

3.7.1 串一并转换接口25

3.7.2 中断方式接口26

第4章录音电话的硬件结构及软件设计27

4.1电话网中的有关信号27

4.2系统特性27

4.3录音电话的硬件结构30

4.3.1铃流、忙音的检测和摘机模似电路30

4.3.2 T6668语音处理芯片与89C51的连接30

4.3.3T6668与DRAM的连接30

4.3.4模拟量I/O(输入/输出)31

4.4录音电话的监控程序31

4.4.1上电复位程序(主程序)32

4.4.2命令发送子程序33

4.4.3铃流检测子程序33

4.4.4 留言录入和发送子程序34

4.4.5忙音检测36

4.4.6录音程序36

结论39

致谢40

参考文献41

附录A 42

附录B 45

第1章绪论

1.1课题背景及意义

语音合成技术及其产品的应用,在我们的日常生活中扮演着越来越重要的角色。在这种前提下,我们充分研究了当前国内外数字语音自动录放系统产品的现状,提出了一种新的语音合成技术与单片机综合应用系统。

数字语音自动录放系统是语音合成技术在通信领域的应用。它可以作为小型程控电话交换机的外围设备,对用户的操作进行语音提示,达到与用户交互的目的。也可以用作信息查询系统,如天气预报自动查询台。或者是作为一部高质量的留言电话来使用。

当前的数字语音自动录放系统主要有两种设计方式:一种是以磁带作为存储介质,它的主要部件是一个磁带录音机,辅之以少量的外围电路。这种答录器结构简单、价格低廉,技术上十分成熟,国内外很早就有产品问世。但是它的缺点是十分突出的。这种答录器的录放音只能是顺序的进行的,当利用菜单来跳转时,需要很长的定位时间。而且,由于磁带录音机使用了大量的机械装置,使得机械故障率较高。此外,磁带录音音质较差,磁带、磁头磨损严重等问题也是不容忽视的。

另外一种设计是用数字存储器作为存储介质,配合专用DSP芯片来实现的。DSP是从微处理器的基础上发展起来的一种完成密集的数字信号处理算法的高速微处理器和微计算器。数字存储器使用较多的为256k的动态DRAM。在8K比特的抽样频率下,8片41256的DRAM 能存储大约4分钟的语音信息。近年来,许多电话厂家纷纷推出了带语音存储功能的电话机,他们所采用的设计就是这种结构。这种设计具有以下一些优点:使用软件完成语音压缩与解压缩,电路较简单;数字存储器DRAM为非顺序存储介质,无须长时间的定位,寻址速度非常快;存储芯片的使用寿命很长,而且也不会因长时间使用后,存储的语音音质降低。但是这种设计也有明显的局限性。

基于此,我们的设想和目的是:利用单片机技术,采用带有存储介质的语音合成芯片,研制出一种与公用电话交换网( PSTN)完全兼容的数字语音自动录放系统。这种数字语音自动录放系统有以下特点:价格便宜、使用方便、功能强大,存储容量大并且易于扩展,使用范围广,具有较高的兼容性和可靠性等。

目前,在国内外基于上述思想的设计思路,还很少见之与报道。因此,我们认为,这一产品的研制和开发将具有非常重要的现实意义。

1.2语音合成技术在人机交互中的重要地位

人类进入现代社会,依靠各种机电设备从事劳动、生产和科学研究。当人们操纵这些机电系统时,就自然而然地出现了人与机电系统间的信息交流,即系统不断报告自己的运行状态和结果,而人们根据这些状态、结果发出其下一步应进入何种状态的命令,这就是人机对话。早期的机械系统常以其自然的运行状态(力、热、声、光、位移、速度等)来表示自己的运行状态和结果,而人们根据这些状态作出判断,直接实现对机械系统的控制操作。随着电子技术的发展,可以很方便的把各种物理状态转换成易于传输,经过加工后集中反映了各种信息的信号(如数字、曲线、图表、声响等),人们对系统的操作、控制不采用直接方式,而是向系统输入各种指令信号(如数字、符号、状态等),系统则根据这些指令信号进入规定的运行状态。因此,只有当人、机之间以规定的信号方式进行信息交流时,才开始有了人机对话。

长期以来,机器在与人的信息交流中一直处于“聋哑”状态。人对机器的输入主要靠各种形式的按键、键盘,机器要报告运行状态、结果只能通过各种显示装置。这基本上属于“接触”式的人机对话。它把人和对象系统限制在近距离面对面的空间里,所交换的信号基本上是数字量或数字量的转化形式。这种较原始的人机对话不能满足进一步智能化的发展要求。

语音是众多信息载体中具有最大信息容量的信号,具有最高的智能水平,人们在提高机器智能化水平时,在人机对话方面就是寻求最好的语音信息交换手段。

语音作为人机对话的手段使人机对话向人-人对话发展,在形式上最终填补了人机对话的空白。语音的对话方式使人-机界面从数字领域进入模糊领域。

1.3语音合成技术的发展

声音作为一种传输媒介,是人与人交往、交流思想、表达内容的最直接工具,这种工具的特殊性决定了它是一种重要的信息交流方式。

寻求一种模拟人类语言功能的装置系统,一直是人们孜孜以求的美好愿望。1779年,由俄国沙皇悬赏“讲话者机器方案”而制作的元音合成器,算是第一个能发出声响的合成器。当然,这还称不上真正意义的语音合成器。1791年由风箱、皮筒、金属笛管等拼凑组装而成的合成器,从生理学的角度模仿人的口腔与鼻腔发音,在发声方面又向前迈进了一步。但其发出的声音与人类语音仍然相去很远。1902年以后,随着电的发现与利用,基于电的合成器便以彻底更新的设计思路,引导人们对语音的合成进行研究。

人类从事语音合成技术的研究虽然已有较长的时间,但是语音合成技术的商品化,则还是随

着50年代初期数字电子计算机的出现,才在实践上迈出了可喜的一步。

80年代以后,随着微电子技术的迅速发展,大规模集成电路的语音处理芯片开始进入市场,而配合微型计算机组成各种复杂程度的语音处理系统,使得语音合成技术进入了一个更新的应用时代。

1989年,仍然是T1公司,在美国商业周刊(Business Week)的国际版刊出一种语音合成的新产品——会“说话’的广告,它只占了四页,只需撕去开关挚上的标签,便会发出一段语音清晰甜美、历时1s秒的话音广告。它的措施是利用一个仅有婴儿指甲大小的集成电路——包括了语音合成系统所需的一个8位微处理器、高级语音合成器和只读存储器(ROM)、随机存取存储器(RAM)及输入输出电路等,结合一个信用卡大小的模块作为发声装置,三颗纽扣电池提供电力,使得这套系统能够将广告内容播放达650次。进入6O年代以后,由于语音处理技术取得了重大的进展,时序解析的数字方法引入语音分析,尤其在语音处理理论和模型方面的建树,诸如确立LPC与PARCOR技术的地位,更加深了对语音合成的应用潜力的认识,促进了语音合成技术的飞速发展。70年代开始,语音合成技术渐趋成熟,规则合成法的提出,共振峰方式合成器得到重视,同时,相应的产品也接踵问世,意味着语音合成技术将优质语音带进产品是完全能够实现的,这也进一步推动了语音合成技术的发展。1978年,在美国芝加哥举行的电子消费品展览上,美国德克萨斯仪器公司(TEXAS INSTRUMENTS)展示一种叫做“说和拼”( speak&spell)语言学习辅助工具。这是人类历史上第一种可以大量生产的发声电子产品,虽然信息量为1200比特(bps),属于超低速的声音编码器,但是它是由8位的微处理器和128K位的ROM,以及其它的专用集成电路组成的线路结构,不仅轻巧便携、价格低,也成为语音合成技术将优质语音应用于畅销产品的先例。

今天,语音合成产品更是与我们的生活密切相关,给我们带来了很大的便利。我们乘坐公共汽车时,常可以听到语音报站器自动播报站名,声音清晰、洪亮,这就是语音合成芯片的一个简单应用。市场上卖的非常火爆的英语学习机,是用语音合成芯片与普通的磁带录音机配合,一般可以录制60~240秒的数字语音信号,克服了磁带只能顺序放音的缺点,给英语学习者带来了极大的方便。

1.4语音合成技术的应用

语音合成技术产品的广泛使用,拉近了人与机器之间的距离,也给我们的生活带来了许多乐趣。

1.家庭民用产品与装置

语音合成技术应用于日常生活,可以给我们提供会说话的玩具、游戏机,和能够进行语音提示的家用电器。比如,钟表或记时器报告时间:“现在是上午8点整”,听起来要比“当、当、当”的声音要悦耳得多。

2.商业与银行

大型商场的门口或自动扶梯旁,语音播放系统与自动感应系统相互配合,给顾客一声轻轻的问候或一句适当的提示,都能给顾客带来些许暖意。银行方面,报告兑汇率、利息等信息,或者给用户进行操作提示,也是颇受欢迎的。

3.通讯

语音合成技术在通讯方面的应用更加具体、广泛。从电话机到程控交换机,从自动天气预报到各种信息查询,从自动寻呼系统到股票交易系统,语音合成技术的作用都得到了充分的体现。

4.检浏与控制

在检测与控制领域,语音合成技术的应用也十分普遍。语音输出提供了一条更为直接的参数获取途径,可用来辅助捕获信息或提示与操作者有关的操作步骤。在生产设备的监控系统中

加入语音报警装置,则不论操作者是否注意到,都可以及时的得到警报,从而能预防重大事故的发生。

5.运输工具

可用于公共汽车、地铁、出租车和电梯等运输工具。如车站自动报站器可以减轻售票员的劳动强度,也能够更为有效的提醒乘客注意。

6.其它

语音合成技术在军事等其它领域也有很重要的作用,如雷达的方位情况报告等。

1.5课题的研究内容与方法

这一课题的主要研究内容有:探索和研究实现多功能数字语音自动录放系统所必须解决的一些理论上的问题和具体实现上的关健技术问题;提出一种实用的多功能数字语音自动录放系统的设计方案,并在此基础上研制一种具有较高性价比、高可靠性、功能完善、可与公用交换电话网(PSTN)实现无缝连接的稳定的数字语音自动录放系统。

本课题的研究分为理论分析和实验研究两个方面进行。

在理论上将探索一种适用于多种用途的语音产品开发模型,并选择出最优模型结构;在此基础上,制作出使用产品。

拟采用的技术路线为:

电路逻辑设计——电路结构定型——软件设计方案——软、硬件联机调试——各项性能指标测试令样机产品。

本课题的实验方案分硬件和软件两个方面。

1)硬件上:采用ATMEL公司的AT89C51单片机为中心,控制外围电路来实现铃流信号检测、忙音检测、DTMF双音多频信号检测以及录放音等功能。语音合成芯片选用东芝公司的T6668,它内置大容量、可读写、稳定性强的DRAM存储介质。然后根据不同的用途进行不同容量扩展。

2)软件上:主要是用单片机汇编语言来具体实现各种功能。

第2章语音合成应用及其综合应用系统评述

2.1概述

在日常生活中,人机接口这一界面上的一个主要目标将是语音合成系统。语音系统,特别是一个声音再生系统,它利用语音合成(LSI),已经迅速得到重视并应用,起着愈来愈明显的作用。

合成语音输出是将语音合成技术揉合进入一个单片机控制应用系统中去产生的效果,它可以反映本机或控制对像的有关情况,从而缓和人机界面上一直存在的视而无声的单调气氛。合成语音输出既可以辅助反映信息的输入/输出情况,也可以及时反映系统的诸多综合情况,如报告中间过程、指导操作、解释当前控制环节等。本章基于实现合成语音输出能力,给出几个典型实用配接口电路,结合单片机应用,指出语音合成技术在机电仪器产品设计中的应用前景。

2.2语音合成的各种方法

数字语音信号处理的特征是获得语音信号的离散表示,以及在处理这一离散表示时所使用的较为特殊的方法。目前,语音合成主要有两种方法,即波形存储法和参数合成法。

波形存储法是一种相对简单的语音合成技术。它是最早的数码压缩和编码方式,直接对音频波形进行量化。常见的有PCM(脉冲编码调制法)、ADPCM(自适应差分PCM法)、ADM(自适应增量调制法)等。这类算法具有声音自然度和保真度高的优点,缺点是数据存储量大。以CCITT ITU G6.726标准为例,其算法采用了ADPCM,数据压缩后存储速率为32kbps,声音保真度和自然度都相当理想,频率响应范围可达l0kHz。但是高达32kbps的存取速率,使得一片4M位的存储器只能存储125秒的语音信息。

参数合成法又叫分析合成法,是指对语音分析后将音调、共振峰、频谱、发音域函数等语音特征参数记录下来,然后根据这些特征将声音再合成重现。其最大的优点在于可以以较小的数据存储量实现长时间数码录音。参数合成法主要包括LPC(线性预测编码)和PARCOR(偏自相关系数法)等。近年来,有出现了MELP混合激励线性预测编码)、CELP(码本激励线性预测编码)、MBE(多频段激励编码)等。LPC方式有1.6kbps的存取速率就能完成语音编码,但是声音自然度和保真度很不理想;PARCOR方式可以得到还原度较高的语音,但是它与LPC方式一样,在参数编码的采样、分析、计算等方面非常复杂,用单一芯片来实现难度较大;MELP方式存取速率为2.4kbps和3.2kbps,声音自然度和保真度较LPC有了一定的改进,但仍有明显的不自然感觉;CELP方式具有了较逼真的语音效果,特别是在13.2kbps 或9.6kbps高码率情况下,基本上能反映出所录语音的特点;CELP在较低码率(如4.8kbps 或5.2kbps)情况下声音自然度也还可以接受。MBE是有美国麻省理工学院最新发展的编码方法,其码率可以在2.4-9,6kbps范围内由用户选择,语音自然度和保真度要比其它方式高一个等级,可以说是目前最好的参数编码方式。

目前较多的参数编码芯片采用CELP方式,如LUCENT公司的LR-30, MXIC公司的93521, Tl公司的TSP50C-34等。采用MBE方式的有DVS公司的AMBE-1000芯片。参数编码芯片通常需要和编解码芯片(CODEC)一起使用。通常人的语音最高为3800Hz。根据采样原理可知,采样频率必须大于模拟量信号最高频率成分的两倍以上,因此一般使用的CODEC的采样频率是8kHz,实现的语音频率最高为3.8kHz。

2.3具有合成语音输出系统的构成

语音合成技术的发展与集成电路工艺技术有关,当大规模集成电路工艺走向成熟,也就开辟了语音合成技术的应用领域,保证了语音合成技术向实用化、民用化方向深入发展。

一般来说,语音合成方法为波形存贮法和参数法,具体则有脉冲编码调制方式PCM ,差分编码调制方式DPCM, δ调制方式、自适应δ调制方式ADM,线性预测编码方式LPC、偏自相关方式PAR-COR等。另外还有音素法、线性增量调制LDM、连续可变斜率增量调制CVSD 等。依照上述方式,许多集成电路厂商成功地推出了一系列的语音合成专用芯片。例如TSP50C10/ll,它采用线性预测编码方式((LPC-12);T6668, TC8830AF则采用ADM方式;TC8831则采用PARCOR方式。还有诸如:SP-0256A-AL2采用LPC方式,μPD77P56G采用DPCM方式等等。所有这些集成芯片都旨在建立一个语音合成系统,使得优质语音输出成为现实,以支持建立一种更具合理的人机对话关系。

合成语音输出系统的构成主要由二部分组成:语音合成处理中心和合成声音信号输出。

对于语音合成所需要的语音数字表示数据,一般由二种途径来获得:声音信号输入,由话筒捡拾声音信号,然后经由放大滤波再经采样量化分析处理,以得到波形编码数据;另一途径就是由数据处理获得参数合成所需数据。语音合成处理中心节语音处理芯片,它可以分析/合成语音。

2.4常用语音合成技术在典型芯片中的应用

考虑单片机应用系统中实现合成语音输出,下面对T6668, TC8830AF和TMS5220结合MCS-S1系列89C51单片机作一说明:

2.4.1 TC8830AF

TC8830AF采用ADM合成方式,具有手动和CPU操作模式,而且其外围使用SRAM 型存储器作为语音数据保存CPU操作模式,TC8800AF提供CPU接口,11条可得到响应的命令,使得TC8830AF的语音存储器可以为CPU使用,即可以扩展单片机系统的存储器,也可以交由CPU管理TC8830AF的语音存贮器。

2.4.2 TMS5220

TM5220使用LPC合成方式,通过CPU发出有关命令。TMS5220便可以将50位一帧(满位

一帧)的语音数据分析合成为指定意义的语声输出。

2.4.3 T6668

T6668语音LIS采用ADM合成方式,使用动态DRAM为其外用语音数据存贮器,而且具有手动和CPU二种操作模式供选择使用。CPU操作模式,T6668提供与CPU连接的接口,通过该接口,CPU可以给定T6668能予以响应的9条命令。由于T6668具有这种CPU接口能力,因此对于单片机应用系统而言,可以实现:使用T6668外围DRAM为单片机系统存贮器;使用单片机系统存贮器用作T6668语音数据存贮器。

该接口电路特点是语音数据是固定非易失性的。它利用T6668的CPU接口特点,即CPU给定比特率,起始地址和终止地址,而且起始地址和终止地址间隔为8位,这样的话,只要CPU将一个8位语声数据反映在74LS165(并入/串出寄存器)上,T6668通过74LS165可以由74LS165一位一位读入一个字节的语音数据。CPU查询T6668动态标志,以便将所需语音数据按照上述步骤而最终一一得到解码。形成指定内容的语声输出。

2.5语音信号存储器

数字语音处理的明显优点就是反映模拟电路所能实现的效果。这是因为数字化的语音信号在很大程度上依赖于所使用的信号存储途径,二进制数0和1凭借一些专用的器件得以保存。由于存取灵活方便,因此从根本上决定了由数字表示的信号能够借助存储这个途径,实现极其复杂的系统设计。

静态RAM(SRAM)

静态RAM存取存储器一般采用CMOS(包括HCMOS)工艺制造,具有高速低功耗的优点,能够与常规的双极型TTL器件接口直接相连。另外,采用综合双极型与CMOS两种不同技术新型BiCMOS工艺制作TTL或BCL SRAM,提高了读写周期速度,增强了系统的抗干扰能力。

从容量方面来看,目前生产的单片SRAM产品,具有4Mb的存储能力。不过普遍使用的仍是256k位的器件。容量达到1M位的单片SRAM,基本上都是采用CMOS工艺制造的TTL 器件,存取时间在35ns和25ns之间。

动态随机存取存储器(DRAM )

动态随机存储器与静态RAM相似,其器件内的存储单元也是按行列组成矩阵,不过它依靠单管存储单元输入电容的暂存电荷来保持所驻留的数据。由于PN结的漏电流会引起存储单元放电,因此必须重复、定时的对动态存储单元进行读出和恢复,即进行存储器再生的过程。一般来说,温度对放电速度有很大影响:温度越高,放电速度也越快。

要保证存储单元存储的数据不丢失或不受影响,再生时间间隔要求在1100 u s之间。如器件工作在70℃温度下,典型的再生时间间隔是2nS。在这个过程中,将一个行地址发送给存储器器件,然后执行一次读操作,便可完成时选中的行中各个存储单元的再生。

存储器再生与正常的存储器读周期有以下三点区别:

第一,二者使用的地址所依赖的硬件电路不一致。一般来说,存储器再生地址由再生地址计数器提供,每经过一次存储器再生,该计数器就自动加1,以便顺序提供所有的行地址。而对于读操作来说,输入至存储器的地址来自地址总线。

第二,存储器再生周期期间,其模块的各器件都处于启动状态,所以每块器件的再生是同时进行的,这样可以减少再生周期数。而在正常的读周期中,最多只会启动一行存储阵列。第三,除了芯片启用控制输入外,动态RAM通常还有一个数据输出允许拉制端。当这两个拉制端都有效时,数据输出才得到允许,否则数据输出端呈现高阻态。在存储器再生过程中,不驱动器件的数据输出允许控制端,因此数据输出端是处于高阻态的。

动态RAM的缺点是需要再生逻辑,并且在再生周期中,存储器模块不能进行读操作,更不能进行写操作,因此对于读或写来说,读、写的请求时间会相应延长一倍。存储器再生需

要牺牲动态存储器的有关响应时间。

DRAM的制造工艺也属CMOS工艺(NMOS)。封装也有DIP, ZIP或SOJ等。目前DRAM器件的单片容量已经达到128M位,更大容量的DRAM器件也即将推出。

DRAM器件存取时间典型的为100ns, 120ns和150ns,高速的达60~70ns,因受到制造工艺的影响,DRAM存取速度很难再得到提高。

动态RAM的最大好处是功耗低,一般每位动态RAM的耗散功率小于0.05m W,与典型的静态RAM每位的功耗(0.2m W)相比要小四倍,所以动杰RAM更适宜于构成非易失性存储器。

紫外线可擦除电可编程只读存储器( EPROM )

紫外线可擦除电可编程只读存储器,是一种能有效保存数据的存储器。EPROM的封装有DIP,陶瓷PLCC和SOP等种类,另外还有超薄性TSOP封装。EPROM具有不挥发性和电不可改写性,用于存放程序执行代码能大大提高程序运行的可靠性,但由于EPROM的内容不能带电在线修改,不利于内容的更新,在使用上有许多不便之处。另外,EPROM的读取速度较慢,约150ns左右;容量也较小,最多为25dKB还不能满足目前大容量存储的需要。 电擦除可编程只读存储器(REPROM )

EEPROM是一种电可擦除并能反复使用的可编程只读存储器。它采用可靠的浮空门技术,具有EPROM的片选拉制与输出允许位。它的擦除/写入循环可达100 000次,并且读取时间快、功耗低。但是,擦除/写入的技术条件大都是在0-70℃是才能得到保证,而且容量小,价格昂贵。EEPROM的封装形式多种多样,有DIP, SOP和TSOP等。

闪烁存储器(Flash Memory)

Flash Memory是近20年来出现的第一种最引人注目的新型存储器,它是EPROM和EEPROM技术有机结合的产物,Flash Memory具有和EPROM一样的可编程能力,又带有像EEPROM一样的电可擦除性能,对它的重新编程不需要将它从电路板上取下来就可以实现。同样的优点,虽然EEPROM和带有后备电池的SRAM也具有,但相同的容量,Flash Memory的价格还不到它们的一半。Flash Memory还具有不挥发性,访问速度快(约6Ons)和密度高等特点。Flash Memory的不挥发性,使它掉电后不需要后备电池供电就可以长期可靠地保存数据。FlashMemory工作于12V时,可以像EEPROM一样实现带电改写,这就使它有相当大的潜力应用于过去采用EPROM, EEPROM,后备电池供电的SRAM的场合。

2.6合成语音输出的综合应用系统评述

语音作为人机对话手段,可以促使人机界面从数字领域进人模糊领域。合成语音输出,它的作用是实现人机对话联系的一个重要环节。衡量合成语音的指标是音质,诚然我们很难定性地决定采用波形编码合成法还是参数合成法可以得到优质语音输出,但是鉴于开发应用时所能提供的手段,波形编码合成法占有一定优势。

汉语的汉字在国标码中有二个级别,一级字库为常用汉字3755个,二级字库汉字3008个,总计6763个。考虑具体使用对像以及同音字,那么即便以最常用的近700个发音字考虑(含同音字),基于16KBPS及ADM合成方式,所需存储器容量也大约为256K字节。由于这种语音库建立起来很方便,而且最终合成语音输出质量也能得到保障,所以具有性能价格比高及开发应用方便的特点。而采用参数合成法,由于获得参数及至调整参数,以克服机器音工作复杂,虽然可以缩减存贮容量。但是在当前应用时还是有一定的困难的。

具有合成语音输出的综合系统可以有以下几方面优点:

1.语音指导操作,使操作员直接根据装置的提示而熟悉使用方法;

2.报告信息,辅助显示报告有关情况;

3.报告故障情况,提供维修的可能方法;

4.帮助建立人机对话联系。

总之,语音合成作为语音处理中的一部分有其自身的特点,它可以加入计算机应用系统中去,增强信息的输出能力,对于人机界面上的沟通有着重要的作用。

第3章T6668语音芯片介绍及与单片机接口技术

3.1系统特性

随着科学技术的迅速发展,通信事业成为首当其冲的发展对像,电话事业作为公共传播媒体发展最为普及。但目前我国使用的电话,大多数不具有留言的功能,这给通话双方均带来一定的不便。我们认为开发留言式电话机,可以提高电话的通信功能及服务质量。

利用89C51单片机与T6668语音合成芯片构成的性能/价格比高、功能强、语音清晰的电话留言机。它可以外挂于电话机之外,构成独立的留言机,与电话机并联使用,也可以将其与电话机组合起来构成一体化的电话留言机。该留言机的特点为:

?采用DRAM存贮语音信号。既缩小了整机体积,又可提高记录媒体的可靠性。

?可实现多人留言。通过增加存贮器容量,改变采样频率、留言时间,可达到灵活设定留言人数的目的。

?留言时间可定长或非定长,即给每个留言人规定固定的留言时间或使留言时间随话音时问长短而定。

?若用户不留言或留言满,可自动挂机。

?用户可通过留言机上的小话筒自行存人须告知电话对方的各种信息,用户可在非留言状态下,随时、反复地回放留言。

?具有人工(按键)、自动(定时)方式消除留言的功能。人工清除是随机的,而自动清除则是在留言保留一定时间后,允许接收新留言来覆盖的留言。

?具有自动振铃检测功能。即振铃m次后,自动摘机。

?设置了录、放、联机按键,以便用户操作,同时,指示灯为用户提供该机的工作状态,?外挂式留言机既可独立地工作,又可与电话机并行工作。

3.2语音合成芯片T6668简介

T6668时日本东芝公司生产的一种高级语音处理器,它可以由手动控制,也可以由CPU驱动,并且可以与DRAM相连,完成动态RAM的刷新。T6668是采用模拟信号分解、数字信号合成、动态存储技术的数字化语音集成电路。问世以来以其较强的功能和较高的性能价格比倍受设计者的宠爱,与简单的外围器件配合即构成随录随放型T6668语音可手动控制实现语音记录、再生。T6668语音处理器是一种新型的用数字技术实现的语音信号记录和再生的大规模CMOS集成电路芯片。

3.2.1常见语音芯片比较

为明确T6668芯片特点,现将各种常见语音芯片列表比较,请见表3-1

表3-1 常用语音芯片

序号芯片名称引脚数配用存储器录放时间

(s)电源电压(v)备注

1 UM5101 双列直插40脚1~2片DRAM 8 +5,+8 两种速率可供选择

2 UM5100 双列直插40脚SDRAM 25 3~6

3 UM93520A/B 双列直插28脚DRAM 8~32 +5 三种速率可供选择

4 T6668 方60脚EEPR0M 128 +

5 有CPU接口,可分16段

5 TC8830AF 方67脚SRAM 128 +5 有CPU接口,可分16段

6 YYH40 双列直插28脚DRAM 16~60 +5

7 ISD2590 双列直插28脚EEPR0M 45~90 +5

8 ISD1000A 双列直插40脚EEPR0M 12~20 +5

9 HY18A和HY18B 55mm×40mm印制版2×40脚SRAM 8~16 6

10 VP-1000 双列直插40脚SRAM 26 3~6

11 VP-1410 双列直插48脚SRAM 106 3~6 可分10段

12 VP-2500/

2505/2508 双列直插40脚SRAM 3~6

13 IVR1061 双列直插16脚R0M 6 +5 一次性编程,可级联

14 YYH402 双列直插48脚SRAM 16 +5

15 SR9F26C

方40脚EEPRM 12 +5

16 KS5917 双列直插40脚DRAM 128 +5

17 YYH16 双列直插28脚DRAM 8~32 +5

18 HY-20A 双列直插28脚EEPR0M 20 +5 可分16段

19 VTV001B 印刷版40脚DRAM 64 +6,+5 16~32kbps速率可选

3.2.2芯片特点

1.单芯片语声录制/再生大规模集成器件;

2.动态RAM作为语音数据的存储器,可外接4片64K位或者4片256K位的DRAM芯片;

3.芯片内载DRAM所需的刷新电路;

4.采用自适应增量△调制(ADM)方式;

5.具有直接与外部CPU联系的接口,并且可由外部CPU设置9种控制T6668工作方式的操作命令;

6.能够进行多达16段的声音录放。采用分区记忆,在存储器中自动划分区域,以任意长度存取录音数据。并在声音再生时不要求录制时的顺序,可自由的择取与组合;

7.32kbps,l6kbps。llkbps,8kbps四种比特率供选择使用;

8.录制声音使用4片256位DRAM,以8kbps比特率(语音已经清晰)进行声音录制时,声音录制的时间一般可达128秒;

9.内载高性能录音话筒放大器以及声音再生带通滤波器;

10.内载10位D/A转换器、电压跟随器输出;

11.内载陶瓷振子的振荡电路;

12.单电源-5V DC供电;

13.具有CCMOS结构的低功耗特性;

14.具有CPU操作与手动操作二种工作方式,以供用户选择使用;

15. 60脚薄形扁平封装。

3.2.3 T6868应用的局限性

T6868有如下局限性:

1.只能外接动态RAM,仅适用于简单的录、放音系统,无法进行语音编辑和存储。

2.录、放音时间受T6668本身的存储量限制,最大为256K字节。

3.外接DRAM,掉电后语音信息将丢失。

4.与EPROM不能直接相连。

5.索引方式下最多录放16段,在许多场合受限制。

3.3 T6668的引脚功能及内部结构介绍

3.3.1 T6668的引脚功能

T6668芯片各引脚如图3-1所示:

1.CAS1~CAS4: 列地址选通脉冲输出端,工作时CAS1到CAS4顺序工作,

他们分别接相应序号的片选端。

2. Ext:用于测试电路的输入引脚。

3.M1,M2:输入引脚,用于编程决定外接DRAM的片数,其编程见表3-2:

表3-2 存储器片数选择

片数M1 M2

1 0 0

2 0 1

3 1 0

4 1 1

4. Vss1:数字地。

图3-1 T6668芯片引脚图

5. Vss2:模拟地。

6. MICOUT:内部话筒放大器的输出端。

7. C1,C2:内部话筒放大器的耦合电容连接端。

8. MICIN:内部话筒放大器的输入端,话筒经过电路与该端相连。

9. TS1,TS2:芯片测试端,用户使用时可以闲置。

10.FILOUT,FILIN:声音再生的内部带通滤波器的信号输出输如引脚。

11.DAO:声音合成电路的声音输出端。电压跟随器输出。录制期间,此端

为输入声音的监听输入端。输出实在VDD这个中心上下摆动的振荡信号。12. ADI:录音时的声音输入端。输入信号必须是在VDD这个中心上下摆动

的振荡信号,并且最大值为1.6V(峰—峰)。

13. VDD :电源正端,接+5V 。

14.ACL:复位信号输入端。

15.CPUM:操作模式转换端。此端为低电平时,T6668工作在手动操作模式;此端高电平时为CPU操作模式。

16.D0~D7:在CPU操作模式下为双向数据总线;在手动操作模式下,则以

如下方法使用:

D0~D3:用作段选择输入端。D3为高位,D0为低位。D0~D3为0000时选择第0段,为0001时选择第1段……为1111时选择第15段。

D4为启动输入端,高电平有效。

D5为停止端,高电平有效。录音和再生均由D4,D5启动,停止。

D6,D7位比特率选择输入端。具体设置如表3-3所示:

表3-3 比特率选择

比特率D7 D6

8kbps 0 0

11kbps 0 1

16kbps 1 0

32kps 1 1

17. CE :CPU操作模式下为芯片的使能端。在手动操作模式下,录音时必须为低电平,放音时该引脚为有声无声的控制,该端为低电平时有声音输出,高电平时无声音输出。

18. WR :在CPU操作模式下,该引脚为写脉冲输入端。在手动操作模式下,该脚为录音,再生控制端。该端高电平为录音,低电平为放音。

19. EOS :语音终止输出端。当录音/再生启动后,该脚为低电平;当录音/再生停止之后该脚变为高电平。

20. XIN,XOUT:振荡器输入,输出端。外接655kHz的陶瓷振子和电容器。两只电容器一端接XIN,XOUT,另一端接地。

21. 256K:用于选择DRAM的类型。该端为低电平接64k位DRAM,为高电平时接256k 位DRAM。

22. WE :写脉冲输出端,接DRAM的WRITE引脚,低电平有效。

23. RAS :行地址选通脉冲输出端,接DRAM的RAS 端,低电平有效。

24. DIN :数据输入端,接DRAM的数据输出端。

25. A0~A8:地址输出端,当选择64k位DRAM时,A8可闲置或任意处理。

3.3.2 T6668的内部结构

T6668的内部结构框图如下图所示。它重要由以下几个部分组成:

(1)地址计数器:20位的地址计数器有1M位的寻址能力,用于指示外接DRAM的地址。在CPU操作模式下能通过命令读取或设置。

(2)停止地址计数器;用语知识停止录音或放音的地址。在CPU操作模式下可以命令读取,但不能任意设置。在手动模式下其值确定在00400H~0FFFFH之间。在芯片录放期间,地址计数器自动递增记数并和停止计数器比较。

图3-2 T6668内部结构框图

(3)变址寄存器:变址寄存器在表索引模式下用于指示DRAM中索引区的地址,用户不能操作。

(4)刷新计数器:用于DRAM的自动定时刷新,以保持数据不丢失。

(5)状态寄存器:8位的状态计数器用以指示T6668的工作状态。

(6)CPU接口:T6668接口电路用于外接CPU,并由CPU向T6668发送有关命令,以决定T6668的工作情况。在手动操作模式下,可用以消除抖动,内部有消颤电路,消抖动时间约16ms。

(7)话筒放大器:用于将话筒产生的语音信号放大。从MICOUT端口输出的语音信号和ADI(声音分析/合成电路的声音信号输入端)端口相连。放大器增益为45db。

(8)带通滤波器;用于声音的再生过程,滤去混入声音中的无效部分。

(9)DRAM接口;提供与DRAM接口的信号线,地址线。

(10)ADM分析合成器:自适应增量δ调制(ADM)分析合成电路,将语音信号变成数字序列信号,进行时化处理,形成二进制表征值存储到外接DRAM中去。

(11)D/A转换器与电压跟随器:用于将数字语音序列经ADM解译重新转换为模拟信号,以便恢复语音信号。

(12)时序发生控制电路:主要用于定时控制,产生时序。

3.4 探索T6668索引区的秘密

T6668是日本东芝公司的语音录放大规模集成电路。由于其高性能价格比,使广大开发者乐

于使用。它有两种工作方式即手动方式和CPU控制方式。外围电路简单,可选择4种比特率和可分16段录放,易于与CPU接口,使其应用更加灵活。T6668最适合外接到EPROM,进一步开拓它的应用。在手动工作方式下,开发者首先在不同段选下采入不同的音,固化EPROM后,在同样段选下放出原先录入的音。固化后,EPROM的前80H字节为T6668的索引区,这里记录了录音时各段的起始地址和结束地址及其他信息,重放时T6668读出地址数据,装入地址计数器中。目前国内许多生产T6668开发装置的厂家均采用这种方法。这种方法固然能完成某些工作,但局限性很大。最重要的原因是录音过程头尾间隙较大,照原样固化则浪费很多宝贵的EPROM空间。如果砍头去尾后得到有效的语音,但索引区的地址又不正确。因此有必要了解索引区存放数据的规律。下面将就这方面进行探讨。

3.4.1 T6668的索引区

T6668在手动控制时(或CPU控制使用LABLE命令时),把各段的起始地址、结束地址及比特率写入RAM,利用段号的选择进行录放音。不管外接RAM的容量,从地址0000H 到003FFH均为索引区,如图3-3所示。

图3-3 索引区示意图

在进行录音时,复位信号输入,使T6668复位到初始状态,这时内部地址计数器被预置在00400H,准备由此地址开始录入数据。

3.4.2 索引区内记录起止地址的方法

索引区地址与分段信息的对应如前所述,固EPROM后,处于EPROM的前80H字节,即对应DRAM的400H位作为T6668的索引区。因为T6668最大可分16段录放,每段分配8字节记录索引信息。在录音时,由T6668的D0(LSB)到D3(MSB),4根输入线的电平选择段为0,1, 2……F,段号和EPROM的字节地址有如下对应关系(见表3-4)。

表3-4 地址对应表

地址段号

0-7 0

8-F 1

10-17 2

…………

78-7F F

1.起止地址的表示法

每一录放段对应的8字节地址中,0,1两字节为本段的起始地址字节;4,5两字节为本段的结束地址字节,如表3-5

表3-5 8字节地址

字节0 1 2 3 4 5 6 7

内容00 01 X X E0 FF X X

起始地址字节和结束地址字节中存放起始地址和结束地址的有关信息。但并不可以直接看出,例如本例中并不是从000l一E0FF。它们中间有一定的换算关系。

2.起始字节内容(结束字节内容)和起始地址(结束地址)的换算关系

下面通过一个具体实例来说明这种换算关系。

设有一音固化在EPROM 27256中,其字节地址为0080H-07FFH,通过以下两个步骤,可以算出索引区起始字节和结束字节的内容。

(1)将起止地址每一字节的高低两半字节交换得: 0008一70FF

(2)查下表,将每一个十六进制位替代,

表3-6 十六进制位替代表

0 1 2 3 4 5 6 7 8 9 A B C D E F

0 8 4 C 2 A 6 E 1 9 5 D 3 B 7 F

得:0001一E0FF,即字节0的内容为00,字节1的内容为01,字节4的内容为E0,字节5的内容为FF。它们代表了EPROM 27256在0080H一07FFH中固化的语音地址。

3.注意事项

不管外接EPROM的容量多少,如果要16段使用,则EPROM的最前80H字节(字节地址为00H ~7FH ),必须留出作索引区。语音数据从80H开始存放。如果实际使用只分8段,则索引区可以只留40H字节(即字节地址00H - 3FH ),语音数据可以从40H开始存放。当然这时的段号只能是0-7只要掌握了段号和索引区地址的关系,以及实际语音存贮地址和索引区起止地址字节内容的换算关系,不难进行种种灵活的设计。

3.5 T6668主要工作方式

3.5.1手动操作模式

(1)录音:录音时先要人工设定段数,波特率数和WR端为高电平。例如将D3~DO设定为0010即第2段,D7,D6为01,即11kbps。电路连接好后即可给D4送宽度大于16ms的正脉冲,开始录音。录音需要停止时D5送宽度大于16ms的正脉冲,录音过程结束。再次录音时重复上述过程,将段数设定为其它值。在录音过程中DRAM达到最大值也自动停止录音过程。

(2)放音:放音与录音过程相似,先设定段数,波特率数WR为低电平。D4送正脉冲后开始放音。放音时T6668根据录音时装入DRAM中的启动地址和停止地址工作。放音时的段数顺序不一定和录音时的顺序相同。

3.5.2 CPU操作模式

在CPU操作下,T6668可以用9中命令来实现对其操作的控制。在任意时刻CPU都可以读取。T6668写入命令之前先要读取状态寄存器的D7位,当D7位为“1”时即BUSY“忙“,不能写入命令。只有当D7位为“0”时才能写入命令。如果命令是ADLD1,ADLD2等三字节命令时,在BUSY不“忙”时才能写入命令,此时必须等三个字节都写完后才能写入其它命令。

3.5.3 T6668能执行的九条命令

1.空操作命令NOP:NOP为单字节命令,高4位为0,低4位任意,详见表3-7。这个命令用于在录制过程中设置T6668为再生方式。此外,还用于复位状态寄存器的ERR和OVR 位。

2.启动命令START(单字节);该命令用于录音/再生的启动。执行此命令时根据地址计数器所指DRAM地址开始,利用直接方式启动录音或再生。

3.停止命令STOP(单字节):用户声音的录制或再生的停止。如果爱LABEL命令下录音时,本命令发出时的地址计数器值将写入DRAM的相应的索引区中。

4.起始地址设置命令ADLD1(三字节):该命令用语设定地址计数器的起始地址。命令为三字节当指定DRAM为64k位时,对应的A18,A19应强制为0。

5.终止地址设置命令ADLD2(三字节):该命令用于设置终止地址寄存器地址。同样,指定DRAM为64k位是A18,A19应强制为0。

6.比特率与声响状态指定命令CNDT(单字节):该命令用于指定波特率和声响状态,在录音时不允许社顶为无声状态。

7.段号指定命令LABLE(单字节):该命令用于指定段号。

8.读起始地址命令ADRD(单字节):该命令用于读出地址计数器的内容。从数据总线上分三次读出地址计数器的A0~A19。如果未完成三次读操作便又给下一个命令,那么ADRD 命令将被终止而进行下一命令的处理。

9.录音命令REC(单字节):该命令用于设置T6668进入录制声音的守侯状态。它可以中断正在进行的放音过程。NOP命令可以中断录音守侯状态而进入再生方式。

为表达清楚,下面列表将T6668所能执行的九条命令以表3-7作简单介绍:

表3-7 T6668能执行的九条命令

序号指令第一字节第二字节第三字节

特征位D7~D4 D3~D0 D7~D0 D7~D0

1 NOP 0000 XXXX ——

2 START 0001 XXXX ——

3 STOP 0010 XXXX ——

4 ADLD1 1100 A19A18A17A16 A15~A8 A7~A0

5 ADLD2 0100 A19A18A17A1

6 A15~A8 A7~A0

6 CNDT 0101 X SL BR1 BR0

————

状态SL 比特率BR1 BR0

有声0 8kbs 0 0

无声1 11kbs 0 1

16kbs 1 0

32kbs 1 1

7 LABEL 0110 L B3 LB2 LB1 LB0

4位LB3 LB2 LB1 LB0的定义,决定段号N0.X段号。N0.X为16段,为N0.1~N0.15

8 SDRD 0111 X XXX

读输出数据

D7D6 D5 D4 D3 D2 D1

第一次0 0 0 0 A19 A17 A16

第二次A15 A14 A13 A12 A11 A10 A9 A8

第三次A7 A6 A5 A4 A3 A2 A1 A0

9 REC 1000 XXXX

3.5.4状态寄存器

CPU工作时要经常检测状态寄存器的内容,以决定下一步的动作。状态寄存器各位的意义如表3-8:

表3-8 状态寄存器

D7 D6 D5 D4 D3 D2 D1 D0

BUSY EOS ERR O VR M2 M1 0 0

1)D7位(BUSY位):当该位为0时CPU可以对T6668输入命令;当D7=1是不接收CPU 的任何命令。BUSY位出现“1”的条件有三种:

1.T6668在复位周期期间。

2.T6668处理外部命令期间。

3.由于地址溢出而停止声音录制的处理过程期间。

2)D6位(EOS位):该位为1时表示T6668不能进行录音/再生才能被启动。D6为的值与EOS端输出电平相一致。D6为1时EOS也为1,D6为0时EOS也为0。

3)D5位(ERR位):命令出错指示位。CPU给T6668任一未定义指令时则ERR位置“1”。命令NOP用来完成起复位,恢复为“0”。

4)D4位(OVR位):地址溢出指示位。在用LABEL命令录音时,若地址计数器值超过DRAM 的最大地址时,该位置“1”,以表示录音结束。由

5)NOP指令为其复位。地址溢出的检测由芯片内部的地址溢出检测器判断并给予D4位置位。

6)D3 D2位(M2,M1):这两位与T6668的M1端和M2端设置情况相一致,通过这两位可以读出决定M0,M1外接芯片片数。

7)D1,D0位:这两位固定为0,没有意义。

3.5.5 CPU操作模式下控制的两种模式

CPU操作模式下还分直接模式和标记索引模式:

(1)直接模式

直接模式是指对于每一段的起始地址,停止地址和比特率都由CPU通过命令予以给定。这时T6668的工作段数将不是16段而是任意的,DRAM中的标记索引区可以作为数据区使用。

(2)标记索引模式

标记索引模式则是指对于每一段的起始地址,终止地址,比特率均写入DRAM的索引区中,CPU通过命令只需要控制段号便可响应。录音时先给复位端ACL复位为低电平,然后再置高电平。这个复位的时间不能小于46μs。复位操作使地址计数器和停止地址计数器都置成00400H,比特绿设置为8kbps,ERR,OVR位复位,复位结束后BUSY位由“1”变为“0”,若在CPU操作模式下复位后初始化为声音再生方式。

3.6 A T89C51单片机介绍

51内核的8位系列单片机现在已非常成熟,随着各种外围功能的扩展,51单片机已从最单纯的MCU控制器发展成为拥有强大外围扩展功能的系列产品;其工作频率也从最初常用的6MHz发展到现在的33MHz;生产单片机的公司也从最初的Intel公司发展到了ATMEL,PHILIPS,NEC,CYPRESS以及Winbond等众多公司。

最近ATMEL公司把在线可编程技术ISP(In System PROGRAMMED)和51系列单片机结合起来,大力推广AT89S系列大单片机。这种单片机能够实现动态下载程序代码,从而使用户的开发和使用更加方便。

3.6.1 A T89C51单片机综合特性介绍

89C51单片机的技术特点如下:

1)基于Mcs-51核的处理器结构;

2)32个I/O引脚;

3)2个计数器/记时器;

4)5个分为2个优先级的中断入口;

5)128字节的内部数据存储器(RAM)。

At89C51的资源如下:

4kb 的内部flash程序存储器,可实现3个级别的程序存储器保护功能;

128字节的内部数据存储器;

32个可编程I/O引脚;

6个中断源,2个优先级;

1个可编程的穿行通信存储器。

AT89系列单片机(兼程9系列单片机)是A TMEL公司的8位Flash单片机。这个系列单片机最吸引人之处是以89C51核构成的,所以与8051系列单片机互兼容。这个系列对于以8051为基础的系统来说,取代和构造十分容易。故对于熟悉8051的用户来说,用A TMEL公司的89系列单片机取代8051来进行系统设计是轻而易举的事。

89系列单片机的内部结构与80C51相近,主要含有以下一些部件:

89C51 CPU:

振荡电路

总线控制部件

中断控制部件

片内Flash存储器

片内RAM

并行I/O接口

定时器

串行I/O接口

主要性能参数:

与MCS-51产品指令系统完全兼容

4k可重擦写Flash闪速存储器

1000次擦写周期

全静态操作:0Hz-24MHz

三级加密程序存储器

128X8字节内部RAM

32个可编程I/O口线

2个16位定时/计数器

6个中断源

可编程串行UART通道

低功耗空闲和掉电模式

AT89系列单片机对于一般用户来说,存在3个明显的优点:

1.内含Flash存储器

由于内含Flash存储器,因此在应用系统的开发过程中可以十分容易地进行程序的修改。这就大大的缩短了系统的开发周期。同时,系统工作过程中,能有效的保存一些数据信息,即使外界电源损坏了也不影响信息的保存。

2.与80C51插座兼容

AT89系列单片机的引脚与89C51是一样的,所以,当用AT89系列单片机取代80C51时可以直接进行取代。这时,不管采用40引脚还是44引脚的产品,只要用相同引脚的AT89系列单片机取代就80C51即可。

3.静态时钟方式

AT89系列单片机采用静态时钟方式,所以可以节省电能。这对于降低便携式产品的功耗十分有用。

AT89系列单片机的内部结构与一般单片机是相似的,含有CPU,存储器,和I/O等部件。本节将介绍AT89系列单片机的结构方框图,定时程序,和接口部件及其功能。A T89系列单片机有AT89C系列的标准型及低档型,还有AT89S系列的高档型。AT89S系列是在AT89C系列的基础上增加一些特别的功能不见组成的,所以两者在结构上基本相似,只是在个别模块模块及功能上有些差别。

3.6.2 A T89C51单片机引脚介绍

89C51单片机采用双列直插式(DIP)、QFP44(Quad Flat Pack )和LCC(Leaded Chip Carrier) 形式引脚封装,如下图所示。

图3-4总线型89C51引脚封装

(1)电源及时钟引脚(4个)

?:电源接入引脚;

?:接地引脚;

?XTAL1:晶体振荡器接入的一个引脚(采用外部振荡器时,此引脚接地);

?XTAL2:晶体振荡器接入的另一引脚(采用外部振荡器时,此引脚作为外部振荡信号的输入端)。

(2)控制线引脚(4个)

RST/ :复位信号输入引脚/备用电源输入引脚;

ALE/PROG:当访问外部程序存储器或数据存储器时,ALE(地址锁存允许)输出脉冲用于锁存地址的低8位字节。即使不访问外部存储器,ALE仍以时钟振荡频率的1/6输出固定的正脉冲信号,因此它可对外输出时钟或用于定时目的。要注意的是每当访问外部数据存储器时将跳过一个ALE脉冲。对Flash存储器编程期间,该引脚还用于输入编程脉冲PROG 。

如有必要,可通过对特殊功能寄存器(SFR)区中的8EH单兀的D0位置位,可禁止ALE操作。该位置位后,只有一条MOVX和MOVC指令ALE才会被激活。此外,该引脚会被微弱拉高,单片机执行外部程序时,应设置ALE无效。

EA/VPP:外部访问允许。欲使CPU仅访问外部程序存储器(地址为0000H-FFFFH ), EA端必须保持低电平(接地)。需注意的是:如果加密位LB1被编程,复位时内部会锁存EA端状态。如EA端为高电平(接Vcc端),CPU则执行内部程序存储器中的指令。

Flash存储器编程时,该引脚加上+12V的编程允许电源Vpp,当然这必须是该器件是使用12V 编程电压Vpp。

:外部程序存储器选通信号输出引脚。

(3)并行I/O引脚(32个,分成4个8位口)

P0口:P0口是一组8位漏极开路型双向工I/O口,也即地址/数据总线复用口。作为输出口用时,每位能吸收电流的方式驱动8个TTL逻辑门电路,对端口写“1”可作为高阻抗输入端用。

在拍访问外部数据存储器或程序存储器时,这组口线分时转换地址(低8位)和数据总线复用,在访问期间激活内部上拉电阻。

在Flash编程时,P0口接收指令字节,而在在程序校验时,输出指令字节,校验时,要求外接上拉电阻。

P1口:P1是一个带内部上拉电阻的电路8位双向I/O口,P1的输出缓冲级可驱动(吸收或输出电流)4个TTL逻辑门电路。对端口写“1”通过内部的上拉电阻把端口拉到高电平,此时可作输入口。作输入口使用时,因为内部存在上拉电阻,某个引脚被外部信号拉低时会输出一个电流。

Flash编程和程序校验期间,P1接收低8位地址。

P2口:P2口是一个带有内部上拉电阻的8位双向I/O口,P2的输出缓冲级可驱动(吸收或输出电流)4个TTL逻辑门电路。对端口“1“,通过内部的上拉电阻把端口拉到高电平,此时可作输入口,作输入口使用时,因为内部存在上拉电阻,某个引脚被外部信号拉低时会输出一个电流I。

在访问外部程序存储器或16位地址的外部数据存储器(例如执行MOVX @DPTR指令)时,P2口送出高8位地址数据。在访问8位地址的外部数据存储器(如执行MOVX @RI指令)时,P2口线上的内容(也即特殊功能寄存器(SFR)区中R2寄存器的内容),在整个访问期间不改变。

Flash编程或校验时,P2亦接收高位地址和其它控制信号。

P3口:P3口是一组带有内部上拉电阻的8位双向I/O口。P3口输出缓冲级可驱动(吸收或输出电流)4个TTL逻辑门电路。对P3口写入“1”时,它们被内部上拉电阻拉高并可作为输入端口。作输入端时,被外部拉低的P3口将用上拉电阻输出电流。

3.7 T6668与微处理器的接口技术

下面我们以MCS-51系列的89C51单片机控制T6668进行声音再生为例,讨论T6668与微处理器的接口技术。对于其它的微处理器及微机,原理是一样的,录制过程原理也类似。下面先给出工作流程图(图3-5),在分别介绍两种不同的接口技术。

图3-5工作流程图

3.7.1 串一并转换接口

此方式是利用74LS165芯片实现T6668与89C51的连接。

具体方法是T6668外接一片DRAM,将CAST信号端与74LS165的CK端相连,而74LS165的Q端直接与T6668的数据端DI相连,这样只要89C51将一个字节送给74LS165的并行八位口,同时控制T6668使其在直接模式下进行仅有八个比特单位的再生,等89C51检测到EOS变高后,再送另一字节给74LS165,进行另外一个比特的再生,直到完成全部数据为止。

这种接口可以实现89C51对T6668的控制和向它提供数据,其缺点一是硬件代价大,二是将一段完整的语音数据分成多个八比特再生,每次都对T6668写入起始地址、终止地址和波特率,并启动它,引入了较多的附加时间,因此音质受到影响。

3.7.2 中断方式接口

我们知道,动态存储器在进行读写时,RAS用于行地址的锁存,CAS用于列地址的锁存,从地址线来看,CAS用于锁存低地址位,RAS用于锁存高地址位,所以T6668进行每比特数据读写时,都必然有CAS出现,即CAS将产生一个负脉冲,我们将CAS作为中断请求信号,便十分容易地实现了T6668与89C51的接口。

值得说明的是,这种接口方式只占用89C51的两根I/O线,硬件代价很小,是实现低成本的一条有效途径,并且音质优于串-并转换接口。

这种方式有几个特点:

(1)T6668工作于CPU方式;

(2)T6668的“外接DRAM”定为一片;

(3)占用89C51外部中断口“0",89C51通过P3.5向T6668送数。

这时,T6668工作于直接模式,由于硬件上规定为外接一片256K DRAM,因此最大寻址范围是0~3FFFF bit,我们在启动T6668前把起始和终止地址定为最大,即0- 3FFFF bit,而真正放音的起止地址由89C51来控制,送完指定的数据后,由89C51向T6668发STOP 命令即可。

每次启动T6668只能寻址。0~3FFFF bit的空间,因此每次启动的时间受到限制,例如波特率定8K,则每次启动放音时间最多为32s,在实际运用过程中,要放超过32s(以8K为

智能语音录放系统

语 音 录 放 系 统 设 计 报 告系别:电气工程与自动化 专业:xxxxx

摘要 目前,语音合成、语音识别、语音存储和回放技术的应用越来越广泛,尽管利用一般的单片机测控系统中都有的硬件电路(如A/D、 D/A、存储器等)能完成语音信号的数字化处理,但是功能比较单一、且效果不是很好。本文采用单片机AT89C52与语音芯片ISD2560组成的语音存储系统,实现了语音的录取、循环回放。系统硬件电路简单,调试方便,性价比高,实用性强。 关键词:语音录放系统;单片机AT89C52 ;ISD2560

第1章绪论 1.1导言 目前基于单片微机的语音系统的应用越来越广泛,如电脑语音钟、语音型数字万用表、手机话费查询系统、排队机、监控系统语音报警以及公共汽车报站器等等。本文用单片机AT89C52和录放时间达60S的数码语音芯片 ISD2560设计了一套智能语音录放系统,实现了语音的分段录取、组合回放,通过软件的修改还可以实现整段录取,循环播放,而且不必使用专门的 ISD语音开发设备。 1.2数字语音录放系统的发展 数字语音录放是指利用数字技术对语音信号进行采集、处理、并且在一定存储设备中进行存储,并可在需要时进行输出的过程。相对于模拟设备来说,数字设备易于集成、小型化、成本更低,同时更为稳定,且操作更为直接、方便,使得数字语音录放系统目前在各种领域中都得到了广泛的应用。例如监控环境中使用的语音采集系统;再如家庭或学校中使用的语音复读机等,都可看作是数字语音录放系统的典型应用。 然而目前一般的数字语音录放系统中,对语音只是进行简单的采集、存储和播放;虽然可以较大程度上保证语音的保真度,但过多的语音数据会造成对大量存储设备的需求。对于大型系统,可通过采用大容量的硬盘、甚至大规模的磁盘阵列来解决;但是对于小型的设备,例如便携式的语音复读机,由于容量有限,则不能采用同样的方法。 近年来,语音信号处理技术研究的突飞猛进,为数字语音录放系统提供了新的发展空间。对语音的采集、处理从以前简单的波形编码转变为进行参数编码、压缩,从而大大减少了存储数据。举例来说,原始语音一般都是采用8KHz抽样,16bits的线性PCM编码进行采集,在一般的系统中就直接将采集后的数据进行存储;而如果采

数字信号处理 语音信号分析与处理及其MATLAB实现..

摘要 (2) 1 设计目的与要求 (3) 2 设计步骤 (4) 3 设计原理及内容 (5) 3.1 理论依据 (5) 3.2 信号采集 (6) 3.3 构造受干扰信号并对其FFT频谱分析 (8) 3.4 数字滤波器设计 (9) 3.5 信号处理 (10) 总结 (12) 致谢 (13) 参考文献 (14)

用MATLAB对语音信号进行分析与处理,采集语音信号后,在MATLAB软件平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。 数字滤波器是数字信号处理的基础,用来对信号进行过滤、检测和参数估计等处理。IIR数字滤波器最大的优点是给定一组指标时,它的阶数要比相同组的FIR滤波器的低的多。信号处理中和频谱分析最为密切的理论基础是傅立叶变换(FT)。离散傅立叶变换(DFT)和数字滤波是数字信号处理的最基本内容。 关键词:MATLAB;语音信号;加入噪声;滤波器;滤波

1. 设计目的与要求 (1)待处理的语音信号是一个在20Hz~20kHz频段的低频信号 (2)要求MATLAB对语音信号进行分析和处理,采集语音信号后,在MATLAB平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器进行滤除噪声,恢复原信号。

2. 设计步骤 (1)选择一个语音信号或者自己录制一段语音文件作为分析对象; (2)对语音信号进行采样,并对语音信号进行FFT频谱分析,画出信号的时域波形图和频谱图; (3)利用MATLAB自带的随机函数产生噪声加入到语音信号中,对语音信号进行回放,对其进行FFT频谱分析; (4)设计合适滤波器,对带有噪声的语音信号进行滤波,画出滤波前后的时域波形图和频谱图,比较加噪前后的语音信号,分析发生的变化; (5)对语音信号进行回放,感觉声音变化。

单片机语音录放系统设计电气原理图汇编源程序流程图.

单片机语音录放系统设计+电气原理图+汇编源程序+流程图 单片机语音录放系统设计+电气原理图+汇编源程序+流程图第3章硬件电路部分设计3.1单片机的选择在设计中文章选择单片机AT89C52作为播放器的核心控制部件,原因是因为AT89C52的功能全部兼容MCS-51,并且还有程序加密等功能,相比而言更加实用。AT89C52单片机是美国ATMEL公司生产的低电压,高性能CMOS8位单片机,片内含8KB的可反复擦写的只读程序存储器和256字节的随机存取存储器,器件采用ATMEL公司的高密度、非易失性存储技术生产,与标准MCS-51指令系统及8051产品引脚兼容,片内置通用8位中央处理器(CPU)和Flash存储单元,其强大的功能更适合较为复杂的控制应用场合。其主要工作特性是:?片内程序存储器内含8KB的Flash程序存储器,可擦写寿命为1000次;?片内数据存储器内含256字节的RAM;?具有32根可编程I/O口线;?具有3个可编程定时器;?中断系统是具有8个中断源、6个中断矢量、2级优先权的结构;?串行口是具有一个全双工的可编程串行通信口;?具有一个数据指针DPTR;?低功耗工作模式有空闲模式和掉电模式;?具有可编程的3级程序锁定位;?AT89C52工作电源电压位5(1±0.2)V,且典型值为5V。?AT89C52最高工作频率为24MHZ,编程频率为3~24HZ,编程启动电流为1mA。 3.1.1 引脚排列及功能 AT89C52的引脚排列如图3.1所示:首先对于I/O口线做一介绍:?P0口—8位、漏极开路的双向I/O口。当使用片外存储器及外扩I/O口时,P0口作为低字节地址/数据复用线。在编程时,P0口可用于接收指令代码字节;在校验时,P0口可输出指令字节(须外加上拉电阻)。P0口也可做通用I/O口使用,但需加上拉电阻,变为准双向口。当作为普通输入时,应将输出锁存器置1。P0口可驱动8个TTL负载。?P1口—8位、准双向 I/O口,具有内部上拉电阻。P1口是为用户准备的I/O口双向口。在编程和校验时,可用做输入低8位地址。用做输入时,应先将输出锁存器置1。P1口可驱动4个TTL负载。?P2口—8位、准双向I/O口,具有内部上拉电阻。当使用片外存储器或外扩I/O口时,P2口输出高8位地址。在编程/校验时,P2口可接收高字节地址和某些控制信号。P2口也可做普通I/O口使用。用做输入时,应先将输出锁存器置1。P1口可驱动4个TTL负载。?P3口—8位、准双向I/O 口,具有内部上拉电阻。P3口可做普通I/O口使用。用做输入时,应先将输出锁存器置1。在编程/校验时,P3口接收某些控制信号。它可驱动4个TTL负载。图 3.1 AT89C52引脚排列图 3.1.2 编程与效验方式AT89C52的编程、校验、程序锁定位的编程和片擦除等操作与AT89C51相同只是地址空间为0000H~1FFFH。表3-1 AT89C52编程电标志顶端标志型号编程电压VPP=5V 编程电压原文请找腾讯3249114六,维~论'文'网 https://www.wendangku.net/doc/b81794289.html, VPP=12VAT89C52 AT89C52 AT89C52 XXXX- 5 XXXX YYWW YYWWAT89C52的编程电压VPP为12V或5V,在产品封装的顶部印有编程电压标志,如表3.1所列: 3.2 晶振及复位电路设计单片机要想工作必须要在XTAL1和XTAL2端口加晶振电路,单片机工作速度也是由晶振电路决定的。典型的晶振电路如图3.2.1所示:在晶振电路中,电路中电容C3和C4对振荡频率有微调作用,通常的取值范围30±10pF;石英晶体选择6MHz或12MHz都可以。其结果只是机器周期时间不同,影响记数器的记数初值和运算

《verilog_数字系统设计课程》(第二版)思考题答案

绪论 1.什么是信号处理电路?它通常由哪两大部分组成? 信号处理电路是进行一些复杂的数字运算和数据处理,并且又有实时响应要求的电路。它通常有高速数据通道接口和高速算法电路两大部分组成。 2.为什么要设计专用的信号处理电路? 因为有的数字信号处理对时间的要求非常苛刻,以至于用高速的通用处理器也无法在规定的时间内完成必要的运算。通用微处理器芯片是为一般目的而设计的,运算的步骤必须通过程序编译后生成的机器码指令加载到存储器中,然后在微处理器芯片控制下,按时钟的节拍,逐条取出指令分析指令和执行指令,直到程序的结束。微处理器芯片中的内部总线和运算部件也是为通用目的而设计,即使是专为信号处理而设计的通用微处理器,因为它的通用性也不可能为某一特殊的算法来设计一系列的专用的运算电路而且其内部总线的宽度也不能随便的改变,只有通过改变程序,才能实现这个特殊的算法,因而其算法速度也受到限制所以要设计专用的信号处理电路。 3.什么是实时处理系统? 实时处理系统是具有实时响应的处理系统。 4.为什么要用硬件描述语言来设计复杂的算法逻辑电路? 因为现代复杂数字逻辑系统的设计都是借助于EDA工具完成的,无论电路系统的仿真和综合都需要掌握硬件描述语言。 5.能不能完全用C语言来代替硬件描述语言进行算法逻辑电路的设计? 不能,因为基础算法的描述和验证通常用C语言来做。如果要设计一个专用的电路来进行这种对速度有要求的实时数据处理,除了以上C语言外,还须编写硬件描述语言程序进行仿真以便从电路结构上保证算法能在规定的时间内完成,并能通过与前端和后端的设备接口正确无误地交换数据。 6.为什么在算法逻辑电路的设计中需要用C语言和硬件描述语言配合使用来提高设计效率? 首先C语言很灵活,查错功能强,还可以通过PLI编写自己的系统任务,并直接与硬件仿真器结合使用。C语言是目前世界上应用最为广泛的一种编程语言,因而C程序的设计环境比Verilog HDL更完整,此外,C语言有可靠地编译环境,语法完备,缺陷缺少,应用于许多的领域。比较起来,Verilog语言只是针对硬件描述的,在别处使用并不方便。而用Verilog的仿真,综合,查错等大部分软件都是商业软件,与C语言相比缺乏长期大量的使用,可靠性较差,亦有很多缺陷。所以只有在C语言的配合使用下,Verilog才能更好地发挥作用。C 语言与Verilog HDL语言相辅相成,互相配合使用。这就是即利用C语言的完整性又要结合Verilog对硬件描述的精确性,来更快更好地设计出符合性能要求的

语音录放器电子课程设计

南华大学电气工程学院 《电子技术课程设计》 设计题目:___________ 语音录放器___________ 专业:________ 本11通信02班 _________ 学生姓名:______________ 王佳杰____________ 学号:__________ 20114400218 ________ 指导教师:____________ 王彦________________ 教研室主任:__________ 王彦________________

语音录放器电子课程设计 《电子技术课程设计》任务书

2. 对课程设计成果的要求〔包括图表(或实物)等硬件要求〕: ■ ■■ ■ ■*?■ ■ ■ ■ HT?■ ■ H■ ■ W■■■ ■ ■ H!■ ■?*■ ■ ■ VI■ ■ H!■■■ ▼?■ ■ !R■ ■?T?■ ■ *■ ■ ■ ■ ■ ■ W■ ■ !n■ ■ m■ ■ *■ ■ ■H■ ■ BH!■ ■?■ ■■■ VI■ ■ H ■ ■?*■ ■ ■ ■■■ ■ ■ ■■■ ■?■ ■ H ■ ■ m■ ■ !T?■ ■ IV■■■*■■■ ■ ■ ■*!!■■■ H■ ■ ■!■!■■■ VI ■ ■ H■ ■?*?设计电路,安装调试或仿真,分析实验结果,并写出设计说明书,语言流畅简洁,文字不得少于3500字。要求图纸布局合理,符合工程要求,使用Protel软件绘出原理图(SCH和印制电路板(PCB), 器件的选择要有计算依据。 3. 主要参考文献: (1) 黄智伟.全国大学生电子设计竞赛技能训练[M].北京: 北京航空航天大学出版社,2007 (2) 黄智伟. 全国大学生电子设计竞赛制作实训[M].北京: 北京航空航天大学出版社,2007 (3) 黄智伟. 全国大学生电子设计竞赛系统设计[M].北京: 北京航空航天大学出版社,2006 (4) 黄智伟. 全国大学生电子设计竞赛电路设计[M].北京: 北京航空航天大学出版社,2006 (5) 黄智伟. 全国大学生电子设计竞赛常用电路模块制作[M].北京:北京航空航天大学出版社, 2010 (6) 黄智伟等?基于NI multisim 的电子电路计算机仿真设计与分析[M].北京:电子工业出版社, 2007 (7) 黄智伟.印制电路板(PCB设计技术与实践[M].北京:电子工业出版社,2009 (8) 高吉祥等.电子技术基础实验与课程设计[M].北京:电子工业出版社,2002 (9) 吴运昌.模拟集成电路原理与应用[M].广州:华南理工大学出版社,2001年 (10) 谭博学等.集成电路原理及应用[M].北京:电子工业出版社,2003 (11) 魏立军.CMOS 4000系列60种常用集成电路的应用[M].北京:人民邮电出版社,1993 (12) 杨宝清.实用电路手册[M].北京:机械工业出版社.2002 (13) 陈有卿.报警集成电路和报警器制作实例[M].人民邮电出版社1996 (14) 肖景和.红外线热释电与超声波遥控电路[M].人民邮电出版社.2003 4. 课程设计工作进度计划:

基于单片机的语音识别系统 毕业设计

基于单片机的语音识别系统毕业设计 目录 摘要..................................... 错误!未定义书签。Abstract ................................. 错误!未定义书签。目录..................................................... I 前言.. (1) 1 方案介绍及设计简介 (2) 1.1小车的控制要求及设计方案 (2) 1.1.1小车的控制要求 (2) 1.1.2方案设计与论证 (2) 1.2SPCE061A 简介 (3) 1.2.1SPCE061A单片机概述 (5) 1.2.2SPCE061A的介绍 (7) 1.2.3SPCE061A的结构 (7) 1.3SPCE061A 单片机强大的语音功能 (7) 1.3.1语音识别的原理 (8) 1.3.2系统的结构框图 (9) 1.4语音控制小车设计要求 (10) 1.4.1功能要求 (10) 1.4.2语音控制小车的主要功能 (10) 1.4.3参数说明 (10) 1.4.4注意事项 (10) 2电路设计及程序设计 (11) 2.1电路设计基础知识 (11) 2.2电路方框图及说明 (13) 2.3各部分电路设计 (13) 2.3.1电机的选择 (14)

2.3.2继电器驱动电路的设计 (14) 2.3.3行驶状态控制电路设计 (15) 2.3.4麦克录音输入及AGC电路 (16) 2.3.5语音播报电路 (18) 3软件设计 (19) 3.1软件流程图及设计思路说明 (19) 3.1.1程序设计 (20) 3.2模块设计 (20) 3.2.1中断流程图部分 (20) 3.2.2语音识别部分 (22) 4连接和操作说明 (25) 4.1硬件模块连接图 (25) 4.1.1功能说明 (25) 4.1.2代码下载 (26) 4.1.3训练小车 (27) 4.1.4声控小车 (28) 4.1.5重新训练 (28) 总结 (30) 致谢 (31) 参考文献 (32) 附件1 系统程序说明 (33)

语音播报器的设计

语音播报器的设计 1 总体设计方案 为了实现语音播报所需的功能,即按下开始键,启动录音,松开开始键,结束录音。结 束录音后,循环播放所录音。而且为了使语音播报器的音质好, 功能强, 实验运行效果较好,使用起来也很简单。。所以本设计采用的设计框图如图1 所示: 由上面的框图可知:本设计框图包括,按键,单片机,语音芯片,话筒和扬声器。其中 单片机为本设计的控制核心,它控制语音芯片,实现对声音的存储和播放。语音芯片实现对语音的录入和播放。 1.1 微处理器的选择 近年来,随着科学技术的发展,微型计算机技术日益发展,已经在许多领域得到了广 泛的应用。随着集成电路工艺的发展,出现了单片机、DSP,ARM 等多种单片机。本系统采用AT89C51单片机。。AT89C51 是一种带4K 字节闪烁可编程可擦除只读 存储器(FPEROM—Falsh Programmable and Erasable Read Only Memory)的低电压,高性能CMOS8 位微处理器,俗称单片机。该器件采用ATMEL 高密度非易失存储器制造技术制造,与工业标准的MCS-51 指令集和输出管脚相兼容。由于将多功能8 位CPU 和闪烁存储器组合在单个芯片中,ATMEL 的AT89C51 是一种高效微控制器,为很多嵌入式控制系统提供了一种灵活性高且价廉的方案[3]。51 单片机虽然和DSP,ARM 相比处理速度和运算速度上都比较慢,但它的体积小、质量轻、价格便宜,它的速度可以满足本次实验的要求,所以我们采用AT89C51 这款单片机。 1.2 语音芯片的选择 目前市场流行的语音芯片有很多,从性价比的角度来考虑,美国ISD 公司的ISD 系列 语音芯片可谓是一只独秀。ISD 系列语音芯片具有以下优点: ·采用模拟量数据存储在半导体存储器直接存储的专利技术,即将模拟量数据直接 写入单个存储单元,不需要经过A/D,D/A 转换。 ·内部集成了大容量的的EEPROM,不再需要扩展存储器。 ·控制简单,控制引脚与TTL 电平兼容。 ·集成度高,使用方便。

课程设计--语音录放器

课程设计--语音录放器

南华大学电气工程学院 《电子技术课程设计》设计题目:语音录放器 专业:本11通信02班 学生姓名:王佳杰 学号: 20114400218 指导教师:王彦 教研室主任:王彦

《电子技术课程设计》任务书 1.课程设计的内容和要求(包括原始数据、技术要求、工作要求等): 一、课程设计内容 题目:语音录放器 要求:电源电压DC6~12V,利用语音录放芯片完成声音的录放。 注:可以采用麦克风作为声音传感器,扬声器作为声音播放,ISD2560等语音芯片制作。 二、课程设计要求 1.综合运用已学习过模拟电路和数字电路等知识,阅读相关集成电路芯片资料和相关文献,了解电子电路设计的有关知识,方法和特点,掌握基本的电子电路设计和芯片使用方法。 2.一人一题,所设计的电路必须制作成功,并且全部或者部分通过计算机仿真。课程设计必须自己独立完成,不得从网上下载,一经发现该课程成绩记零分。 3.课程设计设计说明书(报告)应包括有: ①电路工作原理分析 ②电路元器件参数设计计算 ③电路调试说明 ④电原理图和PCB图(必须自己画)

⑤元器件装配图(必须自己画) ⑥元器件清单 ⑦自己的收获和体会 ⑧要求字数不得少于3500字 ⑨要求图纸布局合理,符合工程要求,使用 Protel等软件绘制电原理图(SCH)、元器件布 局图和印制电路板(PCB)。 4.所有的文档和表格必须采用Word形式。 5.同类型的设计题可以组成一个设计组,组员之间可以开展研究与讨论。雷同者均计0分。 6.阅读有关芯片英文参考资料,理解资料内容。 7.英文资料中的曲线、参数、方框图、引脚端封装等图(不包括电原理图和PCB图)可以直接采用(pdf 文档中的图可放大300倍后裁剪到Word文档中),图中的英文可以采用英文(中文)方式翻译在图下。 8.英文资料中的一些词,如果翻译拿不准,可以采用英文(中文)方式标注。 9.设计资料中的有关的公式可以直接采用。 10.课程设计结束,需要交制作的作品、文字稿和电子稿,采用Word文档形式。 11.成绩评定: ①按ABCDE分档,其中:优秀为A,良好为B,

数字信号处理课设+语音信号的数字滤波

语音信号的数字滤波 ——利用双线性变换法实现IIR数字滤波器的设计一.课程设计的目的 通过对常用数字滤波器的设计和实现,掌握数字信号处理的工作原理及设计方法;熟悉用双线性变换法设计 IIR 数字滤波器的原理与方法,掌握利用数字滤波器对信号进行滤波的方法,掌握数字滤波器的计算机仿真方法,并能够对设计结果加以分析。 二.设计方案论证 1.IIR数字滤波器设计方法 IIR数字滤波器是一种离散时间系统,其系统函数为 假设M≤N,当M>N时,系统函数可以看作一个IIR的子系统和一个(M-N)的FIR子系统的级联。IIR数字滤波器的设计实际上是求解滤波器的系数和,它 是数学上的一种逼近问题,即在规定意义上(通常采用最小均方误差准则)去逼近系统的特性。如果在S平面上去逼近,就得到模拟滤波器;如果在z平面上去逼近,就得到数字滤波器。 2.用双线性变换法设计IIR数字滤波器 脉冲响应不变法的主要缺点是产生频率响应的混叠失真。这是因为从S平面到Z平面是多值的映射关系所造成的。为了克服这一缺点,可以采用非线性频率压缩方法,将整个频率轴上的频率范围压缩到-π/T~π/T之间,再用z=e sT转换 平面的-π/T~π到Z平面上。也就是说,第一步先将整个S平面压缩映射到S 1 /T一条横带里;第二步再通过标准变换关系z=e s1T将此横带变换到整个Z平面上去。这样就使S平面与Z平面建立了一一对应的单值关系,消除了多值变换性,也就消除了频谱混叠现象,映射关系如图1所示。 图1双线性变换的映射关系 为了将S平面的整个虚轴jΩ压缩到S1平面jΩ1轴上的-π/T到π/T段上,可以通过以下的正切变换实现

语音识别基本知识及单元模块方案设计

语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 1语音识别的基本原理 语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模式库等三个基本单元,它的基本结构如下图所示: 未知语音经过话筒变换成电信号后加在识别系统的输入端,首先经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的模型,将计算机中存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表就可以给出计算机的识别结果。显然,这种最优的结果与特征的选择、语音模型的好坏、模板是否准确都有直接的关系。2语音识别的方法 目前具有代表性的语音识别方法主要有动态时间规整技术(DTW)、隐马尔可夫模型(HMM)、矢量量化(VQ)、人工神经网络(ANN)、支持向量机(SVM)等方法。 动态时间规整算法(Dynamic Time Warping,DTW)是在非特定人语音识别中一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别技术中出现较早、较常用的一种算法。在应用DTW算法进行语音识别时,就是将已经预处理和分帧过的语音测试信号和参考语音模板进行比较以获取他们之间的相似度,按照某种距离测度得出两模板间的相似程度并选择最佳路径。 隐马尔可夫模型(HMM)是语音信号处理中的一种统计模型,是由Markov链演变来的,所以它是基于参数模型的统计识别方法。由于其模式库是通过反复训练形成的与训练输出信号吻合概率最大的最佳模型参数而不是预先储存好的模式样本,且其识别过程中运用待识别语音序列与HMM参数之间的似然概率达到最大值所对应的最佳状态序列作为识别输出,因此是较理想的语音识别模型。 矢量量化(Vector Quantization)是一种重要的信号压缩方法。与HMM相比,矢量量化主要适用于小词汇量、孤立词的语音识别中。其过程是将若干个语音信号波形或特征参数的标量数据组成一个矢量在多维空间进行整体量化。把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替。矢量量化器的设计就是从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最佳的矢量量化系统,用最少的搜索和计算失真的运算量实现最大可能的平均信噪比。在实际的应用过程中,人们还研究了多种降低复杂度的方法,包括无记忆的矢量量化、有记忆的矢量量化和模糊矢量量化方法。 人工神经网络(ANN)是20世纪80年代末期提出的一种新的语音识别方法。其本质上是一

智能语音播报显示系统

智能语音播报、显示系统 作者: 1、方栋学号 1062610315 2、许其亮学号 1062610323 3、任帅辉学号 1062510127 作品简介: 1、制作背景: 随着智能化和机械化的发展,语音播报功能越来越受到大众的青睐,公交车、汽车、电动车、电话等得到了普及。但还有很多设备仍然不具有这种超便利的功能。为此我们设计了这款语音智能播报和选段显示系统,它可以应用于各种设备,小巧便利。 2、摘要: 本系统以APR9600语音芯片为基础,采用52单片机系统控制,和数码管显示,实现语音智能播报和显示。 调试与制作: 1、总体设计: 想通过控制电路的方式来选择工作方式,然后语音经过话筒输入进入语音芯片,再有音频电路(功放)再经过扬声器输出。通过单片机程序的控制实现播报系统的智能化。 2、语音芯片的选取与电路设计: 我们需要的是具有录放音功能的芯片,而且录音量不需要太大,但要可以录入足够多段。而且可以通过快进键来控制语音选段的播放。通过搜集资料我们选择了APR9600语音芯片。他有串行和并行两种模式,根据需要我们选择了串行模式。 功能介绍:置 MSEL1、MSEL2 均为 0,在录音时S8 置 1。置RE 端为 0 为录音状态,按住M1 即开始录第一段,松键即停止。再按住S1 即录第二段,如此一直分段录音,直到芯片溢出。在放音时(RE=1)S8 置 0 为串行选段控制方式,按一下/M1 只能放音第一段,再按还是放音第一段。这时的S2 有效成为快进选段键,每按一下S2 即向后移动一段,例如现在按了三下S2,再按S1 就放音第四段。因此可以实现选段放音。按CE 键复位为第一段。具体电路设计:

【完整版】基于Matlab的语音识别系统的设计本科毕业论文设计

摘要 语音识别主要是让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息执行人的各种意图。语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。本文基于语音信号产生的数学模型,从时域、频域出发对语音信号进行分析,论述了语音识别的基本理论。在此基础上讨论了语音识别的五种算法:动态时间伸缩算法(Dynamic Time Warping,DTW)、基于规则的人工智能方法、人工神经网络(Artificial Neural Network,ANN)方法、隐马尔可夫(Hidden Markov Model,HMM)方法、HMM和ANN的混合模型。重点是从理论上研究隐马尔可夫(HMM)模型算法,对经典的HMM模型算法进行改进。 语音识别算法有多种实现方案,本文采取的方法是利用Matlab强大的数学运算能力,实现孤立语音信号的识别。Matlab 是一款功能强大的数学软件,它附带大量的信号处理工具箱为信号分析研究,特别是文中主要探讨的声波分析研究带来极大便利。本文应用隐马尔科夫模型(HMM) 为识别算法,采用MFCC(MEL频率倒谱系数)为主要语音特征参数,建立了一个汉语数字语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练、识别匹配算法;同时,提出利用Matlab图形用户界面开发环境设计语音识别系统界面,设计简单,使用方便,系统界面友好。经过统计,识别效果明显达到了预期目标。 关键词:语音识别算法;HMM模型;Matlab;GUI ABSTRACT Speech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of people.Speech recognition technology is not only an important internationally competed technology,but also an indispensable foundational technology for the national economic development.Based on the mathematical model from the speech signal,this paper analyze audio signal from the time

《___数字系统设计___》试卷含答案

,考试作弊将带来严重后果! 华南理工大学期末考试 《数字系统设计》试卷 1. 考前请将密封线内各项信息填写清楚; 所有答案请直接答在试卷上(或答题纸上); .考试形式:开(闭)卷; 本试卷共大题,满分100分,考试时间120分钟 (每小题2分,共16分) 大规模可编程器件主要有FPGA、CPLD两类,下列对CPLD结构与工作原理 ( C ) CPLD即是现场可编程逻辑器件的英文简称; CPLD是基于查找表结构的可编程逻辑器件; 早期的CPLD是从GAL的结构扩展而来; 在Altera公司生产的器件中,FLEX10K 系列属CPLD结构; 在VHDL语言中,下列对时钟边沿检测描述中,错误的是( D ) then ...; then ...; then ...; 在VHDL语言中,下列对进程(PROCESS)语句的语句结构及语法规则的描述中,正确( A ) PROCESS为一无限循环语句;敏感信号发生更新时启动进程,执行完成后,等待下一. 敏感信号参数表中,应列出进程中使用的所有输入信号; 进程由说明部分、结构体部分、和敏感信号参数表三部分组成; 当前进程中声明的信号也可用于其他进程 基于EDA软件的FPGA / CPLD设计流程,以下流程中哪个是正确的:( C ) 原理图/HDL文本输入→适配→综合→时序仿真→编程下载→功能仿真→硬件测试 原理图/HDL文本输入→功能仿真→综合→时序仿真→编程下载→适配→硬件测试; 原理图/HDL文本输入→功能仿真→综合→适配→时序仿真→编程下载→硬件测试 原理图/HDL文本输入→适配→时序仿真→编程下载→功能仿真→综合→硬件测试。 关于综合,从输入设计文件到产生编程文件的顺序正确的是:(B) .逻辑综合→高层次综合→物理综合;

数字信号处理期末实验-语音信号分析与处理

语音信号分析与处理 摘要 用MATLAB对语音信号进行分析与处理,采集语音信号后,在MATLAB软件平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。 数字滤波器是数字信号处理的基础,用来对信号进行过滤、检测和参数估计等处理。IIR数字滤波器最大的优点是给定一组指标时,它的阶数要比相同组的FIR滤波器的低的多。信号处理中和频谱分析最为密切的理论基础是傅立叶变换(FT)。离散傅立叶变换(DFT)和数字滤波是数字信号处理的最基本内容。 关键词:MATLAB;语音信号;加入噪声;滤波器;滤波 1. 设计目的与要求 (1)待处理的语音信号是一个在20Hz~20kHz频段的低频信号。 (2)要求MATLAB对语音信号进行分析和处理,采集语音信号后,在MATLAB平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器进行滤除噪声,恢复原信号。

2. 设计步骤 (1)选择一个语音信号或者自己录制一段语音文件作为分析对象; (2)对语音信号进行采样,并对语音信号进行FFT频谱分析,画出信号的时域波形图和频谱图; (3)利用MATLAB自带的随机函数产生噪声加入到语音信号中,对语音信号进行回放,对其进行FFT频谱分析; (4)设计合适滤波器,对带有噪声的语音信号进行滤波,画出滤波前后的时域波形图和频谱图,比较加噪前后的语音信号,分析发生的变化; (5)对语音信号进行回放,感觉声音变化。 3. 设计原理及内容 3.1 理论依据 (1)采样频率:采样频率(也称采样速度或者采样率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率只能用于周期性采样的采样器,对于非周期采样的采样器没有规则限制。通俗的讲,采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位之间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。 (2)采样位数:即采样值或取样值,用来衡量声音波动变化的参数。 (3)采样定理:在进行模拟/数字信号的的转换过程中,当采样频率f s.max大于信号中,最高频率f max的2倍时,即:f s.max>=2f max,则采样之后的数字信号完整的保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍;采样频率又称乃奎斯特定理。 (4)时域信号的FFT分析:信号的频谱分析就是计算信号的傅立叶变换。连续信号与系统的傅立叶分析显然不便于直接用计算机进行计算,使其应用受到限制。而FFT是一种时域和频域均离散化的变换,适合数值计算,成为用计算机分析离

基于matlab的语音识别系统

机电信息工程学院专业综合课程设计 系:信息与通信工程 专业:通信工程 班级:081班 设计题目:基于matlab的语音识别系统 学生姓名: 指导教师: 完成日期:2011年12月27日

一.设计任务及要求 1.1设计任务 作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。以语音识别开发出的产品应用领域非常广泛,有声控电话交换、语音拨号系统、信息网络查询、家庭服务、宾馆服务、旅行社服务系统、订票系统、声控智能玩具、医疗服务、银行服务、股票查询服务、计算机控制、工业控制、语音通信系统、军事监听、信息检索、应急服务、翻译系统等,几乎深入到社会的每个行业、每个方面,其应用和经济社会效益前景非常广泛。本次任务设计一个简单的语音识别系。 1.2设计要求 要求:使用matlab软件编写语音识别程序 二.算法方案选择 2.1设计方案 语音识别属于模式识别范畴,它与人的认知过程一样,其过程分为训练和识别两个阶段。在训练阶段,语音识别系统对输入的语音信号进行学习。学习结束后,把学习内容组成语音模型库存储起来;在识别阶段,根据当前输入的待识别语音信号,在语音模型库中查找出相应的词义或语义。 语音识别系统与常规模式识别系统一样包括特征提取、模式匹配、模型库等3个基本单元,它的基本结构如图1所示。 图1 语音识别系统基本结构图 本次设计主要是基于HMM模型(隐马尔可夫模型)。这是在20世纪80年代引入语音识别领域的一种语音识别算法。该算法通过对大量语音数据进行数据统计,建立识别词条的统计模型,然后从待识别语音信号中提取特征,与这些模

型进行匹配,通过比较匹配分数以获得识别结果。通过大量的语音,就能够获得一个稳健的统计模型,能够适应实际语音中的各种突发情况。并且,HMM算法具有良好的识别性能和抗噪性能。 2.2方案框图 图2 HMM语音识别系统 2.3隐马尔可夫模型 HMM过程是一个双重随机过程:一重用于描述非平稳信号的短时平稳段的统计特征(信号的瞬态特征);另一重随机过程描述了每个短时平稳段如何转变到下一个短时平稳段,即短时统计特征的动态特性(隐含在观察序列中)。人的言语过程本质上也是一个双重随机过程,语音信号本身是一个可观测的时变列。可见,HMM合理地模仿了这一过程,是一种较为理想的语音信号模型。其初始状态概率向量π,状态转移概率矩阵向量A,以及概率输出向量B一起构成了HMM的3个特征参量。HMM 模型通常表示成λ={π,A,B}。 2.4HMM模型的三个基本问题 HMM模型的核心问题就是解决以下三个基本问题: (1)识别问题:在给定的观测序列O和模型λ=(A,B,π)的条件下,如何有效地计算λ产生观测序列O的条件概率P(O︱λ)最大。常用的算法是前后向算法,它可以使其计算量降低到N2T次运算。 (2)最佳状态链的确定:如何选择一个最佳状态序列Q=q1q2…qT,来解释观察序列O。常用的算法是Viterbi算法。 (3)模型参数优化问题:如何调整模型参数λ=(A,B,π),使P(O︱λ)最大:这是三个问题中最难的一个,因为没有解析法可用来求解最大似然模型,所以只能使用迭代法(如Baum-Welch)或使用最佳梯度法。 第一个问题是评估问题,即已知模型λ=(A,B,π)和一个观测序列O,如何计算由该模型λ产生出该观测序列O的概率,问题1的求解能够选择出与给定的观测序列最匹配的HMM模型。 第二个问题力图揭露模型中隐藏着的部分,即找出“正确的”状态序列,这是一个典型的估计问题。

数字系统设计与verilogHDL课程设计

数字系统设计与v e r i l o g H D L课程设计设计题目:实用多功能数字钟 专业:电子信息科学与技术 班级:0313410 学号: 姓名:杨存智 指导老师:黄双林 摘要 本课程设计利用QuartusII软件VerilogVHDL语言的基本运用设计一个多功能数字钟,经分析采用模块化设计方法,分别是顶层模块、alarm、alarm_time、counter_time、clk50mto1、led、switch、bitel、adder、sound_ddd、sound_ddd_du模块,再进行试验设计和软件仿真调试,分别实现时分秒计时、闹钟闹铃、时分秒手动校时、时分秒清零,时间保持和整点报时等多种基本功能。 单个模块调试达到预期目标,再将整体模块进行试验设计和软件仿真调试,已完全达到分块模式设计功能,并达到设计目标要求。 关键字:多功能数字钟、Verilog、模块、调试、仿真、功能 目录

课程设计的目的 通过课程设计的锻炼,要求学生掌握Verilog HDL语言的一般设计方法,掌握Verilog HDL语言的基本运用,具备初步的独立设计能力,提高综合运用所学的理论知识独立分析和解决问题的能力,基于实践、源于实践,实践出真知,实践检验真理,培养学生的创新精神。 掌握现代数字逻辑电路的应用设计方法,进一步掌握电子仪器的正确使用方法,以及掌握利用计算机进行电子设计自动化(EDA)的基本方法。 课程设计的任务与要求 用Verilog HDL语言设计一个多功能的数字钟,具有下述功能: (1)计时功能。包括时、分、秒的计时; (2)定时与闹钟功能:能在设定的时间发出闹铃音; (3)校时功能。对时、分和秒能手动调整以校准时间; (4)整点报时功能;每逢整点,产生“嘀嘀嘀嘀一嘟”四短一长的报时音。 2.课程设计思路及其原理 数字计时器要实现时分秒计时、闹钟闹铃、时分秒手动校时、时分秒清零,时间保持和整点报时等多种基本功能,所有功能都基于计时功能。因此首先需要获得具有精确振荡时间的脉振信号,以此作为计时电路的时序基础,实验中可以使用的振荡频率源为50MHZ,通过分频获得所需脉冲频率1Hz。得到1hz脉冲后,要产生计时模块,必须需要加法器来进行加法,因此需要一个全加器,此实验中设计一个八位全加器来满足要求。 数字电路设计中,皆采用二进制加法,为实现实验中时分秒的最大功能,本实验中采用十六进制加法器,再进行BCD码进行转换来实现正常时钟显示。为产生秒位,设计一个模60计数器,利用加法器对1HZ 的脉冲进行秒计数,产生秒位;为产生分位,通过秒位的进位产生分计数脉冲,分位也由模60计数器构成;为产生时位,用一个模24计数器对分位的进位脉冲进行计数。整个数字计时器的计数部分共包括六位:时十位、时个位、分十位、分个位、秒十位和秒个位。基本的计时模块完成之后,整点报时、清零、校时、LED显示、闹铃模块可以相互实现,其中,闹铃模块与计时模块的显示相互并行。 清零功能是通过控制计数器清零端的电平高低来实现的。只需使清零开关按下时各计数器的清零端均可靠接入有效电平(本实验中是低电平),而清零开关断开时各清零端均接入无效电平即可。 保持功能是通过逻辑门控制秒计数器输入端的1Hz脉冲实现的。正常情况下,开关不影响脉冲输入即秒正常计数,当按下开关后,使脉冲无法进入计数端,从而实现计时保持功能。

超声波导盲仪及语音提示系统开题报告

毕业设计(论文)开题报告 1.结合毕业设计(论文)课题情况,根据所查阅的文献资料,每人撰写不少于1000字左右的文献综述: 本课题研究的是超声波盲人导航及语音提示系统的设计,当有视力障碍的人外出行走,手持本装置,通过前端超声波发送和接收模块对障碍物进行测距,由单片机处理数据,再由串行通信传送给语音芯片D/A转换后,由功放放大,通过扬声器或耳机发声。此外,超声所测距离也通过液晶显示出来,供视力正常者检测。 目前,国内外带语音提示的导盲器是由超声波探测器获取数据,经单片机处理后将数据发送给语音提醒器,然后驱动语音芯片提醒。但是这种导盲器是通过不同音量、音调、节奏的提示音或者是误差较大的分段式语音提示对盲人进行提醒,只能使盲人对障碍物的距离有个大概的判断,并且消耗了盲人的大量精力,容易造成错误判断。为了克服现有的语音提示导盲器不能提供障碍物精确距离的不足,本实用新型提供一种语音提示导盲器,该语音提示导盲器能够实时提供障碍物的精确距离。 中国是世界盲人最多的国家,目前约有500万盲人,占世界盲人总数的18%,低视力者600多万。盲人出行的问题是一个不可忽视的社会问题。目前,盲人的出行主要依靠盲道、手杖。而超声波盲人导航系统则能够更好地识别障碍物物以及其所在的距离。此系统的目的旨在提供一种方便盲人出行的导航系统,解决现有的盲人导航系统不够准确安全的为盲人导航的问题。 (1)历史发展: 盲人导航设备在历史上大致经历了以下几个过程:拐棍或手杖、盲道砖、导盲犬和电子导盲系统。导盲棍可以在盲人外出时起到安全警示作用,帮助盲人出行。而新式的导盲棍可以装上各类感应器,用来检测路面上有没有水、障碍物或者有没有坑,棍上还可以安装一个夜间发光的灯,它在白天可以自动接收太阳能进行充电。盲道砖以及盲人通道是现代化社会中常用的盲人帮助设施。是专门为盲人设计的地砖,防止盲人走错道路,摔倒时防止摔伤。盲道砖是按照国际残联的有关标准制造的,设计优良,具有灵敏的触觉感,耐强腐蚀,耐损耗性和长寿命等特征。这种高强塑料盲道砖的表面既美丽又光滑,适用于室内或室外装修。它凹凸的模型不仅可以使盲道更加安全,同时还美化环境作用。盲人道砖为盲人带来福音,同时也美化了城市道路。导盲犬是经过严格训练的犬,是工作犬的一种。它们习惯于颈圈、导盲牵引带和其他配件的约束,懂得很多口令,可以带领盲人安全地走路,当遇到障碍和需要拐弯时,会引导主人停下以免发生危险。电子导盲仪可以有效的帮助盲人进行通行等生活项目,其仪器分类主要有超声波导盲仪、移动式机器人导引式手杖,能大大减少以往导盲设备的不便以及昂贵的价格。 (2)现状评述:

相关文档
相关文档 最新文档