文档库 最新最全的文档下载
当前位置:文档库 › 基于SIP的嵌入式AndroidVoIP语音终端的研究与实现

基于SIP的嵌入式AndroidVoIP语音终端的研究与实现

基于SIP的嵌入式AndroidVoIP语音终端的研究与实现
基于SIP的嵌入式AndroidVoIP语音终端的研究与实现

一种嵌入式语音识别模块的设计与实现

嵌入式系统结业(论文) 基于STM32的嵌入式 语音识别模块设计 学生姓名: 所在学院:信息技术学院 班级:电气 学号: 中国·大庆 2013 年12 月

摘要:介绍了一种以ARM为核心的嵌入式语音识别模块的设计与实现。模块的核心处理单元选用ST公司的基于ARM Cortex-M3内核的32位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320芯片为核心的硬件单元实现语音识别功能,采用嵌入式操作系统μC/OS-II来实现统一的任务调度和外围设备管理。经过大量的实验数据验证,本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。 关键词:ARM;语音识别;对话管理;LD3320;μC/OS-II 1 引言 服务机器人以服务为目的,因此人们需要一种更方便、更自然、更加人性化的方式与机器人交互,而不再满足于复杂的键盘和按钮操作。基于听觉的人机交互是该领域的一个重要发展方向。目前主流的语音识别技术是基于统计模式。然而,由于统计模型训练算法复杂,运算量大,一般由工控机、PC机或笔记本来完成,这无疑限制了它的运用。嵌入式语音交互已成为目前研究的热门课题。 嵌入式语音识别系统和PC机的语音识别系统相比,虽然其运算速度和内存容量有一定限制,但它具有体积小、功耗低、可靠性高、投入小、安装灵活等优点,特别适用于智能家居、机器人及消费电子等领域。 2 模块整体方案及架构

现有的语音识别技术按照识别对象可以分为特定人识别和非特定人识别。特定人识别是指识别对象为专门的人,非特定人识别是指识别对象是针对大多数用户,一般需要采集多个人的语音进行录音和训练,经过学习,达到较高的识别率。 基于现有技术开发嵌入式语音交互系统,目前主要有两种方式:一种是直接在嵌入式处理器中调用语音开发包;另一种是嵌入式处理器外围扩展语音芯片。第一种方法程序量大,计算复杂,需要占用大量的处理器资源,开发周期长;第二种方法相对简单,只需要关注语音芯片的接口部分与微处理器相连,结构简单,搭建方便,微处理器的计算负担大大降低,增强了可靠性,缩短了开发周期。 语音识别技术在国内外的发展十分迅速。目前国内在PC应用领域,具有代表性的有:科大讯飞的InterReco2.0、中科模式识别的Pattek ASR3.0、捷通华声的jASRv5.5;在嵌入式应用领域,具有代表性的有:凌阳的SPCE061A、ICRoute的LD332X、上海华镇电子的WS-117。 本文的语音识别方案是以嵌入式微处理器为核心,外围加非特定人语音识别芯片及相关电路构成。语音识别芯片选用ICRoute公司的LD33 20芯片。 3 硬件电路设计 3.1 语音识别电路 图3为语音识别部分原理图,参照了ICRoute发布的LD3320数据手册进行设计。LD3320的内部集成了快速稳定的优化算法,不需外接Fla-sh、RAM,不需要用户事先训练和录音而完成非特定人语音识别,识别准确率高。

基于STM32的嵌入式语音识别模块设计实现

基于STM32的嵌入式语音识别模块设计实现 介绍了一种以ARM 为核心的嵌入式语音识别模块的设计与实现。模块的 核心处理单元选用ST 公司的基于ARM Cortex-M3 内核的32 位处理器STM32F103C8T6。本模块以对话管理单元为中心,通过以LD3320 芯片为核心的硬件单元实现语音识别功能,采用嵌入式操作系统μC/OS-II 来实现统一的任务调度和外围设备管理。经过大量的实验数据验证,本文设计的语音识别模块具有高实时性、高识别率、高稳定性的优点。 服务机器人以服务为目的,因此人们需要一种更方便、更自然、更加人性化的方式与机器人交互,而不再满足于复杂的键盘和按钮操作。基于听觉的人机交互是该领域的一个重要发展方向。目前主流的语音识别技术是基于统计模式。然而,由于统计模型训练算法复杂,运算量大,一般由工控机、PC 机或笔记 本来完成,这无疑限制了它的运用。嵌入式语音交互已成为目前研究的热门课题。 嵌入式语音识别系统和PC 机的语音识别系统相比,虽然其运算速度和内存容量有一定限制,但它具有体积小、功耗低、可靠性高、投入小、安装灵活等优点,特别适用于智能家居、机器人及消费电子等领域。 模块整体方案及架构 语音识别的基本原理如图1 所示。语音识别包括两个阶段:训练和识别。不管是训练还是识别,都必须对输入语音预处理和特征提取。训练阶段所做的具体工作是通过用户输入若干次训练语音,经过预处理和特征提取后得到特征矢量参数,最后通过特征建模达到建立训练语音的参考模型库的目的。而识别阶段所做的主要工作是将输入语音的特征矢量参数和参考模型库中的参考模型进行相似性度量比较,然后把相似性最高的输入特征矢量作为识别结果输出。这

基于STM32单片机的嵌入式语音识别系统设计

基于STM32单片机的嵌入式语音识别系统设计 陈心灵1,钱宁博2,胡佳辉1,王战中1 (1.石家庄铁道大学机械工程学院,河北石家庄050043;2.石家庄铁道大学电气与电子工程学院,河北石家庄 050043) 摘要:设计了一款以STM32F103为核心的自然语言识别系统,为满足实时语音识别系统对内存资源和运算速度的要求,基于硬件资源合理 设计语音处理算法,在嵌入式平台上实现了对孤立词语的语音识别。首先根据背景噪声和语音信号的时域特征差异设定相应门限值,从而实现了对语音信号的端点检测。然后针对语音识别中传统梅尔倒谱系数对语音的高频信息敏感度较低,对语音信号分别提取梅尔倒谱系数(MFCC)与翻转梅尔倒谱系数(IMFCC),结合Fisher 准则构造混合特征参数。最后采用动态时间规整算法实现语音识别。因系统体积小、便携性好等特点,易于实现对不同设备的语音控制,有一定的市场前景。关键词:语音识别;梅尔倒谱系数;翻转梅尔倒谱系数;Fisher 准则;动态时间规整算法;STM32F103 中图分类号:TP391.4 文献标识码:A 文章编号:1009-9492(2019)06-0135-03 Embedded Speech Recognition System Design Based on STM32F103 CHEN Xin-ling 1,QIAN Ning-bo 2,HU Jia-hui 1,WANG Zhan-zhong 1 (1.College of Mechanical Engineering ,Shijiazhuang Tiedao University ,Shijiazhuang 050043,China ; 2.College of Electrical and Electronic Engineering ,Shijiazhuang Tiedao University ,Shijiazhuang 050043,China ) Abstract:A natural language recognition system is designed based on STM32F103.To meet the requirements of real-time speech recognition system for memory resources and computing speed ,the speech processing algorithm is designed based on hardware resources and speech recognition of isolated words is implemented on the embedded platform.Firstly ,the corresponding threshold is set according to the time domain characteristic difference of the speech signal and the background noise and thereby realizing the endpoint detection of the speech signal.Concerning the traditional Mel Frequency Cepstral Coefficient (MFCC)in speech recognition is less sensitive to high frequency signals of speech ,MFCC and IMFCC (Inverted MFCC)are extracted respectively for the speech signal and the Fisher criterion is used to construct the mixed feature parameters.Dynamic time warping algorithm is used in speech recognition process.Due to the small size of the system and good portability ,it is easy to implement voice control for different devices and has much marker potential. Key words:speech recognition ;MFCC ;IMFCC ;Fisher criterion ;DTW ;STM32F103 收稿日期:2018-12-22 DOI:10.3969/j.issn.1009-9492.2019.06.045 0引言 语音识别是人机交互很重要的模块,应用领域相当广阔。集成电路的快速发展使得将具有先进功能的语音识别系统固化到更加微小的芯片或模块上成为可能[1],更便于语音识别系统的推广与使用,嵌入式语音识别技术开发变得更加有价值。 本文设计一个基于STM32F103单片机的嵌入式语音识别系统,包括硬件设计和软件设计 [2-3] 。语音特征提取在传 统梅尔倒谱系数基础上,运用Fisher 比结合梅尔倒谱系数与翻转梅尔倒谱系数,构建了混合特征参数[4],识别算法采用动态时间规整算法。硬件设计上实现了语音信号采集、语音信号处理、语音信息存储、语音识别结果的显示等功能。 1系统硬件设计 本系统主要由电源部分(LDO )、主控(STM32F103)、语音采样电路、LCD 显示模块等组成,如图1所示。 1.1MCU 选择 STM32F103开发板基于Cortex-M3处理器,内置2个 12位模数转换器,2个DMA 控制器,共12个DMA 通道,其可以满足本系统中的语音处理需求。1.2采样电路 采样电路选用差分放大电路,抑制共模干扰,放大有用信号,有效地解决采样噪声硬件预处理的问题。其原理图如图2。 在设计过程中,其输出端(即Q1\Q2的C 极)静态工作点为1/2Vcc 最为适宜,能保障其最大动态输出范围。电路设计尽可能使Q1、Q2的静态工作参数一致,构成对 称电路。 图1系统硬件框图 Fig.1The system hardware block diagram · ·135

用于智能家居语音识别系统设计

仪器科学与电气工程学院 本科毕业论文(设计)开题报告题目:用于智能家居的语音识别系统设计 学生姓名:学号: 专业:电气工程及其自动化 指导教师:讲师 2015年1月3日

1. 选题依据 1.1选题背景 语言作为人类信息交流中最重要的和最方便的方式,人与机器的交流能否像人与人一样自如,是人们研究的问题。控制论创始人维纳在1950年就曾指出:“通常,我们把语言仅仅看作人与人之间的通信手段,但是,要使人向机器,机器向人以及机器向机器讲话,那也是完全办得到的”。 随着现代科学技术的进一步发展和人民生活水平不断的提高,人们对家庭住宅需求的概念也发生了彻底的改变。人们正在从以往追求房屋空间的宽阔和装饰的亮丽、豪华,向着追求品味、安全、舒适、便捷和智能方向发展。现在的家庭不仅要满足人们生活、工作、娱乐和交流的需要,同时还可以提供充分的安全防护、物业管理等手段。智能家居是建筑艺术、生活理念与信息技术、电子技术等现代高科技手段完美结合的产物,它的出现满足了人们对住宅高性能、智能化的要求21世纪信息时代的到来,IT产业的发展和人们生活水平的提高,“智能家居”、“家庭自动化”、“网络家电”、“家庭网络”等技术的推动,智能家居的生活已经近在咫尺。 在智能家居中传统的家用电器的控制,无外乎两种控制方式:手动或遥控。随着家用电器的增多,开关和遥控越来越多,使用极不方便。这时,我们可以釆用语音识别的方式控制,例如,在观看电视频道时,我们可以很方便地直接说出“中央一套”来,所以语音识别及控制在智能家居中尤其重要。 1.2国内外研究现况 1、语音识别技术的发展 就技术而言,目前国内外对语音识别理论及各种实用算法的研究是一热点。人们普遍关心的问题是不断提高语音识别的识别率、识别更多的词汇量、扩大语音识别的应用等研究。语音识别技术发展到今天,PC 机的语音识别系统己经趋于成熟,而且还出现了一些具有实用价值和市场语音识别前景的语音识别芯片。近几年来,个人消费类电子产品的广泛使用,使大量的识别系统从实验室 PC 平台转移到嵌入式平台设备中,现在嵌入式对特定人语音识别系统的识别精度己经达到 98%以上。嵌入式语音识别系统和 PC 机的语音识别系统相比,虽然其运算速度和内存容量有一些限制,但是它也有各自的特点。嵌入式系统体积小、可靠性高、耗电低、投入小、便于移动等优点,是嵌入式语音识别系统和 PC 机的语音识别系统相比的最大优势。而且嵌入式语音识别系统多为实时系统,当用户讲话后,系统能够立即完成词条识别并作出反应。这些特点决定了嵌入式语音识别系统的应用十分广泛。可以预测在近几年内,嵌入式语音识别系统的应用将更加广泛。各种语音识别系统将出现在市场上。根据美国专家预测,具有语音识别功能的产品可达 50 亿美元。在短期内还不可能具

设计和实现一个嵌入式自动语音识别

设计和实现一个嵌入式自动语音识别 系统 sujay Phadke Rhishikesh Limaye亚洲时报Siddharth维尔马 Kavitha Subramanian 孟买印度技术研究所 电机工程学系 个人所得税孟买Powai,孟买,400076,印度。 {sujay,rhishi,亚洲时报Siddharth kavitha}@ ee.iitb.ac.in 摘要 我们提出了一个新的嵌入式语音识别系统的设计。它结合了硬件和软件设计等方面实现依赖扬声器,孤立词,小词汇量语音识别系统。是基于规模的修正Mel频率倒谱系数(MFCC)特征提取和模板匹配采用动态时间规整(DTW)的。一种新的算法已经被用来改善一个字开始检测。围绕行业标准TMS320LF2407A的DSP硬件。作为一个通用的DSP24X系列的TI DSP 开发板电路板设计。据载,除了从DSP,外部SRAM,闪存,ADC接口的I / O接口模块和JTAG 接口。无论是硬件和软件已设计的同时,最小功率最大精度和便携式设备,以便实现高速识别。建议的解决方案是一个低成本,高性能,可伸缩的替代现有的其他产品。 1.介绍 语音识别一直是一个活跃的研究领域多年。随着超大规模集成电路技术,高性的 编译器的进步,它已成为可能纳入这些算法在硬件。在过去的几年中,各系统已开发,以满足各种应用。有许多的ASIC解决方案,提供小型,高性能系统。然而,这些患有低的灵活性和较长的设计周期。一个完整的基于软件的解决方案是为桌面应用程序的吸引力,但未能提供一个便携式,嵌入式解决方案。高端的公司如TI,ADI公司的数字信号处理器(DSP)的,提供一个理想的平台,在硬件的开发和测试算法。 C编译器,模拟器和调试器之类的先进的软件工具提供了一种简单的方法,优化算法和减少市场的时间。然而,为了获得最大的优势,硬件和软件都必须设计在手。语音识别是任何扬声器独立或依赖[1]。独立扬声器模式涉及提取讲话是在口语中所固有的那些特点。这一类的算法一般比较复杂,并利用统计模型和语言模型。另一方面,扬声器依赖模式涉及讲话中提取用户特定的功能。必须为每个用户创建一个词提取系数的模板进行匹配,以确定口语。此外,使用孤立的单词,而不是一个复杂连续的话,有助于提高准确性承认。我们的工作涉及扬声器依赖性,孤立词语音识别系统的发展。该系统是能够认识到口语词,从10-15字的模板。它具有较高的识别精度和适度抑制比。本文组织如下。第二节处理软件的一部分。它解释了背后的梅尔倒频谱系数提取和动态时间规整技术,应用的基础上形成的理论。第三节介绍了定制硬件开发此应用程序设计有关的各种问题。 C代码的DSP平台的软件优化和移植在第四节进行了讨论。结果和比较在部分解释五,最后,我们的结论第六节系统的应用潜力。 2。软件 本节介绍软件方面使用的语音识别引擎。 MFCC的理论是解释其实施。还提出了由作 者开发的一种新的开始检测和错一个字抑制算法。它的结论与动态规整(DTW),确认使用的模板匹配算法。 2.1。特征提取 - 梅尔规模的频率倒谱系数(MFCC)

嵌入式语音识别综述

嵌入式语音识别技术及应用综述 张哲,S110331038,控制工程 (重庆邮电大学,自动化学院,400065) 摘要:随着计算机处理能力的迅速提高,语音识别技术得到了飞速发展,其技术的应用正在日益改变着人类的生产和生活方式。本文介绍了语音识别的基本原理、方法,综述了语音识别系统的分类及语音识别技术的应用,分析了语音识别所面临的问题。在此基础上,设计了一个基于ARM和DSP芯片的语音识别子系统,用于嵌入式系统中的语音识别,该语音识别子系统由ARM和DSP芯片为核心,配合其他功能电路,能够独立完成语音识别的工作。 关键字:语音识别;语音识别原理;嵌入式系统;应用; On the Speech Recognition Technology and Its Application for Embedded System ZHANG Zhe,S110331038 (Chongqing University of Posts and Telecommunications,School of Automation) Abstract: With the rapid increase in computer processing capabilities, speech recognition technology has the rapid development of the application of its technology, which is increasingly changing people’s production and lifestyle. This article describes the basic principles of speech recognition methods, gives an overview of the classification of speech recognition systems and speech recognition technology, and analyses the problems faced by speech recognition. On those basis of speech recognition subsystem based on ARM and DSP chip, was designed for embedded systems. The subsystem can accomplish speech recognition independently. Key words: speech recognition; speech recognition principle; embedded systems; application 引言 语音作为语言的声学体现,也是人类进行信息交流最自然、和谐的手段。与机械设备进行语音的沟通,让机器可以明白人类在说什么.并理解这是人类长期的梦想。 语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别包括两种意义.一种是把人类口述的语句逐句的进行翻译并转换为文字.再一种就是对口述语言所包括的需求和询问做出合理的分析,而不是仅仅转换为书面文字。 语音识别技术。也被称为自动语音识别AutomaticSpeechRecognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别技术正逐步成为计算机信息处理技术中的关键术.语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 由于我国的汉语的基本特性(例如同音字比较多等),关于汉语的语音识别技术开发的难度会比较大一些。和国外相比我国的语音识别技术研究起步比较晚,但发展速度比较快,研究的水平也在逐步的提高。国家在1987年开始执行863计划,就专门为语音识别技术研究专设了项目,从1991年,每两

一种嵌入式语音识别控制模块的设计与实现

第16卷 第4期厦门理工学院学报V o.l 16 N o .4 2008年12月Journa l of X ia m en U niversity of T echno logy D ec .2008 [收稿日期]2008-10-04 [修回日期]2008-11-19 [基金项目]福建省教育厅科技项目(J A 08219)[作者简介]徐敏(1963-),男,福建龙岩人,副教授,从事嵌入式技术与智能控制研究. 一种嵌入式语音识别控制模块的设计与实现 徐 敏1,邹 莹2,魏洪兴2 (1.厦门理工学院电子与电气工程系,福建厦门361024;2.北京航空航天大学机器人研究所,北京100191) [摘 要]在分析语音识别原理的基础上,结合机器人系统人机交互需求,提出了一种基于L i nux 应用 平台、S3C2410X 为处理器的低功耗、高性能的嵌入式语音识别控制模块,并分别从模块的硬件结构、软件 流程进行分析和设计,通过硬件平台的搭建和软件程序的实现,达到了硬件设计简单、控制灵活、人机交 互便捷的目的. [关键词]机器人;语音识别;嵌入式系统;隐式马尔可夫模式 [中图分类号]TP391 [文献标志码]A [文章编号]1008-3804(2008)04-0043-04 0 引言 随着计算机技术、模式识别等技术的发展,适应不同场合的语音识别系统相继被开发出来,语音识别及处理技术在计算机、信息处理、通信与电子系统、自动控制等领域的应用也越来越广泛.嵌入式语音识别技术已经发展到第二代,即以隐式马尔可夫模式识别方法为主要技术来实现对非特定语音的识别,这种技术的发展降低了识别计算复杂度,并提高了识别准确率 [1].同时在语音识别技术的革新中,也带来了语音识别在机器人交互技术下一代的应用革新. 在智能机器人功能中,语音识别是人机交互的重要组成部分之一,而在语音采样基础上的识别,是机器人传感器融合中的重要环节,它用以接收人声的控制命令和信息交互.在传统的语音识别应用中,多采用PC 或DSP 来实现,前者的目的是利用PC 较强的处理速度来实现模拟定点运算,后者则是直接利用DSP 的定点运算能力完成,但二者的功耗均较大,不适合应用于对功耗敏感的嵌入式计算场合.DSP 处理器发展多年到今天已经品种繁多,如TI 公司和ADI 公司等几大阵营有多款优秀的DSP 处理器芯片,但它们仍然没有能够有效降低功耗到消费电子的水平,使得使用高性能嵌入式处理器来模拟定点运算,成为了这类低功耗需求的主要实现策略. 语音识别除要求高识别率外,还应考虑软硬件设计简单、价格低廉、可移植性好、外围控制灵活、人机交互便捷等特点.为此,本文利用高性能ARM 处理器S3C2410X 来运行语音识别引擎,设计了一种低功耗的嵌入式语音识别控制模块,并已在娱乐机器人、教育机器人中得到成功应用.1 语音识别原理与功能分析 1 1 语音识别原理 语音识别根据实际需要和应用场合的不同,可以分为孤立词识别和连续语音识别、特定人识别和非特定人识别.语音识别方法很多,如动态时间归整法(Dyna m ic T i m e W ar p i n g )、隐式马尔可夫法(H i d den M arkov M odels)、人工神经网络法(A rtific ialN er va lN et w ork)等,隐式马尔可夫法对非特定人连续语音有很高的识别率,目前一般都采用基于隐式马尔可夫法的识别方法作为基本算法,采用模

嵌入式语音识别及控制技术在智能家居系统中的应用-课程设计

目录 一、摘要 (1) 二、设计要求 (2) 2.1 语音红外控制 (2) 2.2 系统需求规划 (2) 三、设计的作用和目的 (2) 四、系统设计方案 (3) 4.1 系统原理框图 (3) 4.2 设计方案及特点 (3) 五、系统硬件设计 (4) 5.1 开关控制的硬件设计 (4) 5.2 红外控制的硬件设计 (5) 5.3 硬件系统的设计 (7) 六、系统软件设计 (8) 6.1 嵌入式操作系统的构建 (8) 6.2 Microsoft Speech 的调用 (12) 七、心得体会 (1) 9 八、参考文献 (20)

1 嵌入式语音识别及控制技术在智能家居系统中的应用 一、摘要 随着现代科学技术的发展和人民生活水平的提高,人们对居住环境的要求,正在从以往追求居室空间宽大和装饰豪华,向着追求品味、安全、舒适、便捷和智能方向发展。人们对家庭住宅的观念也有所改变,家庭智能化是今后家庭装饰的必经之路。然而智能家居目前还存在很多的问题。嵌入式高性能芯片的出现、各种操作系统应用于嵌入式系统以及网络技术的发展为解决这些问题提供能了技术保障。嵌入式系统芯片性能在不断提高,操作系统在嵌入式系统中也得到了广泛的应用,为智能家居目前存在的问题提供了解决途径,也为未来智能家居的发展提供了技术背景。虽然,嗅觉、触觉也是人类固有的感觉,人们可以从中得到某些外界信息,但最重要、最精细的信息源只有图像和语言两种。而且,语言是人类最重要的、最有效的、最常用的和最方便的通信形式。这就很容易让人想到能否用自然语言代替传统的人机交流方式如键盘、鼠标等。传统的家用电器的控制,无外乎两种控制方式:手动或遥控。随着家用电器的增多,开关和遥控版越来越多,使用极不方便,有时分不清谁是谁的控制器,甚至找不到遥控器等,特别是以后电视数字化了,频道增加,用遥控器翻查电视非常麻烦和耗时,而采用语音控制,可以很方便的分别出电视,空调等设备,并且可以直接叫出如“中央一台”来,所以语音识别及控制在智能家居中尤其重要。 二、设计要求 本课题主要通过选择性能优良的语音识别方法,嵌入在 Windows 操作系统中,对家居设备如电灯等开关电器,电视机等遥控设备实现语音控制,语音开关控制通过麦克风发出语音信号,实现电灯等开关设备的控制,要求:实现开、关等基本控制;语音识别客厅、卧室、卫生间等不同开关设备;保留手动控制方式为备用控制。 2.1 语音红外控制 语音控制电视机、空调等红外遥控设备,要求:能学习不同遥控器的按键编码;

嵌入式语音识别呼救装置的设计与实现

0引言 对于家庭安防监控系统来说,及时报警是最重要的。在许多遇险场合下,报警人想通过一般手段(报警电话、大声呼救)完成报警,是很难做到的。如遇到入室抢劫,受害人通常会被蒙住眼睛和嘴;而突发疾病或卧床不起的人也不能大声、清晰地呼救。所以遇险时,通过声音呼救是合适的,只是对于接收呼救声音的呼救装置来说,要能及时洞察到轻微且不清晰的呼救声是十分重要的。当呼救装置识别到真正的呼救声音信号后,可以及时触发装置的监控探头捕获报警现场图像并及时远程传向救援方,即可为用户带来快速、便捷、有效的安全保护。这样的装置即称为无线呼救装置,要求其具有体积小,安装灵活、使用安全隐蔽且成本低的特点。本文涉及的基于嵌入式Linux 的呼救装置就是由此需求出发进行设计实现的,主要技术由语音识别和多媒体数据无线传输两部分组成。 1语音识别 可以看出本设备中语音识别技术重要的位置。利用语音 识别技术实现语音控制是提高家居安防先进性的一条重要途径。根据需求,采集对象应是能发出的最简单声音:即在遇险呼救时,用最小力或最不引人注意的发声方式,都可以发出的音频数据。图1为采集的样本数据。 呼救音显示振幅较低,时间延续较长(每次约10s ),反复3次以上。在呼救现场听起来较沉闷单调,不会引起注意,这就是设计的意图。该呼救音信号经X 轴增益后可得到如图2所示细节。 由图2可以发现,呼救音信号具有较强的时域稳定性。这样的信号在时域上可提取短时能量和短时平均过零率作为重要特征。根据需求,本装置使用的语音识别应属于特定人语音识别,只有发现并断定是设定呼救人呼救后,识别模块才会触发整个呼救装置开始工作,如报警、图像捕获、数据传输等,其功能需求如下: 收稿日期:2007-10-26E-mail :music@https://www.wendangku.net/doc/b317163078.html, 基金项目:浙江省教育厅2006年科研基金项目(20061728)。 作者简介:沈音乐(1973-),女,硕士,讲师,研究方向为嵌入式计算机开发技术、软件工程。 嵌入式语音识别呼救装置的设计与实现 沈音乐 (杭州职业技术学院,浙江杭州310018) 摘 要:阐述了基于语音识别和多媒体无线远程传输两项技术的实时呼救系统的设计思路,介绍了其中的几个关键性技术要点。系统以ARM 为硬件平台,使用嵌入式Linux 操作系统进行开发,完成了用呼救音触发呼救监控装置,及时将多媒体呼救信息传给救援方,为居家安防提供了一种解决方案和技术依据。 关键词:语音识别;隐马尔科夫模型;梅尔频率倒谱系数;多媒体信息服务;呼救装置中图法分类号:TP393文献标识码:A 文章编号:1000-7024(2008)10-2526-04 Design and realization of embedded speech recognition annunciator SHEN Yin-yue (Hangzhou V ocational and Technical College,Hangzhou 310018,China ) Abstract :A method based on speaker-dependent speech recognition and multimedia message transmition is described and some key technologies are introduced.The system,which is based on arm CPU and using embedded-Linux as operating system,can realize sending multimedia message to ask for help with the annunciator provoked by voice.A solution example is provided as reference and technology support for the development of house safeguard. Key words :speech recognition;HMM;MFCC;MMS;annunciator 2008年5月计算机工程与设计 May 2008 第29卷第10期Vol.29 No.10 Computer Engineering and Design 图1 采集的数字音频样本数据 图2 经X 轴增益后声音时域波形

DSP的嵌入式语音识别-开题报告

上海工程技术大学 毕业设计(毕业论文)开题报告 学院电子电气工程学院 专业电子信息工程 班级学号 学生 指导教师 题目基于DSP的嵌入式语音识别系统设计

《基于DSP的嵌入式语音识别系统设计》 ————开题报告 一、选题背景 语言是人类相互沟通信息的重要工具。随着现代科学技术的发展,特别是语音通信和各类相关产品的普及,语音信号的数字化处理在越来越多的领域中发挥着至关重要的作用。 所谓的语音技术,无非是一种集合:一种涵盖了识别、合成、检出关键词、口语对话系统的集合,而这个集合的核心无可厚非便是语音识别技术,特别是连续识别——这门最初为了解决机器如何能够准确地解析人的语音内容的学科,正以一种不可思议的态势飞速发展,给“死板”的机器添上了一份“人性”。 算法运算量大,处理快速高效(无论是实时或准实时)这些都是一个语音系统的基本要求,而DSP凭借着本身强劲的数据处理能力和高运行速度挑起大梁,充当起整个系统的“心脏”。它是一种特殊的微处理器,一种以数字信号来处理大量信息的器件,其工作原理:首先将接收模拟信号进行转换,转换为0或者1的数字信号,再对数字信号进行修改、删除及强化并在其他系统芯片中把数字数据解译回模拟数据或实际环境格式。具有可编程性的它,以每秒千万条复杂的令程序的实时运行速度,让那些通用的微处理器望尘莫及。 二、研究课题的意义

本文实现的语音识别系统主要由硬件设备和相应的软件算法组成。在Matlab7.8平台上验证和改进了算法(如:预处理、端点检测、特征提取和模式匹配),然后用 C汇编语言结合混编的方式移植到DSP的开发平台——CCS,最终在ICETEK-VC5416AE-S60实验箱上实现孤立词(0-9)的识别,而随着库内容的丰富,本系统将会越发接近当下最为热门的语音助手——siri。 三、语音识别的研究概况 1.国外语音识别技术的研究现状 从1952年Bell实验室的Audry到2012年iphone的Siri。60年来语音识别这项技术一直都是计算机研究领域内的“香饽饽”,倍受 IBM、微软等IT巨头器重,相关研究成果也层出不穷。 IBM——作为语音识别技术的先驱,以它的 ViaVoice 软件为例:可以帮助人们通过麦克风用语音向字处理软件输入文字,无论是英语、意大利语、德语、法语、日语还是汉语等都照单全收。而微软新版的 Windows 操作系统 Vista,也配置了先进的语音识别软件。用户动口而不动手来完成通过语音和计算机交流(比如通过口来“书写”信件或电子邮件······)。而这个功能对于那些“特殊群体”,带来的便利是不言而喻的。 目前世界上最先进的语音识别软件叫做 Naturally Speaking,出自于Nuance Communications公司。Naturally Speaking已经得到了大多数用户的认可。对着麦克风说话,屏幕上就显示出说话的内

相关文档