文档库 最新最全的文档下载
当前位置:文档库 › 通用语音(IVR)系统

通用语音(IVR)系统

通用语音(IVR)系统
通用语音(IVR)系统

自动语音查询系统

白皮书

北京同力信通软件有限公司

2011年4月

1、概述

1.1、 IVR概述

IVR(Interactive V oice Response,即交互式语音查询系统.又称自动语音回复系统)是呼叫中心的重要组成部分,是呼叫中心系统中进行自动服务的重要设备。

IVR是与用户连接的关键部分,电话用户在呼入时,IVR提示用户按键输入选择并根据选择完成自动语音报读、自动传真收发、记录客户留言、对数据库的操作等功能,它处理了许多重复性的工作,使大部分电话呼入实现了自动化,同时还能减轻座席人员的负担,使坐席仅处理确实需要人工处理的呼叫。

使用IVR可以使用户一天24小时随时、简单、方便的获得信息服务,从而改善了对客户的服务质量,增强了竞争力,减少了管理开支,而且它可以全天24小时为客户提供礼貌和周到的服务,因而受到人们的普遍欢迎。

IVR一般分为以下两种:

●普通声讯服务。用户通过拨入信息服务者所提供的号码,直接进入信息

系统,立即听取相应的信息,获得声讯服务,广为人知的168服务为这

种服务最具有代表性的服务。

●交互式声讯服务。用户拨入信息服务者提供的服务号码,进入信息服务

系统,用户需要与信息服务系统进行交互操作,比如:通过按键输入

DTMF信号选择服务。中央电视台开通16897168就是这种业务的典型

例子。

在客户服务中心的应用中,自动语音服务可分为三类:自动语音应答、语音引导和自动业务代表。

●自动应答:进入客服中心的呼叫,由IVR进行应答,通知用户已经接通

客服中心。

●语音引导:IVR能够接收并识别用户的按键即DTMF信号,并且根据

用户的选择播放不同的语音或者提供自动语音、传真或者人工座席的服

务。通过合理应用IVR的语音引导功能,客服中心能够对用户进行自动

导航,帮助用户选择所需的服务,提高客服中心的效率。

●自动业务代表:IVR通过获得用户按键和播放语音为客户服务中心的用

户提供服务。

环顾我们四周,我们可以发现,IVR已经用的非常广泛。拨打121可以查询天气预报,拨打117可以知道准确的时间,拨打1860可以在语音的提示下查询手机费用,还有各种点播热线。

同力信通公司的IVR系统是基于同力信通智能语音平台的基础上根据用户

的需求定制的。它可以为从低成本的只有几条电话线的语音查询系统到大型的多条E1中继线的呼叫中心应用。

1.2、智能语音平台简介

同力信通智能语音平台是一套多功能、多硬件体系的基于COM组件的开放的电话语音系统开发平台,它利用现有比较发达的电话网,跟踪和吸收发达国家的先进技术,采用了计算机网络技术、数字程控交换技术、数字信号处理技术、数据库技术,和人工服务相结合,以信息为支柱,为广大中小型企事业、政府机关、大型企事业的客户部门、销售部门等提供了全面有效的客户服务解决方案。

同力信通在多年呼叫中心产品的研发和应用中,积累了大量CTI应用开发经验,对电话语音应用进行了高度的分解和抽象,提供了几十个内建模块。利用这些模块,可以方便的控制程序流程,连接各种类型的数据库,从而搭建出各式各样的电话语音应用。对于系统集成商来说,无须花费数月的时间,去研究那些枯涩难懂的语音卡函数,便可开发出符合您需求的性能稳定的、专业的电话语音系统。简单、快捷地实现ACD、自动语音应答及流程设定(IVR)、数据库访问及修改、Fax、短信、语音合成及识别、人工坐席服务等功能,极大的降低了开发成本,开发人员入门门槛低。

在硬件集成方面,智能语音平台系统将许多著名的语音产品,如Dialogic 、NMS 、Telelink 、东进、五岳新等多家不同品牌的语音卡,集成到同一开发环境,真正做到应用环境与设备无关,用户只需将自己的应用流程和数据库系统连接到开发平台,便可驱动各种不同的语音卡工作。用户可以根据实际情况在多种硬件配置中选择,实现成本控制。

由于同力信通呼叫中心开发平台在CTI应用层的层次上屏蔽了不同体系结构集成方案的差异,提供基于COM组件的坐席端开发接口,使呼叫中心和企业的业务逻辑剥离,方便了系统集成商的业务二次开发。系统集成商可以根据客户的情况,将将电话多媒体技术、数据库系统、计算机网络、客户关系管理有机的结合到一起。

同力信通呼叫中心开发平台由四大部分组成:服务程序,管理程序,统计分析程序以,坐席程序及实用工具程序,如语音录音程序,语音卡测试程序,交换机收发码测试程序等。

2、产品结构

同力信通呼叫中心平台由硬件设备与软件两部分组成。

呼叫中心的结构如下图所示:

●PSTN:公用电话交换网

●CTI服务器:电脑电话应用服务器

系统的核心控制部件,负责业务的支撑,完成呼叫的控制,呼叫的技能路由,提供与呼叫同步的用户数据及监视信息等。CTI服务器与各系统之间采用协议通讯,CTI服务器向各系统发送与呼叫相关的指导性控制指令。

CTI服务器主要由工业工控机和语音板卡组成

工控机:与商用机相比,以工业标准设计、生产的工业控制机具有高可靠性、高稳定性。其平均无故障时间远远大于商用机,与其他硬件产品的兼容性好;安装、调试简便。以工业控制机为服务中心服务器,可确保系统的高可靠性、高稳定性,当然也可以使用普通PC机。

语音卡:专业语音板卡厂商生产的语音卡,将计算机与通信技术紧密地结合在一起,可实现信息访问、消息处理,以及本地网与广域网的互联。

●IVR系统: Interactive Voice Response 交互式语音应答

用户拨入热线,ACD直接将呼叫分配给IVR系统的空闲端口,IVR系统自动摘机并同时播放欢迎词,并提示客户选择服务功能。用户根据提示选择后,系统提供对自动流程的控制,将会调用语音资源进行语音的播放。在服务过程中,客户可以随时和人工坐席通话,获得进一步的服务。

●传真服务器:支持传真自动应答

●人工坐席

完成电话的人工受理。在电话进入后的任何过程中均可以实现自动流程处理与人工坐席处理的灵活切换。在自动应答系统不能回答用户问题时,能够在呼叫用户的控制下进入到人工应答系统;在不再需要人工应答时,可切换到自动应答系统回答用户的问题。班长台对所有的座席台都可进行监控,进行质量监督。

●数据库服务器

数据库服务器数据库服务器的主要功能是存储客户信息,同时也存储大量有关企业政策、产品等信息,以供客户查询,同时还对操作员进行日志记录。由于客户服务中心完全以客户为第一,追求人性化的服务,所以DBS对客户的资料及交易数据应有完整的记录。建议数据库服务器采用高性能的专用服务器。

3、产品功能

3.1、人工接听

在自动语音服务无法满足客户需要时,也可以转接人工,由人工坐席为用户提供服务。

3.2、 IVR多媒体语音交互应答

IVR自动语音应答系统主要用于为用户电话来访提供语音提示,引导用户选择服务内容和输入电话事务所需的数据,并接受用户在电话拨号键盘输入的信息,系统自动根据所选数字键和功能键,播放事先录制的语音

信息为其服务。

服务人员在接听客户电话时,也可以通过在电话机按键选择,转到播放一条事先录制的语言信息。

语音合成

对客户播放的语音既可以选择人工预先录制,也可以选择文本文件,通过TTS(Text To Speach)技术动态合成的语音信息的。

流程编辑

通过拖拽模块的方式对语音(IVR)流程进行修改,并重新录制语音后即可生成实现,无需对系统进行修改。

在同一个系统中可以有多个流程,用户拨打不同的电话,运行不同的流程。每个流程可以完成不同的功能。

在流程的节点语音更改时,只需选择节点的属性为更新后的语音文件即可。更新过程不会对正常通话业务造成任何影响。

IVR语音流程可以提供多层配置(不限层数,但层数过多,会给客户造成复杂的感觉),每层可以定义9个节点,使用话机数字键(0至9)进行选择。

3.3、 IFR交互式传真应答

完成接收传真,联机发送传真,事后发送传真、定时发送传真、传真机识别等功能,并为IVR子系统和座席应用提供传真服务功能调用。

交互式的语音传真系统提高了客户服务的反应能力。客户可以根据语音提示菜单选择他们想要的内容。另外,许多不喜欢向供应商做传统咨询的人,他们不必面对业务员,只要按照需要接收相应的传真就可以了。对于业务员而言,系统节约了很多销售和客户服务工作量,可以去做更有价值的事。IFR系统具备对主叫进行身份验证(帐号、密码)的功能

系统提供即时传真回复和异步传真回复两种方式,支持双向收发传真,语音疏忙。系统还常常集成在一个文档管理系统中,这个文档管理系统管理着企业内部网上有关文档的存取。偏远的客户可以通过电话连接到这个系统上来取资料。只要用双音频按键输入文档的编号,就可以从文档库中调出文件,发回到指定的传真机上,这些操作是通过系统完成的。

3.4、录音功能

录音子系统录制通话内容的过程是采用国际上通用语音压缩技术,符合CCITT的建议标准,将话音信号经取样、数字化、压缩后存储在计算机光磁盘中,放音则是通过对硬盘上的语音数据进行解压缩后通过外接音箱恢复录音的内容。

录音受被录电话的摘、挂机信号控制,电话摘机则系统开始录音,电话挂机则系统停止录音,停止录音的同时将有关该次通话的时间、录音线号等信息自动添加到数据库中,以便日后查询。

3.5、语音信箱

主要用于人工座席忙或保存用户的意见、建议、投诉等不能即时受理的信息,事后工作人员可以查询,收听信箱中的留言。

3.6、 TTS功能

语音合成(Text To Speech),简称TTS技术,可以将文本状态的文字信息

转化为可听的声音信息。使以往只能用眼睛看的文字信息,也可以用耳朵来听。在复杂的语音编制中,通过TTS可以大大降低语音录制工作强度,提高工作效率。

3.7、系统管理

系统管理的内容主要包括以下几个方面,这几个部分相互独立,相互保障,是呼叫中心系统安全正常高效运行的前提:

人员管理:操作员管理和分组管理

状态监控:座席状态、中继状态、人员状态、录音状态、传真状态和日志信息

信息管理:传真查看、留言听取、听取录音、短信信息查询、用户资料管理等

4、运行环境

4.1、硬件平台

工控机:工控PIII850,128M内存,40G硬盘,10/100M网卡以上配置研祥工控机

语音板卡:东进语音板卡

4.2、软件环境

操作系统:中文Win2000 Advance Server

数据库:中文SQL Server 2000(pack 3)

4.3、系统规模

单机支持8到120端口,多机最大容量为1560端口。

5、产品特点

5.1、可视化的流程开发界面

屏蔽代码编辑过程,完全采用可视化的方式进行语音流程设计,所有的操作仅通过鼠标点击、拖放和少量键盘输入实现。对开发人员的编程要求大为降低,不需要开发人员具备高深的编程经验和技巧,只要熟悉电话语音应用的业务流程,即可轻松进行开发工作。完全可视化定制IVR流程,国内首推“零编码(Z-Code)”构造自己的呼叫中心系统。

使用流程生成器,可为使用者带来如下好处:

1)、不须熟悉电话语音的技术!

2)、设计速度快! 别人采用古老的API方式,花费数个月才能设计完成的语音应用,若改用合适的语音软件产生器来设计,可能您在一两天就可以交卷了,事半功倍。

3)、减少写程序的时间! 在屏幕上描述各功能的语音节点的关系,并设定各语音节点功能,用户无须编写程序,便可生成各种流程的程序,方便快捷,是构造CTI系统的利器。

4)、便于维护和移植。

5)、支持数据库操作(ODBC方式)、加减乘除运算、逻辑判断、字符串运算等。

6)、提供在线调试工具、预编译功能及错误检查功能。

7)、以独立文件为信息存放基础,采用解释执行的运行方式。

5.2、多流程架构

同力信通呼叫中心平台可以同时运行多个语音流程,系统为每个语音流程设置使用的通道。用户可以针对不同的业务使用不同的流程,例:办公流程、接线流程、投诉流程、客服流程等。所有的流程可同时运行在统一平台基础商,大大提高了系统的灵活性。

5.3、外挂语音引擎

系统采用多层应用架构,应用层和底层驱动无关。系统支持国内外多

种语音引擎,包括Dialogic、五岳新、东进等知名板卡制造商的驱动。无

论用户使用哪种板卡驱动,系统都能构给予很好的支持。

5.4、丰富的数据库支持

平台支持目前流行的数据库种类,包括桌面型和网络型(SQL Server、Oracle、SyBase)。无须自己撰写外挂接口,就可以通过平台的内建支持

对多种数据库进行连接、查询等操作。

6、产品服务

良好的服务是系统成功实施并充分发挥效能的关键。北京同力信通公

司有着一支专业化的服务队伍,通过合理的程序,为用户提供充分的售前

咨询,方案设计,安装,调试,培训,售后技术支持,维护,版本升级的

一条龙服务。使用户真正体会到该系统的方便、高效,把主要精力投放到

业务处理上,而不是软件系统的维护上。

服务流程:

销售人员售前工程师售后工程师服务工程师

客户咨询系统方案合同安装、调试、培训支持、维护

升级

图 6:服务流程图

今天,我们正在进入一个崭新的知识经济时代,企业能否快速适应新

经济的特点,并在其中占据有利位置是关系到企业明天的生存和发展的头

等大计。我们希望通过我们的产品,技术和服务帮助我们的客户在新一轮

竞争中占得先机,并为社会的发展做出贡献。

7、环境要求

为了保证系统的稳定性,对系统运行的外部环境有一定的要求。

工作环境条件:

●2温度:0--30° C

●2相对湿度:40%--80%

●2空气与周围环境清洁

●2供电电压波动范围:AC 220V±10%(50±1HZ)

电源接地系统要求:

●2直流地接地电阻小于1W

●2交流地接地电阻小于3W

●2安全地接地电阻小于4W

8、系统的维护与培训

同力信通公司提供完善的售后服务、技术支持以及系统培训服务,包括:

●及时的现场服务

●提供全天候技术支持

●公司将提供升级服务和后续开发支持

●免费对工程师和系统管理员进行系统的操作维护培训

●硬件一年包换

●系统软件升级:一年内同一系列内软件免费升级。

附件一、IVR功能

同力信通IVR系统是一个智能的语音应答平台,用户并不需要了解底层的实现原理、语音卡的硬件、软件编写等知识,而将精力完全放在具体的业务流程开发上即可。通过IVR完成:咨询、宣传、各类综合信息查询、自助服务等,具体描述如下所述。

咨询及宣传

咨询及宣传主要包含以下各方面的内容:

1. 心理咨询;

2. 医疗保健咨询;

3. 生理卫生咨询;

4. 国家法律、法规咨询;

5. 社会医疗保险咨询;

6. 电信业务咨询;

7. 工商、税务业务咨询;

8. 旅游信息咨询;

9. 银行业务咨询;

10. 电脑上网咨询;

11. 娱乐、饮食、住宿咨询;

12. 其它代办业务咨询。

综合信息查询

咨询服务中心的综合信息查询业务包括:

1. 流行音乐欣赏;

2. 戏曲、相声名段欣赏;

3. 影视歌明星档案查询;

4. 人文景观、风土人情查询;

5. 招聘信息查询;

6. 租赁信息查询;

7. 征婚信息查询;

8. 股票行情实时查询;

9. 股评欣赏;

10. 飞机航班查询;

11. 列车时刻表查询;

12. 天气预报查询;

13. 主要政府机关、企事业单位电话号码查询;

14. 邮政编码查询;

15. 电话区号查询;

16. 其它各行业信息查询。

自助服务

客户资料登记、修改;

语音、传真信息点播;

个人账户查询;

自助缴费;

个人语音、传真信箱。

附件二、IVR的应用范围

IVR在政府机关中的应用

政府热线是政府连接市民、了解民情意的一个重要窗口,是市政府实行政务公开、改进工作作风、提高办事效率、加强廉政建设、倾听市民呼声、密切群众联系、树立政府形象的一项重要举措,对有效地监督各职能部门的工作效率和工作作风,增强市民对政府的信任,维护党和政府的形象具有重要的意义。

目前,各地市政府大都开通了政府热线电话“12345”,市民可以通过该热线向政府部门提出建议、意见或进行投诉、举报等事项。利用四通八达的电话网,建立政府与群众之间全天候的联系渠道,随时听取群众的意见、解决群众的困难、接受群众监督,当好人民的公仆。全国各地自“12345”热线电话开通以来,一直受到群众的称赞,它是政府和群众之间的重要联系窗口,在充分发扬民主、实行政务公开、听取群众意见、改进工作作风、提高工作效率、杜绝腐败现象、密切同人民群众联系等方面发挥着重要作用,加强市民对政府的信任度,增强党和政府的“为人民服务”的良好形象。

由于原有的“12345”政府热线系统普遍采用人工方式,工作效率低、信息共享能力差,目前已有许多“12345”政府热线系统采用现代通信技术和计算机技术,建立综合的热线服务平台。通过该综合服务台,集中受理群众的意见、建议和投诉,及时解决了群众反映的热点和难点问题,并且提供政策法规,城市指南、办事指南、投资指南及查询有关部门职能范围等咨询服务,通过计算机和网络系统的支持,将所有来电的意见都详细记录,并且进行录音。同时,通过自动语音和自动传真系统,在无人值班的时候,可以记录来电者的电话号码,按语音提示实现政策法规查询、投诉处理结果查询、市长信箱留言、实时投诉录音。真正做到了每周7天,每天24小时的全天候值班。通过对信息的储存、汇总、分析,可有效地帮助领导对群众反映热点和难点问题进行量化的总结和分析,及时发现工作中存在的问题,并且能有效地监督各相关部门的工作效率和工作作风,提高民众对政府工作的满意率,对维护党和政府形象,能起到积极的作用。

IVR在企业中的应用

随着经济全球化及市场竞争日趋白热化,现代企业面临着更加严峻的挑战,同行业竞争越来越激烈。而客户是企业经营发展的重要对象,提高客户服务质量成为企业生存、壮大的关键。

为了满足市场的需求,企业组建的客户服务中心可以改善服务质量,提高工作效率、并增加企业的市场新业务。

IVR是呼叫中心整体流程的先导,IVR为企业处理大量的日常业务,无须通过业务代表。顾客通过按键或语音选择,向企业主机输入信息,在允许范围内访问各类企业数据库(通过ODBC),自助得到多种服务,令业务代表有更多的时间服务于有特别要求的顾客。

IVR也可以是呼叫中心的主控者。顾客来电可以自由的在人工坐席和IVR 之间转移,例如业务代表可以要求IVR验证顾客ID,或播放咨询信息,并在结束后收回控制权。在转移过程中携带顾客数据及相关信息。

企业应用IVR系统可同时处理多路来话,再加上遇忙自动处理流程,会极大降低顾客听到忙音或途中放弃的概率,提高顾客满意程度,从而帮助企业高效率的服务每个顾客,准确及时的记录他们的各种不同要求,用亲切的语音服务使每个客户感到满意,从而最大限度的留住每个顾客,并努力发掘潜在客户,增加企业收益,降低人工成本。

政府

●12345市长热线

●12315消费者申诉举报服务热线

●110/119/120报警处警系统

●税务举报热线

●税费查询催缴系统

●电话报税系统

企业

●电话营销

●数字防伪系统

●客服热线

银行为储户

●帐户查询

●各类卡激活

●信用认证

●基金查询

●利率查询

●姓名/住址变更

●转帐

保险为保户

●索赔/资格认证

●投保信息查询

●共同赔付信息

●受益人信息

●ID卡申请

●保单申请

●健康咨询

保险为保险代理人

●险种宣传

●销售策略指导

●佣金查询

●条款咨询

●奖惩信息

●业务存档

续保咨询

运输为航空公司

●航班离港/到港时间查询

●固定顾客信息

●订票信息

●智能呼叫处理

●预定机票座位确认

●自动取消航线通知

●货运监督

为货运公司

●装运申请及重量确认

●装运跟踪

●到货日期查询

●员工/司机计划表

●地点查询

证券

●股票电话交易

●估价查询

电信

●特种电信服务

●费用查询

●姓名/住址变更

●营业网点查询

社会信息台

●自动人工点歌台

●心理热线

●自考查分;

教育

●毕业证书电话查询

●校园语音信息导航系统

●自动语音分数查询系统。

车载导航人机语音交互系统的实现.

车载导航人机语音交互系统的实现 引言语音作为自然的人机接口,可以使车载导航系统实现更安全、更人性化的操作。通过国内外车载导航系统的功能对比可知,支持语音交互是车载导航系统的一个发展趋势。另外,市场信息服务公司J.DPowerandAssociates的调研数据也表明,56%的消费者更倾向于选择声控的导航系统。因此,开发车载语音导航系统是很有意义的。目前,国内已经具备开发车载语音导航系统的技术基础,特别是文语转换TTS技术和基于中小词汇量的语音命令识别技术 引言 语音作为自然的人机接口,可以使车载导航系统实现更安全、更人性化的操作。通过国内外车载导航系统的功能对比可知,支持语音交互是车载导航系统的一个发展趋势。另外,市场信息服务公司J.D Power and Associates的调研数据也表明,56%的消费者更倾向于选择声控的导航系统。因此,开发车载语音导航系统是很有意义的。目前,国内已经具备开发车载语音导航系统的技术基础,特别是文语转换TTS技术和基于中小词汇量的语音命令识别技术已经达到比较实用的程度。本文在课题组的车载导航系统和国内两款语音引擎的基础上,开发了一套支持语音交互的车载导航系统。 车载语音导航系统结构 车载语音导航系统从功能上分为车载导航和导航语音交互两方面。其中车载导航功能包括GPS卫星导航定位、电子地图浏览查询、智能的路径规划、车辆地理位置和速度等导航信息的实时显示;导航语音交互功能分为语音操作和语音提示两部分。在系统的设计中,根据人机交互的需求,设计语音导航系统的硬件框架如图1所示。 语音导航系统和用户之间的人机交互接口由触摸屏、按钮、话筒、显示屏和扩音器等五个交互设备组成。该硬件框架可实现常规的手动交互方式,也可以实现语音交互方式。整个系统划分为三个子系统:导航子系统、语音识别子系统和语音合成子系统,各子系统间通过接口进行通信,协调完成语音导航任务。 车载导航人机语音交互系统对话模式设计 导航系统的状态转换网络 整个导航系统是一个复杂的人机交互系统,为便于语音交互对话模式的设计,首先对系统作状态划分,然后从人机交互的角度描述整个系统的状态转换网络。将系统划分为地图浏览、功能选择等六个功能状态和一个退出状态。图2描述了这些状态之间的状态转换网络。

一种可用于单片机系统的中文语音交互电路

一种可用于单片机系统的中文语音交互模块 ——安然之家中文语音交互模块 自从Apple公司的Siri语音交互程序发布以来,用自然语言特别是中文与设备进行交互控制成了一个热门话题。然而Siri的工作是依赖高速的处理能力和庞大的网络后台系统实现的,对于一般开发团队来说很难模仿或为己所用。 针对这种需求,安然之家智能电子工作室开发了一种低成本(百余元)和简单硬件环境(单片机)为基础实现中文语音交互系统,使语音智能交互走进各种简单电子设备成为可能。其特色在于: ·该系统的特别之处在于免录音,免训练,识别内容内需要通过汉语拼音描述,合成内容只需要通过汉字描述。使开发过程极其简单,修改内容极其方便。 ·为了方便开发人员对功能的自由组合,本系统设计成三个体积超小,功能完全独立的模块——超易用语音识别模块,迷你版语音合成模块和ST 单片机超小系统模块。模块间采用简单的串口通信,便于与各种用户系统、单片机和上位机连接。 ·程序采用C语言编写,高度结构化,封装了芯片级控制函数,可以方便地移植到客户的系统中。经长期大量用户应用与反馈,确保程序稳定可靠。 ·模块采用安然之家产品统一的接口和管脚布局,组合方便,并向下兼容安然之家未来的更高商端的语音模块,产品升级极其方便,节省重复开发所浪费的时间。 实验条件 软件: Keil uVision2.0/3.0及以上版本 STC_ISP下载程序 LP-COMM V2.23调试工具(模块附送) 语音交互系统C51源码(模块附送)

硬件: 232转TTL串口模块 232串口线或USB转232串口线 安然之家语音交互模块3件套装(合成模块+识别模块+超小系统) 3.3V直流电源(不小于500mA) 模块结构与连接方法示意图 模块外观实拍 图中从左至右依次为:语音识别模块,超小系统模块和语音合成模块。 语音交互模块连接示意图

北汽新能源EU5五智十谈智能语音交互系统

如今,汽车已经成为人类出行的伙伴,这不仅需要汽车更懂驾驶者,更需要其 成为驾驶者的“灵魂伴侣”! E U5搭载的人车深度交互智能对话和语音控制系统,不仅能解放您的双手,更让您在旅途中有了可以聊天和帮您安排行程的伙伴。同时,E U5还加入了迎宾、提醒、警示等特别音效,让开关门都有了不一样的仪式感。 强大的语音交互系统 U5的智能语音交互系统真正实现了人与车机的深度对话交流。该系统基于对周边服务的整合,可预判需求并帮助用户实现。 E U5的智能语音系统与同级车型相比,具备四大功能优势: 个性起名 用户可以给爱车起一个专属的名字,就像好朋友一样,甚至可以用它的名字唤醒系 统并发出语音指令。 随意打断、抢说

提供单轮和多轮对话的模式,用户可以随时打断系统的播报,系统则及时响应新的 命令和交互,实现更快捷的交互要求。 多条件查询 支持条件叠加式的搜索,例如搜索指定距离及驾车时间内的美食信息,能够更加贴 近用户想要查询的目标物。 对话闲聊 可以与系统讨论要去哪里吃饭、要看哪场电影。不管是聊天对象或者是智能生活助手,系统都可以扮演好相应的角色。 “云端大数据”支持 E U5的智能语音交互系统,基于自然语言和14亿人的出行、旅游、美食等经验内容,进行了浩瀚的数据结构化,并缓存到可以被快速调用的云端区域,使得系统可根据客户询问的内容,结合云端大数据,迅速给出最佳的推荐方案! 目前,该语音系统的功能已融入到车内的导航路况、娱乐信息、生活信息、酒店航旅、车辆控制等服务功能中,使人、车、生活的生态连结更加完善,并可兼容百度、高德等导航系统;另外,车内安装的即时通讯A P P可收发语音内容,让出行生活更加轻松自如且富有乐趣,真正实现车与生活的无缝衔接。

机器人语音交互系统的设计

龙源期刊网 https://www.wendangku.net/doc/988830189.html, 机器人语音交互系统的设计 作者:赵邦宇 来源:《电子技术与软件工程》2018年第15期 摘要 随着科学技术的发展和计算机研究力度的不断增大,人机语言通信技术成为目前最受关注的一项关键技术,随着语音技术研究力度的增强和快速发展,其对人们的日常生活还有计算机发展都产生了一定的影响作用,同时因为语音技术而研发出的各种产品也广泛应用到各个领域当中,例如军事监控、电话交换、信息网络查询、语音拨号系统、语音通信系统、家庭服务以及信息检索等等,可以说已经渗入到每一个行业当中。该项技术也可以很好地促进人机交互之间的自然友好关系,是未来人机交互领域的主要发展方向。 【关键词】机器人语音交互系统研究设计 1 智能机器人语音交互系统设计 我国当前对机器人语音交互系统的主要研究内容集中在对单独使用电脑相关硬件或者软件的语音交互载体,目前已经实现了语音交互的有效控制,但是在实际应用过程中仍然还是存在一定的局限性,只是能够满足已经下载好的几个系统功能,想要实现进一步扩展就存在一定的障碍。以下将对智能机器人语音控制系统最为例子对离线语音的识别以及云在线语音识别两项内容进行一定的分析和研究。 在计算机各种类型当中,RaspberryPI是一种新型的种类,其具有很好的音频和视频处理 功能,这种类型的计算机配备了ARM的微型电脑主板,SD/MicroSD卡内存硬盘,4.14个USB接口,802.11nWi-Fi,一个10/100以太网接口,蓝牙还有网线和鼠标等,并且实现了HDMI高清视频输出接口和视频模拟信号的电视输出接口的同步拥有。和其他的单片机相比较而言,其具有一套非常完整的操作系统,而且自身携带有接口,可以利用相应的程序编程来实现对各种软件的有效应用。利用联网就可以实现对云开放识别技术和简单开关的智能语音交互,进一步实现对语音交互各种软件和硬件的有效控制,同时还有效实现了在线和离线的有效结合。 在具体操作过程中主要分为以下几个步骤: (1)利用互联网语音识别、离线语音识别以及云开放语音识别等多个接口的有效连接对外界的语音信息还有一些比较简单的动作信息进行有效的采集,并将其传送到主板上进行一定的处理; (2)经过处理之后的信息输出之后,利用简单的开关和扬声器对这些信息做出一定的反馈和互动,然后再次利用开关设备和联网连接实现对无线开关的有效控制。2离线语音识别

车载导航人机语音交互系统的实现

引言 语音作为自然的人机接口,可以使车载导 航系统实现更安全、更人性化的操作。通过国 内外车载导航系统的功能对比可知,支持语音 交互是车载导航系统的一个发展趋势。另外, 市场信息服务公司J.D Power and Associates的 调研数据也表明,56%的消费者更倾向于选择 声控的导航系统。因此,开发车载语音导航系 统是很有意义的。目前,国内已经具备开发车 载语音导航系统的技术基础,特别是文语转换 TTS技术和基于中小词汇量的语音命令识别技 术已经达到比较实用的程度。本文在课题组的 车载导航系统和国内两款语音引擎的基础上,开发了一套支持语音交互的车载导航系统。车载语音导航系统 结构 车载语音导航系统 从功能上分为车载导航 和导航语音交互两方面。 其中车载导航功能包括 GPS卫星导航定位、电 子地图浏览查询、智能的路径规划、车辆地理位置和速度等导航信息的实时显示;导航语音交互功能分为语音操作和语音提示两部分。在系统的设计中,根据人机交互的需求,设计语音导航系统的硬件框架如图1所示。语音导航系统和用户之间的人机交互接口由触摸屏、按钮、话筒、显示屏和扩音器等五个交互设备组成。该硬件框架可实现常规的手 动交互方式,也可以实现语音交互方式。整个 系统划分为三个子系统:导航子系统、语音识别子系统和语音合成子系统,各子系统间通过接口进行通信,协调完成语音导航任务。车载导航人机语音交互系统对话模式设计导航系统的状态转换网络整个导航系统是一个复杂的人机交互系 车载导航人机语音交互系统的实现 Design and Implementation of Human-machine Speech Interaction in Vehicle Navigation 清华大学汽车安全与节能国家重点实验室 刘旺 杨殿阁 连小珉 摘要:支持语音交互是车载导航系统的一个发展趋势。本文讨论了 车载导航系统人机语音交互的实现方法,包括对话模式、关 键词识别、语音控制命令、名称识别、语音合成。试验结果 证明,系统能满足车载导航人机语音交互的要求。 关键词:车载语音导航;人机语音交互;语音识别;语音合成 图1 语音导航系统的 硬件框架图2 导航系统的状态转换网络

机器人语音交互系统的设计

电子技术 ? Electronic Technology 66 ?电子技术与软件工程 Electronic Technology & Software Engineering 【关键词】机器人 语音 交互系统 研究 设计1 智能机器人语音交互系统设计我国当前对机器人语音交互系统的主要研究内容集中在对单独使用电脑相关硬件或者软件的语音交互载体,目前已经实现了语音交互的有效控制,但是在实际应用过程中仍然还是存在一定的局限性,只是能够满足已经下载好的几个系统功能,想要实现进一步扩展就存在一定的障碍。以下将对智能机器人语音控制系统最为例子对离线语音的识别以及云在线语音识别两项内容进行一定的分析和研究。在计算机各种类型当中,RaspberryPI 是一种新型的种类,其具有很好的音频和视频处理功能,这种类型的计算机配备了ARM 的微型电脑主板,SD/MicroSD 卡内存硬盘,4.14个USB 接口,802.11nWi-Fi ,一个10/100以太网接口,蓝牙还有网线和鼠标等,并且实现了HDMI 高清视频输出接口和视频模拟信号的电视输出接口的同步拥有。和其他的单片机相比较而言,其具有一套非常完整的操作系统,而且自身携带有接口,可以利用相应的程序编程来实现对各种软件的有效应用。利用联网就可以实现对云开放识别技术和简单开关的智能语音交互,进一步实现对语音交互各种软件和硬件的有效控制,同时还有效实现了在线和离线的有效结合。在具体操作过程中主要分为以下几个步骤:(1)利用互联网语音识别、离线语音识机器人语音交互系统的设计 文/赵邦宇 别以及云开放语音识别等多个接口的有效连接 对外界的语音信息还有一些比较简单的动作信息进行有效的采集,并将其传送到主板上进行 一定的处理;(2)经过处理之后的信息输出之后,利用简单的开关和扬声器对这些信息做出一定的反馈和互动,然后再次利用开关设备和联网连接实现对无线开关的有效控制。2 离线语音识别在离线语音识别系统当中主要采用的语音识别模块,另外还采用了Raspberry 控制板一定的架构方案,并利用LD3320语音识别模块对语音进行有效的识别。在具体操作过程中 可以利用相关的软件系统对关键字信息进行有效的识别。在工作过程中,该模块通常情况下 只要捕捉到一些语音信息就会及时发出相应的 字节,然后可以Raspberry 嵌入控制面板来获取相应的字节来对其做出反应,例如可以让语 音模块来播放相应的声音或者是做出相应的动 作,以此来对机器人语音识别功能进行有效的 体现,离线语音识别系统的框架如图2所示。3 云在线语音识别云在线语音识别一般情况下都是利用百度识别系统、百度云语音合成还有云聊天机器人三个主要的系统共同所组成。在机器人和人之前进行语音交互的过程中,机器人首先会利用麦克风对语音交互相关信息进行采集,然后利用PyAudio 对其进行组件操作,同时也就提 供了Python 语言,最后在利用Python 程序对其进行视频和音频的播放,并利用互联网将这些识别之后的文件传输到百度语音服务器上。百度云语音服务器在对这些文件进行有效的识别之后,就可以将其转换成相应的文本形式,然后再次利用互联网将其发送到智能机器人的相关模块。这种百度云语音识别系统在使用过程中具有以下的特点:整个平添都采用的RESTAPI ,而且为开发者提供了语音模型和顶级声学模型,这种模型可以适用于任何一个平台对语音的识别和控制,就我国目前的情况来看已经达到了35个左右的理解和定制,更好地满足用户的实际需求。文本别有效的识别之后,就可以利用互联网将其发送到云在线聊天机器人,智能机器 人就可以充分结合其前后语境对文本的内容进行很好地识别,然后在整个数据库当中找到与 之最为相匹配的资料。图灵机器人是现如今最为高端的一种机器人大脑,在全球都是一种非常领先的计算和认知平台,其对中文语句的意思理解几乎可以达到90%以上的准确率,不但可以实现对中文语义和自然语言的分析和理解,而且还可以实现智能深度问答服务。在接受到云在线聊天机器人的问题之后,就可以及时在百度云语音系统当中搜索到与之相适应的文本数据或者是语音数据,然后以语音的格式发送给智能机器人,智能机器人就可以对这些语音进行播放。总而言之,语音识别其实就是机器人利用自身的硬件或者是软件系统对所接受的信息进行有效的处理之后形成相应的语音或者是文件的一种高级技术,经过几十年的发展之后,证明其具有很大的潜在市场,在人机交互实现过程中体现出十分重要的意义,是网络时代最为方便的一种交流工具。本文主要对机器人交互语音交互系统进行了一定的分析和研究。参考文献[1]陈天雪.论我国智能语音机器人专利保护[D].广西师范大学,2016.作者简介赵邦宇(1983-),男,山东省济南市人。工程师,主要从事电子信息产品软硬件开发工作。作者单位浪潮软 件集团有限公司 山东省济南市 250101 图2图1

智能语音交互式自助服务系统

成果上报申请书 成果名称智能语音交互式自助服务系统 成果申报单位安徽省(自治区/直辖市)公司 成果承担部门 省公司信息系统部部门/ 分公司 /分公司 项目负责人姓名项目负责人联系电 话和Email 成果专业类别*业务支撑所属专业部门*业务支撑线条 成果研究类别*其他省内评审结果* 优秀 关键词索引(3~5个)语音识别 IVR 语音自助 应用投资221万元(指别的省引入应用大致需要的投资金额) 产品版权归属单位中国移动通信集团安徽有限公司 对企业现有标准规范的符合度:(按填写说明5) 中国移动业务支撑系统NG1-CRM、NG1-BOSS、宽带P-BOSS系列规范,并如下方面进行了增强: 一、实现了基于“自由说”呼叫导航语音识别技术的智能语音交互,提升用户体验,突破传统按键IVR的局限性。 二、针对移动客服业务应用,优化语音识别声学模型和语言模型,提升语音识别准确率。 三、首创的超大规模语音检索功能,扩展自助服务的业务范围。 四、设计了完善的语音识别系统的VUI(语音交互界面),保障智能客服系统服务鲁棒性。 五、设计了完善的语音识别语义解析系统。 如果该成果来源于研发项目,请填写研发项目的年度、名称和类型(类型包括:集团重点研发项目、集团联合研发项目、省公司重点研发项目、其他研发项目),可填写多个: 省公司重点研发项目 成果简介:简要描述成果目的和意义,解决的问题,取得的社会和经济效益。 目前10086的主要服务方式为按键式自助服务,随着业务高速发展,传统的按键式IVR日益表现出冗长、复杂、效率低下、用户体验差等局限性。本项目通过应用最新的交互式语音识别和语音合成技术,实现高效、便捷、自然的自助语音服务,有利于增强自助服务、提高工作效率、降低运营成本、提升用户体验。 项目意义:本项目改变了按键式IVR随着业务扩展带来的层级复杂,操作流程过长的问题,大幅提升用户体验,同时本项目可以使得自助服务更为便捷和高效,使更多的用户愿意选择自助语音服务,从而降低人工座席压力,可大幅节省客户中心人力成本。

相关文档