文档库 最新最全的文档下载
当前位置:文档库 › 【推荐】科大讯飞实习报告-word范文模板 (15页)

【推荐】科大讯飞实习报告-word范文模板 (15页)

本文部分内容来自网络整理,本司不为其真实性负责,如有异议或侵权请及时联系,本司将立即删除!

== 本文为word格式,下载后可方便编辑和修改! ==

科大讯飞实习报告

篇一:毕业实习报告

实习报告

关于在安徽科大讯飞科技信息科技股份有限公司单位从事语音资源整理数据标

注的实习报告

实习单位: 安徽科大讯飞信息科技股份有限公司实习时间:

实习岗位:语音资源整理数据标注学生姓名:苏晓文学号:1 0 4 2 1 5 2 1 3 1 院系:信息工程学院专业:信息管理与信息系

年月日

关于在安徽科大讯飞科技信息科技股份有限公司单位从事语音资源整理数据标

注的实习报告

一、实习单位及岗位简介

(一)实习单位的简介

安徽科大讯飞信息科技股份有限公司是一家专业从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成的国家级骨干软件企业。公司智能语音核心技术代表了世界的最高水平。201X年,科大讯飞在深圳

证券交易所挂牌上市,股票代码:002230。

科大讯飞成立于1999年,是我国产业化实体中,在语音技术领域中基础研究时间最长、资产规模最大、历届评测成绩最好、专业人才最多及市场占有率最高

的公司。

语音技术实现了人机语音交互,使人与机器之间沟通变得像人与人沟通一样简单。语音技术主要包括语音合成和语音识别两项关键技术。让机器说话,用的

是语音合成技术;让机器听懂人说话,用的是语音识别技术。此外,语音技术

还包括口语评测、语音编码、音色转换、语音消噪和增强等技术,有着广阔应

用空间。

科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期

的研究积累,并在语音合成、语音识别、口语评测、自然语言处理等多项技术

上拥有国际领先的成果。科大讯飞是我国唯一以语音技术为产业化方向的“国

家863计划成果产业化基地”、“国家规划布局内重点软件企业”、“国家高

技术产业化示范工程”,并被原信息产业部确定为中文语音交互技术标准工作

组组长单位,牵头制定中文语音技术标准。

201X年、201X年,科大讯飞两次荣获“国家科技进步奖”;201X年、201X年

两次获得中国信息产业自主创新最高荣誉“信息产业重大技术发明奖”。201X

年至201X年,已连续七届英文语音合成国际大赛(Blizzard Challenge)荣获

第一名。201X年至201X年,连续四年在国际说话人、语种识别评测大赛中名

列前茅。201X年,“国家智能语音高新技术产业化基地”、“语音及语言信息

处理国家工程实验室”相继落户合肥,有利于进一步汇聚产业资源,提升科大

讯飞产业龙头地位。

基于拥有自主知识产权的世界领先智能语音技术,科大讯飞已推出从大型电信

级应用到小型嵌入式应用,从电信、金融等行业到企业和消费者用户,从手机

到车载,从家电到玩具,能够满足不同应用环境的多种产品。科大讯飞已占有

中文语音技术市场70%以上市场份额,开发伙伴超过8000家,以讯飞为核心的

中文语音产业链已初具规模。

随着移动互联网“语时代”的到来,科大讯飞率先发布了全球首个提供移动互

联网智能语音交互能力的“讯飞语音云”平台,并持续升级优化。基于该平台,科大讯飞相继推出了“讯飞语音输入法”、“讯飞语点”等示范性应用,并与

广大合作伙伴携手推动各类语音应用深入到手机、汽车、家电、玩具等各个领域,引领和推动着移动互联网时代大潮下输入和交互模式的变革。

(二)实习岗位的简介

我所从事的是数据标注,这是一份看似简单却充满技术性的工作,该工作主要

针对公司的产品需求,按照资源的整理格式,通过网络及相关渠道进行大量的

文本资源的收集、分类和整理。整理的主要内容是对资源名称进行别称简称及

是否歧义的整理。根据规范对文本信息资源进行标注,内容资源数据的后期制

作及数据标注工作。

公司实行每周五天,每天八小时工作制。首先是三天的试用期,主要是适应工

作环境,了解工作内容,学习工作方法,熟悉公司的各个部门。三天后办理入

职手续领取工作证,签劳动合同。

在主管的安排下我被分到了语音资源部数据标注组,我拥有自己的格子间和办

公电脑,我们所做的工作都是为了讯飞语点服务的。首先我们的组长向我介绍

了我们的组员以及它们各自所分配的任务,并且告诉我工作期间的交流都是通

过飞信进行的,还有上班下班的时间,吃饭时间及打卡的时间,上下班的班车

路线等。然后他向我介绍了工作的内容,如何登陆讯飞内部网络,如何进入标注平台。接着他让我先学习标注规范和平台的使用说明了解我们的工作。每天早上要签到,下班前要及时撰写工作日报。最后他向我强调了公司的规章制度以及我入职之后所要从事的工作,包括线网内的数据抓取和修改,测试集的修改与汇总,数据的标注,语音的测试,语音识别,资源整理等。同时,在空余时间要协助其他组完成相应的任务,相互合作共同进步,定期和本组同事相互交流相互按时撰写日报和工作心得。

二、实习内容及过程

1、标注

标注规范包括手机语点标注规范,车载标注规范,商旅标注规范,电视标注规范等。

在做一项任务之前都要了解他的规范,标注规范是进行语点标注的准则,标注规范由协议框架协议组成,语义框架包括四部分内容:focus, action, object, content。我们判断一句话的内容找出他的兴趣点也就是所表达的意思来选择相关的协议,再看看根据兴趣点所发出的动作和对象来辨别是否符合标注规范的要求。过一段时间我们会根据实际的需求对标注规范进行,以适应当前的实际需求,在修改的过程中有些业务需要扩充,有些业务需要转移,甚至有时会增加一些新的兴趣点等等。

此规范主要是针对生活中的一些相似或者相同场景进行细化从而避免由于引擎跑错地方而导致语点不能更好地服务于用户,再者一些语句对于业务来说是错误的或者是一些闲聊的话语使得引擎无法识别从而不能满足用户的需求。

由于时代在发展,科技在进步我们的标注规范也在不断的更新,我们会每隔一段时间更新一次标注规范,是为了更好地服务于相关工作的进行。在对数据进

行标注之前,掌握标注细则是非常重要的,它关系到我们后期标注工作的正确性和可靠性,每天的工作中我都会先熟悉标注细则然后再进行标注,我们标注数据的准确性可能会对上面技术部门的工作造成一定的影响。

2、语音合成技术

语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。和语音识别相比,语音合成的技术相对说来要成熟一些,并已开始向产业化方向成功迈进,大规模应用指日可待。我们会每天接听大量的语音信息,把语音信息中不清楚的信息保留下来进行分析与修正。

3、语音识别技术

自动语音识别技术(Auto Speech Recognize,简称ASR)所要解决的问题是让计

算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。ASR

技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系

统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。我们与机器对话让机器辨别

我们所要求的内容并进行相应的操作。

4、语音评测技术

语音评测技术,又称计算机辅助语言学习(Computer Assisted Language Learning)技术,是一种通过机器自动对发音进行评分、检错并给出矫正指导的

技术。语音评测技术是智能语音处理领域的一项研究前沿,同时又因为能显著

提高受众对语言(口语)学习的兴趣、效率和效果而有着广阔的应用前景。

5、自然语言

自然语言是几千年来人们生活、工作、学习中必不可少的元素,而计算机是20

世纪最伟大的发明之一,如何利用计算机对人类掌握的自然语言进行处理、甚

至理解,使计算机具备人类的听说读写能力,一直是国内外研究机构非常关注

篇二:暑假实践报告之科大讯飞培训

暑假实践报告

科大讯飞培训报告

今年的这个暑假是大学三年最充实的一个暑假收获最多的一个暑假。

在上学期学期结束之前,报名参加了一个科大讯飞的一个培训照片,很幸运的

通过了测试。这是一个软件编程培训,免费的,但也要付出一定代价的:培训

期间考核通过就要和科大讯飞公司签两年就业合同。这也相当于找到工作了,只是岗前培训的时间比较长而已。在参加这个招聘测试之前,我也到这家公司

做了一定的了解。科大讯飞是一家发展前景很好、专业语音信息从事智能及语音技术研究、软件及芯片产品开发、语音服务的国家级骨干软件企业,主要股

东包括:中科大资产经营有限公司、上海广信、联想投资、盈福泰克等。在语

言技术领域是基础研究时间最长、资产规模最大、历届评测成绩最好、专业人

才最多及市场占有率最高的公司,其智能语音核心技术代表了世界最高水平。

员工的工作待遇方面也是很不错的。工资水平也是在安徽中排在全省前列的,

五险一金比较齐全,福利方面也比较丰富。不仅这些,他还为员工提供了很多

深造的机会,让员工在工作中提升自己的各种能力。听上届的学长说,这个公

司是理想的就业目标。

综上以上信息,我就参加了这次招聘,也借此多学些专业知识,为以后的工作

打下基础。

相关文档
相关文档 最新文档