文档库 最新最全的文档下载
当前位置:文档库 › 多媒体音频视频处理大作业

多媒体音频视频处理大作业

多媒体音频视频处理大作业
多媒体音频视频处理大作业

实验三:音频处理技术

实验目的:学会使用“超级解霸”的音频播放器实现简单的音频处理。

学会使用“超级解霸”的音频格式转换功能,完成几个文件的转换工作

实验内容:一、用音频解霸将影碟中的伴音单独分离出来存为W A VE格式文件

二、实现声音片段的任意截取并保存为MP3格式

三、将W A VE格式文件转换为MP3格式、将MP3格式转换为W A VE格式

四、将CD碟中的歌曲转换成MP3格式

实验要求:完成一个声音片段的转换

实验步骤:

一、将影碟中的伴音单独分离出

打开“超级解霸”中的声音播放器“音频解霸”其界面如下:

通过下拉菜单:文件/打开一个(多个)文件可以进入“打开文件”窗口在这里找到要打开的影音文件。

点击“打开”按钮后返回播放界面,这时只要点击播放按钮就可以实现当前影音文件的声音播放。由于在VCD影碟上的歌曲和音乐都是采用MPEG格式压缩当我们要使用

WA VE格式的时候就要进行转换,能实现这种功能的软件很多,如果是要转换的文件不多的情况下用直接用“音频解霸”来转换还是很方便的。

操作过程是这样的先找到要转换的开始点然后点击“波形录音”按钮就可以进入到保存波形文件对话框,选择好保存路径、输入保存文件名,点击“保存”按钮就可以开始转换

保存。当声音播放到需要结束的位置时点击“停止”按钮就完成了文件转换工作。二、实现声音片段的任意截取并保存为MP3格式

点击播放模式转换钮将“音频解霸”播放模式转换为“循环/选择录取区域”模式,此时该按钮旁边的设定“开始点”、“结束点”、“压缩录音”按钮变

为有效。移动播放器在时间轴上的滑块分别设定开始点和结束点然后点击“压

缩录音”按钮,进入保存对话框输入保存的文件名,就可以按照设定将选取的区域转换为MP3格式的声音文件。

三将W AVE格式文件转换成MP3格式

将W A VE格式文件转换成MP3格式或者将MP3转换成W A VE格式的软件有很多,我们这里用“超级解霸”中的附带功能就可以很方便的实现。

实验步骤:

少量的文件转换时可以采用实验二中介绍的方法,但是如果要转换的文件很多再用这种方法就太慢了,我们可以使用“超级解霸”软件包内里的音频工具“MP3格式转换器“来实现,其界面如下:

首先根据我们的使用要求设定“默认输出”的文件类型,例如:MP3文件。

然后再左边窗口选择要转换的文件(可以是一整个目录),再点击“设置”按钮进入设置窗口设置相应参数。一般默认情况下“压缩层次”选“第三层”、“频率”选“44100Hz”、“位率”选“128”。如果你想要音质更好些可以选择更高的位率,但是当位率超过“224”之后音质在听觉上不会再有改善,结果只是输出的文件比较大而已。还有就是设置好保存路径,

这样设置就完成了。这时返回主界面点击“开始压缩”按钮,经过一段时间的等待计算机就把文件转换工作完成了。

如果是要将MP3格式文件转换为W A VE格式的话只要将设置更改一下就可以了。

四、将CD碟中的歌曲转换成MP3格式

1、将音乐CD抓成W A V

运行《MP3数字CD抓轨》,将CD光盘放入光驱,如果您拥有多个光驱,请注意在“光驱”栏中选择一下有CD的光驱。此时下一栏中将出现轨道的信息,部分按钮变为可用。如下图所示:选择一个轨道,还可以选择开始点(从起始位置选择);点击,即您将要保存文件的路径,并起一个文件名;点击“开始读取”,则抓轨程序开始工作,“读取进度”指示您当前的工作状态和进度。当您所需的部分已经抓取之后,点击“停止读取”,停止工作即可。

此时一段W A VE文件录制完成了。

2、将音乐CD直接抓成MP3

操作基本与操作1相同,增加了一个步骤:将右下角的“直接压缩成MP3”前的复选框的“√”选上。右边与MP3相关的栏目将变为可选。同时在“保存路径”中的文件扩展名变为MP3格式。如下图:

至于其中的“压缩方法”、“压缩比”一般使用默认即可,这也是一般MP3歌曲所采用的。如果对音质要求比较高可以适当选择较大数字的压缩比,一般大于13%就可以获得较好的音质就不需要再提高,否则只会增加文件的尺寸而对音质的改善没有太多实质的帮助。

实验四:视频处理技术

一、录制设置:

设置录像持续时间,从录像开始时录制的时间. 一般VCD碟的最长播放时间为74分钟,我们在设置框内设置时间为74分钟。有时所采集的时间少于74分钟的话,我们可以设置与实际的录象时间相同的参数来实现无人看管的采集。

设置自动录像时间,自动开始录制的时间(24小时制)。

设置vcd格式,已为录制vcd文件设置好了各种参数,但必须要有可用并能录音的声卡(能否录音可以用微软的录音机测试)

不用vcd格式时,可以调整其他参数.可以设置录制模式为只录视频,只录音频,或音频加视频。

可设置录像的压缩格式为mpeg或m-jpeg两种,m-jpeg只能录视频。

可设置视频尺寸为SIF(352X288)或QSIF(176X144) 。

二、高级设置:

设置音视频同步补偿。

如果视频与音频不同步,则可以设置该参数(单位:毫秒),使音频提前或滞后,以达到音频与视频同步。

音频周期(15秒)样值调整。

用户在使用 Media Player 播放录制文件时,若几分钟后发现音视频有的不同步,用户可以调整此样值以达到音视频同步之目的。

[例如:] 如果设为500, 意味着在15秒内减少500个取样值,相当于在半小时录制过程中减少 500 * (60/15) * 30 = 60000 样值下调(也就是减少了60000/44100 = 1.36秒)。若为负数将增加取样值。

设置快照文件格式,分为JPEG,BMP,MPG(MOTION-JPEG)。

设置快照文件尺寸为FULL(704X576)。

设置LOGO标志。

设置拉伸时长宽比保持为4:3。

设置帧间距,大小为1到63,增大时可以减小文件尺寸,但帧数减少。

若选择“录像时使用默认文件名”,则每次录像时都以同一个固定的文件名存到“MPEG文件路径”中。否则,每次录像前都提示您为录像取名。

如果录像时使用默认文件名设为 null 名后,系统录像后不会有文件生成.

三图象调整

颜色设置共有四个滑动条,分别用于设置明亮度,饱和度,对比度及色调。观察预览窗口图象的亮度、对比度、色彩等效果,调整到最佳状态即可。

点击缺省按钮会使以上的值恢复为缺省值。

四声音调整

调整输入音量的滑块使输入的音量大小合适

(3)录像采集

当所有的设置都完成之后就可以进行采集,点击录象按钮就可以在弹出的窗口输入保存的文件名然后将录像机提前几秒播放,当录象内容到了录制点时电击保存按钮开始记录。在录制过程中尽量不要运行其他程序。采集到结束位置时再点一次采集按钮就可以停下来。采集完成后如果不需要对录像内容进行编辑的话就可以直接调用光盘刻录软件制作影碟了,否则可以使用非线性编辑软件对录像进一步处理。值得注意的是这些档次比较低的采集卡在采集持续时间比较长之后容易出现声音与图象不同步的问题,解决的办法是:(1)修改采集设置里面的声音延迟参数;(2)把录像分成多个较小的片段来采集。

采集完成后就可以刻录光盘或者用视频编辑软件进一步编辑处理。

制作VCD影碟的软件有很多种,VideoPack 5在所有的这类软件里可以说是最好用的。

实验目的:掌握VideoPack 5 制作影碟的方法

实验内容:1、用VP5制作单一片段和多片段影碟

2、用VP5制作有选择菜单的多片段影碟

实验步骤:

VideoPack 5运行之后的主界面如下:

在准备好刻录VCD影碟的文件之后就可以进入刻录影碟的步骤。

一、建立项目

在启动画面上选择VCD、SVCD或DVD。

二、建立播放结构

首先在文件菜单中选View->Editor Toolbars->Display in CD Windows,显示编辑工

具栏。

添加菜单及播放项目。在VP5中不分菜单、容器和播放项目,由具体操作后的层次决定,

就象Windows的资源管理器。我们来做一个标准的VideoCD2.0 VCD,包含一个首播片段,

一个菜单和三个播放项。

结构如图:

放在最上面的是首播片段,放些工作室标志片段或欢迎片段。

第二层是菜单页。

下面三个同级的是播放项。

在VP5中所有的播放项延时默认都是0秒了,省去了在VP4中每个项目都要将它的延时播放重设成0。储存结构,方便以后调用。

三、放置播放内容,将你的图片、MPG或AVI逐一从文件选择窗口中拖入到项目内。为防止拖错位置请按图操作:

或者:

如果拖入的文件不符合格式,VP5将会用红色的“!”号标识该文件。

例如上图中的首播项中,有一个红色的“!”号,因为拖入的是AVI,需要编码,VP5不能判断是否符合格式。

四、做菜单页。

菜单、按钮编辑功能是VP5最诱人的功能之一,用它能轻易地在菜单上加入文字和定制各种风格的按钮,有了它你可以不用PHOTOSHOP软件,制作出精美和活动的菜单来。

左侧的项目设计窗口中选中你的菜单页,然后点击右面菜单、视频编辑窗口的Button editor(按钮编辑)弹出如下画面:

还有三个默认按钮(根据项目结构自动产生)。

(一)按钮移动到所需位置,调整大小。

(二)设定按钮边界和模式,如图:

1、按钮模式,点击按钮旁边的兰色三角形,会弹出菜单来,有五种模式可选:

(1)None (无)即不增加任何图形,生成菜单时不进行复合运算,适合已经用Photoshop 之类制作好的菜单。

(2)Darken (变暗)加入白色按钮号码,并使整个按钮变暗,需要复合运算。

(3)Lighten (变亮)加入黑色按钮号码,并使整个按钮变亮,需要复合运算。

(4)Preview (预览)编译菜单播放长度的相应项目片段到按钮位置,需要较长复合运算时间。

(5)Still frame (静止帧)在菜单按钮位置放置播放项目的第一帧。

如果要在按扭上输入文本,只要在空白的的地方拖拉鼠标在弹出的菜单里选择Text,在文本框里输入你需要的文字,并可选择字体、颜色和阴影,再拖到你的按钮上,调节文本框大小。

2、按钮风格

按钮风格一共有36种预设,存放在VideoPack\Images\MASK下,你可以将你喜欢的图

像加入此目录来调用。

(三)要调整菜单的播放时间了,只要点击项目属性窗口中的Slide show栏就会显示菜单播放的所有内容。根据内容要分3部分:

(1)静止图片;只要右键点击图标,弹出菜单选择Properties…,Settings

还可以在你的菜单上输入文字和设定图片的边界及方向,就是Text和Representation了。

2)静止图片+背景音乐(静止图片高清晰度VCD就是这一种);

只要拖入音乐到菜单项并双击音乐图标。

第一个是不管几张图片,播放的总时间等于音乐长度,单张图片播放时间=音乐长度/图片张数。

第二个是图片播放完立刻停止音乐播放(如果音乐短的话,后面的图片当然就没有音乐了),音乐播放时间=单张图片播放时间X图片张数。

第三个是不管图片是否播放完,都播放音乐,直到音乐放完(音乐长度大于图片播放总时间时,始终显示最后一张图片,直到音乐放完)。

(3)如果菜单页是AVI或MPG的话,就是将它放完啦。

在这里选择的是第1个(音乐、图片同时放完)。

五、绘制连线:

建议用Routing自动连线,只要点一下Routing按钮就可以了,当然你也可以手工连线出特殊的播放顺序来,但是容易出错。

数字音频作业及其答案精品资料

数字音频作业及其答 案

第一次作业: 1:、声音可分为两种:纯音和复合音,平常人们说话的声音属于哪一种?语音的频率范围是多少?音频通常包括哪几种声音信号?其频率范围是多少? 2、请说明音频信号数字化的三个步骤? 3、如何理解“量化是信号数字化过程中重要的一步,而这一过程又是引入噪声的主要根源”这句话的含义?通过哪些途径可以减小量化误差? 4对双极性信号若采用均匀量化,则量化信噪比SNR与量化比特数之间的关系为:SNR=6.02xN+1.76dB,试分析此式对实际量化与编码的指导意义? 5:、A/D、D/A转换器的技术指标有哪些? 答:1:人们说话的声音为复合音,语言的频率范围为300HZ-3000HZ。音频暴多语音、音乐、效果声等声音信号,频率范围为20HZ-20KHZ。 2:1取样:对连续信号按一定的时间间隔取样。奈奎斯特取样定理认为,只要取样频率大于等于信号中所包含的最高频率的两倍,则可以根据其取样完全恢复出原始信号,这相当于当信号是最高频率时,每一周期至少要采取两个点。但这只是理论上的定理,在实际操作中,人们用混叠波形,从而使取得的信号更接近原始信号。2量化:取样的离散音频要转化为计算机能够表示的数据范围,这个过程称为量化。量化的等级取决于量化精度,也就是用多少位二进制数来表示一个音频数据。一般有8位,12位或16位。量化精度越高,声音的保真度越高。以8位的举例稍微说明一下其中的原理。若一台计算机能够接收八位二进制数据,则相当于能够接受256个十进制的数,即有256个电平数,用这些数来代表模拟信号的电平,可以有256种,但是实际上采样后的某一时刻信号的电平不一定和256个电平某一个相等,此时只能用最接近的数字代码表

多媒体技术期末考试试卷(附答案)

XX学校 XXXX-XXXX学年XX学期《多媒体技术》期末试卷班级:姓名: 一、选择题:(每小题1分,共25分) 1.多媒体计算机系统的两大组成部分是( D )。 A.CD- ROM驱动器和声卡 B.多媒体器件和多媒体主机 C.多媒体输入设备和多媒体输出设备 D.多媒体计算机硬件系统和多媒体计算机软件系统 2.多媒体技术的主要特性有( B )。 (1)多样性(2)集成性(3)交互性(4)可扩充性 A.(1) B.(2)(3) C.(1)(2)(3) D. 全部 3.( A )文件是Windows所使用的标准数字音频文件。。 A. WAV B. VOC C. MIDI D. PCM 4.视频卡的种类很多,主要包括( D )。 (1)视频捕获卡(2)电影卡(3)电视卡(4)视频转换卡 A.(1) B.(1)(2) C.(1)(2)(3) D. 全部 5.下列采集的波形声音质量最好的是( D )。 A. 单声道、8位量化、22.05kHz B. 双声道、8位量化、44.1kHz C. 单声道、16位量化、22.05kHz D. 双声道、16位量化、44.1kHz 6.王老师想配制一台多媒体计算机,并且想在他的课件中添加录音,那么在他的电脑中应该安装什么软件才可以进行录音,并且可以对声音进行编辑处理( C )。 A. Photoshop B. Word C. GoldWave D. PowerPoint 7.以下,( B )是合法的FLASH表达式。 A.(1+2)×4 B.A*b-2.1+100 C.[(3+5)+2]/c D. 3(x+y) 8.Illustrator cs3提供了( B )混合。 A. 平滑和对等 B. 平滑和扭曲 C. 对等和扭曲 D. 变形和平滑 9.Illustrator中,运用以下( D )方法不能切割图形。A. 执行“切割”菜单命令 B. 在工具箱中使用剪刀工具 C. 在工具箱中使用小刀工具 D. 使用工具箱中套索工具 10.遮罩动画主要是利用( B )图层来实现。 A. 引导 B. 遮罩 C. 普通 D. 静态11.FLASH动画制作中,要将一只青蛙变成王子,需要采用的制作方法是( B )。 A.设置运动动画 B. 设置变形动画 C. 逐帧动画 D. 增加图层 12.Flash软件必须通过ActionScript才能制作出( A )。 A. 交互动画 B. 位移变形动画 C. 位移动画 D. 变形动画 13.按( C )键可增加一个关键帧。 A. F4 B. F5 C. F6 D. F7 14.安装软件时通常需要设置安装类型,一般选择( B )安装。 A. 协议 B. 典型 C. 自定义 D. 压缩 15.要想提高流媒体文件播放的质量,最有效的措施是(A)。 A. 采用宽带网 B. 自行转换文件格式 C. 用超级解霸 D. 更换播放器16.媒体所承载的是( B )。 A. 声音 B. 信息 C. 图像 D. 文字 17.在各种图像文件中,图像压缩比高,适用于处理大量图像的场合是( B )。 A. BMP文件 B. JPG文件 C. TIF文件 D. PCX文件 18.下列文件格式中,( B )不是视频文件格式。 A. avi B. rab C. mpeg D. mov 19.印刷采用的色彩模式是( B )。 A. RGB B. CMYK C. Bitmap D. Lab 20.下述声音媒体中,质量最好的是( A )。 A. 数字激光唱盘 B. 调频无线电广播 C. 调幅无线电广播 D. 电话 21.通常我们所说的声音的音调高低,实际上是指( A )。 A. 声音信号变化频率的快慢 B. 声音的振幅大小 C. 泛音的多少 D. 声音的响亮程度 22.( C )泛指数字音乐的国际标准。 A. WAV B. VOC C. MIDI D. MOD 23.以下,哪种图形是用一组指令或参数来描述其中的各个成分的( A )。A. 矢量图形 B. 位图图形 C. JPEG图形 D. PNG图形24.Illustrator中,绘制直线时,按以下(D )键可以绘制水平、垂直或45o的角。

数字音视频处理

实验报告 课程名称数字音视频原理 实验题目MATLAB音频文件处理 专业电子信息工程 班级3班 学号09080323 学生姓名王志愿 实验成绩 指导教师吴娱 2012年3月 一、实验目的 1、掌握录制语音信号的基本过程; 2、掌握MATLAB编程对语音信号进行简单处理的方法并分析结果。 二、实验要求

上机完成实验题目,独立完成实验报告。 三、实验内容 1、问题的提出:数字语音是信号的一种,我们处理数字语音信号,也就是对一种信号的处理,那信号是什么呢? 信号是传递信息的函数。离散时间信号(序列)——可以用图形来表示。 按信号特点的不同,信号可表示成一个或几个独立变量的函数。例如,图像信号就是空间位置(二元变量)的亮度函数。一维变量可以是时间,也可以是其他参量,习惯上将其看成时间。信号有以下几种: (1)连续时间信号:在连续时间范围内定义的信号,但信号的幅值可以是连续数值,也可以是离散数值。当幅值为连续这一特点情况下又常称为模拟信号。实际上连续时间信号与模拟信号常常通用,用以说明同一信号。 (2)离散时间信号:时间为离散变量的信号,即独立变量时间被量化了。而幅度仍是连续变化的。 (3)数字信号:时间离散而幅度量化的信号。 语音信号是基于时间轴上的一维数字信号,在这里主要是对语音信号进行频域上的分析。在信号分析中,频域往往包含了更多的信息。对于频域来说,大概有8种波形可以让我们分析:矩形方波,锯齿波,梯形波,临界阻尼指数脉冲波形,三角波,余弦波,余弦平方波,高斯波。对于各种波形,我们都可以用一种方法来分析,就是傅立叶变换:将时域的波形转化到频域来分析。 2、设计方案: 首先要对声音信号进行采集,Windows自带的录音机程序可驱动声卡来采集语音信号,并能保存成.WAV格式文件,供MATLAB相关函数直接读取、写入或播放。 利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波。对于波形图与频谱图(包括滤波前后的对比图)都可以用MATLAB画出。我们还可以通过sound/wavplay命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 3、主体部分: (1)语音的录入与打开: [x,fs,bits]=wavread('d:\1.wav');%用于读取语音,采样值放在向量x中,fs 表示采样频率(Hz),bits表示量化位数。

多媒体音频视频处理大作业范文

实验三:音频处理技术 实验目的:学会使用“超级解霸”的音频播放器实现简单的音频处理。 学会使用“超级解霸”的音频格式转换功能,完成几个文件的转换工作 实验内容:一、用音频解霸将影碟中的伴音单独分离出来存为W A VE格式文件 二、实现声音片段的任意截取并保存为MP3格式 三、将W A VE格式文件转换为MP3格式、将MP3格式转换为W A VE格式 四、将CD碟中的歌曲转换成MP3格式 实验要求:完成一个声音片段的转换 实验步骤: 一、将影碟中的伴音单独分离出 打开“超级解霸”中的声音播放器“音频解霸”其界面如下: 通过下拉菜单:文件/打开一个(多个)文件可以进入“打开文件”窗口在这里找到要打开的影音文件。

点击“打开”按钮后返回播放界面,这时只要点击播放按钮就可以实现当前影音文件的声音播放。由于在VCD影碟上的歌曲和音乐都是采用MPEG格式压缩当我们要使用 WA VE格式的时候就要进行转换,能实现这种功能的软件很多,如果是要转换的文件不多的情况下用直接用“音频解霸”来转换还是很方便的。 操作过程是这样的先找到要转换的开始点然后点击“波形录音”按钮就可以进入到保存波形文件对话框,选择好保存路径、输入保存文件名,点击“保存”按钮就可以开始转换 保存。当声音播放到需要结束的位置时点击“停止”按钮就完成了文件转换工作。二、实现声音片段的任意截取并保存为MP3格式 点击播放模式转换钮将“音频解霸”播放模式转换为“循环/选择录取区域”模式,此时该按钮旁边的设定“开始点”、“结束点”、“压缩录音”按钮变 为有效。移动播放器在时间轴上的滑块分别设定开始点和结束点然后点击“压 缩录音”按钮,进入保存对话框输入保存的文件名,就可以按照设定将选取的区域转换为MP3格式的声音文件。 三将W AVE格式文件转换成MP3格式 将W A VE格式文件转换成MP3格式或者将MP3转换成W A VE格式的软件有很多,我们这里用“超级解霸”中的附带功能就可以很方便的实现。 实验步骤: 少量的文件转换时可以采用实验二中介绍的方法,但是如果要转换的文件很多再用这种方法就太慢了,我们可以使用“超级解霸”软件包内里的音频工具“MP3格式转换器“来实现,其界面如下:

华工2017-多媒体技术大作业

华南理工大学多媒体技术大作业报告 专业:计算机科学与技术班级: 学号: 学生姓名: 完成时间:2017年10月30号

目录 说明 (3) 第一章概述 (4) 第二章技术介绍 (5) 第三章音频处理 (11) 第四章图像合成 (14) 第五章动画制作 (21) 第六章设计与制作的总结 (21)

说明 一、内容要求 1.用GoldWave软件处理音频 素材准备:音频素材(MP3、WAV、MIDI,至少准备两种格式的文件,每种格式准备2个以上文件) 操作要求: 1)文件拆分与合并 打开一个音频文件,将该音频文件拆分成两个文件分别存盘;打开两个音频文件,将两个音频文件合成一个音频文件。 2)文件格式转换 打开多个同种格式文件,将其批量转换成另一种格式文件存盘。3)音频内容编辑 录制你的声音、声音内容是你的专业、姓名和学号。 4)音频效果编辑 淡入淡出效果、频率均衡控制、回声效果、改变音高、倒序声音2.用Photoshop软件,运用“快速蒙板”抠图实现图像合成 素材准备:准备风景图一张,你的相片一张 操作要求:把风景图和你的相片合成一个图像。 3.用Flash软件,设计由变化数字组成的“倒计时”逐帧动画 操作要求:场景中数字从9依次变化到0,实现倒计时效果。 二、大作业报告 完成以上3项内容,书写大作业报告,按大作业报告格式书写。 大作业以提交的大作业报告(学生名字命名的WORD文件)作为期末成绩评分依据。 必须在规定时间内按要求完成。请在12月8日前提交大作业。 大作业务必独立完成,一经发现雷同作“0”分处理。

第一章概述 概述课程学习情况 通过学习这门课程,我学到了一些以前不曾学到的知识,认识到自己的不足之处,对此有一些深刻的体会。 在本学期中,我们学习了Photoshop、flash、goldwave这些软件的知识。了解了一些以前不曾接触到的知识Photoshop和其它计算机图形图像处理程序一样,通过操作工具,在菜单、调板和对话框中做出各种选择来使用。在对图片进行修改以前,必须告诉PS要修改图中的哪些部分,可以选择一个图层或它的一个蒙版,或在一个图层内确定选区。如果不做选择,PS就会假定不限制修改,将把修改应用到正在工作的图层或蒙版的所有地方。它具有一定的灵活性这一点是值得肯定的。 多数人对于Photoshop的了解仅限于“一个很好的图像编辑软件”,并不知道它的诸多应用方面,实际上,Photoshop的应用领域很广泛的,在图像、图形、文字、视频、出版各方面都有涉及。大致上有:平面设计、修复照片、广告摄影、影像创意、艺术文字、网页制作、建筑效果图后期修饰、绘画、绘制或处理三维帖图、婚纱照片设计、视觉创意、图标制作、界面设计这13大领域的运用设计,但是还有其他有待开发的功能及用途。 通过这门课程的学习,让我了解到在如今科技高速发展的时代,多媒体技术学习应用对于新闻行业已经越来越显得愈发重要。我们应该积极学习这方面的知识,学以致用成为一个全面发展的人才。

数字信号处理作业DOC

成绩: 《数字信号处理》作业与上机实验 (第三四章) 班级: 13-电信 学号: 姓名: 任课老师:李宏民 完成时间: 15.11.08 信息与通信工程学院 2015—2016学年第1学期

第3-4章 离散傅里叶变换及快速算法与应用 一、实验内容及要求: 1、对信号在x(n)={1,2,3,4,5,6,7,8},n=0,1,2....7,求其N=8点的DFT 。要求采用基于时间抽取算法编写FFT 实现程序,画出DFT 幅度谱与相位谱,并将计算结果与用MATLAB 自带的FFT 函数计算结果进行比较。 2、一个由40Hz 和100 Hz 正弦信号构成的信号,受零均值随机噪声的干扰(噪声服从标准正态分布,由randn 函数产生,n(t)= randn(m,n) 返回一个m*n 的随机矩阵),即()sin(2100)sin(240)()s t t t n t ππ=++g g 。数据 采样率为500Hz ,试用FFT 函数来分析其信号频率成分。 ① 求其幅度频谱,从频谱图(横坐标以HZ 为单位,用plot 函数画图)中能否观察出信号的2个频率分量? ② 提高采样点数,再求该信号的幅度频谱图,此时幅度频谱发生了什么变化?信号的2个模拟频率和数字频率各为多少?FFT 频谱分析结果与理论上是否一致? 3、研究高密度频谱与高分辨率频谱。频率分辨率是指所用的算法能将信号中两个靠得很近的谱峰分开的能力。信号末尾补零由于没有对原信号增加任何新的信息,因此不能提高频率分辨率,但可以减小栅栏效应,所得到的频谱称为高密度频谱。在维持采样频率不变的情况下,为提高分辨率只能增加采样点数N ,此时所得到的频谱称为高分辨率频谱。设有连续信号 ) 1092cos()1072cos()105.62cos()(333t t t t x a ??π+??π+??π=

多媒体技术大作业

多媒体技术 姓名:xxx 学号: xxx 专业: xxx 科目:多媒体通信 日期:2013年12月21日

目录 作业一:图片处理 (1) 1、要求与目的 (1) 2、工作环境 (1) 3、步骤 (1) 4、小结 (8) 作业二:声音处理 (9) 1、要求与目的 (9) 2、工作环境 (9) 3、实验步骤 (9) 4、小结 (12) 作业三:视频处理 (12) 1、要求与目的 (12) 2、工作环境 (12) 3、步骤 (12) 4、小结 (15)

作业一:图片处理 1、要求与目的 (1)掌握Photoshop的基本使用,了解Photoshop操作的一般流程,能够利用Photoshop工作制作进行简单的图像制作与处理。 (2)掌握Photoshop的色彩调整,了解Photoshop图层的应用,掌握图层的基本操作,准确学会抠图、以及色彩的调整。 2、工作环境 使用的软件是photoshop cs4。Adobe Photoshop CS4 是Adobe公司旗下最为出名的图像处理软件之一,它是一款很强大的制图工具,具有集图像扫描、编辑修改、图像制作、广告创意,图像输入与输出于一体的图形图像处理软件,深受广大平面设计人员和电脑美术爱好者的喜爱。 3、步骤 (1)先扣出一张咖啡杯的图,我找了一张色彩为黑白的图片。 图1-1 (2)因为这张图片比较色彩单一,所以很好抠图,方法如图1-2,在菜单栏的“选择”中选择“色彩范围”设置参数如下:

图1-2 (3)然后在原来的杯子图像上拖动一下就出现了一个新的咖啡杯!复制粘贴就会多出来一个图层,这个图层很有用。先保存一下。 图1-3 (4)新建一个文件,设置前景色为黑色,填充背景,效果如图1-4所示。 图1-4

多媒体技术-多媒体技术大作业报告

华南理工大学多媒体技术大作业报告 专业:多媒体技术 班级: 2015秋 学号: 20 学生姓名:鲁斌 完成时间: 2016-11-19

目录 说明 (3) 第一章概述 (4) 第二章技术介绍 (5) 第三章音频处理 (7) 第四章图像合成 (12) 第五章制作电影 (15) 第六章动画制作 (18) 第七章设计与制作的总结 (20)

说明 一、内容要求 1.用GoldWave软件处理音频 素材准备:音频素材(MP3、WAV、MIDI,至少准备两种格式的文件,每种格式准备2个以上文件) 操作要求: 1)文件拆分与合并 打开一个音频文件,将该音频文件拆分成两个文件分别存盘;打开两个音频文件,将两个音频文件合成一个音频文件。 2)文件格式转换 打开多个同种格式文件,将其批量转换成另一种格式文件存盘。 3)音频内容编辑 选择音频段、音频段静音、音频段删除、插入空白区域、撤消误操作、声音段内容移动位置。 4)音频效果编辑 淡入淡出效果、频率均衡控制、回声效果、改变音高、倒序声音 2.用Photoshop软件,运用“快速蒙板”抠图实现图像合成 操作要求:运用快速蒙版分别抠出图形,如荷花、花瓶,然后将抠出的图片与一个新建的背景图层合成,得到最终合成图像。 3.用Movie Maker软件,由多个独立的视频剪辑文件、音频文件合 成制作为电影 操作要求:将独立的视频文件和音频文件结合在一起,生成一个统一的电影文件。 4.用Flash软件,设计由变化数字组成的“倒计时”逐帧动画 操作要求:场景中数字从9依次变化到0,实现倒计时效果。 二、大作业报告 完成以上4项内容,书写大作业报告,按大作业报告格式书写。 ?大作业以提交的大作业报告(学生名字命名的WORD文件)作为期末成绩评分依据。 必须在规定时间内按要求完成。请在12月15日前提交大作业。 大作业务必独立完成,一经发现雷同作“0”分处理。

数字语音信号处理实验报告

语音信号处理实验报告 专业班级电子信息1203 学生姓名钟英爽 指导教师覃爱娜 完成日期2015年4月28日 电子信息工程系 信息科学与工程学院

实验一语音波形文件的分析和读取 一、实验学时:2 学时 二、实验的任务、性质与目的: 本实验是选修《语音信号处理》课的电子信息类专业学生的基础实验。通过实验 (1)掌握语音信号的基本特性理论:随机性,时变特性,短时平稳性,相关性等; (2)掌握语音信号的录入方式和*.WAV音波文件的存储结构; (3)使学生初步掌握语音信号处理的一般实验方法。 三、实验原理和步骤: WAV 文件格式简介 WAV 文件是多媒体中使用了声波文件的格式之一,它是以RIFF格式为标准。每个WAV 文件的头四个字节就是“RIFF”。WAV 文件由文件头和数据体两大部分组成,其中文件头又分为RIFF/WAV 文件标识段和声音数据格式说明段两部分。常见的WAV 声音文件有两种,分别对应于单声道(11.025KHz 采样率、8Bit 的采样值)和双声道(44.1KHz 采样率、16Bit 的采样值)。采样率是指声音信号在“模拟→数字”转换过程中,单位时间内采样的次数;采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为8 位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16 位的整数(int),高八位和低八位分别代表左右两个声道。WAV 文件数据块包含以脉冲编码调制(PCM)格式表示的样本。在单声道WAV 文件中,道0 代表左声道,声道1 代表右声道;在多声道WAV 文件中,样本是交替出现的。WAV 文件的格式 表1 wav文件格式说明表

多媒体技术期末考试试卷

-、单项选择题(每小题1分,共40分) 1. 多媒体计算机系统的两大组成部分是__D___。 A 多媒体器件和多媒体主机 B 音箱和声卡 C 多媒体输入设备和多媒体输出设备 D 多媒体计算机硬件系统和多媒体计算机软件系统 2. __B____类型的图像文件是没有经过压缩的,所占存储量极大。 A JPG B BMP C GIF D TIF 3.以下__A_____文件是视频影像文件。 A MPG B MP3 C MI D D GIF 4. CD-ROM__D___。 A 仅能存储文字 B仅能存储图像 C仅能存储声音 D能存储文字、声音和图像 5. 多媒体数据具有___D__特点。 A 数据量大和数据类型少 B 数据类型间区别大和数据类型少 C 数据量大、数据类型多、数据类型间区别小、输入和输出不复杂。

D 数据量大、数据类型多、数据类型间区别大、输入和输出复杂。 6. 多媒体信息不包括_C____。 A 音频、视频 B 动画、图像 C 声卡、光盘 D 文字、图像 7. 下列叙述中,错误是__B___。 A 媒体是指信息表示和传播的载体,它向人们传递各种信息 B 多媒体计算机系统就是有声卡的计算机系统 C 多媒体技术是指用计算机技术把多媒体综合一体化,并进行加工处理的技术 D 多媒体技术要求各种媒体都必须数字化 8. 下列各组应用不是多媒体技术应用的是__B___。 A 计算机辅助教学 B 电子邮件 C 远程医疗 D 视频会议 9. 计算机存储信息的文件格式有多种,.gif格式的文件是用于存储__B___信息的。 A 文本 B 图片 C 声音 D 视频 10. Photoshop是一种__B___。

语音信号处理答案

二、问答题(每题分,共分) 、语音信号处理主要研究哪几方面的内容? 语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科,语音信号处理的理论和研究包括紧密结合的两个方面:一方面,从语言的产生和感知来对其进行研究,这一研究与语言、语言学、认知科学、心理、生理等学科密不可分;另一方面,是将语音作为一 种信号来进行处理,包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法 和技术。 、语音识别的研究目标和计算机自动语音识别的任务是什么? 语音识别技术,也被称为自动语音识别,(),其目标是将人类的语音中的词汇内容转换为 计算机可读的输入,例如按键、二进制编码或者字符序列。 计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本 或命令的高技术。 、语音合成模型关键技术有哪些? 语音合成是实现人机语音通信,建立一个有听和讲能力的口语系统所需的两项关键技术,该系统主要由三部分组成:文本分析模块、韵律生成模块和声学模块。.如何取样以精确地抽取人类发信的主要特征,.寻求什么样的网络特征以综合声道的频率响应,.输出合成声音的质量如何保证。 、语音压缩技术有哪些国际标准? 二、名词解释(每题分,共分) 端点检测:就从包含语音的一段信号中,准确的确定语音的起始点和终止点,区分语音信号和非语音信号。 共振峰:当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。 语谱图:是一种三维频谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定的频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。 码本设计:就是从大量信号样本中训练出好的码本,从实际效果出发寻找好的失真测度定义 公示,用最少的搜素和计算失真的运算量。 语音增强:语音质量的改善和提高,目的去掉语音信号中的噪声和干扰,改善它的质量 三、简答题(每题分,共分) 、简述如何利用听觉掩蔽效应。 一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。人耳的掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声 音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值,或者 说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明,—绝对闻阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对闻阈值要大得多。在范围内闻阈随频率变化最不显著,即在这个范围内语言可储度最高。在掩蔽情况下,提高被掩蔽弱音的强度, 使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限),被掩蔽弱音必须提高的分贝值称为 掩蔽量(或称阈移)。 、简述时间窗长与频率分辨率的关系。 采样周期、窗口长度和频率分辨率△之间存在下列关系:△(*) 可见,采样周期一定时,△随窗口宽度的增加而减少,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。 、简述时域分析的技术(最少三项)及其在基因检测中的应用。()

网络多媒体技术大作业.doc

网络多媒体技术期末大作业 -----基于Adobe Audition3.0 的音频处理技术 200892201 0827 董光玉一.Adobe Audition的介绍 Cool Edit Pro是一个非常出色的数字音乐编辑器和MP3制作软件。不少人把Cool Edit形容为音频“绘画”程序。因其“业余软件的人性化”和“专业软件的功能”,不断的扩大着它的影响力,并最终引起了著名的媒体编辑软件企业Adobe的注意。 (CE被AU收购,总的来说Audition就是Cool Edit的后续更新版本。) Audition3.0的新功能介绍: 1.支持VSTi虚拟乐器!这意味着Audition由音频工作站变为音乐工作站 2.增强的频谱编辑器。可按照声像和声相在频谱编辑器里选中编辑区域,编辑区域周边 的声音平滑改变,处理后不会产生爆音 3.增强的多轨编辑:可编组编辑,做剪切和淡化 4.新效果:包括卷积混响、模拟延迟、母带处理系列工具、电子管建模压缩 5.iZotope授权的Radius时间伸缩工具,音质更好 6.新增吉他系列效果器 7.可快速缩放波形头部和尾部,方便做精细的淡化处理 8.增强的降噪工具和声相修复工具 9.更强的性能:对多核心CPU进行优化 10.波形编辑工具:拖拽波形到一起即可将他们混合,交叉部分可做自动交叉淡化 二、录音篇 1.首先打开录音软件Adobe Audition 3.0

出现如下界面,是不是感觉很华丽、是不是感觉有点不知所措~没关系我们继续往下看。 首先我们点选左上角的“文件”菜单,选择“新建会话”如图: 在这里是选择你作品的采样率,点确定。 采样率越高精度越高,细节表现也就越丰富,当然相对文件也就越大。 这里我们选择默认的也就是44100, 因为大多数网络下载的伴奏都是44100HZ的,当然也有少数精品是48000HZ(比如一些CD

《多媒体技术与应用》期末大作业

《多媒体技术与应用》期末大作业 作业要求: 本次作业是该课程的期末考核,必须在6.24-7.1期间提交,否则不核算总评成绩。本大作业成绩占总评成绩的60%,平时作业和考勤占40%。请同学们按要求完成1-4题作业,从而顺利获得本课程学分。 注:每题有A和B两个题目,只需选做1题,多做不加分,每题中必须贴上自己的标识。 第一题:教材经典例题模仿(30分) A题:“水中倒影”图像制作(P74); B题:“精致的围棋棋盘”制作(P91)。 第二题:课堂经典习题模仿(30分) A题:“地球苹果”图像制作(制作过程参考附录1); B题:“柜台首饰”制作(制作过程参考附录2)。 第三题:个人创意(30分) A题:以足球为主体,展开自己的想像,创作一幅作品,要求必须使用4个以上图层,采用路径、蒙版及滤镜技术,作品要充分展现自己的图像处理技术; B题:以宇宙为主体,展开自己丰富的联想,创作一幅作品,要求必须使用4个以上图层,采用路径、蒙版及滤镜技术,作品要充分展现自己的图像处理技术。 第四题:个人名片制作(10分) 名片中必须包含个人姓名、学号、班级等基本信息。 附录1: 使用PHOTOSHOP制作“地球苹果”图案步骤: 1、制作苹果: (1)单击“文件”选“打开”菜单命令。弹出“打开”对话框,导入一幅地球图片。 (2)使用“自由钢笔工具”在画布窗口的地球图像上画出一个类似于被人咬了一口的苹果路径,这时“路径”调板中将出现“工作路径”,单击“路径”调板

下面的“将路径作为选区载入”图标按钮,这时刚才“自由钢笔工具”所画的路径将变为选区。 (3)单击“选择”中“羽化”菜单命令,弹出“羽化选区”对话框,设定羽化半径为2像素,单击“好”按钮退出。 (4)单击“图层”中“新建”的“通过拷贝的图层”菜单命令,这时“图层”调板中将出现“图层1”图层。 (5)单击选中“图层”调板中的“背景”图层,使用工具箱中“自由钢笔工具”在画布窗口的地球位置上,画出一个类似于一片叶子的路径,这时“路径”调板中将出现“工作路径”,单击“路径”调板下的“将路径作为选区载入”图标按钮,这时刚才用“自由钢笔工具”所画的路径变成了选区。 (6)单击“选择”中“羽化”菜单命令,弹出“羽化选区”对话框,设定羽化半径为2像素,单击“好”按钮退出。 (7)单击“图层”中“新建”的“通过拷贝的图层”菜单命令,这时“图层”调板中将出现“图层2”图层。 (8)单击选中“图层”调板中的“背景”图层,再单击“编辑”中“填充…”菜单命令,弹出“填充”对话框,设定填充颜色为黑色,模式为正常,单击“好”按钮退出。 (9)单击选中“图层”调板中“图层1”图层,再单击“滤镜”中“渲染”的“光照效果”菜单命令,弹出“光照效果”对话框,将“光照类型”中的颜色设定为浅蓝色,光照类型为点光,强度35,聚焦69,光泽0,材料69,曝光度0,环境8,单击“好”按钮退出。 (10)单击选中“图层”调板中的“图层2”图层,再单击“滤镜”中“渲染”的“光照效果”菜单命令,弹出“光照效果”对话框,将“光照类型”中的颜色设定为浅绿色,光照类型为点光,强度35,聚焦69,光泽0,材料69,曝光度0,环境8,单击“好”按钮退出。 2、制作文字 (1)输入文字“APPLE”,将文字的颜色设定为红色,这时“图层”调板将出现“APPLE”图层,单击选中“图层”调板中的“APPLE”图层,再单击“图层”中

语音信号处理作业7

语音识别技术发展历程及趋势 学号: 201105021 姓名: 指导教师:

语音识别技术发展历程及趋势 摘要:本文回顾了语音识别技术的发展历史,描述了语音识别系统的基本原理,介绍了语音识别的几种基本方法,并对语音识别技术面临的问题和发展前景进行了讨论。 关键词:语音识别;特征提取;人机交互 引言 通过语音传递信息是人类最重要、最有效、最常用的和最方便的交换信息形式。语言是人类特有的功能,声音是人类常用的工具,是相互传递信息的最重要的手段。因此,语音信号是人们构成思想疏通和感情交流的最主要的途径,他具有最大的信息容量和最高的智力水平。 让计算机能听懂人类语言,是人类自计算机诞生以来梦寐以求的想法。随着计算机越来越向便携化方向发展,以及计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输入这样便于使用的、自然的、人性化的输入方式。语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。 1 语音识别技术概述 语音识别(Speech Recognition)主要指让机器听懂人说话,即在各种情况下,准确地识别出语音的内容,从而根据其信息,执行人的各种意图。。作为一门交叉学科,语音识别又是以语音为研究对象,是语音信号处理的一个重要研究方向, 是模式识别的一个分支,涉及到计算机、信号处理、生理学、语言学、神经心理学、人工智能等诸多领域,甚至还涉及到人的体态语言,其最终目标是实现人与机器进行自然语言通信。 随着计算机技术、模式识别和信号处理技术及声学技术等的发展,使得能满足各种需要的语音识别系统的实现成为可能。近二三十年来,语音识别在工业、军事、交通、医学、民用诸多方面,特别是在计算机、信息处理、通信与电子系统、自动控制等以语音识别技术开发出的产品应用领域非常广泛,如声控电话交

多媒体大作业报告

学号 多媒体技术大作业 2014 ~2015 学年第一学期 教学系: 专业班级: 指导教师: 学生姓名: 成绩: 2014 年10 月07 日

大作业任务书学生姓名专业班级题目: 宫崎骏眼中的美好世界

初始条件: 1、掌握多媒体技术的基本技能,包括图片处理、动画设计、程序开发、视频音频处理; 2、具有多媒体开发的能力。 要求完成的主要任务: 1.设计制作一个多媒体作品题目自拟,所用软件不限,最好结合两个和两个以上软件, 如:Photoshop、Flash、Premiere、会声会影及authorware等等; 题目范围:(1)电影剪辑(片头、字幕、背景音乐、片尾) (2)动画设计(动画片段、网络广告) (3)平面设计(海报、广告、创意作品) (4)多媒体应用程序开发(电子书、电子相册) 2.需明确多媒体的主题和风格,明确制作的目的; 3.根据确定的主题和风格,搜集相关的素材(背景音乐、风景图片、视频动画等。); 4.合理设计多媒体的表现形式,明确各部分的重点及内容; 5.设计与主题相匹配的素材链接方式及匹配文字、图像等; 6.按照要求完成设计报告。 时间安排: 要求在本学期第10周(11月07日~11月14日)完成。时间安排1周。课程设计提交应当提供源程序、应用程序和设计报告,尽可能的当面演示。

目录 一、设计效果图(主界面效果图) (5) 二、设计思路与步骤 (9) 1.设计思路(含设计策划、素材收集与准备,素材的预处理等部分) (9) 2.设计步骤(配合步骤的文字描述和关键截图) (11) 视频处理: (11) 图片按钮处理: (12) 音频处理: (14) 视频制作: (15) Authorware程序文件制作 (15) 三、心得及体会(不少于500字) (18)

大作业任务多媒体V2.0

2014-2015学年度第一学期大作业 课程名称:多媒体技术 任课教师: 作业题目:多媒体技术大作业 姓名: 学号: 专业:计算机科学与技术 教学中心: 联系电话: 评审日期__________成绩_________评审教师(签名)__________

华南理工大学网络教育学院 目录 说明 (2) 第一章概述 (3) 第二章技术介绍 (3) 第三章音频处理 (4) 第四章图像合成 (11) 第五章制作电影 (18) 第六章动画制作 (24) 第四章设计与制作的总结 (25) 教师评分 (26)

说明

1、内容要求 1.用GoldWave软件处理音频 素材准备:音频素材(MP3、WAV、MIDI,至少准备两种格式的文件,每种格式准备2个以上文件) 操作要求: 1)文件拆分与合并 打开一个音频文件,将该音频文件拆分成两个文件分别存盘;打开两个音频文件,将两个音频文件合成一个音频文件。 2)文件格式转换 打开多个同种格式文件,将其批量转换成另一种格式文件存盘。3)音频内容编辑 选择音频段、音频段静音、音频段删除、插入空白区域、撤消误操作、声音段内容移动位置。 4)音频效果编辑 淡入淡出效果、频率均衡控制、回声效果、改变音高、倒序声音2.用Photoshop软件,运用“快速蒙板”抠图实现图像合成 操作要求:运用快速蒙版如教材图3-31(a)与(b)(要求学生自己找类似图片)中分别抠出荷花、花瓶,然后将抠出的图片与一个新建的背景图层合成,得到最终合成图像,效果如教材图3-32所示。 3.用Movie Maker软件,由多个独立的视频剪辑文件、音频文件 合成制作为电影 操作要求:将独立的视频文件和音频文件结合在一起,生成一个统一的电影文件。参考教材例4-1,素材自己找。 4.用Flash软件,设计由变化数字组成的“倒计时”逐帧动画 操作要求:场景中数字从9依次变化到0,实现倒计时效果。 2、大作业报告 完成以上4项内容,书写大作业报告,按大作业报告格式书写。 大作业以提交的大作业报告(打印版)作为期末成绩评分依据。 必须在规定时间内按要求完成。请在12月1日前提交大作业。 第1章概述

基于Matlab的语音信号处理与分析

系(院)物理与电子工程学院专业电子信息工程题目语音信号的处理与分析 学生姓名 指导教师 班级 学号 完成日期:2013 年5 月 目录 1 绪论 (3) 1.1课题背景及意义 (3) 1.2国内外研究现状 (3) 1.3本课题的研究内容和方法 (4) 1.3.1 研究内容 (4) 1.3.2 开发环境 (4) 2 语音信号处理的总体方案 (4) 2.1 系统基本概述 (4) 2.2 系统基本要求与目的 (4) 2.3 系统框架及实现 (5) 2.3.1 语音信号的采样 (5) 2.3.2 语音信号的频谱分析 (5) 2.3.3 音乐信号的抽取 (5) 2.3.4 音乐信号的AM调制 (5) 2.3.5 AM调制音乐信号的同步解调 (5) 2.4系统设计流程图 (6) 3 语音信号处理基本知识 (6) 3.1语音的录入与打开 (6)

3.2采样位数和采样频率 (6) 3.3时域信号的FFT分析 (7) 3.4切比雪夫滤波器 (7) 3.5数字滤波器设计原理 (8) 4 语音信号实例处理设计 (8) 4.1语音信号的采集 (8) 4.3.1高频调制与低频调制 (10) 4.3.2切比雪夫滤波 (11) 4.3.3 FIR滤波 (11) 5 总结 (12) 参考文献 (13) 语音信号的处理与分析 【摘要】语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。 本设计针对现在大部分语音处理软件内容繁多、操作不便等问题,采用MATLAB7.0综合运用GUI界面设计、各种函数调用等来实现语音信号的变频、变幅、傅里叶变换及滤波,程序界面简练,操作简便,具有一定的实际应用意义。 最后,本文对语音信号处理的进一步发展方向提出了自己的看法。 【关键词】Matlab 语音信号傅里叶变换低通滤波器

多媒体技术期末考试试题及答案

试卷编号 06104—C 第 1 页 共 2 天津理工大学考试试卷 2006~ 2007学年度第一学期 《多媒体技术》 考试试卷 课程代码:1460095 试卷编号:06104-C 命题日期: 2006 年 11 月 15 日 答题时限: 90 分钟 考试形式:闭卷笔试 4分,共40分) 1. MPC : Multimedia Personal Computer 多媒体个人计算机 个人计算机加上多媒体接口和设备及相应软件,能综合处理图、文声、像的功能。 2.JPEG : JPEG (Joint Photographic Experts Group )是联合图像专家组的英文缩写。 是针对连续色调、多级灰度、静止图像的数字图像压缩编码方法。 。 3.MPEG :MPEG(Moving Picture Experts Group)是运动图像专家组的英文缩写。 是可用于数字存储介质上的视频及其关联音频的国际标准。 。. 4.PCM :差值脉冲编码调制法 (Differential Pulse Code Modulation) 预测编码方法 基本方法是根据某一数学模型,利用以往的样本值来对新的样本值进行预测,然后 将样本的实际值与该预测值相减,对得到的误差值来进行编码。 5.CMYK :这是一种基于印刷处理的颜色模式。 用三补色: C (Cyan )青、M (Magenta )紫红、 Y (Yellow )黄、 K (blacK )黑表示。 6.HSI :用H (Hue )色调、S (Saturation )饱和度、I (Itensity )亮度构成的彩色空间。 7.YUV 8.RGB 9.: Compact Disc Read Only Memroy 紧凑型只读光盘存储器 (P95) 10. 图像分辨率 :指数字化图象的大小,以水平的和垂直的像素数表示。 二. 问答题:(每题8分,共40分) ? 简要说明。 答:1). 感觉媒体:中间作用于人们的感觉器官,使人能直接产生感觉的一类媒体。 2). 表示媒体:为了加工、处理和传输感觉媒体而人为研究、构造出来的一种媒体。 3). 显示媒体:指人们为获取信息或再现信息的物理手段的类型, 分为输入和输出显示媒体。 4). 存储媒体:用于存放表示媒体,计算机随时处理和调用存放在存储媒体中的信息编码。 5). 传输媒体:将媒体从一处传送到另一处的物理载体的类型。 (P2) (每种1分,解释占3分) 2.什麽是图像的数字化? 图像的数字化的过程是怎样的?简要说明。 答:将亮度的变化是连续的模拟图象转化为由一系列离散数据所表示的数字图象的过程 称为图象的数字化。 (2分) 过程包括:抽样和量化。 (2分) 对连续变化的模拟图像函数f(x, y)的空间连续坐标(x, y)进行离散化处理的过程称为采样。 (2分) 采样后,把连续变化的图像函数f(x, y)的每个离散点(像素)的亮度(颜色)值用数字量 来表示的过程称为量化。 (2分) 3. 图象数据压缩编码的国际标准有哪些? 简要说明。 答:JPEG : JPEG (Joint Photographic Experts Group )是联合图像专家组的英文缩写。 是针对连续色调、多级灰度、静止图像的数字图像压缩编码方法。(3分) MPEG :MPEG(Moving Picture Experts Group)是运动图像专家组的英文缩写。 是可用于数字存储介质上的视频及其关联音频的国际标准。 (3分) H .261 在综合业务数字网上提供视频会议和可视电话的视频图像压缩国际标准。 又称为P ×64标准。 (2分) 专业 班级 姓名 学号 装 订 线 学号

相关文档
相关文档 最新文档