当前位置：文档库 › 第3章_音频处理技术

第3章_音频处理技术

一、选择题

1、下列选项不属于多媒体组成部分的是：（ C ）。

A、视频

B、声音

C、像素

D、文字

2、声波不能在( D )中传播。

A、水

B、空气

C、墙壁

D、中空

3、下列选项不属于声音的重要指标的是:( B )。

A、频率

B、音色

C、周期

D、振幅

4、下列选项表示波的高低幅度即声音的强弱的是：（ D ）。

A、频率

B、音色

C、周期

D、振幅

5、下列选项表示两个相邻的波之间的时间长度的是：（ C ）。

A、频率

B、音色

C、周期

D、振幅

6、下列选项表示每秒中振动的次数的是：（ A ）。

A、频率

B、音色

C、周期

D、振幅

7、自然界的声音是——信号，要使计算机能处理的音频信号必须将其——，

这种转换过程即声音的数字化。 (A/D)

A. 连续变化的模拟离散化

B. 离散变化的模拟连续化

C. 连续变化的数字离散化

D. 离散变化的数字连续化

8、对声音信号进行数字化处理，是对声音因信号——。 (D)

A. 先量化再采样

B. 仅采样

C. 仅量化

D. 先采样再量化

9、对声音信号进行数字化处理首先需要确定的两个问题是——。 (A)

A. 采样频率和量化精度

B. 压缩和解压缩

C. 录音与播放

D. 模拟与压缩

10、对声音信号进行数字化时，间隔时间相等的采样称为——采样。 (B)

A. 随机

B. 均匀

C. 选择

D. 模拟

11、对声音信号进行数字化时，用多少哥二进制位来存储表示数字化声音的

数据，称为——。 (D)

A. 采样

B.采样频率

C.量化

D.量化精度

12、对声音信号进行数字化时，每秒钟需要采集多少个声音样本，称为——。

（B）

A. 压缩

B. 采样频率

C. 解压缩

D. 量化精

13、乃奎斯特采样理论指出，采样频率不超过声音最高频率的（B）倍

A. 1

B. 2

C.3

D.4

14、满足奈奎斯特采样理论，则经过采样后的采样信号（A）

A.可以还原成原来的声音

B.不能还原成原来的声音

Ｃ.是有损压缩 D.模拟声音

15、从听觉角度看，声音不具有（C）要素

A.音调

B.响度

C.音长

D.音色

16、声音的高低叫做（），他与频率（B）

A.音调无关

B.音调成正比Ｃ.音调成反比Ｄ.响度无关

17、下列表示人耳对声音音质的感觉的是（C）

A.音调

B.响度

C.音色

D.音量

18、从电话，广播中分辨出是熟人的根据（A）的不同，它是由谐音的多寡，各

谐音的特性决定的

A.音色

B.响度

C.频率

D.音调

19.音色又称音品，它与_____C____有关。

A．响度 B.振幅 C.频率 D.音调

20.响度即声音的响亮程度，它与_____B__有关。

A．音色 B.振幅 C.频率 D.音调

21.人耳能够听到的声音信号是：_____C_______

A.次声波

B.超声波

C.音频

D.声波

22．人们把频率范围为20Hz~20KHz的声音信号称为____C_____信号。

A.次声波

B.超声波

C.音频

D.声波

23．人们把高于20KHz的声音信号称为___B___信号。

A.次声波

B.超声波

C.音频

D.声波

24．假设CD格式的某立体声音乐的采样频率是44.1KHz，量化位数为16bit，那么该音乐每分钟的数据量为：____C___

A.42.336Mbps

B.21.168Mbps

C.10.584Mbps

D.5.292Mbps

25.下面哪个不属于波形编码器：____D________

A.脉冲编码调制

B.自适应差分编码

C.自适应增量调制

D.线性预测编码

26．语音的压缩技术通常采用______B___技术。

A.霍夫曼编码

B.波形编码

C.行程编码

D.算术编码

27．MP3的压缩比____D__.

A . 2:1 B. 4：1 C. 6:1 D. 10:1

完成人：洪浩、陈世百、刘平、杜星

检查人：洪浩

二.填空题。

1、声音的三个重要指标是（频率）,(周期）和（振幅）。

2. 声音所具有的三个要素是指（音调）（音色）和（响度）。

3. 笛子和小提琴演奏相同的乐曲时，我们能够正确地分辨出不同的乐器是因为它们的（音色）不同。

4. 按照人们听觉的频率范围，声音可分为（次声波），（超声波）和（音频）三类，其中（次声波）指频率低于20Hz的信号，（超声波）指频率高于20KHz的信号，而（音频）指频率范围在20Hz～20KHz的声音信号。

5. 声音数字化分为两个步骤：（采样）和（量化）。

6..采样就是将声音信号在时间上进行离散化处理，即每隔相等的一段时间在声音信号波形曲线上采集一个信号样本（声音的幅度）。

7.量化就是把采样得到的声音信号幅度转换成相应的数字值，将每一个值归入预先编排的最近的量化级上，并赋予相同的量化值。如果复读的划分是等时间隔的，就称为线性量化。

8. 量化精度是指每个声音样本需要用多少位二进制数来表示，反映了度量声音波形幅度的精确度。它的值越高，数字化后的声音信号就越可能接近原始信号，但所需要的存储空间也越大。

9.数字化声音的技术指标包括量化精度、采样频率和声道数等参数。

10.采样频率指单位时间内采样次数。它的值越高，在一定的时间间隔内采集的样本数越多，音质越好，数字化声音的数据量越大。

11. 数字化声音的数据量是由（采样频率），量化精度，（声道数）和声音持续时间所决定的。

12. 音频压缩技术按照语音的压缩编码方法可分为三类：（波形编码），参数编码和（混合编码），其中（波形编码）是基于语音波形的编码方法，（参数编码）是基于参数的编码方法，（混合编码）是在其他两种的基础上获得的编码方法。目前的音频压缩方法中，只有（波形编码）能用于音乐信号的压缩

13. 声音压缩算法主要是利用（语音信号相关）和（人耳听觉特性）进行压缩的。

14. 语音信号中存在两种类型的相关性，即样点之间（短时）相关性和相邻基音周期之间存在的（长时）相关性。

15. 声卡的采样频率有11.025KHz ,22.05KHz和（44.1）KHz。

完成人：黄晓亮、欧传佳、展恒超

检查人：洪浩

第三章

1.声音的数字化概念，它包括那几个步骤，并简述每个步骤的过程。

答：概念：声音数字化就是将模拟的连续声音波形在时间上和幅值上进行离散化处理。分为两个步骤：采样和量化。

采样就是将声音信号在时间上进行离散化处理，即每隔相等的一段时间在声音信号波形曲线上采集一个信号样本（声音的幅度）。

量化就是把采样得到的声音信号幅度转换成相应的数字值。采样后的数值不一定能在计算机内部进行方便的表示，所以将每一个样本值归入预先编排的最近的量化级上，该过程称为量化。

如果幅度的划分是等间隔的，就称为线性量化，否则就称为非线性量化。

量化的过程如下：将采样后的信号按整个声波的幅值划分为若干个区段，把落入某区段的样值归为一类，并赋予相同的量化值。

采样就是将声音信号在时间上进行离散化处理，即每隔相等的一段时间在声音信号波形曲线上采集一个信号样本（声音的幅度）。

量化就是把采样得到的声音信号幅度转换成相应的数字值，将每一个值归入预先编排的最近的量化级上，并赋予相同的量化值。如果复读的划分是等时间隔的，就称为线性量化。

量化精度是指每个声音样本需要用多少位二进制数来表示，反映了度量声音波形幅度的精确度。它的值越高，数字化后的声音信号就越可能接近原始信号，但所需要的存储空间也越大。

数字化声音的技术指标包括量化精度、采样频率和声道数等参数。

采样频率指单位时间内采样次数。它的值越高，在一定的时间间隔内采集的样本数越多，音质越好，数字化声音的数据量越大。

2.怎样进行采样频率的选择？

答：数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始声音的，实现这个步骤使用的设备是模/数转换器（A/D）它以每秒上万次的速率对声波进行采样，每一次采样都记录下了原始模拟声波在某一时刻的状态，称之为样本。将一串的样本连接起来，就可以描述一段声波了，把每一秒钟所采样的数目称为采样频率或采率，单位为HZ（赫兹）。采样频率越高所能描述的声波频率就越高。

根据奈魁斯特（NYQUIST）采样定理，用两倍于一个正弦波的频繁率进行采样就能完全真实地还原该波形，因此一个数码录音波的休样频率直接关系到它的最高还原频率指标例如，用44.1KHZ的采样频率进行采样，则可还原最高为22.05KHZ的频率-----这个值略高于

人耳的听觉极限。

3.音频压缩技术按照语音的压缩编码方法的分类，简述每种方法的思想及特点。

答：（1）波形编码

编码前根据采样定理对模拟语音信号进行采样，然后进行幅度量化与二进制编码。

波形编码比较简单，具有适应能力强、话音质量好、抗噪、抗误码的能力强等特点，但所需的编码速率高。

（2）参数编码

根据声音的形成模型，把声音变换成参数的编码方式，直接针对音频PCM码流的采样值进行处理，通过静音检测、非线性量化、分差等手段对码进行压缩，根据声音的波形，取中间值，删除反差较大的值来实现对声音的压缩。

由于参数编码是保护语音模型，重建清晰可识别的语音，而不注重波形的拟合，所以这类编码技术实现的是合成语音质量下的低速或极低速的编码。

（3）混合编码

在波形编码和参数编码的基础上，以相对较低的比特率获得较高的语音质量，所以其数据率和音质介于波形编码和参数编码二者之间。

混合编码因为克服了波形编码和参数编码的弱点、结合了它们的有点，所以在4—16kbps速率上能够得到高质量的合成语音。在本质上具有波形编码的优点，有一定抗噪和抗误码的性能，但时延较大。

4.声音压缩算法主要是利用语音信号的相关性和人耳的听觉特性进行压缩的。

1）利用语音信号的相关性

语音信号的相关性是相邻采样点之差很小，其包含的信息量远小于采样值本身，差值编码比采样值编码所需的比特率下降。语音信号中有两种类型的相关性：样点之间的短时相关性和相邻基音周期之间存在的长时相关性，减弱这些相关性再编码即可实现语音压缩编码

2）利用了人耳的听觉特性

利用人耳的掩蔽效应也可以进行语音压缩编码，降低比特率。

完成人：扬长进、冯建、乔宝栋、姚迪

检查人：洪浩

DSP在数字音频处理技术中的应用

万方数据

DSP在数字音频处理技术中的应用作者：陈兴刚，金鑫作者单位：陈兴刚(贵州大学,电子科学与信息技术学院,贵州,贵阳,550025)，金鑫(云南大学软件学院,云南,昆明,650200) 刊名：黑龙江科技信息英文刊名：HEILONGJIANG SCIENCE AND TECHNOLOGY INFORMATION 年，卷(期)：2008，(31) 引用次数：0次参考文献(5条) 1.谢铿基于DSP的数字音频系统[学位论文] 2002 2.陆牧基于DSP的数字音效系统研究[学位论文] 2002 3.韩纪庆.冯涛.郑贵滨音频信息处理技术 2007 4.博创科技MP3播放器与U盘设计 2004 5.卢官明.宗昉数字音频原理及应用 2005 相似文献(9条) 1.会议论文陈佳.董金明StarCore SC140优化技术分析2006 软件优化是软件开发的重要部分.本文针对运行于StarCoreSC140平台的点对点数字音频系统,对该系统的软件部分的优化进行了分析,分别探讨了C语言优化和汇编语言优化的具体实现方法.通过优化,大大缩短了代码的运行周期,提高了运行效率,证明了优化方法的有效性. 2.学位论文曹承涛基于TMS320C5402 DSP的数字音频系统的研究2002 该论文首先简要介绍了TI公司的TMS320C54x系列DSP.之后,详细叙述了论文作者设计研制的一种基于DSP的数字音频系统.该系统以 TMS320C5402（DSP）为中央处理器,可完成MP3音频数字信号的分析和处理,并通过串行A/D/A芯片实现对外界模拟音频信号的采集和发送.该系统配有大容量FLASH和硬盘,用于程序和音频数据的存储,128K字节高速RAM作为数据缓冲区.同时,通过USB控制芯片完成系统与PC机之间的数据通信.系统中的大量控制信号由一片CPLD产生,该文也对CPLD的设计进行了描述.论文对ISO/IEC11172标准中的LayerⅢ音频算法和基本原理进行了介绍.在对关键解压算法技术,如霍夫曼解码,反量化的快速算法进行深入研究的基础上,提出基于DSP汇编语言的快速算法实现方案. 3.期刊论文王林章.李双田多路实时数字音频系统中的PCI通信-电声技术2003(6) 介绍一个多路实时数字音频系统的PCI通信,包括Windows管理体系,静态和动态设备内存映射方法,PCI配置寄存器的访问方法,以及PC机和DSP之间通信方法等必须的关键技术. 4.期刊论文白若冰.朱善安基于OMAP5912的数字音频系统-电子技术2005,32(9) OMAP5912处理器是由TI应用最为广泛的TMS320C55x DSP内核与低功耗、高性能的ARM926EJ-S微处理器组成的双核应用处理器.C55x系列可支持低功耗应用的实时多媒体处理,ARM926可满足控制和接口方面的处理需要.基于双核结构,OMAP5912采用开放式、易于开发的软件设施. 5.学位论文谢铿基于DSP的数字音频系统2002 该文首先综述了数字音频和数字信号处理器（DSP）的发展概况以及DSP技术在数字音频领域的应用情况.然后简单介绍了音频系统和组成，叙述了扬声器的频率响应特性及其对音质的影响，提出使用均衡器补偿扬声器频响特性的方法;动态范围压缩器、扩展器、限制器在音频系统中也起着重要的作用，该文也对其做出了介绍，并阐述了它们的用途和使用方法.在介绍数字音频系统结构的同时，还提到现时最新的数字功放技术.在系统的控制部分，介绍了TAS300X系列芯片所使用的控制总线—I<'2>C总线，及由德州仪器公司出口的MSP430超低功耗单片机，阐述了如何合作使用MSP430单片机通过 I<'2>C总线来控制TAS300X系列数字音频处理器实现各种功能.最后是使用TAS3001EVM评估板和MSP430单片机FLASH系列的FET开发工具制作出来的实验装置对扬声器进行频率响应补偿实验，实验结果显示与仿真结果相符，扬声器的音质得到在很大的改善. 6.期刊论文孙冬.王新金.许爽.SUN Dong.WANG Xin-jin.XU Shuang DSP与数字功放芯片DPPC2006的接口设计-电子器件2008,31(5) 介绍了专业数字音频功放芯片DPPC2006和DSP TMS320VC5409芯片的主要特点.数字音频处理系统使用了TI公司的通用DSP 作为声场处理器,根据系统和IIS数字音频格式的要求,设计了DSP与DPPC2006的数字音频接口电路,并给出了DSP的McBSP串口软件设置程序.该设计实现了DSP在数字音频系统中的应用,增强了系统的灵活性,并经实验验证了该接口电路的可靠性. 7.期刊论文潘涛涛.张正炳.夏振华.PAN Tao-tao.ZHANG Zheng-bing.XIA Zhen-hua OMAP5912双核通信及其数字音频系统实现-电声技术2008,32(1) 根据OMAP5912双核的特点,详细叙述了双核间通信的几种方式和基础应用程序.并以基于OMAP5912的数字音频系统为例,介绍OMAP双核问通信的具体应用. 8.期刊论文曾荣.严国萍.陆牧基于Motorola DSP的数字音效处理系统-电声技术2002(12) 提出一种基于Motorola DSP56364的数字音效处理系统的设计方案.文中首先讨论数字音频系统设计需要注意的事项,接着分析DSP56364的ESAI接口通过I2S协议与外部A/D、D/A进行无缝连接的问题,并给出系统的流程和硬件结构框图.最后以典型的回声音效算法为例,说明基于该系统平台的软件处理流程.实验证明在该系统平台上可以很好的运行多种音效处理算法. 9.学位论文董志刚基于DSP的数字音频处理系统的设计与实现2008 数字信号处理是伴随数值计算技术和计算机技术的发展而迅速发展起来的新兴学科，特别是数字信号处理器(DSP)的出现，使其理论得以广泛应用于实际系统之中。MPEG 1-LAYERS是MPEG-1国际标准音频(ISO/IEC 11172)第三层编码/解码算法，它具有压缩比例高，还原音质好等诸多优点。利用这种标准制作的MP3格式音乐，己经在网络上得到极大流行。但是目前市场上的MP3播放器大都是基于专用ASIC，因此存在着功能单一，灵活性不够的特点。

多媒体技术知识点整理

多媒体技术知识整理 1.1.1 多媒体的含义和分类 1、媒体的定义:人们用来与外界沟通和交流各种信息的载体,或者说是信息传递和信息存储的最基本的手段。 2、强调媒体的两层含义:一是存储信息的实体,二是指传递信息的载体,多媒体技术主要指后者。 3、国际通用定义媒体的分类:感觉、表示、显示、存储和传输五种媒体,信息源流最丰富的媒体(感觉媒体),最主要的媒体(表示媒体)。 4、表示媒体通常包含的几种媒体(多媒体数据的分类) 文本:最基本声音(音频):三种表现形式(解说词、音效、背景音乐),具有很强的前后相关性,数据量大,实时性强图片、图像:图像主要以位图形式存放,是一种最基本的形式,图片一般以向量图形式存在。视频影像:(静态和动态,真实的画面) 动画:移动的主观设计的绘画(二维平面、三维立体),根据制作方法分为造型和帧动画两类。05年高考题:分别指出WINDOWS系统中下列工具软件所处理的媒体,记事本(文本)、画图(图像)、录音机(声音)、CD唱机(声音)、媒体播放器(音频、视频)。填空:___________、声音、图形、图像和动画等信息载体中的两个或多个的组合成为多媒体。单:下列不属于多媒体技术中的媒体的范围是(A 存储信息的实体B 信息的载体 C 文本D 图像)A

超文本是一个什么样的结构(A顺序的树形B非线性的网状C线性的层次D随机的链式)B 1.1.2 多媒体技术的概念 1、多媒体技术的含义:以计算机技术为基础,综合处理图像、文本、声音、动画等多种媒体信息、具有交互式的综合与实时处理多种媒体信息的计算机系统,具有集成性、交互性和实时性的特点。 2、多媒体技术的基本特征:集成性(综合性)、交互性、实时性。集成性注意把握处理媒体的设备的集成和多种类型数据的集成化处理两个方面,了解创作的含义,基类媒体的概念。 05年高考题:多媒体作品与影视作品的主要区别是(A、共享性B集成性C交互性D传播性) C交互性是多媒体技术最基本的特征。简:请回答单:多媒体技术的主要特性有(A、多样性B集成性C交互性D可扩充性)ABC 填空:多媒体技术具有__________、实时性、交互性、高质量等特性。 1.1.3 多媒体技术的发展和应用 1、多媒体技术的发展简史:1986年,世界上第一台多媒体计算机AMGIA;1985年,只读光盘的问世;多媒体PC机标准MPC-1,MPC-2,MPC-3。 2、多媒体计算机的应用:了解性内容,注意几个符号简称的意义 1.2 多媒体计算机系统组成 1.2.1 硬件组成

浦喆科技音频处理器

音频处理器品牌：浦喆是一款高性能、多种音频处理技术高集成的8路输入8路输出的数字音频处理器，采用DSP 音频处理技术，为用户提供卓越的声音品质；内置反馈抑制、回声消除、噪声消除等功能，还原高品质声音。主要应用于中大型场所，可以满足远程视频会议、体育场馆、会议中心、礼堂、宴会厅、展厅、多媒体会议、指挥中心等公共扩声系统等多方面的应用需求。功能特点: 1. 输入每通道：8路平衡式话筒/线路，采用裸线接口端子，平衡接法。 2. 输出每通道：8路平衡式线路输出，采用裸线接口端子，平衡接法。 3. 提供24bit/48KHz卓越的高品质声音。 4. 全功能矩阵混音，提供用户灵活、简单的信号路由操作，路由路径和电平大小可在一个按钮上完成。 5. 面板具备USB接口，支持多媒体存储，可进行播放或存储录播 6. 配置双向RS-232接口，可用于控制外部设备。 7. 配置RS-485接口，可实现自动摄像跟踪功能。 8. 配置8通道可编程GPIO控制接口（可自定义输入输出）。 9. 支持断电自动保护记忆功能。 10. 支持通道拷贝、粘贴、联控功能。 11. Enternet多用途数据传输及控制端口，可以支持实时管理单台及多台设备。 12. 支持通过浏览器访问设备，下载自带管理控制软件；软件界面直观、图形化，可工作在XP/Windows7、8、10等系统环境下。 13. 支持iOS、iPad、Android的手机/平板APP进行操作控制。技术参数： 1. 输入通道：前级放大、信号发生器、扩展器、压缩器、5段参量均衡、AM自动混音功能、AFC自适应反馈消除、AEC回声消除、ANC噪声消除 2. 输出通道：31段参量均衡器、延时器、分频器、高低通滤波器、限幅器 3. 采样率：48K 4. 幻像供电：DC 48V 5. 频率响应：20Hz-20KHz 6. 总谐波失真+噪声：＜0.002% @1KHz ,4dBu 7. 数/模动态范围(A-计权)：120dB 8. 模/数动态范围(A-计权)：120dB 9. 输入阻抗(平衡式)：20KΩ； 10. 最大输出阻抗（平衡式)：100Ω； 11. 通道隔离度：1kHz，100dB 12. 输入共模抑制：60Hz，80dB 13. 最大输出电平：+24dBu，平衡 14. 最大输入电平：+24dBu，平衡 15. 工作温度：0℃-40℃ 16. 工作电源：AC110V-220V,50Hz/60Hz 17. 电源功耗：<40W 18. 尺寸(宽x深x高)：482×258×45(mm)

多媒体技术-多媒体技术大作业报告

华南理工大学多媒体技术大作业报告专业：多媒体技术班级： 2015秋学号： 20 学生姓名：鲁斌完成时间： 2016-11-19

目录说明 (3) 第一章概述 (4) 第二章技术介绍 (5) 第三章音频处理 (7) 第四章图像合成 (12) 第五章制作电影 (15) 第六章动画制作 (18) 第七章设计与制作的总结 (20)

说明一、内容要求 1.用GoldWave软件处理音频素材准备：音频素材（MP3、WAV、MIDI，至少准备两种格式的文件，每种格式准备2个以上文件）操作要求： 1)文件拆分与合并打开一个音频文件，将该音频文件拆分成两个文件分别存盘；打开两个音频文件，将两个音频文件合成一个音频文件。 2)文件格式转换打开多个同种格式文件，将其批量转换成另一种格式文件存盘。 3)音频内容编辑选择音频段、音频段静音、音频段删除、插入空白区域、撤消误操作、声音段内容移动位置。 4)音频效果编辑淡入淡出效果、频率均衡控制、回声效果、改变音高、倒序声音 2.用Photoshop软件，运用“快速蒙板”抠图实现图像合成操作要求：运用快速蒙版分别抠出图形，如荷花、花瓶，然后将抠出的图片与一个新建的背景图层合成，得到最终合成图像。 3.用Movie Maker软件，由多个独立的视频剪辑文件、音频文件合成制作为电影操作要求：将独立的视频文件和音频文件结合在一起，生成一个统一的电影文件。 4.用Flash软件，设计由变化数字组成的“倒计时”逐帧动画操作要求：场景中数字从9依次变化到0，实现倒计时效果。二、大作业报告完成以上4项内容，书写大作业报告，按大作业报告格式书写。 ?大作业以提交的大作业报告（学生名字命名的WORD文件）作为期末成绩评分依据。必须在规定时间内按要求完成。请在12月15日前提交大作业。大作业务必独立完成，一经发现雷同作“0”分处理。

多媒体技术复习资料

多媒体技术感觉媒体直接作用于人的感官、使人能直接产生感觉的一类媒体。声音、文字、图形和图像，物体的质地、形状、温度表示媒体为了加工感觉媒体而构造出来的一种媒体。各种编码：语音编码、图像编码等显示媒体感觉媒体与通信电信号进行转换的一类媒体可分为：输入表现媒体，输出表现媒体存储媒体用于存放表示媒体的一类媒体如：硬盘、光盘等传输媒体用来将表示媒体从一处传送到另一处的物理传输介质，如各种通信电缆。多媒体概念以数字化为基础，能够对多种媒体信息进行采集、编码、存储、传输、处理和表现，综合处理多种媒体信息并使之建立起有机的逻辑联系，集成为一个系统并能具有良好交互性的技术。简言之, 多媒体技术就是计算机综合处理声、文、图信息, 具有多样性、集成性和交互性多媒体的关键特性多样性—适应了信息载体的多样性交互性—易于人和计算机的交互集成性—实现了信息处理的集成性

多媒体计算机的关键技术视频音频信号获取技术；多媒体数据压缩编码和解码技术；视频音频数据的实时处理和特技；视频音频数据的输出技术。要把一台普通的计算机变成多媒体计算机需要解决哪些关键技术？答：视频音频信号的获取技术；多媒体数据压缩编码和解码技术；视频音频数据的实时处理和特技；视频音频数据的输出技术。多媒体计算机的关键技术及其主要应用领域。答：多媒体计算机的关键技术是：①视频音频信号获取技术；②多媒体数据压缩编码和解码技术；③视频音频数据的实时处理和特技； ④视频音频数据的输出技术。多媒体计算机的主要应用领域：①多媒体数据库和基于内容的检索；②多媒体通信；③多媒体创作工具。音频处理技术什么是模拟音频和数字音频？它们的特点是什么？声音是机械振动。振动越强，声音越大，话筒把机械振动转换成电信号，模拟音频技术中以模拟电压的幅度表示声音强弱。在计算机内，所有的信息均是以数字表示的。各种命令是不同的数字，各种幅度的物理量也是不同的数字。当然，语音信号也是由一系列数字来表示，称之为数字音频。数字音频的特点是保真度好，动态范围大。模拟声音在时间上是连续的。数字声音在时间上是断续的。

多媒体技术课后答案

《多媒体技术及应用》习题参考答案第1章多媒体技术概论 1．什么是多媒体？答：使用计算机交互式综合技术和数字通信网络技术处理多种表示媒体——文本、图形、图像和声音，使多种信息建立逻辑连接，集成为一个交互式系统。 2．多媒体技术中的主要多媒体元素有哪些？答：图形、图像、文本、动画、音频、视频等。 3．什么是多媒体技术？什么是多媒体计算机？简述多媒体技术的主要特点。答：多媒体技术可以定义为：计算机综合处理文本、图形、图像、音频与视频等多种媒体信息，使多种信息建立逻辑连接，集成为一个系统并且具有交互性。多媒体计算机是指具有多媒体处理功能的计算机。多媒体技术的主要特点有：集成性、实时性、交互性、媒体的多样性等。 4．多媒体计算机标准的意义是什么？答：对于技术开发人员而言是用来指导多媒体个人计算机及其软件的设计规范；对于用户而言，是把现有PC机升为MPC的指导原则；对于经销商而言，可作为多媒体的性能及兼容性的尺度。 5．简述多媒体系统的组成。答：一般多媒体系统由多媒体硬件系统、多媒体软件系统两个部分组成。硬件是多媒体系统的物质基础，是软件的载体，软件是多媒体系统的核心，两者相辅相成，缺一不可。 6．试从实例出发，谈谈多媒体技术的应用对人类社会的影响。略 7．谈谈你如何看待多媒体技术的发展前景。略 8．选择题。（1）音频卡是按（）分类的。

（A）采样频率（B）声道数（C）采样量化位数（D）压缩方式（2）一个用途广泛的音频卡应能够支持多种声源输入，下列（）是音频卡支持的声源。 ①话筒②线输入③CD Audio ④MIDI （A）仅①（B）①②（C）①②③（D）全部（3）（）是MPC 对视频处理能力的基本要求。 ①播放已压缩好的较低质量的视频图象②实时采集视频图象 ③实时压缩视频图象④播放已压缩好的高质量分辨率的视频图象（A）仅①（B）①②（C）①②③（D）全部（4）（）是MMX 技术的特点。 ①打包的数据类型②与IA 结构安全兼容 ③64 位的MMX 寄存储器组④增强的指令系统（A）①③④（B）②③④（C）①②③（D）全部（5）下列关于触摸屏的叙述（）是正确的。 ①触摸屏是一种定位设备②触摸屏是最基本的多媒体系统交互设备之一 ③触摸屏可以仿真鼠标操作④触摸屏也是一种显示设备（A）仅①（B）①②（C）①②③（D）全部（6）下列关于数码相机的叙述（）是正确的。 ①数码相机的关键部件是CCD ②数码相机有内部存储介质 ③数码相机拍照的图像可以通过串行口、SCSI 或USB 接口送到计算机 ④数码相机输出的是数字或模拟数据（A）仅①（B）①②（C）①②③（D）全部

音频处理的一些技巧

一、正常对话两个人的音量大小在-15到-6之间会很河蟹二、场景切换时间长度不要少于3秒，不然会感觉很赶。三、淡入淡出时间长度不要少于2秒，不然会完全没感觉。四、声音层次的分布：人声> 音效> BGM > 环境音效。五、人物脚步声除非特定，不要多于4秒，不然会很拖节奏。首先说一下：波形振幅处理 1、波形振幅—动态处理：这个是一个用来做音量的动态处理的一般来说很少用到。。因为它用起来不如C4那么直观。 2、波形振幅--渐变：渐变里面有很多的预制项，大多数时候我们只需要用到正常的预制就好了前面6个10 3 6DB CUT或则是BOOST就是音量波形减小或则增大。 CENTE WAVE 就是调整直流偏移。。就是调波形中线的东西 FADE IN和FADE OUT就是淡入淡出，这个记得你要先选一段，不然直接处理就变全干音淡入或则淡出了。也可以通过调整那个-240的数值做出声音慢慢接近或则慢慢走远的效果。然后是4个PAN开头的，意思是第一个，左边没声音，第二个，声音从左到右，第三个，声音从右到左，第四个，右边没声音。。这四个带耳机做一次就会听的很明显。接下来4个和上面四个差不多，第一个是右声道淡入，第二个是右边衰减3，第三个是左声道淡入，第四个是左边衰减3。我们可用2 和4做出声音偏左或偏右的感觉！调整那个-3DB 数值可以让感觉更偏或更中间。 3、波形振幅--空间回旋：就是立体声回旋啦，自己试听下就明白了 4、波形振幅--强硬限制：这是一个限幅器，就是用来限制增幅强度的。类似音量标准化，不过不同的地方在于这个是增加是加法。而音量标准化是乘法即按比例放大。 5、波形振幅—声道重混缩：这个就是混缩左右波形的让它重新生成的一个东西，比如说有一些干音左边大右边小，我们就声道重混缩一下，它就一样了。这个还有一个用处就是做伴奏带，消人声里面的VOCAL CUT 就是了。 6、波形振幅—声相/声场：就是声音位置处理和加强立体声感觉的一个东西，试着做1、2下就明白了，大多数时候用不到。 7、波形振幅—音量包络：

目前市面上流行的音频处理芯片汇总

目前市面上流行的音频处理芯片汇总一下,目前我们使用的较为熟练的为ADAU1701,与大家分享. 美国Cirrus Logic上市了用于车载音响放大器,集 32bit DSP、4声道A-D转换器、8声道A-D转换器以及数码音响接口(收发信)电路等于一身的SoC“CS47048”(英文发布资料).以DSP性能高为特点. DSP的工作频率为150MHz.为固定小数点类型,运算能力为300MMACS.配备有72bit的累加器.内置32K word的32bit SRAM.A-D转换器为ΔΣ型,分辨率为24bit.动态范围为105dB,THD+N为98dB.D-A转换器分辨率为24bit,动态范围为 108dB,THD+N为98dB.输入、输出信号均支持单端信号和差分信号.数码音响接口电路支持S/PDIF、TDM及I2S各种规格的收发.采样频率最大为192kHz,支持 32bit分辨率的音频数据.备有支持SPI、I2C的控制用串行接口. 电源电压方面,内核为+1.8V,输入输出电路为+3.3V.封装为100端子的LQFP.备有工作温度范围0~+70℃和-40~+85℃的型号.计划2008年12月开始样品供货.每1万个批量购入时的单价为6.12美元. 资料下载 cs47078 1227429840.pdf1227429887.pdf ADI日前宣布,其SigmaDSP数字音频处理器系列三款新产品──ADAV400、ADAU1701和ADAU1702问世,新产品针对音频系统等需求设计,包括高清电视(HDTV)以及多媒体播放器使用的便携式扬声器系统. ADI表示,ADAV400具备125MHz的速度,符合新一代高清平面电视(如LCD电视)对音频处理的需求.该产品整合56位音频处理核心,以及具有超过95dB动态范围的模拟数字转换器(ADC)和数字模拟转换器(DAC).并包含一组延迟内存,针对弥补目前电视的视频处理延迟所设计,能使影像与声音同步传送,同时还支持16个数字输出入信道(I2S). ADAU1701和ADAU1702则使设计者可选择采用50MHz或25MHz的DSP引擎,适合数字音频应用方案,如MP3随身听使用的扩充基座、车载收音机和接电扩音器.新组件整合了ADC和DAC、多信道数字I/O(I2S)与延迟内存,以及具备自行开机、外部控制、实体按键和音量控制接口,为一组turnkey系统设计解决方案,不需额外的处理器或微控制器,适合搭配ADIAD199x Class-D放大器系列. 新组件并可与SigmaStudio GUI(图形使用者界面)设计工具合并使用;该工具拥有易于使用的拖曳画面,数据库内的区块包括音量控制、跨接及等化滤波器、动态处理器等.SigmaStudio并支持多种业界标准算法,如SRS TruSurroundXT、Waves MaxxBass、Dolby Prologic-II 或BBE-Viva. ADAV400现正提供样本,采用无铅80脚LQFP封装,包括SigmaStudio设计工具的评估板也已开始供货.ADAU1701和ADAU1702目前开始供应样本,采用无铅48接脚LQFP封装,两者的评估板与SigmaStudio设计工具同样已开始限量供应. adau1701 1227430054.pdf满足消费类音频对高保真度的要求为了强化致力为消费类音频电子产品提供高质量集成电路的决心,德州仪器|仪表 (TI) 日前宣布其高性能数字音频处理器系列又添一款新成员.TAS3308 音频片上系统是一款单芯片SoC 解决方案,为音响设备制造商提供了出色的处理性能,以创建各种可满足严格要求的应用,如数字电视 (DTV) 音频子系统、迷你∕微型组合音响、5.1 条形音箱以及其它消费类音频电子产品. TAS3308 在TI 原有高端音频解决方案的基础上得到了进一步增强,其集成了一个模拟多路复用器、立体声 ADC、一个高性能数字音频处理器以及六个脉宽调制 (PWM) 输出通道.这种高硬件集成度配合直观易用的 PurePath Studio 软件开发环境,使客户能在尽可能降低软硬件开发资源投入的情况下,向市场推出高级数字音频信号处理产品. 高性能的系统级集成TI 最新处理器采用包括 PWM 输出在内的全面集成数字音频信号链,有助于降低系统成

多媒体技术图片音视频知识点

多媒体＝多种媒体（文本、图形、图像、声音、动画和视频等）多媒体技术：计算机综合处理文字、图形、图像、音频、视频等多媒体信息，使多种信息建立逻辑连接，集成为一个系统并且具有交互性的一门综合性技术。多媒体技术主要包括：媒体处理技术、人机交互技术、数据压缩技术、软硬件平台技术、通信与网络技术。多媒体技术基本特征：数字性、多样性、交互性、集成性和实时性。其中交互性是关键特征。多媒体计算机特征部件：光驱、音箱、显卡声卡、视频采集卡、刻录机、摄像头、触摸屏、扫描仪、数码相机、数字投影仪…… 多媒体技术主要应用：教育培训、电子出版、影音娱乐、网络。多媒体【例题】 1、多媒体技术不包含以下哪种技术（C） A、数据压缩技术 B、人机交互技术 C、机械技术 D、通信与网络技术 2、以下哪一项不是常用的多媒体设备（B） A、摄像头 B、U盘 C、数据照相机 D、数字投影仪 3、以下哪一项不是多媒体技术的应用（D） A、教育培训 B、电子出版 C、网络 D、数字投影仪 4、计算机可以处理图像、声音和视频等信息，这种技术属于（D） A、智能化技术 B、自动控制技术 C、网络技术 D、多媒体技术

5、在多媒体计算机中，用来播放、录制声音的硬件设备是（B） A、网卡 B、声卡 C、视频卡 D、显卡 6. 下列关于多媒体技术主要特征描述正确的是：(D) ①多媒体技术要求各种信息媒体必须要数字化 ②多媒体技术要求对文本，声音，图像，视频等媒体进行集成 ③多媒体技术涉及到信息的多样化和信息载体的多样化 ④交互性是多媒体技术的关键特征 A. ①② B. ①④ C. ①②③ D. ①②③④ 7. 下面关于多媒体技术的描述中,正确的是：(C) A. 多媒体技术只能处理声音和文字 B. 多媒体技术不能处理动画 C. 多媒体技术就是计算机综合处理声音，文本，图像等信息的技术 D. 多媒体技术就是制作视频 8、以下属于多媒体技术应用的是：（B）（1）远程教育（2）美容院在计算机上模拟美容后的效果（3）电脑设计的建筑外观效果图（4）房地产开发商制作的小区微缩景观模型 A、(1)(2) B、(1)(2)(3) C、(2)(3)(4) D、全部 9、在多媒体课件中，课件能够根据用户答题情况给予正确和错误的回复，突出显示了多媒体技术的(D)。Ａ、多样性Ｂ、非线性Ｃ、集成性Ｄ、交互性

数字音频资源的获取、处理及应用

实验二数字音频资源的获取、处理及应用【实验目的】 1.了解数字音频资源的常用格式 2.学会数字音频资源的获取方法 3.能够对数字音频资源进行简单的加工处理 4.学会在多媒体课件、主题学习网站中使用数字音频资源的方法【实验类型】验证型实验 2学时【实验环境】 1．能够连接Internet的多媒体计算机； 2．耳麦； 3．Cool Edit、录音机、Microsoft PowerPoint等软件。【实验内容】 1. 比较wav文件和mp3文件存储尺寸：将一个wav格式的声音文件，转换为mp3文件，记录其前后存储尺寸，并说明其变化情况。 2．声音片段截取：从网络上下截一个音频文件，运用声音处理软件截取一段音频，保存为t1.mp3。 3．声音录制与处理：使用声音软件录制自己的一段声音，要求采样率44100，声道立体声，采样精度16位，然后进行如下操作： 1）加上回音； 2）选择一首背景音乐，给自己的声音加上伴奏； 3）将录音头尾空白部分删除；

4）做淡入与淡出处理；结果保存为t2.mp3。 4．声音文件的使用：从网上下载或自己制作声音文件，经过处理后，运用到ppt中。【实验步骤】【实验指导】一、常用数字音频文件的格式 1．WAV文件格式 W A V（Waveform Audio) 文件格式，扩展名为WA V，是Microsoft公司开发的一种音频文件格式。 WA V音频文件是对声音模拟波形的采样而形成的文件格式，即将声音源发出的模拟音频信号通过采样、量化转换成数字信号，再进行编码，以波形文件(.WA V)的格式保存起来，记录的是数字化波形数据。其中声音信息采样频率和量化的精度直接影响声音的质量和数据量。常用的采样频率有三种：44.1khz（CD 音质）；22.05khz（广播音质）；11.025khz（电话音质）。量化的精度即采样位数可分为8位（低品质）、16位（高品质）。频率越高，量化精度越大，声音质量越好，但是存储量也越大。由于WA V格式的数字音频未经过压缩，文件的体积很大，不方便通过网络和其他媒介来传递和保存，所以在教学中，它多用于表示短时间的效果声，不适于用作长时间的背景音乐或解说。 2．MP3文件格式 MP3(Moving Picture Experts Group Audio Layer3)文件格式，扩展名为MP3，是一种基于MPEG LayerⅢ压缩的数字音频文件格式。它能够在影响音质很小的前提下根据人的听觉特性，将音频文件按照某种算法压缩为原来存储量的

多媒体技术(内容+题+答案)

中公金融人：https://www.wendangku.net/doc/475214218.html, 第1页中公教育学员专用资料多媒体技术第一节多媒体技术概论 1、多媒体技术的概念多媒体一词来自于英文“Multimedia ”，它是一个复合词。多媒体技术是利用计算机对文字、图像、图形、动画、音频、视频等多种信息进行综合处理、建立逻辑关系和人机交互作用的产物。 2、多媒体技术的处理对象（1）文字：采用文字编辑软件生成文本文件，或者使用图像处理软件形成图形方式的文字。（2）图像：主要指具有23～232彩色数量的.gif 、.bmp 、.tga 、.tif 、.jpg 格式的静态图像。图像采用位图方式，并可对其压缩，实现图像的存储和传输。（3）图形：图形是采用算法语言或某些应用软件生成的矢量化图形，具有体积小、线条圆滑变化的特点。（4）动画：动画有矢量动画和帧动画之分，矢量动画在单画面中展示动作的全过程；而帧动画则使用多画面来描述动作。帧动画与传统动画的原理一致。代表性的帧动画文件有.flc 、.fla 等动画文件。（5）音频信号：音频通常采用.wav 或.mid 格式，是数字化音频文件。还有.mp3压缩格式的音频文件。（6）视频信号：视频信号是动态的图像。具有代表性的有.avi 格式的电影文件和压缩格式的.mpg 视频文件。 3、动画制作软件分三类：（1）绘制和编辑动画软件： AnimatorPro 、AnimationStudio 、Flash 等软件用于制作各种形式的平面动画。 3DStudio 、3DStudioMax 、Cool3D 、Maya 等软件用于制作各种各样的三维动画。（2）动画处理软件：Premiere 、GIFConstructionSet 网页动画处理软件等。（3）计算机程序：Authorware 多媒体平台软件、VisualBasic 等计算机语言。

多媒体技术与应用

多媒体技术与应用内容综合练习（含参考答案）一、填空题 1.______等是信息的载体，其中两个或多于两个的组合构成了多媒体。文本、声音、图形、图像和动画 2.多媒体技术就是指运用计算机综合处理______的技术。多媒体系统是指利用______技术和______技术来处理和控制多媒体信息的系统。多媒体信息（文本、声音、图形、图像等）；计算机；数字通信网 3.多媒体数据的输入方式分为两种：______和______。多通道异步输入方式；多通道同步输入方式 4.多媒体系统按照功能来分可分为开发系统、______、培训系统、家庭系统等四种。演示系统 5.______是人与计算机之间进行信息交换的主要媒体。字 6.在现实世界中，______是人们进行通讯的主要形式。文字 7.在计算机中，西文采用______表示。 ASCII码 8.在计算机中，西文采用ASCII表示，ASCII即______。美国标准信息交换码 9. ASCII码共有个______字符。 128 10.汉字内码是______。汉字信息的存储、交换、检索等操作的机内代码 11.汉字内码一般采用______个字节表示。两 12.音频指的是大约在______的频率范围。 20Hz到20kHz 13.声音具有______、______、______三要素。音调；音强；音色 14.音调与______有关，音强与______有关，音色由混入______的______决定。频率；振幅；基音；泛音 15.音频数字化就是把模拟音频信号转换成有限个数字表示的______。离散序列 16.在音频数字化过程中，要考虑______、______和______的问题。采样；量化；编码 17.对于音频，常用的三种采样频率是：______、______、______。 44.1kHz；22.05kHz；11.025kHz 18.采样率决定了______。数字化音频录制的精确程度 19.音强的单位是______。分贝

多媒体技术——音频信息处理实验报告

音频信息处理

音频信息处理一、实验内容及任务要求 1、内容：学习Audition的使用 2、任务要求： ①请制作一段自己的录音文件，并配背景音乐，写出制作步骤。 ②请叙述用Audition取出某段录音文件中的环境噪音的步骤。 ③请把某段正常速度录制的语音文件，在保持语调不变的情况下把语速降低到正常语速的70%。二、实验任务分析与设计 ①录音软件： Adobe Audition 3.0 ②基本原理：声音以振动波的形式从声源向四周传播，声音依靠介质的振动进行传播。声音在不同介质中的传播速率和衰减率不一样，导致声音在不同介质中传播距离不同。声音三要素：周期、振幅、频率。录音时，声音使话筒中产生随声音而变化的感应电流——音频电流，音频电流经放大电路放大后，进入录音磁头的线圈中，在磁头的缝隙处产生随音频电流变化的磁场。磁带紧贴着磁头缝隙移动，磁带上的磁粉层被磁化，在磁带上就记录下声音的磁信号。处理声音的方式有：剪辑、合成、制作特殊效果、增加混响、调整时间长度、改善频响特性等。音质的好坏与采样频率成正比，也与数据量成正比。采样频率越高，音质越好，数据量也越大。 ③基本方法：用Adobe Adition 3.0上录制一段音频，并配置音乐，通过降噪、滤波等效果器处理音频。进行噪音采样，取出录音文件中的噪音。最后通过变调效果器将语速降低。内容包括：针对实验任务所采用的工具，或者所需要的基本原理或方法以及对完成任务的基本方式与方法。三、实验结果展示及分析步骤： ①准备素材。在伴奏网上下载一首伴奏。 ②打开Audition 3.0。将界面调成多轨模式，点击文件中的保存对话框，对文件进行设置。 ③在菜单栏的“插入”下选择音频，导入自己下载的伴奏，并将伴奏拖动到音轨1中。

音视频处理技术

音视频处理技术资成本201016019张海华摘要：信息技术是一门日新月异的学科，每天都有不同的软件被开发、被改进、被运用。本文探讨了“音视频获取与编辑”技术及其在初中英语教学中的运用。本文对此进行了一定的反思和探讨。关键词：音视频；编辑；软件；教学方法；教学效果本单元是学生比较感兴趣的一个单元，由于互联网的普及与发展，目前网络上的一些供网友自唱自秀的翻唱网站（如https://www.wendangku.net/doc/475214218.html,/）以及一些播客网站（如https://www.wendangku.net/doc/475214218.html,/）正在蓬勃地发展，使得网络成为一个体现个人价值的理想场所。而现在的初中生刚好处于一个需要张扬自我个性但却又很容易迷失自我的时期，笔者认为学习本单元的内容对我们的学生有很现实的指导意义。原教材对于本单元内容的定位在于让学生作为一个了解，所以内容编排上较为松散，知识点基本属于“东打一榔头，西敲一棒槌”，就软件这部分内容来讲对教师的实际教学造成了一定的困难。针对这些问题笔者做了一些相关的研究整理工作。一、教材内容分析 1.音频处理（1）在音频处理的这一讲里笔者统计了课堂内容实际涉及的相关软件有三款（千千静听、GOLDWA VE、豪杰音频通），上课的时候这些软件时不时地跳来跳去本身就容易让学生造成学习障碍和困扰。（2）本节内容的知识点为：声音的类型和播放；获取声音；声音的编辑。第一：声音的类型和播放从体系看是逻辑完整的，而且具体编排：类型和播放作为单独的一个内容也没有问题。第二：获取声音这里讲了五种方式：一是从因特网上下载；二是录制语音；三是从CD中录取曲目；四是从视频文件中录取背景音乐；五是声音格式的转换。 ①声音下载。课本提供了一个探究学习，其实这个内容在前面的有效获取信息一节内容里已经完全解决了，而这里学生需要知道的是下载的什么文件是声音文件就可以，而这个问题在声音的类型中是已经解决的。 ②语音的录制。课本提出了利用GOLDWA VE来录制一段声音作为实践内容，实际上目前网上大部分翻唱者使用较多的软件为COOLEDIT PRO。COOLEDIT PRO对声音的编辑操作和界面设置确实要比GOLDWA VE专业些（当然这是个见仁见智的问题）。但是这个活动明显没有考虑机房设施问题（倒不是经济问题，而是很多学校以前配置机房根本就没想过要麦克风）。 ③从CD中录取曲目。 ④从视频文件中录取背景音乐。 ⑤声音格式的转换。后三个内容倒是没有安排实践操作，看起来是可以给教师发挥的一个内容，但是笔者认为第④种方式和第⑤种方式尤其是后者，学生还是比较有掌握的必要（同一曲目的不同音频格式会导致大小不同，并且可用的场合、音质也不同，这点比较重要）。第三：声音的编辑。这里讲了4个内容：一是删除片段；二是连接声音；三是混合声音；四是添加特殊效果。

多媒体信息处理技术(5)

多媒体信息处理技术 1 多媒体数据的分类媒体是承载信息的载体，是信息的表示形式。信息媒体元素是指多媒体应用中可以显示给用户的媒体组成元素，目前主要包括文本、图形、图像、声音、动画和视频等媒体。一、多媒体数据的特点多媒体数据具有数据量巨大、数据类型多、数据类型间差别大、数据输入和输出复杂等特点。多媒体数据类型多，包括图形、图像、声音、文本和动画等多种形式，即使同属于图像一类，也还有黑白、彩色、高分辨率和低分辨率之分，由于不同类型的媒体内容和格式不同，其存储容量、信息组织方法等方面都有很大的差异。二、多媒体数据的分类 1．文字在计算机中，文字是人与计算机之间信息交换的主要媒体。文字用二进制编码表示，也就是使用不同的二进制编码来代表不同的文字。文本是各种文字的集合，是人和计算机交互作用的主要形式。文本数据可以在文本编辑软件里制作，如Word编写的文本文件大都可以直接应用到多媒体应用系统中。但多媒体文本大多直接在制作图形的软件或多媒体编辑软件时一起制作。 2．音频音频泛指声音，除语音、音乐外，还包括各种音响效果。将音频信号集成到多媒体中，可提供其他任何媒体不能取代的效果，从而烘托气氛、增加活力。 3．图形、图像凡是能被人类视觉系统所感知的信息形式或人们心目中的有形想象都称为图像。图形文件基本上可以分为两大类：位图和向量图。位图图像是一种最基本的形式。位图是在空间和亮度上已经离散化的图像，可以把一幅位图图像看成一个矩阵，矩阵中的任一元素对应于图像的一个点，而相应的值对应于该点的灰度等级。图形是指从点、线、面到三维空间的黑白或彩色几何图形，也称向量图。图形是一种抽象化的图像，是对图像依据某个标准进行分析而产生的结果。向量图形文件则用向量代表图中的文件，以直线为例，在向量图中，有一数据说明该元件为直线，另外有些数据注明该直线的起始坐标及其方向、长度或终止坐标，

音视频处理技术

计算机与信息工程学院/系计算机应用技术专业计信1025A班级学号3311025125 姓名卢永甜合作者教师评定第一章概述 1.简述数字化视频处理系统的基本组成。(第13页) 答：（1）视频输入设备：主要功能是将待处理视频/图像信号输入系统，根据应用需求的不同，往往有不同的设备形式。（2）视频输出设备：主要是将经过系统处理后的视频/图像信号以用户能感知的形式显示出来。（3）储存与控制设备：控制设备主要用于在视频处理过程中对视频处理设备进行控制；存储设备主要用于在视频/图像处理过程中对视频/图像信息本身和其他有关信息进行暂时或永久保存。（4）用户存取/通信设备：主要功能是使用户按需将以处理好的，或还需进一步处理的视频/图像信号取出或送入视频处理模块。（5）视频处理设备：它是一个复杂的软、硬件系统。视频处理系统模型如下：

2.数字话音视频信息系统有哪些主要性能指标答：（1）有效性：是指在给定信道内能够传输的信息的多少，通常用码元传输速率或信息传输速率来进行度量。（2）可靠性：是指信宿所接收到的信息的准确度，通常用码元差错概率或信息差错概率来进行度量。（3）保密性：是指数字音视频信息系统通过授权技术，以防范在系统中传输/存储信息被非法授权信宿终端所接收、正确解码和利用的有效程度。（4）便利性：是指信宿终端用户按需从系统中检索出目标信息的简捷程度。第二章数字音频技术基础 1.简述模拟信号数字化过程。(第42页) 答：模拟信号的数字化过程是取样、量化和编码的过程，这个变化过程如图所示的各环节完成，改系统称之为PCM.。它是“数字化”的最基本的技术，模拟信号正是通过PCM 而变化成数字信号的，具体过程是：通过抽样、量化和编码3个步骤，用若干代码表示模拟行驶的信息信号，再用脉冲信号表示这些代码来进行传输存储。图如下所示：第三章音频压缩编解码 1.简要介绍MPEG-1音视编码标准的主要特点和应用(第84页) 答：MPEG-1是第一个官方的视频音频压缩标准。用于传输1．5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码，经过MPEG-1标准压缩后，视频数据压缩率为1/100～1／200，音频压缩率为1／6.5。MPEG-1提供每秒30帧352*240分辨率的图像，当使用合适的压缩技术时，具有接近家用视频制式录像带的质量。MPEG-1允许超过70分钟的高质量的视频和音频存储在一张CD-ROM盘上。VCD采用的就是MPEG-1的标准，该标准是一个面向家庭电视质量级的视频、音频压缩标准。其中的音频压缩的第三级简称MP3，成为比较流行的音频压缩格式。为了追求高的压缩效率，去除图像序列的时间冗余度，同时满足多媒体等应用所必须的随机存取要求，MPEG-1视频把图像编码分成I帧、P帧、B帧和D帧共4种类型。I 帧为帧内编码帧，编码时采用类似JPEG的帧内DCT编码，I帧的压缩率是几种编码类型中最低的。P帧为预测编码帧，采用前向运动补偿预测和误差的DCT编码，由其前面的I 或P帧进行预测。B帧为双向预测编码帧，采用双向运动补偿预测和误差的DCT编码，由前面和后面的I或P帧进行预测，所以B帧的压缩效率最高。D帧为直流编码帧，只包含每个块的直流分量。MPEG-1采用运动补偿支除图像序列时间轴上的冗余度，可使对P 帧和B帧图像的压缩倍数比I帧提高很多。