文档库 最新最全的文档下载
当前位置:文档库 › 信源编码及其发展动态方河仅

信源编码及其发展动态方河仅

信源编码及其发展动态方河仅
信源编码及其发展动态方河仅

信源编码及其发展动态

班级:通信112班

姓名:方河仅

学号:201110404233

摘要:在传统通信系统中,信源编码与传输中抵抗信道损耗的保护技术(信道编码)是分别考虑的。但是,在实际中发现,用某种特定方法连接起来的最优信源编码器和信道编码器,并不一定能够成最佳通信系统。因此出现了实现通信系统整体优化的信源信道联合编码理论。本文给出的信源信道编码理论及其发展动向。实验表明在高噪信道使用联合编码器进行图像传输,性能改善效果非常明显。

关键词:信源编码发展数字信源与信道编码

1.引言

为了减少信源输出符号序列中的剩余度、提高符号的平均信息量,对信源输出的符号序列所施行的变换。具体说,就是针对信源输出符号序列的统计特性来寻找某种方法,把信源输出符号序列变换为最短的码字序列,使后者的各码元所载荷的平均信息量最大,同时又能保证无失真地恢复原来的符号序列。

2.信源编码

信源编码的作用

信源编码的作用之一是设法减少码元数目和降低码元速率,即通常所说的数据压缩;作用之二是将信源的模拟信号转化成数字信号,以实现模拟信号的数字化传输。

信源编码方式

最原始的信源编码就是莫尔斯电码,另外还有ASCII码和电报码都是信源编码。但现代通信应用中常见的信源编码方式有:Huffman编码、算术编码、L-Z编码,这三种都是无损编码,另外还有一些有损的编码方式。信源编码的目标就是使信源减少冗余,更加有效、经济地传输,最常见的应用形式就是压缩。

另外,在数字电视领域,信源编码包括通用的MPEG—2编码和H.264(MPEG—Part10 AVC)编码等

相应地,信道编码是为了对抗信道中的噪音和衰减,通过增加冗余,如校验码等,来

提高抗干扰能力以及纠错能力。

为了减少信源输出符号序列中的剩余度、提高符号的平均信息量,对所施行的变换。具体说,就是针对信源输出符号序列的统计特性来寻找某种方法,把信源输出符号序列变换为最短的码字序列,使后者的各码元所载荷的平均信息量最大,同时又能保证无失真地恢复原来的符号序列。

一般来说,减少信源输出符号序列中的剩余度、提高符号平均信息量的基本途径有两个:①使序列中的各个符号尽可能地互相独立;②使序列中各个符号的出现概率尽可能地相等。前者称为解除相关性,后者称为概率均匀化。

信源编码的一般问题可以表述如下:

若某信源的输出为长度等于M的符号序列集合式中符号A为信源符号表,它包含着K个不同的符号,A={ɑk|k=1,…,K},这个信源至多可以输出K M个不同的符号序列。

记‖U‖=KM。所谓对这个信源的输出

进行编码,就是用一个新的符号表B的符号序列集合V来表示信源输出的符号序列集合U。若V的各个序列的长度等于N,即式中新的符号表B共含L个符号,B={b l|l=1,…,L}。它总共可以编出L N个不同的码字。类似地,记‖V‖=LN。为了使信源的每个输出符号序列都能分配到一个独特的码字与之对应,至少应满足关系‖V‖=L N≥‖U‖=KM 或者N/M≥log K/log L

假若编码符号表B的符号数L与信源符号表A的符号数K相等,则编码后的码字序列的长度N必须大于或等于信源输出符号序列的长度M;反之,若有N=M,则必须有L≥K。只有满足这些条件,才能保证无差错地还原出原来的信源输出符号序列(称为码字的唯一可译性)。可是,在这些条件下,码字序列的每个码元所载荷的平均信息量不但不能高于,反而会低于信源输出序列的每个符号所载荷的平均信息量。这与编码的基本目标是直接相矛盾的。下面的几个编码定理,提供了解决这个矛盾的方法。它们既能改善信息载荷效率,又能保证码字唯一可译。

离散无记忆信源的定长编码定理

对于任意给定的ε>0,只要满足条件N/M≥(H(U)+ε)/log L

那么,当M足够大时,上述编码几乎没有失真;反之,若这个条件不满足,就不可能实现无失真的编码。式中H(U)是信源输出序列的符号熵。

通常,信源的符号熵H(U)

/log L≤N/M≤log K/log L

特别,若有K=L,那么,只要H(U)

离散无记忆信源的变长编码定理

变长编码是指V的各个码字的长度不相等。只要V中各个码字的长度Ni(i=1,…,‖V‖)满足克拉夫特不等式这‖V‖个码字就能唯一地正确划分和译码。离散无记忆信源的变长编码定理指出:若离散无记忆信源的输出符号序列为,式中A={ɑk|k=1,…,K},符号熵为

H(U),对U进行唯一可译的变长编码,编码字母表B的符号数为L,即B={b l|l=1,…,L},那么必定存在一种编码方法,使编出的码字Vi=(v i1,…,v iNi),(i=1,…,‖V‖),具有平均长度嚻:M H(U)/log L≤嚻

若L=K,则当H(U)

具体实现唯一可译变长编码的方法很多,但比较经典的方法还是仙农编码法、费诺编码法和霍夫曼编码法。其他方法都是这些经典方法的变形和发展。所有这些经典编码方法,都是通过以短码来表示常出现的符号这个原则来实现概率的均匀化,从而得到高的信息载荷效率;同时,通过遵守克拉夫特不等式关系来实现码字的唯一可译。

霍夫曼编码方法的具体过程是:首先把信源的各个输出符号序列按概率递降的顺序排列起来,求其中概率最小的两个序列的概率之和,并把这个概率之和看作是一个符号序列的概率,再与其他序列依概率递降顺序排列(参与求概率之和的这两个序列不再出现在新的排列之中),然后,对参与概率求和的两个符号序列分别赋予二进制数字0和1。继续这样的操作,直到剩下一个以1为概率的符号序列。最后,按照与编码过程相反的顺序读出各个符号序列所对应的二进制数字组,就可分别得到各该符号序列的码字。

例如,某个离散无记忆信源的输出符号序列及其对应的概率分布为

对这些输出符号序列进行霍夫曼编码的具体步骤和结果如表。

由表中可以看出,在码字序列中码元0和1的概率分别为10/21和11/21,二者近乎相等,实现了概率的均匀化。同时,由于码字序列长度满足克拉夫特不等式

2×2-2+3×2-3+2×2-4=1

因而码字是唯一可译的,不会在长的码字序列中出现划错码字的情况。

以上几个编码定理,在有记忆信源或连续信源的情形也有相应的类似结果。在实际工程应用中,往往并不追求无差错的信源编码和译码,而是事先规定一个译码差错率的容许值,只要实际的译码差错率不超过这个容许值即认为满意(见信息率-失真理论和多用户信源编码)。

数字电视的信源编码

一个完整的数字电视系统包括数字电视信号的产生、处理、传输、接收和重现等诸多环节。数字电视信号在进入传输通道前的处理过程一般如图1所示:

电视信号在获取后经过的第一个处理环节就是信源编码。信源编码是通过压缩编码来去掉信号源中的冗余成分,以达到压缩码率和带宽,实现信号有效传输的目的。信道编码是通过按一定规则重新排列信号码元或加入辅助码的办法来防止码元在传输过程中出错,并进行检错和纠错,以保证信号的可靠传输。信道编码后的基带信号经过调制,可送入各类通道中进行传输。目前数字电视可能的传输通道包括卫星,地面无线传输和有线传输等。

信源编码的目的是通过在编码过程中对原始信号冗余度的去除来压缩码率,因此压缩编码的技术与标准成为信源编码的核心。九十年代以来,各种压缩编码的国际标准相继推出,其中MPEG-2是专为数字电视《包括标准数字电视和数字高清晰度电视》制定的压缩编码标准。MPEG-2压缩编码输出的码流作为数字电视信源编码的标准输出码流已被广泛认可。目前数字电视系统中信源编码以外的其他部分,包括信道编码,调制器,解调器等,大都以MPEG-2码流作为与之适配的标准数字信号码流。

信源编码的第一步首先要对模拟电视信号进行取样和模数变换,相应的需要一个统一的标准。数字演播室标准ITU-R601正是为此制定的国际标准。

早在七十年代末,英国广播公司和索尼公司就分别展示了其各自开发的彩色数字录像机,成为最早的数字电视编录产品,由此促成了电视信号模数转换规范的产生。1980年,国际无线电咨询委员会CCIR提出了电视信号模数转换标准的建议,即称为数字演播室标准的C CIR601。后来CCIR成为国际电信联盟的无线电委员会,称为ITU-R,相应的CCIR-601也改称ITU-R601,成为模拟电视向数字电视转变过程中的第一个标准规范,其分量编码标准如表1所示。

表1 ITU-R601数字演播室分量编码标准《4:2:2》

参数电视制式PAL NTSC

每行取样数亮度信号每个色差信号

864 858 432 429

取样结构正交取样,色差信号与亮度信号的奇次样值同位

取样频率亮度信号每个色差信号

13.5兆赫6.75兆赫

编码方式亮度和色差信号均采用线性PCM,8比特量化

每数字有效行取样数亮度信号每个色差信号720 360

量化级数亮度信号每个色差信号

220 224

参数说明:

1.取样频率:根据奈奎斯特定理,取样频率应至少不低于信号最高频率的2倍。其次,为便于进行信源编码,取样结构最好为正交结构,即每个取样点应与其相邻行和相邻帧对齐。为此取样频率必须为行频的整数倍。要同时满足PAL与NTSC的正交取样,取样频率应为两者行频的公倍数。同时,取样频率的选取还必须兼顾码率和带宽。综合考虑上述因素,亮度信号的取样频率定为13.5兆赫。在4:2:2格式中,每个色差信号取样数为亮度信号的一半,取样频率定为6.75兆赫;

2.每行取样数:由取样频率除以行频得到每行取样数。为提高编码效率,去掉行场逆程的取样,得到降低了的每数字有效行取样数;

3.编码方式:采用简单的线性PCM编码。量化比特数为8比特,这是一个由实验决定的结果。具体实验显示,8比特量化产生的256级量化级,已完全能满足人眼对亮度与色度层次分辨的需要。

ITU-R601主要是一种取样标准。模拟电视信号据此取样后进行8比特量化和线性PCM 编码,即可得到符合数字演播室标准的基带数字信号。但是,由此得到的数字电视信号具有非常高的码率和带宽,难以进入实用。虽然ITU-R601建议早在1980年已经制定,但直到九十年代一系列有效的图像数码压缩技术及相应的国际标准出现以后,数字电视才得到了迅速的发展。

图像数据的压缩主要基于对各种图像数据冗余度及视觉冗余度的压缩,包括如下一些方法:

1.统计冗余度的压缩:对于一串由许多数值构成的数据来说,如果其中某些值经常出现,而另外一些值很少出现,则这种由取值上的统计不均匀性就构成了统计冗余度,可以对之进行压缩。具体方法是对那些经常出现的值用短的码组来表示,对不经常出现的值用长的码组来表示,因而最终用于表示这一串数据的总的码位,相对于用定长码组来表示的码位而言得到了降低,这就是熵编码的思想。目前用于图像压缩的具体的熵编码方法主要是霍夫曼编码,即一个数值的编码长度与此数值出现的概率尽可能地成反比。霍夫曼编码虽然压缩比不高,约为1.6:1,但好处是无损压缩,目前在图像压缩编码中被广泛采用。

视频图像在每一点的取值上具有任意性。对于运动图像而言,每一点在一段时间内能取可能的任意值,在取值上具有统计均匀性,难以直接运用熵编码的方法,但可以通过适当的变换编码的方法,如DCT变换,使原图像变成由一串统计不均匀的数据来表示,从而利用霍夫曼编码来进行压缩。

2.空间冗余度的压缩:一幅视频图像相邻各点的取值往往相近或相同,具有空间相关性,这就是空间冗余度。图像的空间相关性表示相邻象素点取值变化缓慢。从频域的观点看,意味着图像信号的能量主要集中在低频附近,高频信号的能量随频率的增加而迅速衰减。通过频域变换,可以将原图像信号用直流分量及少数低频交流分量的系数来表示,这就是变换编码中的正交余弦变换DCT的方法。DCT是JPEG和MPEG压缩编码的基础,可对图像的空

间冗余度进行有效的压缩。

视频图像中经常出现一连串连续的象素点具有相同值的情况,典型的如彩条,彩场信号等。只传送起始象素点的值及随后取相同值的象素点的个数,也能有效地压缩码率,这就是行游程编码。目前在图像压缩编码中,行游程编码并不直接对图像数据进行编码,主要用于对量化后的DCT系数进行编码。

3.时间冗余度的压缩:时间冗余度表现在电视画面中相继各帧对应象素点的值往往相近或相同,具有时间相关性。在知道了一个象素点的值后,利用此象素点的值及其与后一象素点的值的差值就可求出后一象素点的值。因此,不传送象素点本身的值而传送其与前一帧对应象素点的差值,也能有效地压缩码率,这就是差分编码DPCM。在实际的压缩编码中,DPC M主要用于各图像子块在DCT变换后的直流系数的传送。相对于交流系数而言,DCT直流系数的值很大,而相继各帧对应子块的DCT直流系数的值一般比较接近,在图像未发生跳变的情况下,其差值同直流系数本身的值相比是很小的。

由差分编码进一步发展起来的预测编码,是根据一定的规则先预测出下一个象素点或图像子块的值,然后将此预测值与实际值的差值传送给接收端。目前图像压缩中的预测编码主要用于帧间压缩编码,方法是先根据一个子块的运动矢量求出下一帧对应子块的预测值及其与实际值的差值,接收端根据运动矢量及差值恢复出原图像。由于运动矢量及差值的数据量低于原图像的数据量,因而也能达到图像数据压缩的目的。

4.视觉冗余度的压缩:视觉冗余度是相对于人眼的视觉特性而言的。人眼对于图像的视觉特性包括:对亮度信号比对色度信号敏感,对低频信号比对高频信号敏感,对静止图像比对运动图像敏感,以及对图像水平线条和垂直线条比对斜线敏感等。因此,包含在色度信号,图像高频信号和运动图像中的一些数据并不能对增加图像相对于人眼的清晰度作出贡献,而被认为是多余的,这就是视觉冗余度。

压缩视觉冗余度的核心思想是去掉那些相对人眼而言是看不到的或可有可无的图像数据。对视觉冗余度的压缩通常已反映在各种具体的压缩编码过程中。如对于DCT系数的直流与低频部分采取细量化,而对高频部分采取粗量化,使得DCT变换能借此压缩码率,并能有效地进行行游程编码。在帧间预测编码中,大码率压缩的预测帧及双向预测帧的采用,也是利用了人眼对运动图像细节不敏感的特性。

图像压缩编码的具体方法虽然还有多种,但大都是建立在上述基本思想之上的。DCT变换,行游程编码,DPCM,帧间预测编码及霍夫曼编码等编码方法,因技术上的成熟,已被有关国际组织定为压缩编码的主要方法。

图像压缩的主要技术与标准

目前有关图像压缩方面的主要标准包括CCITT的H.261,JPEG和MPEG。是分别针对电视电话图像,静止图像和活动图像的压缩编码标准。这几种压缩标准虽然各自针对性不同,但压缩编码方法大体相似。

1.H261

图像压缩编码标准的提出最早源于通讯中对可视电话的研究。经过多年努力,至1980年,国际电报电话咨询委员会CCITT所属的视频编码专家组的H.261建议被通过,成为可视电话和电话会议的国际标准。H.261又称Px64,传输码率为Px64kbps,其中P=1-30可变,根据图像传输清晰度的不同,码率变化范围在64kbps至1.92Mbps之间,编码方法包括D CT变换,可控步长线性量化,变长编码及预测编码等。其简化的编码原理框图如图2所示。

图中,DCT变换的输入输出选择开关由帧内/帧间模式选择电路控制。在帧内模式时,开关打到上面,输入信号经DCT变换,线性量化和变长编码后输出,图像只进行帧内压缩。在帧间模式时,开关打到下面,前一帧图像信号经过预测环中的运动补偿后产生一个后帧的预测信号。后帧的实际输入信号与其预测值相减后,在进行一个帧内压缩编码的过程后输出。

图中变长编码器产生的控制信号送量化器以控制其量化步长。当变长编码器的输入中连续出现许多大数值的数据,导致集中出现长的码组,使缓存器接近溢出时,控制信号使量化器的量化步长加大,以降低大数值数据的出现;反之,也可控制量化器以减小其量化步长。在预测环路中由于存在用于恢复前帧信号的反量化器,量化步长控制信号也要送到预测环中的反量化器中。

H.261所针对的可视电话信号最初考虑是在一般电话网中传输的,带宽和码率是其考虑的核心问题。其每帧取样点数比ITU-R601所规定的低许多,且采取抽帧传输的方法,无法满足数字电视压缩编码的要求,但H.261是此前压缩编码数十年研究的结果,成为以后JP EG和MPEG编码方法的重要基础。

2.JPEG

1986年,国际标准化组织ISO和国际电报电话咨询委员会CCITT共同成立了联合图像专家组《Joint Photographic Experts Group》,对静止图像压缩编码的标准进行了研究,JP EG小组于1988年提出建议书,1992年成为静止图像压缩编码的国际标准。JPEG是一个达到数字演播室标准的图像压缩编码标准,其亮度信号与色度信号均按照ITU-R601的规定取样后划分为8x8子块进行编码处理。

JPEG是一种不含帧间压缩的帧内压缩编码方法,其主要编码过程与H.261的帧内编码过程大致相同。输入信号经DCT变换后,按固定的亮度与色度量化矩阵进行非线性量化。对量化后的DCT直流系数进行差分编码,交流系数进行行游程编码,再按霍夫曼码表进行变长编码后,送缓存器输出。

JPEG不含帧间压缩,压缩比较帧内/帧间压缩低。但因为不含帧间压缩,使得各帧在压缩编码后是各自独立的,这一点对于编辑来说是有利的,可以做到精确到逐帧的编辑。所以对于活动画面只进行帧内压缩的Motion-JPEG,目前仍然在一些数字电视编录设备,如非线性编辑系统中得到应用。

3.MPEG

1988年,国际标准化组织ISO和国际电工委员会IEC共同组建了运动图像专家组《Movi ng Picture Experts Group》,对运动图像的压缩编码标准进行了研究。1992年和1994年分别通过了MPEG-1和MPEG-2压缩编码标准。

MPEG-1主要是针对运动图像和声音在数字存储时的压缩编码,典型应用如VCD等家用数字音像产品,其编码最高码率为1.5Mbps。MPEG-2则针对数字电视的视音频压缩编码,对数字电视各种等级的压缩编码方案及图像编码中划分的层次作了详细的规定,其编码码率可从3Mbps到100Mbps。

MPEG的基本编码过程与H.261相似,即通过DCT进行帧间压缩。除了在编码语法上加进了一些特别规定外,与H.261的一个重要不同是MPEG在预测编码中加进了一个双向预测帧B帧,如图3所示。

图中,I帧只进行帧内压缩,是作为预测基准的独立帧,具有较小的压缩比。由I帧前向预测产生的P帧具有中等压缩比,并与I帧一起成为B帧的预测基准。由此产生的B帧则具有最高的压缩比。I帧出现的频率及I,B,P帧之间如何组合,MPEG未作具体规定,可由编码器自行选择。如索尼的数字Betacom录像机,为便于精确地编辑,在压缩编码过程中抽掉了B帧,只有I帧与P帧的组合。

在上述各种图像压缩编码标准中,MPEG-2是专门针对数字电视的。MPEG-2的压缩编码及其标准码流的形成构成了数字电视信源编码的核心。

主要特性

1、H.264/AVC相对以前的编码方法,以MPEG-2为例,在图像内容预测方面提高编码效率,改善图像质量的主要特点如下:

● 可变块大小运动补偿:选择运动补偿大小和形状比以前的标准更灵活,最小的亮度运动补偿块可以小到4×4。

●1/4采样精度运动补偿:以前的标准最多1/2精度运动补偿,首次1/4采样精度运动补偿出现在MPEG-4第二部分高级类部分,但H.264/AVC大大减少了内插处理的复杂度。

●运动矢量可跨越图像边界:在以前的标准中,运动矢量限制在已编码参考图像的内部。图像边界外推法作为可选技术首次出现在H.263中。

●多参考图像运动补偿:在MPEG-2及以前的标准中,P帧只使用一帧,B帧只使用两帧图像进行预测。H.264/AVC使用高级图像选择技术,可以用以前已编码过且保留在缓冲区的大量的图像进行预测,大大提高了编码效率。

●消除参考图像顺序和显示图像顺序的相关性:在以前的标准中,参考图像顺序依赖显示图像顺序,H.264/AVC消除了该限制,可以任意选择。

● 消除参考图像与图像表示方法的限制:在以前的标准中,B帧图像不能作为预测图像,

H.264/AVC在很多情况可以利用B帧图像作为参考。

● 加权预测:H.264/AVC采用新技术,允许加权运动补偿预测和偏移一定量。在淡入淡出场景中该技术极大提高编码效率,该技术还可用于其他多种用途。

● 改善“跳过”和“直接”运动推测:在以前的标准中,预测编码图像的“跳过”区不能有运动。当编码有全局运动的图像时,该限制非常有害。H.264/AVC对“跳过”区的运动采用推测方法。对双预测的B帧图像,采用高级运动预测方法,称为“直接”运动补偿,进一步改善编码效率。

● 帧内编码直接空间预测:将编码图像边沿进行外推应用到当前帧内编码图像的预测。

● 循环去块效应滤波器:基于块的视频编码在图像中存在块效应,主要来源于预测和残余编码。自适应去块效应滤波技术是非常著名的技术,能有效消除块效应,改善视频的主观和客观质量。

2、除改善预测方法外,其他改善编码效率的特性如下:

● 小块变换:以前的标准变换的块都是8×8,H.264/AVC主要使用4×4块变换,使编码器表示信号局部适应性更好,更适合预测编码,减少“铃”效应。另外图像边界需要小块变换。

● 分级块变换:H.264/AVC通常使用小块变换,但有些信号包含足够的相关性,要求以大块表示,H.264/AVC有两种方式实现。低频色度信号可用8×8,;对帧内编码,可使用特别的编码类型,低频亮度信号可用16×16块。

● 短字长变换:所有以前标准使用的变换要求32位运算,H.264/AVC只使用16位运算。

● 完全匹配反变换:所有以前标准反变换和变换之间存在一定容限的误差,因此,每个解码器输出视频信号都不相同,产生小的漂移,最终影响图像的质量,H.264/AVC实现了完全匹配。

● 基于上下文的熵编码:H.264/AVC使用两种熵编码方法,CAVLC(上下文自适应的可变长编码)和CABAC(上下文自适应二进制算术编码),两种都是基于上下文的熵编码技术。

3、H.264/AVC具有强大的纠错功能和各种网络环境操作灵活性,主要特性如下:

● 参数集结构:H.264/AVC参数集结构设计了强大、有效的传输头部信息。在以前的标准中,如果少数几位关键信息丢失,可能解码器产生严重解码错误。H.264/AVC采用很灵活、特殊的方式,分开处理关键信息,能在各种环境下可靠传送。

● NAL单元语法结构:H.264/AVC中的每一个语法结构放置在称为NAL的单元中,以前的标准采用强制性特定的位流接口。NAL单元语法结构允许很自由的客户化,几乎适合所有的网络接口。

● 灵活的像条大小:在MPEG-2中,规定了严格的像条结构,头部数据量大,降低预测效率,编码效率低。在H.264/AVC可采用非常灵活的像条大小。

● 灵活宏块排序(FMO):H.264/AVC可以将图像划分为像条组,又称为图像区,每个像条可以独立解码。FMO通过管理图像区之间的关系,具有很强的抗数据丢失能力。

● 任意像条排序:因为每个像条几乎可以独立解码,所以像条可以按任意顺序发送和接收,在实时应用中,可以改善端到端的延时特性,特别适合于接收顺序和发送顺序不能对应的网络中,如使用INTERNET网络协议的应用。

● 冗余图像:为提高抗数据丢失的能力,H.264/AVC设计中包含一种新的能力,允许编码器发送图像区的冗余表示,当图像区的主表示丢失时仍可以正确解码。

● 数据划分:视频流中的编码信息的重要性不同,有些信息(如运动矢量、预测信息等)比其他信息更为重要。H.264/AVC可以根据每个像条语法元素的范畴,将像条语法划分为3部分,分开传送。

网络层

NAL规范视频数据的格式,主要是提供头部信息,以适合各种媒体的传输和存储。NAL 支持各种网络,包括:

● 任何使用RTP/IP协议的实时有线和无线Internet 服务。

● 作为MP4文件存储和多媒体信息文件服务。

● MPEG-2系统。

● 其他网。

1、NAL 单元

编码的视频流组织成NAL单元,视频数据放置在网络单元中传输,每个网络单元包含整数个字节,第一个字节是头部信息,指示NAL单元的数据类型,其余是净荷。

净荷数据与仿真预防字节做交织处理,仿真预防字节是特殊值字节,防止偶然在净荷中出现同步字节图样。

NAL规定一种通用的格式,既适合面向包传输,也适合流传送。实际上,包传输和流传输的方式是相同的,不同之处是流传输前面增加了一个起始码前缀。

2、NAL单元在字节流中的应用

类似H.320和MPEG-2/H.222.0等传输系统,传输NAL作为有序连续字节或比特流,同时要依靠数据本身识别NAL单元边界。在这样的应用系统中,H.264/AVC规范定义了字节流格式,每个NAL单元前面增加3个字节的前缀,即同步字节。在比特流应用中,每个图像需要增加一个附加字节作为边界定位。还有一种可选特性,在字节流中增加附加数据,用做扩充发送数据量,能实现快速边界定位,恢复同步。

3、NAL单元在面向包传送中的应用

在类似Internet/RTP面向包传送协议系统中,包结构中包含包边界识别字节,在这种情况下,不需要同步字节。

4、VCL和非VCL的NAL单元

NAL单元分为VCL和非VCL两种,VCL NAL单元包含视频图像采样信息,非VCL包含各种有关的附加信息,例如参数集(头部信息,应用到大量的VCL NAL单元)、提高性能的附加信息、定时信息等。

5、参数集

参数集是很少变化的信息,用于大量VCL NAL单元的解码,分为两种类型:

● 序列参数集,作用于一串连续的视频图像,即视频序列。

● 图像参数集,作用于视频序列中的一个或多个个别的图像。

序列和图像参数集机制,减少了重复参数的传送,每个VCL NAL单元包含一个标识,指向有关的图像参数集,每个图像参数集包含一个标识,指向有关的序列参数集的内容,因

此,只用少数的指针信息,引用大量的参数,大大减少每个VCL NAL单元重复传送的信息。

序列和图像参数集可以在发送VCL NAL单元以前发送,并且重复传送,大大提高纠错能力。序列和图像参数集可以在“带内”,也可以用更为可靠的其他“带外”通道传送。

6、存储单元

一组指定格式的NAL单元称为存储单元,每个存储单元对应一个图像。每个存储单元包含一组VCL NAL单元,组成一个主编码图像,VCL NAL单元由表示视频图像采样的像条所组成。存储单元前面可以加一个前缀,分界存储单元,附加增强信息(SEI)(如图像定时信息)也可以放在主编码图像的前面。

主编码图像后附加的VCL NAL单元,包含同一图像的冗余表示,称为冗余编码图像,当主编码图像数据丢失或损坏时,可用冗余编码图像解码。

7、编码视频序列

一个编码视频序列由一串连续的存储单元组成,使用同一序列参数集。每个视频序列可独立解码。编码序列的开始是即时刷新存储单元(IDR)。IDR是一个I帧图像,表示后面的图像不用参考以前的图像。一个NAL单元流可包含一个或更多的编码视频序列。

MPEG-4标准

运动图像专家组MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)标准第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成为国际标准。

MPEG-4与MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用(影音合成内容)、交互式多媒体(WWW、资料撷取与分散)等整合及压缩技术的需求而制定的国际标准。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具,从而建立起一种能被多媒体传输、存储、检索等应用领域普遍采用的统一数据格式。

MPEG-4的编码理念是:MPEG-4标准同以前标准的最显著的差别在于它是采用基于对象的编码理念,即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。这样既方便我们对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,并且这样也可以方便的实现对于各种对象的操作及编辑。例如,我们可以将一个卡通人物放在真实的场景中,或者将真人置于一个虚拟的演播室里,还可以在互联网上方便的实现交互,根据自己的需要有选择的组合各种视频音频以及图形文本对象。

MPEG-4系统的一般框架是:对自然或合成的视听内容的表示;对视听内容数据流的管理,如多点、同步、缓冲管理等;对灵活性的支持和对系统不同部分的配置。

与MPEG-1、MPEG-2相比,MPEG-4具有如下独特的优点:

(1)基于内容的交互性

MPEG-4提供了基于内容的多媒体数据访问工具,如索引、超级链接、上下载、删除等。利用这些工具,用户可以方便地从多媒体数据库中有选择地获取自己所需的与对象有关的内容,并提供了内容的操作和位流编辑功能,可应用于交互式家庭购物,淡入淡出的数字化效果等。MPEG-4提供了高效的自然或合成的多媒体数据编码方法。它可以把自然场景或对象

组合起来成为合成的多媒体数据。

(2)高效的压缩性

MPEG-4基于更高的编码效率。同已有的或即将形成的其它标准相比,在相同的比特率下,它基于更高的视觉听觉质量,这就使得在低带宽的信道上传送视频、音频成为可能。同时MPEG-4还能对同时发生的数据流进行编码。一个场景的多视角或多声道数据流可以高效、同步地合成为最终数据流。这可用于虚拟三维游戏、三维电影、飞行仿真练习等

(3)通用的访问性

MPEG-4提供了易出错环境的鲁棒性,来保证其在许多无线和有线网络以及存储介质中的应用,此外,MPEG-4还支持基于内容的的可分级性,即把内容、质量、复杂性分成许多小块来满足不同用户的不同需求,支持具有不同带宽,不同存储容量的传输信道和接收端。

这些特点无疑会加速多媒体应用的发展,从中受益的应用领域有:因特网多媒体应用;广播电视;交互式视频游戏;实时可视通信;交互式存储媒体应用;演播室技术及电视后期制作;采用面部动画技术的虚拟会议;多媒体邮件;移动通信条件下的多媒体应用;远程视频监控;通过ATM网络等进行的远程数据库业务等。MPEG-4主要应用如下:

(1)应用于因特网视音频广播

由于上网人数与日俱增,传统电视广播的观众逐渐减少,随之而来的便是广告收入的减少,所以现在的固定式电视广播最终将转向基于TCP/IP的因特网广播,观众的收看方式也由简单的遥控器选择频道转为网上视频点播。视频点播的概念不是先把节目下载到硬盘,然后再播放,而是流媒体视频(streaming video),点击即观看,边传输边播放。

现在因特网中播放视音频的有:Real Networks公司的Real Media,微软公司的Wind ows Media,苹果公司的QuickTime,它们定义的视音频格式互不兼容,有可能导致媒体流中难以控制的混乱,而MPEG-4为因特网视频应用提供了一系列的标准工具,使视音频码流具有规范一致性。因此在因特网播放视音频采用MPEG-4,应该说是一个安全的选择。

(2)应用于无线通信

MPEG-4高效的码率压缩,交互和分级特性尤其适合于在窄带移动网上实现多媒体通信,未来的手机将变成多媒体移动接收机,不仅可以打移动电视电话、移动上网,还可以移动接收多媒体广播和收看电视。

(3)应用于静止图像压缩

静止图像(图片)在因特网中大量使用,现在网上的图片压缩多采用JPEG技术。MPEG -4中的静止图像(纹理)压缩是基于小波变换的,在同样质量条件下,压缩后的文件大小约是JPEG压缩文件的十分之一。把因特网上使用的JPEG图片转换成MPEG-4格式,可以大幅度提高图片在网络中的传输速度。

(4)应用于电视电话

传统用于窄带电视电话业务的压缩编码标准,如H261,采用帧内压缩、帧间压缩、减少象素和抽帧等办法来降低码率,但编码效率和图像质量都难以令人满意。MPEG-4的压缩编码可以做到以极低码率传送质量可以接受的声像信号,使电视电话业务可以在窄带的公用电话网上实现。

(5)应用于计算机图形、动画与仿真

MPEG-4特殊的编码方式和强大的交互能力,使得基于MPEG-4的计算机图形和动画可以从各种来源的多媒体数据库中获取素材,并实时组合出所需要的结果。因而未来的计算机图形可以在MPEG-4语法所允许的范围内向所希望的方向无限发展,产生出今天无法想象的动画及仿真效果。

(6)应用于电子游戏

MPEG-4可以进行自然图像与声音同人工合成的图像与声音的混合编码,在编码方式上具有前所未有的灵活性,并且能及时从各种来源的多媒体数据库中调用素材。这可以在将来产生象电影一样的电子游戏,实现极高自由度的交互式操作。

结束语既然信源编码的基本目的是提高码字序列中码元的平均信息量,那么,一切旨在减少剩余度而对信源输出符号序列所施行的变换或处理,都可以在这种意义下归入信源编码的范畴,例如过滤、预测、域变换和数据压缩等。当然,这些都是广义的信源编码。

参考文献

[1] 傅祖芸.《信息论基础》.北京:电子工业出版社,1989

[2] 孙丽华,陈荣伶.《信息论与纠错编码》(第2 版)电子工业出版社2009

[3] 李梅,李亦农《信息论基础教程》(第 2 版)北京邮电大学2008

[4]肖嵩,张方,吴成柯《基于小波SPIHT 的联合信源信道编码新方法》.计算机学报,2003

[5] 池秀清,《信源编码与信道编码.》科技情报开发与经济. 2001年第11卷第6期.

信源信道编码

青岛农业大学 本科生课程论文 论文题目联合信源信道编码的原理及其在通信中的应用学生专业班级信息与计算科学09级1班 学生姓名(学号)董晨晨(20093991) 指导教师吴慧 完成时间 2012年6月27日 2012 年 6 月 27 日

课程论文任务书 学生姓名董晨晨指导教师吴慧 论文题目联合信源信道编码的原理及其在通信中的应用 论文内容(需明确列出研究的问题):由于通信的根本目的是将消息有效而可靠地从信源传到信宿,信源编码的目的在于提高系统的有效性,信道编码理论核心是提高系统的可靠性,因此在编码时应在一定的传信率条件下,通过有规律的增加冗余度保证信息以尽可能小的差错概率从信源传到信宿,并且充分利用系统资源。基于这种情况下,提出了信源信道联合编码,可以跟随信道的变化充分利用通信系统的资源,达到最好的端对端的通信效果。本文主要研究了以下几个方面的问题:(1)信源信道联合编码的原理;(2)信源信道联合编码的研究方向;(3)信源信道联合编码的关键技术;(4)联合编码在通信系统方面的应用。 资料、数据、技术水平等方面的要求:通过书籍报刊杂志、网络等各种渠道广泛搜集资料,充分利用现有文献,借鉴他人的学术成果,做到了资料翔实,数据准确,引用规范,论证充分。论文符合一般学术论文的写作规范,具备学术性、科学性和一定的创造性。文字流畅、语言准确、要点清楚,有独立的观点和见解。内容理论联系实际,计算数据准确,涉及到他人的观点、统计数据或计算公式标明出处,结论写的概括简短。 发出任务书日期2012.6.20完成论文日期2012.6.27 教研室意见(签字) 院长意见(签字)

课程论文成绩评定表

信源编码的基本原理及其应用..

信源编码的基本原理及其应用 课程名称通信原理Ⅱ 专业通信工程 班级******* 学号****** 学生姓名***** 论文成绩 指导教师***** ******

信源编码的基本原理及其应用 信息论的理论定义是由当代伟大的数学家美国贝尔实验室杰出的科学家香农在他1948 年的著名论文《通信的数学理论》所定义的,它为信息论奠定了理论基础。后来其他科学家,如哈特莱、维纳、朗格等人又对信息理论作出了更加深入的探讨。使得信息论到现在形成了一套比较完整的理论体系。 信息通过信道传输到信宿的过程即为通信,通信中的基本问题是如何快速、准确地传送信息。要做到既不失真又快速地通信,需要解决两个问题:一是不失真或允许一定的失真条件下,如何提高信息传输速度(如何用尽可能少的符号来传送信源信息);二是在信道受到干扰的情况下,如何增加信号的抗干扰能力,同时又使得信息传输率最大(如何尽可能地提高信息传输的可靠性)。这样就对信源的编码有了要求,如何通过对信源的编码来实现呢? 通常对于一个数字通信系统而言,信源编码位于从信源到信宿的整个传输链路中的第一个环节,其基本目地就是压缩信源产生的冗余信息,降低传递这些不必要的信息的开销,从而提高整个传输链路的有效性。在这个过程中,对冗余信息的界定和处理是信源编码的核心问题,那么首先需要对这些冗余信息的来源进行分析,接下来才能够根据这些冗余信息的不同特点设计和采取相应的压缩处理技术进行高效的信源编码。简言之,信息的冗余来自两个主要的方面:首先是信源的相关性和记忆性。这类降低信源相关性和记忆性编码的典型例子有预测编码、变换编码等;其次是信宿对信源失真具有一定的容忍程度。这类编码的直接应用有很大一部分是在对模拟信源的量化上,或连续信源的限失真编码。可以把信源编码看成是在有效性和传递性的信息完整性(质量)之间的一种折中有段。 信源编码的基本原理: 信息论的创始人香农将信源输出的平均信息量定义为单消息(符号)离散信源的信息熵: 香农称信源输出的一个符号所含的平均信息量为 为信源的信息熵。 通信原理中对信源研究的内容包括3个方面: (1)信源的建模 信源输出信号的数学描述已有成熟的理论——随机过程,一般的随机过程理∑=-=L i i i x p x p x H 12) (log )()()(x H

数字通信中的信源编码和信道编码.(优选)

数字通信中的信源编码和信道编码 摘要:如今社会已经步入信息时代,在各种信息技术中,信息的传输及通信起着支撑作用。而对于信息的传输,数字通信已经成为重要的手段。本论文根据当今现代通信技术的发展,对信源编码和信道编码进行了概述性的介绍. 关键词:数字通信;通信系统;信源编码;信道编码 Abstract:Now it is an information society. In the all of information technologies, transmission and communication of information take an important effect. For the transmission of information, Digital communication has been an important means. In this thesis we will present an overview of source coding and channel coding depending on the development of today’s communica tion technologies. Key Words:digital communication; communication system; source coding; channel coding 1.前言 通常所谓的“编码”包括信源编码和信道编码。编码是数字通信的必要手段。使用数字信号进行传输有许多优点, 如不易受噪声干扰, 容易进行各种复杂处理, 便于存贮, 易集成化等。编码的目的就是为了优化通信系统。一般通信系统的性能指标主要是有效性和可靠性。所谓优化,就是使这些指标达到最佳。除了经济性外,这些指标正是信息论研究的对象。按照不同的编码目的,编码可主要分为信源编码和信道编码。在本文中对此做一个简单的介绍。 2.数字通信系统 通信的任务是由一整套技术设备和传输媒介所构成的总体——通信系统来完成的。电子通信根据信道上传输信号的种类可分为模拟通信和数字通信。最简单的数字通信系统模型由信源、信道和信宿三个基本部分组成。实际的数字通信系统模型要比简单的数字通信系统模型复杂得多。数字通信系统设备多种多样,综合各种数字通信系统,其构成如图2-l所示。 图2-1 数字通信系统模型 信源编码是以提高通信有效性为目的的编码。通常通过压缩信源的冗余度来实现。采用的一般方法是压缩每个信源符号的平均比特数或信源的码率。 信道,通俗地说是指以传输媒质为基础的信号通路。具体地说,信道是指由有线或无线电线路提供的信号通路。信道的作用是传输信号,它提供一段频带让信号通过,同时又给信号加以限制和损害。 信道编码是以提高信息传输的可靠性为目的的编码。通常通过增加信源的冗余度来实现。采用的一般方法是增大码率或带宽。与信源编码正好相反。在计算机科学领域,信道编

基于Huffman信源编码和LDPC信道编码的联合译码算法

Joint Source-Channel Decoding of Huffman Codes with LDPC Codes Zhonghui Mei and Lenan Wu Abstract In this paper, we present a joint source-channel decoding algorithm (JSCD) for LDPC codes by exploiting the redundancy of the Huffman coded sources.When the number of Huffman codes increases, just a moderate complexity is added for our algorithm by increasing the size of the lookup table, which is used to estimate the information bit probability based on the source redundancy. Key words - LDPC, Variable length codes (VLC), Huffman code, sum-product algorithm (SPA), joint source-channel decoding (JSCD) I. INTRODUCTION Recently in [1]-[4] several joint source-channel decoding algorithms for variable length codes (VLC) have been proposed. All of these algorithms consider the overall sequence of variable length codeword to exploit the source redundancy. The drawback is that the symbols have to be synchronized in order to limit error propagating. Furthermore, when the number of VLC increases, the decoding complexity of these algorithms explodes. In this paper we present a JSCD algorithm for LDPC codes in combination with Huffman coded sources. The error correcting property of our JSCD algorithm mainly depends on channel codes rather than source redundancy. In order to exploit the source redundancy, we estimate the information bit probability with just some corresponding bits before it, which simplifies the decoding algorithm significantly. The rest of the paper is organized as follows. Section II presents the Huffman coded source model. The JSCD algorithm for LDPC codes is described in section III. Section IV provides the simulation results. Section V concludes this paper. II. HUFFNAN CODED SOURCE MODEL Let denotes a sequence of information bits coded by VLC (e.g. a Huffman code). In [1], [3] and [4], they consider the overall sequence and express the source redundancy with . In order to compute , [3] and [4] design a trellis to illustrate statistics of the source sequence. When the number of the trellis states increases, the computational complexity of will rise explosively. ],......,,,[321n s s s s S =),......,,,()(21n s s s s p S p =)(S p )(S p In this paper, we make use of the source redundancy with , as is illustrated in Fig.1 and table 1. k is chose to be larger than the maximum length of Huffman codes. When the number of VLC increases, we only need to expand the lookup table. In addition, for we just estimate one bit probability with a small part bit of the information sequence every time, the error propagation phenomenon has been avoided successfully. ]),......,,[|(11?+??i k i k i i s s s s p

信源编码的基本原理及其应用讲课稿

信源编码的基本原理 及其应用

信源编码的基本原理及其应用 课程名称通信原理Ⅱ 专业通信工程 班级 ******* 学号 ****** 学生姓名 ***** 论文成绩 指导教师 ***** ******

信源编码的基本原理及其应用 信息论的理论定义是由当代伟大的数学家美国贝尔实验室杰出的科学家香农在他1948 年的著名论文《通信的数学理论》所定义的,它为信息论奠定了理论基础。后来其他科学家,如哈特莱、维纳、朗格等人又对信息理论作出了更加深入的探讨。使得信息论到现在形成了一套比较完整的理论体系。 信息通过信道传输到信宿的过程即为通信,通信中的基本问题是如何快速、准确地传送信息。要做到既不失真又快速地通信,需要解决两个问题:一是不失真或允许一定的失真条件下,如何提高信息传输速度(如何用尽可能少的符号来传送信源信息);二是在信道受到干扰的情况下,如何增加信号的抗干扰能力,同时又使得信息传输率最大(如何尽可能地提高信息传输的可靠性)。这样就对信源的编码有了要求,如何通过对信源的编码来实现呢? 通常对于一个数字通信系统而言,信源编码位于从信源到信宿的整个传输链路中的第一个环节,其基本目地就是压缩信源产生的冗余信息,降低传递这些不必要的信息的开销,从而提高整个传输链路的有效性。在这个过程中,对冗余信息的界定和处理是信源编码的核心问题,那么首先需要对这些冗余信息的来源进行分析,接下来才能够根据这些冗余信息的不同特点设计和采取相应的压缩处理技术进行高效的信源编码。简言之,信息的冗余来自两个主要的方面:首先是信源的相关性和记忆性。这类降低信源相关性和记忆性编码的典型例子有预测编码、变换编码等;其次是信宿对信源失真具有一定的容忍程度。这类编码的直接应用有很大一部分是在对模拟信源的量化上,或连续信源的限失真编码。可以把信源编码看成是在有效性和传递性的信息完整性(质量)之间的一种折中有段。 信源编码的基本原理: 信息论的创始人香农将信源输出的平均信息量定义为单消息(符号)离散信源的信息熵: 香农称信源输出的一个符号所含的平均信息量为 为信源的信息熵。 通信原理中对信源研究的内容包括3个方面: ∑=-=L i i i x p x p x H 12) (log )()() (x H

信源编码与信道编码解析

信源编码与信道编码解析 摘要:衡量一个通信系统性能优劣的基本因素是有效性和可靠性,有效性是指信道传输信息的速度快慢,可靠性是指信道传输信息的准确程度。在数字通信系统中,信源编码是为了提高有效性,信道编码是为了提高可靠性,而在一个通信系统中,有效性和可靠性是互相矛盾的,也是可以互换的。我们可以用降低有效性的办法提高可靠性,也可以用用降低可靠性的办法提高有效性。本文对信源编码和信道编码的概念,作用,编码方式和类型进行了解析,以便于更好的理解数字通信系统的各个环节。 关键字:信源编码信道编码 Abstract: the measure of a communication system the basic factor is quality performance efficiency and reliability, effectiveness refers to channel to transfer information machine speed, reliability is to point to the accuracy of the information transmission channel. In digital communication system, the source coding is in order to improve the effectiveness, channel coding is in order to improve the reliability, and in a communication system, effectiveness and reliability is contradictory, is also can be interchanged. We can use to reduce the availability of improving the reliability, also can use to improve the effectiveness of reduces reliability. In this paper, the source coding and channel coding concept, function, coding mode and the types of analysis, in order to better understand all aspects of digital communication systems. Key words: the source coding channel coding 中图分类号:TN911.21 文献标识码:A 文章编号: 1引言 数字通信系统: 信源是把消息转化成电信号的设备,例如话筒、键盘、磁带等。 信源编码的基本部分是压缩编码。它用于减小数字信号的冗余度,提高数字信号的有效性,如果是模拟信源,则它还包括数模转换功能,在某些系统中,信源编码还包括加密功能。

以香农编码为信源编码、(7,4)循环码为信道编码的2FSK信号的调制解调

目录 1 课程设计目的 (1) 2 课程设计正文 (1) 2.1 调制原理 (1) 2.2 解调原理 (3) 2.3 程序分析 (3) 3 课程设计总结 (9) 4 参考文献 (9)

1 课程设计目的 通过我们对这次CDIO 二级项目的学习和理解,综合运用课本中所学到的理论知识完成一个以香农编码为信源编码、(7,4)循环码为信道编码的2FSK 信号调制解调的课程设计。以及锻炼我们查阅资料、方案比较、团结合作的能力。学会了运用MA TLAB 编程来实现2FSK 调制解调过程,并且输出其调制及解调过程中的波形,并且讨论了其调制和解调效果,增强了我们的动手能力,为以后学习和工作打下了基础。 2 课程设计正文 本次课程设计我们所做的课题是一个以香农编码为信源编码、(7,4)循环码为信道编码的2FSK 信号调制解调的CDIO 项目,这就要求我们需要完成信源编码、信道编码、信号的调制解调以及误码率分析等问题。 图1 数字通信系统模型 数字信号的传输方式分为基带传输和带通传输,在实际应用中,大多数信道具有带通特性而不能直接传输基带信号。为了使数字信号在带通信道中传输,必须使用数字基带信号对载波进行调制,以使信号与信道的特性相匹配。这种用数字基带信号控制载波,把数字基带信号变换为数字带通信号的过程称为数字调制。 2.1 调制原理 用基带信号)(t f 对高频载波的瞬时频率进行控制的调制方式叫做调频,在数字调制系统中则称为频移键控(FSK)。频移键控在数字通信中是使用较早的一种调制方式,这种方式实现起来比较容易,抗干扰和抗衰落的性能也较强。其缺点是占用频带较宽,频带利用串不够高,因此,额移键控主要应用于低、中速数据的传输,以及衰落信道与频带较宽

信源编码(数据压缩)课程课后题与答案(第二章)

信源编码 Assignment of CH2 1、(a)画出一般通信系统结构的组成框图,并详细说明各部分的作用或功能; 信源信源编码信道编码调制 噪声信道传输 , 信宿信源解码信道解码解调 图1、一般数字通信系统框图 各部分功能: 1、信源和信宿:信源的作用是把消息转换成原始的电信号;信宿的作用是 把复原的电信号转换成相应的消息。 . 2、信源编码和信源解码:一是进行模/数转换,二是进行数据压缩,即设法降低信号的数码率;信源解码是信源编码的逆过程。 3、信道编码和信道解码:用于提高信道可靠性、减小噪声对信号传输的影响;信道解码是信道编码的反变换。 4、调制和解调:将信息调制为携带信息、适应在信道中传输的信号。数字 " 解调是数字调制的逆变换。 5、信道:通信的通道,是信号传输的媒介。 (b)画出一般接收机和发射机的组成框图,并分别说明信源编解码器和信道编 解码器的作用; … 高频振荡器高频放大调制高频功放天线

" 音频功放 信 号 图2、一般发射机框图(无线广播调幅发射机为例)

天线 信号放大器混频器解调器音频放大器 信 号 本地振荡器 图3、一般接收机框图(无线广播调幅发射机为例) 信源编解码器作用:它通过对信源的压缩、扰乱、加密等一系列处理,力求 用最少的数码最安全地传输最大的信息量。信源编解码主要解决传输的有效性问题。 信道编解码器作用:使数字信息在传输过程中不出错或少出错,而且做到自 动检错和尽量纠错。信道编解码主要解决传输的可靠性问题。 (c)信源编码器和解码器一般由几部分组成,画出其组成图并给以解释。 信源编码器 时频分析量化熵编码 信道传输 时频分析反量化熵解码 信源解码器 图 4、信源编解码器框图 时频分析部分:信源编码器对信源传送来的信号进行一定方法的时域频域分析,建立一个能够表达信号规律性的数学模型,从而得知信号中的相关性和多余度,分析出信号数据中可以剔除或减少的部分(比如人感知不到的高频率音频信号或者看不见的色彩信号等等),以决定对后续数据的比特分配、编码速率等处理问题。 量化部分:根据时频分析的结果,为了更加简洁地表达利用该模型的参数, 减少精度,采取相应量化方法对信号进行量化,减小信号的多余度和不相关性,

《信息论与信源编码》实验报告

《信息论与信源编码》实验报告 1、实验目的 (1) 理解信源编码的基本原理; (2) 熟练掌握Huffman编码的方法; (3) 理解无失真信源编码和限失真编码方法在实际图像信源编码应用中的差异。 2、实验设备与软件 (1) PC计算机系统 (2) VC++6.0语言编程环境 (3) 基于VC++6.0的图像处理实验基本程序框架imageprocessing_S (4) 常用图像浏览编辑软件Acdsee和数据压缩软件winrar。 (5) 实验所需要的bmp格式图像(灰度图象若干幅) 3、实验内容与步骤 (1) 针对“图像1.bmp”、“图像2.bmp”和“图像3.bmp”进行灰度频率统计(即计算图像灰度直方图),在此基础上添加函数代码构造Huffman码表,针对图像数据进行Huffman编码,观察和分析不同图像信源的编码效率和压缩比。 (2) 利用图像处理软件Acdsee将“图像1.bmp”、“图像2.bmp”和“图像 3.bmp”转换为质量因子为10、50、90的JPG格式图像(共生成9幅JPG图像),比较图像格式转换前后数据量的差异,比较不同品质因素对图像质量的影响; (3) 数据压缩软件winrar将“图像1.bmp”、“图像2.bmp”和“图像3.bmp”分别生成压缩包文件,观察和分析压缩前后数据量的差异; (4) 针对任意一幅图像,比较原始BMP图像数据量、Huffman编码后的数据量(不含码表)、品质因素分别为10、50、90时的JPG文件数据量和rar压缩包的数据量,分析不同编码方案下图像数据量变化的原因。 4、实验结果及分析 (1)在VC环境下,添加代码构造Huffman编码表,对比试验结果如下: a.图像1.bmp:

信源编码和信源解码

信源编码和信源解码 字、符号、图形、图像、音频、视频、动画等各种数据本身的编码通常称为信源编码,信源编码标准是信息领域的基础性标准。无论是数字电视、激光视盘机,还是多媒体通信和各种视听消费电子产品,都需要音视频信源编码这个基础性标准。 大家用电脑打字一定很熟悉,当你用WORD编辑软件把文章(DOC文件)写完,存好盘后,再用PCTOOLS工具软件把你的DOC文件打开,你一定能看到你想象不到的东西,内容全是一些16进制的数字,这些数字叫代码,它与文章中的字符一一对应。现在我们换一种方法,用小画板软件来写同样内容的文章。你又会发现,用小画板软件写出来的BMP文件,占的内存(文件容量)是DOC文件的好几十倍,你知道这是为什么?原来WORD编辑软件使用的是字库和代码技术,而小画板软件使用的是点阵技术,即文字是由一些与坐标位置决定的点来组成,没有使用字库,因此,两者在工作效率上相差几十倍。[信源]->[信源编码]->[信道编码]->[信道传输+噪声]->[信道解码]->[信源解码]->[信宿] 目前模拟信号电视机图像信号处理技术就很类似小画板软件使用的点阵技术,而全数字电视机的图像信号处理技术就很类似WORD编辑软件使用的字库和代码技术。实际上这种代码传输技术在图文电视中很早就已用过,在图文电视机中一般都安装有一个带有图文字库的译码器,对方发送图文信号的时候只需发送图文代码信息,这样可以大大地提高数据传输效率。 对于电视机,显示内容是活动图像信息,它哪来的“字库”或“图库”呢?这个就是电视图像特有的“相关性”技术问题。原来在电视图像信号中,90%以上的图像信息是互相相关的,我们在模拟电视机中使用的Y/C(亮度信号/彩色信号)分离技术,就是利用两行图像信号的相关性,来进行Y/C分离。如果它们之间内容不相关,Y/C信号则无法进行分离。全数字信号电视也一样,如果图像内容不相关,则图像信号压缩也就要免谈。如果图像内容有相关性,那么上一幅图像的内容就相当于下一幅图像的“图形库”,或一幅图像中的某部分就是另一部分的“图形库”,因此,下一幅图像或图像中某一个与另一个相关的部分,在发送信号时,只需发送一个“代码”,而传送一个“代码”要比送一个“图形库”效率高很多,显示时也只需把内容从“图形库”中取出即可,这就是MPEG图像压缩的原理。 利用电视信号的相关性,可以进行图像信号压缩,这个原理大家已经明白,但要找出图像相关性的内容来,那就不是一件很容易的事情,这个技术真的是太复杂了。为了容易理解电视图像的相关性,我们不妨设想做一些试验,把图像平均分成几大块,然后每一块,每一块的进行比较,如果有相同的,我们就定义它们有相关性;如果没有相同的,我们继续细分下去,把每大块又分成几小块,一直比较下去,最后会发现,块分得越细,相同块的数目就越多,但分得太细需要的代码也增多,所以并不是分得越细越好。我们在看VCD的时候经常发现,如果VCD读光盘数据出错,就会在图像中看到“马赛克”,这些“马赛克”就是图像分区时的最小单位,或把数码相片进行放大,也可以看到类似“马赛克”的小区,这就是数码图像的最小“图形库”,每个小“图形库”都要对应一个“代码”。 在单幅图像中找出相关性的几率并不是很大的,所以对单幅图像的压缩率并不很大,这个通过观察数码相片的容量就很容易明白,如果把寻找相关性的范围扩大到两幅图像,你就会发现,具有相关性的内容太多了,这是因为运动物体对于人的眼睛感觉器官来说,是很慢

第10讲 信源编码的性能指标

第10讲 信源编码的性能指标 1. 无失真信源编码的冗余度压缩原理 为了压缩冗余度,必须改造信源输出符号的统计特性。一方面要尽量提高任一时刻输出符号的概率分布的均匀性,另一方面要尽量消除前后输出符号的统计相关性。因此,无失真信源编码的实质是将信源尽可能地改造为均匀分布的无记忆信源。这种信源的通信效率是最大的。改造后的新信源是由原信源和编码器共同组成的,称为编码后的信源。设f 是信源S 的一个编码,X 是编码后的信源,则三者之间的关系表示如下 f S X ??→ 信源编码f 所用的码元可以与信源S 的符号不同,一般是某个信道的输入符号。 从数据处理这个角度来看,编码f 是一个数据处理器,输入信源S 的数据,输出信源X 的数据。从通信的角度看,编码f 是一个信道,输入信源S 的数据,输出信源X 的数据。 无失真信源编码的目的是无损压缩,即用尽可能少的数据表示数据中的所有信息,不能破坏数据原有信息。这相当于提高信息传输效率,使之接近于1。因此,度量无失真编码的压缩性能可以看编码后信息传输效率,称为编码效率。编码效率越接近于1,无损压缩性能越好。下面介绍信源编码的5个性能指标,包括平均码长、码率、编码效率、编码冗余度和压缩率。 2. 平均码长 平均码长是信源编码的一个关键的性能指标。在已知信源熵的前提下,根据平均码长,可以计算出无损压缩编码的码率和编码效率。 定义2.1 设f 是一个N-分组码,各码字的码长分别记为,1i l i q ≤≤,对应的N 长分组的概率为i p ,则f 的平均码长定义为 11(/ q i i i L p l N ==∑码元信源) 注:在有的教材中,当平均码长的单位转化为“比特/信源”时,称为编码速率。本课程用不到这个概念。 讨论:用平均码长估计编码后的数据长度 设S 是一个离散无记忆信源,:f S C →是信源S 的一个编码,其平均码长为L 。令12n s s s s =?是一个信源序列。假设用f 对该数据进行编码,试估计编码后码元序列的长度。 对于信源数据12n s s s s =?,我们令L i 表示信源符号s i 所对应的码字f (s i )的长度,则编码后的数据长度为12+++n L L L 。我们把L i 视为随机变量,则对于任何i ,我们有[]i E L L =。 因为S 是离散无记忆的,所以{L i }是独立同分布随机序列。根据辛钦大数定理,我们有

WCDMA技术的信源编码和信道编码

WCDMA技术的信源编码和信道编码 WCDMA网络是全球商用时间最长,技术成熟、可演进性最好的,全球第一个3G商用网络就是采用WCDMA制式。我国采用了全球广泛应用的WCDMA 3G技术,目前已全面支持HSDPA/HSUPA,网络下载理论最高速率达到14.4Mbps。2G无线宽带的最高下载速度约为150Kbps,我国的WCDMA网络速度几乎是2G网络速度的100倍。支持业务最广泛,基于WCDMA成熟的网络和业务支撑平台,其所能实现的3G业务非常丰富。无线上网卡、手机上网、手机音乐、手机电视、手机搜索、可视电话、即时通讯、手机邮箱、手机报等业务应用可为用户的工作、生活带来更多的便利和美妙享受。终端种类最多,截至2008年底,支持WCDMA商用终端的款式数量超过2000款,全球主要手机厂商都推出了为数众多的WCDMA手机。国内覆盖广泛,截至2009年9月28日,联通3G网络已成功在中国大陆285个地市完成覆盖并正式商用,新覆盖的城镇数量还在不断增长中,联通3G网络和业务已经覆盖了中国绝大部分的人口和地域。开通国家最广,可漫游的国家和地区最多,截至2008年底,全球已有115个国家开通了264个WCDMA网络,占全球3G商用网络的71.3%。截至2009年9月28日,中国联通已与全球215个国家的395个运营商开通了。 WCDMA的优势明显,技术成熟,在WCDMA物理层来看,信源编码和信道编码是WCDMA技术的基础,信源编码是采用语音编码技术,AMR语音编码技术是由基于变速率多模式语音编码技术发展而来,主要原理在于:语音编码器模型由一系列能提供多种编码输出速率与合成质量的声码器构成AMR支持八种速率。鉴于不同信源比特对合成语音质量的影响不同AMR 语音编码器输出的话音比特在传输之前需要按照它们的主观重要性来排序分类,分别采用不同保护程度的信道编码对其进行编码保护。 信源编码AMR模式自适应选择编码器模式以更加智能的方式解决信源和信道编码的速率匹配问题,使得无线资源的配置和利用更加灵活和高效。实际的语音编码速率取决于信道条件,它是信道质量的函数。而这部分工作是解码器根据信道质量的测量参数协助基站来完成,选择编码模式,决定编码速率。原则上在信道质量差时采用低速率编码器,就能分配给信道编码更多的比特冗余位来实现纠错,实现更可靠的差错控制。在信道质量好、误比特率较低时采用高速率编码器,能够提高语音质量。在自适应过程中,基站是主要部分,决定上下行链路采用的速率模式。 信源编码AMR编码器原理,WCDMA系统的AMR声码器共有八种编码模式,它们的输出比特速率不同。为了降低成本和复杂度,八种模式都采用代数码本激励线性预测技术,它们编码的语音特征参量和参量提取方法相同,不同的是参量的量化码本和量化比特数。AMR语音编码器根据实现功能大致可分为LPC分析、基音搜索、代数码本搜索三大部分。其中LPC分析完成的主要功能是获得10阶LPC滤波器的-.个系数,并将它们转化为线谱对参数,并对LSF进行量化;基音搜索包括了开环基音分析和闭环基音分析两部分,以获得基音延迟和基音增益这两个参数;代数码本搜索则是为了获得代数码本索引和代数码本增益,还包括了码本增益的量化。

数据压缩与信源编码第四章

第四章 1、详细解释下面概念:(a)绝对掩蔽门限;(b)临界频带;(c)听觉门限;(d)掩蔽效应。(a)绝对掩蔽门限:被掩蔽音单独存在时的听阈分贝值,或者说在安静环境中能被人耳听到的纯 音的最小值称为绝对掩蔽门限。 (b)临界频带:当噪声掩蔽纯音时,起作用的是以纯音频率为中心频率的一定频带宽度内的噪声 频率。如这频带内的噪声功率等于在噪声中刚能听到的该纯音的功率,则这频带就称为听觉临界 频带。 (c)听觉门限:刚刚能引起感觉的最小刺激量,称为感觉阈下限;能产生正常感觉的最大刺激量 ,称为感觉阈上限。刺激强度不允许超过上限,否则,不但无效而且还会引起相应听觉器官的损 伤。 (d)掩蔽效应:一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象 称为人耳的“掩蔽效应”。 2、详细说明:(a)什么是心理声学模型,它的输入和输出分别是什么? 心理声学模型是对人听感的统计性质的数学表述模型,它解释人各种听感的生理原理。输入是声 音信号,输出是编码数据流。 (b)心理声学模型在音频编码中的作用? 心理声学原理应用到音频压缩技术中,使获得低比特传输速率和透明音质成为可能。 3、(a)MPEG-1音频编码分几层,各层在编码效率、算法复杂度和算法延迟上有和区别?三层,MPEG-1 Layer1采用每声道192kbit/s,每帧384个样本,32个等宽子带,固定分割数据块。 MPEG-1 Layer2采用每声道128kbit/s,每帧1152个样本,32个子带,属不同分帧方式。MPEG-1 Layer3采用每声道64kbit/s,用混合滤波器组提高频率分辨率,按信号分辨率分成6X32或18X32个

数据压缩与信源编码第五章

第五章 1、(a)人类视觉特性中空间频率灵敏度、对比度灵敏度和色彩灵敏度分别表示什么意思?答:空间:从空间频率域来看,人眼是一个低通型线性系统,分辨景物的能力是有限的。由于瞳孔有一定的几何尺寸和一定的光学像差,视觉细胞有一定的大小,所以人眼的分辨率不可能是无穷的,HVS对太高的频率不敏感。对比度:它是相对于亮度变化的一种量度,一般来讲它与激励信号的相对亮度幅度成正比,它与激励的颜色、空间频率和时间频率有关。色彩:这是人类的一中明视觉,基本参数有色调。亮度和饱和度。 (b)JPEG编码算法是如何利用这些灵敏度特性的? 答:JPEG压缩编码算法的主要计算步骤如下:用正向离散余弦变换(FDCT)把空间域图变成频率域图;用加权函数对DCT系数量化,以使人的视觉系统最佳,Z字形扫描(zigzag scan);用差分脉冲编码调制(DPCM)对直流系数(DC)编码;用行程长度编码(RLE)对交流系数(AC)编码;熵编码:使用霍夫曼可变字长编码器进行编码;组成位数据流,以形成帧图像 2、(a)图像编码算法常用的知名算法有那些? 答:行程编码压缩算法、哈夫曼编码压缩算法、LZW压缩算法及离散余弦变换 (b)图像编码算法的关键技术有那些? 答: (c)为什么图像可以进行压缩? 答:数字图像如果不进行压缩,数据量是比较大的,这无疑对图像的存储、处理、传送带来很大的困难。事实上,在图像像素之间,无论在行方向还是列方向,都存在一定的相关性。也就是说,在一般图像中都存在很大的相关性,即冗余度。静态图像数据的冗余包括:空间冗余、时间冗余、结构冗余、知识冗余和视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。图像压缩编码技术就是利用图像数据固有的冗余性和相干性,将一个大的图像数据文件转换为较小的同性质的文件。根据压缩后文件能否准确恢复原文件,将图像压缩编码技术分为无失真编码技术和有失真编码技术。 (d)就现有图像压缩技术而言,压缩比多大时仍然可以保持良好的图像质量? 答:5:1 3、(a)画出JPEG图像编解码算法的框图,并详细解释其算法; 答:图片共享到群里 详解:1)整个文件的大体结构JFIF格式的JPEG文件(*.jpg)的一般顺序为:SOI(0xFFD8) APP0(0xFFE0) [APPn(0xFFEn)]可选DQT(0xFFDB) SOF0(0xFFC0) DHT(0xFFC4) SOS(0xFFDA) 压缩数据EOI(0xFFD9) 2)字的高低位问题JPEG文件格式中,一个字(16位)的存储使用的是Motorola 格式, 而不是Intel 格式。也就是说, 一个字的高字节(高8位)在数据流的前面, 低字节(低8位)在数据流的后面,与平时习惯的Intel格式不一样。. 3)读出哈夫曼表数据a)理论说明在标记段DHT内,包含了一个或者多个的哈夫曼表。对于单一个哈夫曼表,应该包括了三部分:1哈夫曼表ID和表类型这个字节的值为一般只有四个0x00、0x01、0x10、0x11。0x00表示DC直流0号表;0x01表示DC直流1号表;0x10表示AC交流0号表;0x11表示AC交流1号表。2不同位数的码字数量,JPEG文件的哈夫曼编码只能是1~16位。这个字段的16个字节分别表示1~16位的编码码字在哈夫曼树中的个数。3编码内容这个字段记录了哈夫曼树中各个叶子结点

第五章 信源编码(第十讲)

第五章 信源编码(第十讲) (2课时) 主要内容:(1)编码的定义(2)无失真信源编码 重点:定长编码定理、变长编码定理、最佳变长编码。 难点:定长编码定理、哈夫曼编码方法。 作业:5。2,5。4,5。6; 说明:本堂课推导内容较多,枯燥平淡,不易激发学生兴趣,要注意多讨论用途。另外,注意,解题方法。多加一些内容丰富知识和理解。 通信的实质是信息的传输。而高速度、高质量地传送信息是信息传输的基本问题。将信源信息通过信道传送给信宿,怎样才能做到尽可能不失真而又快速呢?这就需要解决两个问题:第一,在不失真或允许一定失真的条件下,如何用尽可能少的符号来传送信源信息;第二,在信道受干扰的情况下,如何增加信号的抗干扰能力,同时又使得信息传输率最大。为了解决这两个问题,就要引入信源编码和信道编码。 一般来说,提高抗干扰能力(降低失真或错误概率)往往是以降低信息传输率为代价的;反之,要提高信息传输率常常又会使抗干扰能力减弱。二者是有矛盾的。然而在信息论的编码定理中,已从理论上证明,至少存在某种最佳的编码或信息处理方法,能够解决上述矛盾,做到既可靠又有效地传输信息。这些结论对各种通信系统的设计和估价具有重大的理论指导意义。 §3.1 编码的定义 编码实质上是对信源的原始符号按一定的数学规则进行的一种变换。 讨论无失真信源编码,可以不考虑干扰问题,所以它的数学描述比较简单。图 3.1是一个信源编码器,它的输入是信源符号},,,{21q s s s S =,同时存在另一符号 },,,{21r x x x X =,一般来说,元素小姐xj 是适合信道传输的,称为码符号(或者码元)。 编码器的功能就是将信源符号集中的符号s i (或者长为N 的信源符号序列)变换成由x j (j=1,2,3,…r)组成的长度为l i 的一一对应的序列。 输出的码符号序列称为码字,长度l i 称为码字长度或简称码长。可见,编码就是从信源符号到码符号的一种映射。若要实现无失真编码,则这种映射必须是一一对应的,并且是可逆的。 码符号的分类: 下图是一个码分类图

数据压缩试题库教学提纲

第一章 填空题: 1、信源编码主要解决传输的问题,信道编码主要解决传输的问题。 2、数据压缩的信号空间包括、、。 3、数据压缩按其压缩后是否产生失真可划分为 和两大类。 第二章 填空题: 1、脉冲编码调制包括、、三个步骤。 2、连续信号的多种离散表示法中,我们最常用的取样方法是。 3、若要将取样信号准确地恢复成原信号,取样频率必须满足定理。 4、黑白电视信号的带宽大约为5MHz,若按256级量化,则按奈奎斯特准则取样时的数据速率为。如果电视节目按25帧/s发送,则存储一帧黑白电视节目数据需内存容量。 5、量化器可分为和两大类。 6、量化器的工作特性可分为、、三个区域。 6、按照处理方法是否线性来判断,我们认为量化过程本身是。 7、我国数字电话网中压扩量化的对数函数采用曲线。 8、信号质量的主观度量方法中最常用的判决方法是。 9、对信号压缩系统的性能评价应从几个性能指标上综合评价,这些性能指标包括、、、。 简答题: 1、量化误差和噪声的本质区别是什么? 2、简述压扩量化的工作过程? 3、数据压缩中的“二次量化”是指什么?它和模数转换时的量化有什么区别? 证明题:

1、试导出以均方误差最小定义的最佳量化方法中量化判决电平k d 和量化输出电平k y 的表达式。 2、证明M-L 量化器的最小量化误差为:{}{}∑-=+≤<-=1 012 2min J k k k k d x d p y x E ε 第三章 填空题: 1、离散无记忆平稳信源的冗余度隐含在 。 2、对于联合信源,其冗余度除了各自本身的冗余度外还隐含在 。 3、离散有记忆信源的的理论极限是 。 4、在限失真编码理论中,使限失真条件下比特数最少的编码称为 。 问答题: 1、什么是平均自信息量(信息熵),平均条件自信息量(条件熵)以及平均互信息量?它们之间有什么关系? 2、简述率失真函数的基本含义,并指出它对信源编码的指导意义。 3、什么是最大离散熵?它对数据压缩有什么指导意义? 证明题: 2、证明 ()()|H Y X H Y ≤,并简述它对数据压缩的意义。 3、证明:()()()Y |X H X H Y X I -=;。 第四章 填空题: 1、统计编码主要是利用消息或消息序列 的分布特性,注重寻找 的最优匹配。 2、长度为L 1,L 2,…,L n 的m 进制唯一可译码存在的充分必要条件是 。

相关文档
相关文档 最新文档