文档库 最新最全的文档下载
当前位置:文档库 › URL编码与解码

URL编码与解码

URL编码与解码
URL编码与解码

URL编码与解码

通常如果一样东西需要编码,说明这样东西并不适合传输。原因多种多样,如Size过大,包含隐私数据,对于Url来说,之所以要进行编码,是因为Url中有些字符会引起歧义。

例如,Url参数字符串中使用key=value键值对这样的形式来传参,键值对之间以&符号分隔,如/s?q=abc&ie=utf-8。如果你的value字符串中包含了=或者&,那么势必会造成接收Url的服务器解析错误,因此必须将引起歧义的&和=符号进行转义,也就是对其进行编码。

又如,Url的编码格式采用的是ASCII码,而不是Unicode,这也就是说你不能在Url 中包含任何非ASCII字符,例如中文。否则如果客户端浏览器和服务端浏览器支持的字符集不同的情况下,中文可能会造成问题。

Url编码的原则就是使用安全的字符(没有特殊用途或者特殊意义的可打印字符)去表示那些不安全的字符。

预备知识:URI是统一资源标识的意思,通常我们所说的URL只是URI的一种。典型URL的格式如下所示。下面提到的URL编码,实际上应该指的是URI编码。

foo://https://www.wendangku.net/doc/9516896208.html,:8042/over/there?name=ferret#nose

\_/ \______________/ \________/\_________/ \__/

| | |

| |

scheme authority path query fragment

哪些字符需要编码

RFC3986文档规定,Url中只允许包含英文字母(a-zA-Z)、数字(0-9)、-_.~4个特殊字符以及所有保留字符。RFC3986文档对Url的编解码问题做出了详细的建议,指出了哪些字符需要被编码才不会引起Url语义的转变,以及对为什么这些字符需要编码做出了相应的解释。

US-ASCII字符集中没有对应的可打印字符:Url中只允许使用可打印字符。US-ASCII 码中的10-7F字节全都表示控制字符,这些字符都不能直接出现在Url中。同时,对于80-FF 字节(ISO-8859-1),由于已经超出了US-ACII定义的字节范围,因此也不可以放在Url中。

保留字符:Url可以划分成若干个组件,协议、主机、路径等。有一些字符(:/?#[]@)是用作分隔不同组件的。例如:冒号用于分隔协议和主机,/用于分隔主机和路径,?用于分

隔路径和查询参数,等等。还有一些字符(!$&'()*+,;=)用于在每个组件中起到分隔作用的,如=用于表示查询参数中的键值对,&符号用于分隔查询多个键值对。当组件中的普通数据包含这些特殊字符时,需要对其进行编码。

RFC3986中指定了以下字符为保留字符:! * ' ( ) ; : @ & = + $ , / ? # [ ]

不安全字符:还有一些字符,当他们直接放在Url中的时候,可能会引起解析程序的歧义。这些字符被视为不安全字符,原因有很多。

?空格:Url在传输的过程,或者用户在排版的过程,或者文本处理程序在处理Url 的过程,都有可能引入无关紧要的空格,或者将那些有意义的空格给去掉。

?引号以及<>:引号和尖括号通常用于在普通文本中起到分隔Url的作用

?#:通常用于表示书签或者锚点

?%:百分号本身用作对不安全字符进行编码时使用的特殊字符,因此本身需要编码?{}|\^[]`~:某一些网关或者传输代理会篡改这些字符

需要注意的是,对于Url中的合法字符,编码和不编码是等价的,但是对于上面提到的这些字符,如果不经过编码,那么它们有可能会造成Url语义的不同。因此对于Url而言,只有普通英文字符和数字,特殊字符$-_.+!*'()还有保留字符,才能出现在未经编码的Url 之中。其他字符均需要经过编码之后才能出现在Url中。

但是由于历史原因,目前尚存在一些不标准的编码实现。例如对于~符号,虽然

RFC3986文档规定,对于波浪符号~,不需要进行Url编码,但是还是有很多老的网关或者传输代理会进行编码。

如何对Url中的非法字符进行编码

Url编码通常也被称为百分号编码(Url Encoding,also known as

percent-encoding),是因为它的编码方式非常简单,使用%百分号加上两位的字符——0123456789ABCDEF——代表一个字节的十六进制形式。Url编码默认使用的字符集是US-ASCII。例如a在US-ASCII码中对应的字节是0x61,那么Url编码之后得到的就是%61,我们在地址栏上输入https://www.wendangku.net/doc/9516896208.html,/search?q=%61%62%63,实际上就等同于在google上搜索abc了。又如@符号在ASCII字符集中对应的字节为0x40,经过Url编码之后得到的是%40。

对于非ASCII字符,需要使用ASCII字符集的超集进行编码得到相应的字节,然后对每个字节执行百分号编码。对于Unicode字符,RFC文档建议使用utf-8对其进行编码得到相应的字节,然后对每个字节执行百分号编码。如"中文"使用UTF-8字符集得到的字节

为0xE4 0xB8 0xAD 0xE6 0x96 0x87,经过Url编码之后得到

"%E4%B8%AD%E6%96%87"。

如果某个字节对应着ASCII字符集中的某个非保留字符,则此字节无需使用百分号表示。例如"Url编码",使用UTF-8编码得到的字节是0x55 0x72 0x6C 0xE7 0xBC 0x96 0xE7 0xA0 0x81,由于前三个字节对应着ASCII中的非保留字符"Url",因此这三个字节可以用非保留字符"Url"表示。最终的Url编码可以简化成

"Url%E7%BC%96%E7%A0%81" ,当然,如果你用

"%55%72%6C%E7%BC%96%E7%A0%81"也是可以的。

由于历史的原因,有一些Url编码实现并不完全遵循这样的原则,下面会提到。

Javascript中的escape, encodeURI和encodeURIComponent的区别Javascript中提供了3对函数用来对Url编码以得到合法的Url,它们分别是escape / unescape, encodeURI / decodeURI和encodeURIComponent / decodeURIComponent。由于解码和编码的过程是可逆的,因此这里只解释编码的过程。

这三个编码的函数——escape,encodeURI,encodeURIComponent——都是用于将不安全不合法的Url字符转换为合法的Url字符表示,它们有以下几个不同点。

安全字符不同:

下面列出了这三个函数的安全字符(即函数不会对这些字符进行编码)

?escape(69个):*/@+-._0-9a-zA-Z

?encodeURI(82个):!#$&'()*+,/:;=?@-._~0-9a-zA-Z

?encodeURIComponent(71个):!'()*-._~0-9a-zA-Z

兼容性不同:escape函数是从Javascript 1.0的时候就存在了,其他两个函数是在Javascript 1.5才引入的。但是由于Javascript 1.5已经非常普及了,所以实际上使用encodeURI和encodeURIComponent并不会有什么兼容性问题。

对Unicode字符的编码方式不同:这三个函数对于ASCII字符的编码方式相同,均是使用百分号+两位十六进制字符来表示。但是对于Unicode字符,escape的编码方式是%uxxxx,其中的xxxx是用来表示unicode字符的4位十六进制字符。这种方式已经被W3C废弃了。但是在ECMA-262标准中仍然保留着escape的这种编码语法。encodeURI和encodeURIComponent则使用UTF-8对非ASCII字符进行编码,然后再进行百分号编码。这是RFC推荐的。因此建议尽可能的使用这两个函数替代escape进行编码。

适用场合不同:encodeURI被用作对一个完整的URI进行编码,而encodeURIComponent被用作对URI的一个组件进行编码。从上面提到的安全字符范围表格来看,我们会发现,encodeURIComponent编码的字符范围要比encodeURI的大。我们上面提到过,保留字符一般是用来分隔URI组件(一个URI可以被切割成多个组件,参考预备知识一节)或者子组件(如URI中查询参数的分隔符),如:号用于分隔scheme 和主机,?号用于分隔主机和路径。由于encodeURI操纵的对象是一个完整的的URI,这些字符在URI中本来就有特殊用途,因此这些保留字符不会被encodeURI编码,否则意义就变了。

组件内部有自己的数据表示格式,但是这些数据内部不能包含有分隔组件的保留字符,否则就会导致整个URI中组件的分隔混乱。因此对于单个组件使用encodeURIComponent,需要编码的字符就更多了。

表单提交

当Html的表单被提交时,每个表单域都会被Url编码之后才在被发送。由于历史的原因,表单使用的Url编码实现并不符合最新的标准。例如对于空格使用的编码并不是%20,而是+号,如果表单使用的是Post方法提交的,我们可以在HTTP头中看到有一个Content-Type的header,值为application/x-www-form-urlencoded。大部分应用程序均能处理这种非标准实现的Url编码,但是在客户端Javascript中,并没有一个函数能够将+号解码成空格,只能自己写转换函数。还有,对于非ASCII字符,使用的编码字符集取决于当前文档使用的字符集。例如我们在Html头部加上

这样浏览器就会使用gb2312去渲染此文档(注意,当HTML文档中没有设置此meta 标签,则浏览器会根据当前用户喜好去自动选择字符集,用户也可以强制当前网站使用某个指定的字符集)。当提交表单时,Url编码使用的字符集就是gb2312。

之前在使用Aptana(为什么专指aptana下面会提到)遇到一个很迷惑的问题,就是在使用encodeURI的时候,发现它编码得到的结果和我想的很不一样。下面是我的示例代码:

"https://www.wendangku.net/doc/9516896208.html,/TR/xhtml1/DTD/xhtml1-transitional.dtd">

运行结果输出%E6%B6%93%EE%85%9F%E6%9E%83。显然这并不是使用UTF-8字符集进行Url编码得到的结果(在Google上搜索"中文",Url中显示的

是%E4%B8%AD%E6%96%87)。

所以我当时就很质疑,难道encodeURI还跟页面编码有关,但是我发现,正常情况下,如果你使用gb2312进行Url编码也不会得到这个结果的才是。后来终于被我发现,原来是页面文件存储使用的字符集和Meta标签中指定的字符集不一致导致的问题。Aptana的编辑器默认情况下使用UTF-8字符集。也就是说这个文件实际存储的时候使用的是UTF-8字符集。但是由于Meta标签中指定了gb2312,这个时候,浏览器就会按照gb2312去解析这个文档,那么自然在"中文"这个字符串这里就会出错,因为"中文"字符串用UTF-8编码过后得到的字节是0xE4 0xB8 0xAD 0xE6 0x96 0x87,这6个字节又被浏览器拿gb2312去解码,那么就会得到另外三个汉字"涓 枃"(GBK中一个汉字占两个字节),这三个汉字在传入encodeURI函数之后得到的结果就

是%E6%B6%93%EE%85%9F%E6%9E%83。因此,encodeURI使用的还是UTF-8,并不会受到页面字符集的影响。

对于包含中文的Url的处理问题,不同浏览器有不同的表现。例如对于IE,如果你勾选了高级设置"总是以UTF-8发送Url",那么Url中的路径部分的中文会使用UTF-8进行Url编码之后发送给服务端,而查询参数中的中文部分使用系统默认字符集进行Url编码。为了保证最大互操作性,建议所有放到Url中的组件全部显式指定某个字符集进行Url编码,而不依赖于浏览器的默认实现。

另外,很多HTTP监视工具或者浏览器地址栏等在显示Url的时候会自动将Url进行一次解码(使用UTF-8字符集),这就是为什么当你在Firefox中访问Google搜索中文的时候,地址栏显示的Url包含中文的缘故。但实际上发送给服务端的原始Url还是经过编码的。你可以在地址栏上使用Javascript访问location.href就可以看出来了。在研究Url 编解码的时候千万别被这些假象给迷惑了。

算术编码工作原理

算术编码工作原理 在给定符号集和符号概率的情况下,算术编码可以给出接近最优的编码结果。使用算术编码的压缩算法通常先要对输入符号的概率进行估计,然后再编码。这个估计越准,编码结果就越接近最优的结果。 例: 对一个简单的信号源进行观察,得到的统计模型如下: ?60% 的机会出现符号中性 ?20% 的机会出现符号阳性 ?10% 的机会出现符号阴性 ?10% 的机会出现符号数据结束符. (出现这个符号的意思是该信号源'内部中止',在进行数据压缩时这样的情况是很常见的。当第一次也是唯一的一次看到这个符号时,解码器就知道整个信号流都被解码完成了。) 算术编码可以处理的例子不止是这种只有四种符号的情况,更复杂的情况也可以处理,包括高阶的情况。所谓高阶的情况是指当前符号出现的概率受之前出现符号的影响,这时候之前出现的符号,也被称为上下文。比如在英文文档编码的时候,例如,在字母Q 或者q出现之后,字母u出现的概率就大大提高了。这种模型还可以进行自适应的变化,即在某种上下文下出现的概率分布的估计随着每次这种上下文出现时的符号而自适应 更新,从而更加符合实际的概率分布。不管编码器使用怎样的模型,解码器也必须使用同样的模型。 一个简单的例子以下用一个符号串行怎样被编码来作一个例子:假如有一个以A、B、C三个出现机会均等的符号组成的串行。若以简单的分组编码会十分浪费地用2 bits 来表示一个符号:其中一个符号是可以不用传的(下面可以见到符号B正是如此)。为此,这个串行可以三进制的0和2之间的有理数表示,而且每位数表示一个符号。例如,“ABBCAB”这个串行可以变成0.011201(base3)(即0为A, 1为B, 2为C)。用一个定点二进制数字去对这个数编码使之在恢复符号表示时有足够的精度,譬如 0.001011001(base2) –只用了9个bit,比起简单的分组编码少(1 – 9/12)x100% = 25%。这对于长串行是可行的因为有高效的、适当的算法去精确地转换任意进制的数字。 编码过程的每一步,除了最后一步,都是相同的。编码器通常需要考虑下面三种数据: ?下一个要编码的符号 ?当前的区间(在编第一个符号之前,这个区间是[0,1), 但是之后每次编码区间都会变化) ?模型中在这一步可能出现的各个符号的概率分布(像前面提到的一样,高阶或者自适应的模型中,每一步的概率并不必须一样) 编码其将当前的区间分成若干子区间,每个子区间的长度与当前上下文下可能出现的对应符号的概率成正比。当前要编码的符号对应的子区间成为在下一步编码中的初始区间。

信息论与编码理论习题答案

信息论与编码理论习题 答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

第二章 信息量和熵 八元编码系统,码长为3,第一个符号用于同步,每秒1000个码字,求它的信息速 率。 解:同步信息均相同,不含信息,因此 每个码字的信息量为 2?8log =2?3=6 bit 因此,信息速率为 6?1000=6000 bit/s 掷一对无偏骰子,告诉你得到的总的点数为:(a) 7; (b) 12。问各得到多少信息 量。 解:(1) 可能的组合为 {1,6},{2,5},{3,4},{4,3},{5,2},{6,1} )(a p =366=6 1 得到的信息量 =) (1 log a p =6log = bit (2) 可能的唯一,为 {6,6} )(b p =361 得到的信息量=) (1 log b p =36log = bit 经过充分洗牌后的一副扑克(52张),问: (a) 任何一种特定的排列所给出的信息量是多少? (b) 若从中抽取13张牌,所给出的点数都不相同时得到多少信息量? 解:(a) )(a p =! 521 信息量=) (1 log a p =!52log = bit (b) ? ??????花色任选种点数任意排列 13413!13 )(b p =13 52134!13A ?=1352 13 4C 信息量=1313 52 4log log -C = bit 随机掷3颗骰子,X 表示第一颗骰子的结果,Y 表示第一和第二颗骰子的点数之和, Z 表示3颗骰子的点数之和,试求)|(Y Z H 、)|(Y X H 、),|(Y X Z H 、 )|,(Y Z X H 、)|(X Z H 。

算术编码与解码

算术编码与解码 1、编码过程 算术编码方法是将被编码的一则消息或符号串(序列)表示成0和1之间的一个间隔(Interval),即对一串符号直接编码成[0,1]区间上的一个浮点小数。符号序列越长,编码表示它的间隔越小,表示这一间隔所需的位数就越多。信源中的符号序列仍然要根据某种模式生成概率的大小来减少间隔。可能出现的符号概率要比不太可能出现的符号减少范围小,因此,只正加较少的比特位。 在传输任何符号串之前,0符号串的完整范围设为[0,1]。当一个符号被处理时,这一范围就依据分配给这一符号的那一范围变窄。算术编码的过程,实际上就是依据信源符号的发生概率对码区间分割的过程。 输入:一个字符串 输出:一个小数 考虑某条信息中可能出现的字符仅有a b c 三种,要压缩保存的信息为bccb。 假设对a b c 三者在信息中的出现概率一无所知(采用自适应模型),暂时认为三者的出现概率相等,也就是都为1/3,将0 - 1 区间按照概率的比例分配给三个字符,即a 从0.0000 到0.3333,b 从0.3333 到0.6667,c 从0.6667 到 1.0000。用图形表示就是: +-- 1.0000 | Pc = 1/3 | | +-- 0.6667 | Pb = 1/3 | | +-- 0.3333 | Pa = 1/3 | | +-- 0.0000 对于第一个字符b,选择b 对应的区间0.3333 - 0.6667。这时由于多了字符b,三个字符的概率分布变成:Pa = 1/4,Pb = 2/4,Pc = 1/4。再按照新的概率分布比例划分0.3333 - 0.6667 这一区间,划分的结果可以用图形表示为: +-- 0.6667 Pc = 1/4 | +-- 0.5834 | | Pb = 2/4 | | | +-- 0.4167 Pa = 1/4 | +-- 0.3333 接着字符c,上一步中得到的 c 的区间0.5834 - 0.6667。新添了c 以后,三个字符的概率分布变成Pa = 1/5,Pb = 2/5,Pc = 2/5。用这个概率分布划分区间0.5834 - 0.6667: +-- 0.6667 | Pc = 2/5 | | +-- 0.6334 | Pb = 2/5 | | +-- 0.6001 Pa = 1/5 | +-- 0.5834 现在输入下一个字符c,三个字符的概率分布为:Pa = 1/6,Pb = 2/6,Pc = 3/6。划分c 的区间0.6334 - 0.6667: +-- 0.6667 | | Pc = 3/6 | | | +-- 0.6501 | Pb = 2/6 | | +-- 0.6390 Pa = 1/6 | +-- 0.6334 输入最后一个字符b,因为是最后一个字符,不用再做进一步的划分了,上一步中得到的 b 的区间为0.6390 - 0.6501,好,让我们在这个区间内随便选择一个容易变成二进制的数,例如0.64,将它变成二进制0.1010001111,去掉前面没有太多意义的0 和小数点,我们可以输出1010001111,这就是信息被压缩后的结果,我们完成了一次最简单的算术压缩过程。我的代码: publicstaticvoidBianMa(String info,StringDeal sd){ int i = 0, j = 0; //定义上下限 double low = 0, high = 1; double count = sd.getCount(); //定义初始各字符频率 double[] zifu = new double[(int)(count)]; for(i = 0;i < zifu.length;i++){ zifu[i] = 1;

信息与编码理论课后习题答案

二章-信息量和熵习题解 2.1 莫尔斯电报系统中,若采用点长为0.2s ,1划长为0.4s ,且点和划出现的概率分别为2/3和1/3,试求它的信息速率(bits/s)。 解: 平均每个符号长为: 15 44.0312.032=?+?秒 每个符号的熵为9183.03log 3 123log 32=?+?比特/符号 所以,信息速率为444.34159183.0=?比特/秒 2.2 一个8元编码系统,其码长为3,每个码字的第一个符号都相同(用于同步),若每秒产生1000个码字,试求其信息速率(bits /s)。 解: 同步信号均相同不含信息,其余认为等概,每个码字的信息量为 3*2=6 比特; 所以,信息速率为600010006=?比特/秒 2.3 掷一对无偏的骰子,若告诉你得到的总的点数为:(a ) 7;(b ) 12。 试问各得到了多少信息量? 解: (a)一对骰子总点数为7的概率是 36 6 所以,得到的信息量为 585.2)36 6(log 2= 比特 (b) 一对骰子总点数为12的概率是36 1 所以,得到的信息量为 17.5361log 2= 比特 2.4 经过充分洗牌后的一付扑克(含52张牌),试问: (a) 任何一种特定排列所给出的信息量是多少? (b) 若从中抽取13张牌,所给出的点数都不相同时得到多少信息量? 解: (a)任一特定排列的概率为! 521, 所以,给出的信息量为 58.225!521log 2 =- 比特 (b) 从中任取13张牌,所给出的点数都不相同的概率为 1313 1313525213!44A C ?=

所以,得到的信息量为 21.134 log 1313522=C 比特. 2.5 设有一个非均匀骰子,若其任一面出现的概率与该面上的点数成正比,试求各点 出现时所给出的信息量,并求掷一次平均得到的信息量。 解:易证每次出现i 点的概率为 21i ,所以 比特比特 比特 比特 比特 比特 比特 398.221 log 21)(807.1)6(070.2)5(392.2)4(807.2)3(392.3)2(392.4)1(6,5,4,3,2,1,21 log )(2612=-==============-==∑=i i X H x I x I x I x I x I x I i i i x I i 2.6 园丁植树一行,若有3棵白杨、4棵白桦和5棵梧桐。设这12棵树可随机地排列, 且每一种排列都是等可能的。若告诉你没有两棵梧桐树相邻时,你得到了多少关 于树的排列的信息? 解: 可能有的排列总数为 27720! 5!4!3!12= 没有两棵梧桐树相邻的排列数可如下图求得, Y X Y X Y X Y X Y X Y X Y X Y 图中X 表示白杨或白桦,它有???? ??37种排法,Y 表示梧桐树可以栽种的位置,它有? ??? ??58种排法, 所以共有???? ??58*??? ? ??37=1960种排法保证没有两棵梧桐树相邻, 因此若告诉你没有两棵梧桐树相邻时,得到关于树排列的信息为1960log 27720log 22-=3.822 比特 2.7 某校入学考试中有1/4考生被录取,3/4考生未被录取。被录取的考生中有50%来 自本市,而落榜考生中有10%来自本市,所有本市的考生都学过英语,而外地落榜考生中以及被录取的外地考生中都有40%学过英语。 (a) 当己知考生来自本市时,给出多少关于考生是否被录取的信息?

编程实现算术编码算法

编程实现算术编码算法 中国地质大学计算机学院信息安全专业 信息论实验报告 实验三算术编码 一、实验内容 编程实现算术编码算法 二、实验环境 1.计算机 2.Windows 2000或以上 3.DEVC++ 三、实验目的 1.进一步熟悉算术编码算法; 2.掌握C语言编程(尤其是数值的进制转换,数值与字符串之间的转换等) 四、实验要求 1.提前预习实验,认真阅读实验原理。 2.认真高效的完成实验,实验过程中服从实验室管理人员以及实验指导老师的管理。 3.认真填写实验报告。 五、实验原理 算术编码是把一个信源表示为实轴上0和1之间的一个区间,信源集合中的每一个元素都用来缩短这个区间。

1.算法流程 (1)输入信源符号个数,信源概率分布,还有需要编码的符号序列,(2)根据概率可以算出初始编码间隔, High——当前编码的上限, Low——当前编码的下限, high——中间变量,用来计算下一个编码符号的当前间隔的上限,low——中间变量,用来计算下一个编码符号的当前间隔的下限,d——当前间隔之间的距离。 (3)扫描需编码的符号序列,确定编码空间 第1个编码符号的当前间隔为其初始的编码间隔, 第i个编码符号的当前间隔为第i-1个编码后的[Low,High),第i+1个编码符号的当前间隔算法如下:high=Low+d*第i+1个初始编码符号对应的上限,low=Low+d*第i+1个编码符号对应的下限,然后High=high,Low=low,d=d*第i 个编码符号的概率。 六、参考书 1.《信息论——基础理论及应用》傅祖芸,电子工业出版社 七、源代码 #include #include #include const double proc[]={0.10,0.10,0.10,0.1,0.1,0.1,0.1,0.1,0.15,0.05}; double result,areaBegin,areaEnd; int cord[1000],cordLength;

编码理论思想内涵及问题

编码理论思想内涵及问题/h1 -- -- 本站首页 免费课件 免费试题 整册教案 教育资讯 计划总结 英语角 幼儿教育 文书写作 海量教案 免费论文

网站地图设为首页收藏本站 语文科数学科英语科政治科物理科化学科地理科历史科生物科中考备战高考备战高考试题中考试题教学论文作文园地

教学论文 经济论文 理工论文 管理论文 法律论文 行政论文 艺术论文 医学论文 文史论文 农科论文 英语论文 课程改革 教育法规 教育管理 家长频道 您现在的位置:3edu教育网免费论文行政论文思想政治教育论文正文3edu教育网,百万资源,完全免费,无需注册,天天更新!

编码理论思想内涵及问题 叶舒宪对探究“历史”的方式以及“历史”的再认识体现了他观念上的两个变化:一是由质疑文字中心主义到强调物叙事或图像叙事。二是“文学”观念的变化,即“文学作品→文学文本→文化文本”。其次是在确定了中国历史与中国文化的性质以及研究路径之后,又如何认识中国历史和中国文化的问题呢?叶舒宪认为,就是要重新阐释和划分大小传统的内涵,厘清大小传统的源流关系。他说:“重新进入历史的理论前提是,对中国文化传统做出‘大’和‘小’的区分,以汉字的有无为标记,前汉字时代的传统称为‘大传统’,汉字书写的传统称为‘小传统’。”叶舒宪对大小传统内涵的再阐释来自于他对雷德菲尔德的大小传统内涵的改造与置换,其目的是重新认识中国文化的特性。他说:“我斗胆提出改造大小传统概念,首先考虑的是如何有效地应用到对中国文化的重新认识。用历史时间为尺度对‘大’与‘小’传统重新区分,得出与雷氏同名而异实的一对概念,彰显人类学转向意义上的观念突破,可以将无文字时代和有文字时代贯通起来看。”雷德菲尔德的大小传统概念是一个有关社会分层的概念,而叶舒宪则“将其各自的内涵颠倒和互换———将有文字记录的文化传承视为小传统,将文字产生之前的文化传承视为大传统。判断大和小的依据为历史的延续程度。”在重新确定了大小传统的内涵之后,又如何进入大传统呢?就是借助考古出土实物及图像的研究和重构来进入中国大传统。再次,建立文学人类学意义上的文学观。它包括:一是对中国文化多源构成的分析以及对“少数民族文学”价值与地位的再重估;二是通过探讨多民族文学史观问题,提出文学人类学意义上的文学史观念构架。具体来看,叶舒宪提出了中国文化及文学的两条传播路径———红山文化———河西走廊和氐羌———藏彝走廊及其发生源流。据此重构了从熊图腾神话到鲧禹启的文学叙事、《山海经》昆仑玉神话叙事到《红楼梦》玉叙事,从《穆天子传》到《西游记》的“西游”范式等。三是提出文学人类学意义上的文学观,它包括活态文学/固态文学、

算术编解码matlab实现

% Author: Qu guangxiang October 23, 2011 %Postal address: % Room A2012, Song garden building no.2,NanHu Campus, China University of Mining and Technology, % XuZhou, Jiangsu, P.R.China, 221008 % %自编程序. clc clear all close all Tip={... '请按下列要求输入字符串:' '1、字符串长度适宜;' '2、可以输入的字符仅限于:a,b,c,d,e,f ;' '3、输入的字符一定要用英文状态下的单引号引起来,例如:''efbfcafdcc''。'}; disp('%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%') disp(Tip) disp('%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %%%%%%%%%%%%%%%%%%%%%%%%%%%%') string_s=input('请按要求输入字符串:'); [j,k]=size(string_s);%计算字符串的长度 pa=0.1;pb=0.1;pc=0.3;pd=0.1;pe=0.1;pf=0.3; %初始化概率 disp(['输入的字符串是:',string_s]) %显示输入的字符串 format long %定义数据显示精度 for i=1:k %开始算数编码 if i==1 %为字符串的第一个字符编码,a1,a2分别表示个字符串区间的端点 switch 1 %用“开关语句”检测是什么字符,在做相应的编码处理 case string_s(i)=='a' a1=0; a2=0+pa; case string_s(i)=='b' a1=pa; a2=pa+pb; case string_s(i)=='c' a1=pa+pb; a2=pa+pb+pc; case string_s(i)=='d' a1=pa+pb+pc; a2=pa+pb+pc+pd; case string_s(i)=='e' a1=pa+pb+pc+pd; a2=pa+pb+pc+pd+pe; case string_s(i)=='f'

霍尔编码解码

早期的受众观都是效果研究的副产品,直到“使用与满足学说”的研究,学术界才开始将受众作为研究对象来对待。而霍尔的编码解码理论,初步确立了受众的本体地位。 《编码/解码》的前身是霍尔1973年在莱斯特大学所做的一场学术报告,该学术报告不久后以《电视话语中的编码与解码》为题,发表在伯明翰大学当代文化研究中心(CCCS) 的内部刊物上。在经过很长一段时间的非公开流通之后,这篇文章才被纳入《文化·媒介·语言》的论文集中得以公开发表。 一、整体梳理 1.关注受众研究(1-7) 传统研究把传播描述成线性过程,只关注局部;应当关注整体和结构。对电视生产过程的分析可以参考马克思的思路,将其视作“生产一流通一分配/消费一再生产”的“接合”(articulation),结构化地考察传一受活动。 电视传播的生产环节即是编码、解码,它们在符号和语法中接合,虽然模糊但确实存在,虽然浅显但指涉结构。 这个结构正是社会文化与政治结构,其中的意识形态补给着编码、解码。传受面对的社会结构存在差异,这造成了他们对符码的使用是不对称的,编码、解码不是直接一致的。 这种不对称要求我们关注受众研究。 2.电视符号是被建构出来的(8-16) 电视符码不等于真实,它只是被深层次自然化,因而受众觉得近乎普遍,习惯,归根到底是建构出来的。 电视符码的外延是建构出来的,内涵对意识形态开放,是文化系统与符号系统的深度交织。内涵所指之间是不平等的,存在一个受偏好的意义,“占主导地位的话语结构”。 3.结构化的符码 所谓有效传播,实质上是受众按照传者偏好的话语对符码作出解读。要实现有效传播,就要研究环境整体,努力克服系统性扭曲(systematicallydistortedc。illmunicatiOn)。 关于误读,解释是“选择性认知”,它遵循的是多元主义而回避了差异的根源——结构性不平等——-认定传受是对称的。 无论是误读还是有效传播,都是高度结构化的编码、解码之间所形成的不同“接合”。关于“接合”情形,这里可以提出三种假设。 4.三种解码立场 主导一霸权式、协商式、抗争式 大部分的受众解码的过程是受众的思想与文本意义之间相互对话的过程,即协调解码的过程: 受众在选择文本意义的过程中必然会把自身的社会背景带入对媒介信息的解读中,这样,在文本的倾向性意义和受众的倾向性解读之间形成了一种协商的过程,而协商的结果就是受众对文本的解读。 二、对符号学的调整:从强调文本到强调受众 符号学认为文本或者符号是意义的主要载体,传统是把重心放在文本之上。符号学家认为符号化是多数人发出的行为,但是面对文本他们又是没有抵抗力的,所以解读符号必须交给研究者来完成。 威廉斯对文化的重新定义,把“生活的总体方式”作为研究对象,对大众文化持平视态度,成为后继文化研究的一个基本观念。 霍尔虽然也是用经典符号学理论来分析电视传播内容,但是首先承认受众解码是结构化的。编码者和文本虽然采取不同符号化策略,但是必须面对不同受众有组织地接受、协商、甚至抗争。受众的判断和参与应该被承认和考虑。 三、从生产消费的直接同一到编码解码的非直接同一

算术编码+及译码原理

算术编码与译码原理: 1、编码过程 算术编码方法是将被编码的一则消息或符号串(序列)表示成0和1之间的一个间隔(Interval),即对一串符号直接编码成[0,1]区间上的一个浮点小数。符号序列越长,编码表示它的间隔越小,表示这一间隔所需的位数就越多。信源中的符号序列仍然要根据某种模式生成概率的大小来减少间隔。可能出现的符号概率要比不太可能出现的符号减少范围小,因此,只正加较少的比特位。 在传输任何符号串之前,0符号串的完整范围设为[0,1]。当一个符号被处理时,这一范围就依据分配给这一符号的那一范围变窄。算术编码的过程,实际上就是依据信源符号的发生概率对码区间分割的过程。 举例说明如下: 假设一则消息“static_tree”具有如下的概率分布: 字符概率 --------------------------------------------------------------- _(space) 0.1 a 0.1 e 0.3 r 0.1 s 0.1 t 0.3 下面用算术编码方法给该消息编码。 一旦字符的概率已知,就沿着“概率线”为每一个单独的符号设定一个范围,哪一个被设定到哪一段范围并不重要,只要编码和解码都以同样方式进行就可以,这里所用的6个字符被分配的范围(range)如下: 字符概率范围 _(space) 0.1 0≤r<0.1 a 0.1 0.1≤r<0.2 e 0.3 0.2≤r<0.5 r 0.1 0.5≤r<0.6 s 0.1 0.6≤r<0.7 t 0.3 0.7≤r<1.0 ---------------------------------------------------------------- 对“state_tree”的算术编码过程为: (1)初始化时,被分割的范围range=high-low=[0,1),下一个范围的低、高端分别由下式计算: Low=low + range×range low

信息论与编码理论习题答案

第二章 信息量和熵 2.2 八元编码系统,码长为3,第一个符号用于同步,每秒1000个码字,求它的 信息速率。 解:同步信息均相同,不含信息,因此 每个码字的信息量为 2?8log =2?3=6 bit 因此,信息速率为 6?1000=6000 bit/s 2.3 掷一对无偏骰子,告诉你得到的总的点数为:(a) 7; (b) 12。问各得到多少信 息量。 解:(1) 可能的组合为 {1,6},{2,5},{3,4},{4,3},{5,2},{6,1} )(a p =366=6 1 得到的信息量 =) (1 log a p =6log =2.585 bit (2) 可能的唯一,为 {6,6} )(b p =361 得到的信息量=) (1 log b p =36log =5.17 bit 2.4 经过充分洗牌后的一副扑克(52张),问: (a) 任何一种特定的排列所给出的信息量是多少? (b) 若从中抽取13张牌,所给出的点数都不相同时得到多少信息量? 解:(a) )(a p =! 521 信息量=) (1 log a p =!52log =225.58 bit (b) ???????花色任选 种点数任意排列 13413!13 )(b p =13 52 134!13A ?=135213 4C 信息量=1313 524log log -C =13.208 bit

2.9 随机掷3颗骰子,X 表示第一颗骰子的结果,Y 表示第一和第二颗骰子的 点数之和,Z 表示3颗骰子的点数之和,试求)|(Y Z H 、)|(Y X H 、 ),|(Y X Z H 、)|,(Y Z X H 、)|(X Z H 。 解:令第一第二第三颗骰子的结果分别为321,,x x x ,1x ,2x ,3x 相互独立, 则1x X =,21x x Y +=,321x x x Z ++= )|(Y Z H =)(3x H =log 6=2.585 bit )|(X Z H =)(32x x H +=)(Y H =2?( 361log 36+362log 18+363log 12+364log 9+365log 536)+36 6log 6 =3.2744 bit )|(Y X H =)(X H -);(Y X I =)(X H -[)(Y H -)|(X Y H ] 而)|(X Y H =)(X H ,所以)|(Y X H = 2)(X H -)(Y H =1.8955 bit 或)|(Y X H =)(XY H -)(Y H =)(X H +)|(X Y H -)(Y H 而)|(X Y H =)(X H ,所以)|(Y X H =2)(X H -)(Y H =1.8955 bit ),|(Y X Z H =)|(Y Z H =)(X H =2.585 bit )|,(Y Z X H =)|(Y X H +)|(XY Z H =1.8955+2.585=4.4805 bit 2.10 设一个系统传送10个数字,0,1,…,9。奇数在传送过程中以0.5的概 率错成另外一个奇数,其余正确接收,求收到一个数字平均得到的信息量。 解: 8,6,4,2,0=i √ );(Y X I =)(Y H -)|(X Y H 因为输入等概,由信道条件可知,

编码理论基础

编码理论基础 包括群、域、本原多项式、伽罗华域算术。 1. 群 令G 是一个集合。现规定G 上的二元运算“*”的规则: 对G 中的每一对元素a 和b ,在G 中指定一个唯一确定的第三个元素c=a *b 。当这样的二元运算“*”定义在G 上时,我们就称在“*”运算下G 是封闭的。若对G 中的任意元素a 、b 、c 有 则称G 上的二元运算“*”是结合的。 定义1.1 设G 是非空集合。并在G 上定义了一种运算“*”,如果满足以下条件就称做群: (1) 满足封闭性。若a 和b 为集合G 中的任意元素,即a ∈G ,b ∈G ,恒有 (2) 结合律成立,对任意a ∈G ,b ∈G ,c ∈G , (3) G 中存在一个恒等元e ,对任意a ∈G ,有 其中a -1∈G ,且称为a 的逆元素。 例如,整数中,任意两个整数相加还是一个整数,因此满足封闭性;显然也满足结合律;任意一个非零整数Z 的逆元素是-Z ,Z+(-Z )=0,所以恒等元是0。则整数在实数加法下是一个群。但整数在实数乘法下就不能构成一个群。 若群G 中,a ∈G ,b ∈G ,有 则称群为可交换群或阿贝尔群。 定理1.1 群G 的恒等元是唯一的,每个元素的逆元素也是唯一的。 定理1.2 令H 是G 的非空子集。若H 在G 的群运算下是封闭的且满足群的所有条件,就称H 为G 的子群。 例如,偶数是整数的一个非空子集。同样可以证明偶数在实数加法下也是一个群,所以偶数是整数的一个子群。 定理1.3 群中元素的个数称为群的阶。 2. 域 域就是一个集合,在其中可以进行加、减、乘、除而不会超出该集合。加法和乘法都必须满足交换律、结合律和分配律,正式定义: 定义2.1 令F 是一个集合,其上定义了两个二元运算,称做加法“+”和乘法“·?”。满足下述条件时,就称集F 和两个运算“+”和“·”是域: c b a c b a **=**)()(G c b a ∈=*c b a c b a **=**)()(e a a =*-1a b b a *=*

斯图亚特·霍尔“编码与解码”理论的研究

斯图亚特哆霍尔“编码与解码”理论的研究 专业名称:文艺学 申请人:赵瑾 指导教师:姚倩教授 论文答辩委员会 哗 互 陡一孩哗扼席员,王委;

斯图亚特?霍尔“编码与解码”理论的研究 研究生:赵瑾导师:姚倩教授。 专业:文艺学研究方向:文艺传播与文化产业年级:2011级 摘要 作为伯明翰学派后期的文化学者,斯图亚特?霍尔的研究思想和成就对文化研究领域影响深远。他的研究成果多见于一些文章,其中一篇发表于1973年的《电视话语的编码与解码》(俗称霍尔模式)意义非凡,改变了实证主义研究对信息传递者与受众关系的线性理解,并侧重于对受众主动性的研究,这种新的研究范式使得受众研究拉开了新的帷幕。在当今媒介形式多样化的今天,不管信息传播的方式如何变化,霍尔模式都依然显现着它客观、合理的意义。为此,全面理解霍尔的编码与解码理论,通过纷繁复杂的大众文化文本,解读传播者与接收者之间的错位与误读现象,发掘大众与传媒冲突、对抗、妥协中所隐含的深层次矛盾,对于加强当代中国的大众文化建设有着重要的现实意义。 文章的第一部分,主要探索霍尔“编码,解码”的理论溯源。霍尔博学慎思,广泛涉猎多学科,跳出当下文化理论研究的局限,敢于从现实角度分析问题,从而开辟了新的文化研究视域。而正是积极的借鉴和思考前人的理论成果,才使得霍尔具有非凡的认识和思辨能力。葛兰西的文化霸权理论、阿尔都塞的意识形态理论、索绪尔的语言学和符号学理论等等,都给了霍尔很大的启示,同时,霍尔在借鉴前人的理论观点时,又加入了自己的思考,通过对实践事例的深入分析、对信息建构和传播过程的探究和整合,虽终形成了具有非凡影响意义的“编码与解码”理论。 文章的第二部分,主要阐述了霍尔“编码,解码”的理论内涵。在这一部分,从认识的角度,概述了编码和解码的理论意义。霍尔的编码解码理论精髓,主要在他对传媒的生产、流通、消费单个过程中体现。这正好对应了理论中所知的编码、流通和解码三个过程。本文就是按照这三个过程,对编码制度结构的内部操作、信息传播过程中的影响因素和解码者再生产的环节进行了简要的分析。并重点对霍尔指出的解码者的“三个假想”立场进行思考,同时依据符码化的信息运作过程中次符码的影响,探究表层解码和深层解码的意义,挖掘信息符码的多重含义。深入认识“霍尔模式”的运作过程,获知这一研究模式与传统线性传播模式的区别,揭示受众在信息传播过程中的主要作用。 文章的第三部分,是论文的核心部分,研究方法主要是通过霍尔的编解码理论来分析多种媒体形式共存的我国大众文化语境下的文化现象。以理性客观的眼光对恶搞、炒作、微博互动等文化狂欢活动,进行“文化解码”。一是从制度结构、意识形态话语、

用斯图亚特·霍尔的“编码与解码”理论分析《非诚勿扰》

用斯图亚特·霍尔的“编码与解码”理论分析《非诚勿扰》 摘要:本文主要用斯图亚特·霍尔的“编码与解码”的理论来解释在当前媒介融合 的状态下对电视节目的解读,处于媒介融合的背景下是否这一理论还适用于此, 并且用三种解码的形式来看当前的一些问题。 关键词:斯图亚特·霍尔;编码与解码 斯图亚特·霍尔的“编码,解码”理论受到很多理论和研究成果的影响和启迪。 霍尔批判的继承了各种思想理论,才形成他独具特色的意义内涵。霍尔对编码的 定义是“实践对象以特殊方式组织起来,以符号为载体的形式产生各种意义,他们想任何形式的传播或语言一样,在一种话语的语义链范围内通过符码的运行而组 织起来。”从霍尔为编码所下的定义来看,是一个复杂的过程,编码以符号为载体,需要了解已有信息的意义,并对这些已有的信息进行重组,并且这些重组需要在 一个新的环境中运作,在运作过程中符码化。在符码的运作过程中,霍尔认为符 码的意义是在随着时间和文化语境而发生改变。但在符码的形成与建构的过程中,也会受到不同的意识形态的制约,尤其是在电视节目,电影等中常常将主导的意 识形态潜移默化的融入受众的思想之中,逐渐让社会大众接受某种框架的制约还 不会导致受众对这种约束的反感。霍尔的“编码与解码”中批判了传统的大众传播 研究中的线性传播方式,传统的“发送者-信息—接受者”的模式过于简单,并没有 考虑到在传播过程中的发送者,传递的信息与接受者之间会存在很多问题。传递 信息者即编码者在传递信息也就是在进行编码的过程中编码者的身份、价值观, 所处的文化背景等不同的因素都会影响编码的整个过程,所编的码也会受到编码 者的影响,而且在信息传递时也会发生扭曲,解码者同样也会像编码者一样在解 读的过程中会带有个人的主观感情色彩,可能会使解码者所获得的信息出现偏差,即信息对抗式的解读,也可能完全理解即是编码者对解码者霸权式的解读,还有 一种可能是编码者与解码者之间相互妥协于协商。 我们现在所处的时代是一个各种新旧媒体相互融合的时代,是否霍尔“编码与 解码”理论还适用于现在,很显然在这个新媒体快速发展的时代,霍尔的这一理论同样适用于当下媒体融合时代。霍尔的“编码与解码”理论同样适用于解释电视节 目的传播的生产即是“编码与解码”的这一过程。霍尔借鉴了葛兰西提出的霸权理论,认为电视节目中传播的内容其中所传递的话语的权利和意识形态构成了一种 主导意义的倾向,或者可以说是带有作者的偏爱的倾向,而这种倾向可以在某些 程度上来影响受众在观看电视节目中即解码者在解释编码者所编写的符码时,在 一定程度上也会体现霸权的思想。可以这样说,任何社会或文化都倾向于强迫他 人接受其对社会、文化、政治、经济的分类标准。这些标准构成一种占主导地位 的文化秩序。 从2010年初起,在各大卫视掀起了婚恋交友节目的新浪潮,例如《非诚勿扰》、《我们约会吧》、《百里挑一》等婚恋交友的节目,并且一度成为广大观 众最喜欢观看的节目,节目环节设计新颖,俊男美女更是吸引观众的眼球。但是 在《非诚勿扰》的节目中,出现的拜金主义、享乐主义的价值观与婚恋观甚至更 有女嘉宾说“我宁愿坐在宝马车里哭,也不愿在自行车上笑”。这一言论在很大程 度上是在误导者观众的心理,这就会使观众在观看即在解码的过程中会得到一个 与之相反的观点即一种对抗性的解读,是解码者对编码者所编写符码的意义的对立。因此,在编码者编码的过程中即传播者在传播内容时,还要考虑到解码者即

“编码”与“解码”之间

如果将文学置身于某种特定的文化背景之下,那么它的传播也无疑将是一种信息的传播。在中外的文化交流中,文学表达是能够非常有效地传达中国人思想和情感的一种方式。正如许多人曾说的“一本书相当于一个外交大使”。但是我们遗憾地发现:尽管许多中国文学的优秀作品被翻译出版并被国外的读者所喜爱,但也有很多作品被搁置在国内,或者传播出去的文学的精神内涵遭到了扭曲和误读,从而在国外读者的头脑中形成了并非真实的中国人的影像。这种编码与解码之间的错位所造成的传播失败令我们深思,也急需我们从理论的视角来考察中国文学的对外传播,并努力扭转这一局面。 “编码、解码”与文学传播 霍尔的电视传播的“编码与解码”理论同文学的接受美学理论有相似的理论阐述,但从艺术作品的传播角度来看,霍尔的理论更形象地阐述了文本创作和受众解读之间的密切关系。相对于电视话语的意义产生,文学话语产生意义同样经历了编码――成码――解码的过程。在这样的传播流程中,符号学成为霍尔的理论武器,也成为我们解读文学传播的有力视角。 霍尔指出,电视传播必须以话语方式进行,电视工作者要把现实进行符号化,要把生活现实转化成镜头语言才能进行传播。“这些实践的‘对象’就是以特殊方式组织起来并以符号载体的形式出现的各种意义和信息,它们像任何形式的传播或语言一样,在一种话语的语义链范围之内通过符码的运作而组织起来。”(1)从这一阐述中,我们得知电视生产者建构了某种信息。霍尔认为,在编码阶段,编码者的世界观及对表现实物的观念都会影响电视作品意义的构建。以霍尔的编码理论来观照文学的对外传播,我们发现,同样的信息生产流程也体现在文学的编码过程中。 霍尔指出人类从出生开始就生活在一个符号世界中,人们在不同的文化背景和不同的语言环境下运用不同的符号来解读周遭的世界。中国文字是一种非常特殊的符号,而以此为载体的文学必然不同于字母文字符号,中国文学的编码即是通过对汉字的组合,形成自己的符号体系的能指和所指。比如中国的唐诗和宋词,期间特有的韵味和美感一定被有中国文化背景的人所领会和热爱,而其他文化背景和语言背景的人则很难从中得到审美的享受。 霍尔在他的编码、解码理论中强调电视作品在完成后,它的意义必须在语言的话语规则的制约下才能得以实现。也就是作品在完成后就进入了产品的流通阶段,媒介的意义就得以突显。霍尔指出:“现实存在于语言之外,但它永远要依靠并通过话语来产生。”(2)文学对现实的表现是复杂、丰富而多义的,读者在接受这些文学信息时完全可能通过自己的理解而使作品获得不同的意义。中国文学运用汉语言文字来书写中国人的形象,传达中国人的情感和精神力量,其中许多文学作品的能指或许清晰简洁,但所指却丰富复杂得多。而中国文学作品中所蕴含的这种无限丰富与复杂的欢乐与痛苦却往往并不能为国外的读者所理解。 在文学的对外传播过程中,编码、解码的情境同样存在,而且从编码到解码的过程中,“虽然每一个环节在表述中对于作为整体的流通都是有必要的,但没有一个环节能完全保证下一个环节,尽管要根据下一个才能把它讲清楚”。(3)文学的对外传播起始于发送者所传送的信息,终结于接受者的解读,期间的传播过程是文学意义得以产生的重要环节,只有在编码与解码之间产生对接的情况下,中国文学才会带给西方世界一个完整真实的中国,才会真正起到“外交大使”的作用。 选择、阐释与误读 作为特殊的文化信息,文学在输出到国外的过程中经历了多重的编码。也许人们会认为,

信息理论与编码-期末试卷A及答案

一、填空题(每空1分,共35分) 1、1948年,美国数学家 发表了题为“通信的数学理论”的长篇论文,从而创立了信息论。信息论的基础理论是 ,它属于狭义信息论。 2、信号是 的载体,消息是 的载体。 3、某信源有五种符号}{,,,,a b c d e ,先验概率分别为5.0=a P ,25.0=b P ,125.0=c P ,0625 .0==e d P P , 则符号“a ”的自信息量为 bit ,此信源的熵为 bit/符号。 4、某离散无记忆信源X ,其概率空间和重量空间分别为1 234 0.50.250.1250.125X x x x x P ????=??? ????? 和12 34 0.512 2X x x x x w ???? =??????? ? ,则其信源熵和加权熵分别为 和 。 5、信源的剩余度主要来自两个方面,一是 ,二是 。 6、平均互信息量与信息熵、联合熵的关系是 。 7、信道的输出仅与信道当前输入有关,而与过去输入无关的信道称为 信道。 8、马尔可夫信源需要满足两个条件:一、 ; 二、 。 9、若某信道矩阵为????? ????? ??01000 1 000001 100,则该信道的信道容量C=__________。 10、根据是否允许失真,信源编码可分为 和 。 11、信源编码的概率匹配原则是:概率大的信源符号用 ,概率小的信源符号用 。(填 短码或长码) 12、在现代通信系统中,信源编码主要用于解决信息传输中的 性,信道编码主要用于解决信息传输中的 性,保密密编码主要用于解决信息传输中的安全性。 13、差错控制的基本方式大致可以分为 、 和混合纠错。 14、某线性分组码的最小汉明距dmin=4,则该码最多能检测出 个随机错,最多能纠正 个随机错。 15、码字101111101、011111101、100111001之间的最小汉明距离为 。 16、对于密码系统安全性的评价,通常分为 和 两种标准。 17、单密钥体制是指 。 18、现代数据加密体制主要分为 和 两种体制。 19、评价密码体制安全性有不同的途径,包括无条件安全性、 和 。 20、时间戳根据产生方式的不同分为两类:即 和 。 二、选择题(每小题1分,共10分) 1、下列不属于消息的是( )。 A. 文字 B. 信号 C. 图像 D. 语言 2、设有一个无记忆信源发出符号A 和B ,已知4341)(,)(==B p A p ,发出二重符号序列消息的信源, 无记忆信源熵)(2X H 为( )。 A. 0.81bit/二重符号 B. 1.62bit/二重符号 C. 0.93 bit/二重符号 D . 1.86 bit/二重符号 3、 同时扔两个正常的骰子,即各面呈现的概率都是1/6,若点数之和为12,则得到的自信息为( )。 A. -log36bit B. log36bit C. -log (11/36)bit D. log (11/36)bit 4、 二进制通信系统使用符号0和1,由于存在失真,传输时会产生误码,用符号表示下列事件,x0: 发出一个0 、 x1: 发出一个1、 y0 : 收到一个0、 y1: 收到一个1 ,则已知收到的符号,被告知发出的符号能得到的信息量是( )。 A. H(X/Y) B. H(Y/X) C. H( X, Y) D. H(XY) 5、一个随即变量x 的概率密度函数P(x)= x /2,V 20≤≤x ,则信源的相对熵为( )。 A . 0.5bit B. 0.72bit C. 1bit D. 1.44bit

编码理论基础

1.熟练掌握本课程所需要的数学工具和知识。这是学习本课程的前提条件。这部分内容只作为习题,不会作为期末考试内容。 2.对重要码类的基本概念、原理和相关性质的熟练掌握。应当具备利用它们构造特定具体参数码的能力。应当能熟练应用MacWilliams定理。 3.具备利用课堂所学知识对某个专题进行文献阅读的能力,鼓励学生进行独立思考,初步具备独立选题和对所选题目进行综述的能力。 4.对量子码、四元码、Goppa码等要求具备较多背景知识的内容,只要求学生能听懂和理解,不会作为期末考试内容。 第一次:引言、分组码及其参数 主要内容: 1.介绍编码理论的发展历史和应用背景,并介绍几种简单的编码方法。举例:ISBN码,重复码。 2.介绍分组码的概念及相关参数:码的汉明重量,信息率,覆盖半径,球堆积上界等。 3.介绍基本的译码思路:极大似然译码原则。 第二次:抽象代数(群、环部分) 主要内容: 本次课主要复习抽象代数中关于群和环的基本内容。举例:循环群、模n剩余类环。子群,子环,商环,整环,理想,陪集,同态的像和核,群/环同态基本定理。 第三次:抽象代数(有限域及其多项式部分) 主要内容: 1.域的概念和具体构造:素域,域上一元多项式环的性质(主理想整环)及其商环,不可约多项式,域的同构。 2.域的抽象理论:域自同构,极小多项式,多项式的分解。 3.域的结构:乘法群结构(循环群,本原元),加法群结构(向量空间) 第四次:线性码、重量多项式 主要内容: 1.线性码的基本概念和参数,生成矩阵,校验矩阵,对偶码 2.线性码的译码:伴随(syndrome),coset leader 3.二元汉明码及其性质 4.码的重量分布和重量多项式:MacWilliams定理 第五次:循环码基础 主要内容: 1.不可约多项式在扩域中的分解 2.循环码:定义,多项式表示,生成多项式,校验多项式,参数 3.极大循环码,极小循环码 第六次:循环码(续) 主要内容: 1.循环码的生成矩阵和校验矩阵 2.循环码的零点。二元汉明码的循环码形式 3.循环码的幂等元

相关文档
相关文档 最新文档