文档库 最新最全的文档下载
当前位置:文档库 › 计算机一级B选择题6(ASCII码与汉字编码)

计算机一级B选择题6(ASCII码与汉字编码)

计算机一级B选择题6(ASCII码与汉字编码)
计算机一级B选择题6(ASCII码与汉字编码)

ASCII码与汉字编码

1)下列关于ASCII编码的叙述中,正确的是B

A)一个字符的标准ASCII码占一个字节,其最高二进制位总为1

B)所有大写英文字母的ASCII码值都小于小写英文字母…a?的ASCII码值

C)所有大写英文字母的ASCII码值都小于小写英文字母…a?的ASCII码值

D)标准ASCII码表有256个不同的字符编码

2)在下列字符中,其ASCII码值最大的一个是C

A)9 B)Z C)d D) X

3)在一列字符中,其ASCII码值最小的一个是A

A) 空格字符B)0 C)A D)a

4) 已知英文字母m的ASCII码值为6DH,那么字母q的ASCII码值是B

A)70H B)71H C)72H D)6FH

5)已知英文字母m的ASCII码值为109,那么字母p的ASCII码值是A A)112 B)113 C)111 D)114

6)字符比较大小实际是比较它们的ASCII码值,正确的比较是B

A)?A?比?B?大B)?H?比?h?小

C) ?F?比?D?小D) ?9?比?D?大

7)一个字符的标准ASCII码码长是B

A)8bits B)7bits C)16bits D)6bits

8)在微机中,西文字符所采用的编码是B

A)EBCDIC码B)ASCII码C)国标码D)BCD码

9)已知英文字母m的ASCII码值为6DH,那么ASCII码值为70H的英文字母是C

A)P B)Q C)p d)j

10)在标准ASCII码表中,已知英文字母D的ASCII码是01000100,英文字母A的ASCII 码是A

A)01000001 B)01000010 C)01000011 D)01000000

11)在标准ASCII码表中,已知英文字母A的ASCII码是01000001,英文字母F的ASCII 码是D

A)01000011 B)01000100 C)01000101 D)01000110

12)A的ASCII码是01000001,则英文字母E的ASCII码是C

A)01000011 B)01000100 C)01000101 D)01000010

13)在标准的ASCII码表中,已知英文字母A的ASCII码是01000001,英文字母D的ASCII码是B

A)01000011 B)01000100 C)01000101 D)01000110

14)计算机的存储器中,组成一个字节(Byte)的二进制位(bit)个数是B A)4 B)8 C)16 D)32

15)标准ASCII码用7位二进制位表示一个字符的编码,其不同的编码共有B A)127个B)128个C)256个D)254个

16)已知三个字符为:a、X和5,按它们的ASCII码值升序排序,结果是D

A)5.a.X B)a.5.X C)X.a.5 D)5.X.a

17)在标准ASCII编码表中,数字码、小写英文字母和大写英文字母的前后次序是C

A)数字、小写英文字母、大写英文字母

B)小写英文字母、大写英文字母、数字

C)数字、大写英文字母、小写英文字母

D)大写英文字母、小写英文字母、数字

18) 根据汉字国标码GB2312-80的规定,将汉字分为常用汉字和次常用汉字两级。次常用汉字的排列次序是按A

A)偏旁部首B)汉语拼音字母

C)笔划多少D)使用频率多少

19)一个汉字的国标码需用2字节存储,其每个字节的最高二进制位的值分别为A

A)0,0 B)1,0 C)0,1 D)1,1

20)根据汉字国标GB2312-80的规定,二级次常用汉字个数是C

A)3000个B)7455个C)3008个D)3755个

21)若已知一汉字的国标码是5E38H,则其内码是A

A)DEB8H D)E38H C)5EB8H D)7E58H

22)假设某台式计算机内存储器的容量为1KB,其最后一个字节的地址是D

A)1023H B)1024H C)0400H D)03FFH

23)一个汉字的内码与它的国标码之间的差是C

A)2020H B)4040H C)8080H D)A0A0H

24)已知汉字“家”的区位码是2850,则其国标码是B

A)4870D B)3C52H C)9C2H D)A8D0H

25)汉字国标码(GB2312-80)把汉字分成2个等级。其中一级常用汉字的排列顺序是按A

A)汉语拼音字母顺序B)偏旁部首

C)笔划多少D)以上都不对

26)汉字输入码可分为有重码和无重码两类,下列属于无重码类的是C

A)全拼码B)自然码C)区位码D)简拼码

27)存储一个24*24点的汉字字形码需要D

A)32字节B)48字节C)64字节D)72字节

28)下列编码中,属于正确的汉字内码的是C

A)5EF6H B)FB67H C)A3B3H D)C97DH

29)一个汉字的机内码与国标码之间的差别是A

A)前者各字节的最高位二进制值各为1,而后者为0

B)前者各字节的最高位二进制值各为0,而后者为1

C)前者各字节的最高位二进制值各为1,0,而后者为0,1

D)前者各字节的最高位二进制值各为0,1,而后者为1,0

30)汉字国标码(GB2312-80)把汉字分成C

A)简化字和繁体字两个等级

B)一级汉字、二级汉字和三级汉字三个等级

C)一级常用汉字、二级次常用汉字两个等级

D)常用字、次常用字、罕见字三个等级

31)汉字区位码分别用十进制的区号和位号表示。其区号和位号的范围分别是C A)0~94,0~94 B)1~95,1~95

C)1~94,1~94 D)0~95,0~95

32)一个汉字的内码长度为2字节,其每个字节的最高二进制位的值分别为B

A) 0,0 B) 1,1 C) 1,0 D) 0,1

33) 一个汉字的16*16点阵字形码长度的字节数是C

A)16 B)24 C)32 D)40

34)根据国标GB2312-80的规定,总计有各类符号和一、二级汉字编码B A)7145个B)7445个C)3008个D)3755个

35)设已知一汉字的国标码是5E48则其内码应该是

A)DE48H B)DEC8H C)5EC8H D)7E68H 36)存储一个汉字的内码需用的字节个数是C

A)4 B)3 C)2 D)1

37)在微型计算机内部,对汉字进行传输,处理和存储时使用汉字的D A)国标码B)字形码C)输入码D)机内码

38)一个汉字的内码和它的国标码之间的差是C

A)2020H B)4040H C)8080H D)A0A0H

点阵LED显示原理与点阵汉字库的编码和从标准字库中提取汉字编码的方法

点阵LED显示原理与点阵汉字库的编码和从标准字库中提取汉字编码的方法。2009年06月03日下午 04:27 一.实验要求 编程实现中英文字符的显示。 二.实验目的 1.了解LED点阵显示的基本原理和实现方法。 2.掌握 三.实验电路及连线 点阵显示模块WTD3088的(红色)列输入线接至内部LED的阴极端,行输入线接至内部LED的阳极端(若阳极端输入为高电平,阴极端输入低电平,则该LED 点亮)。发光点的分布如图22-0所示。

Fig 22-0 WTD3088 LED分布 如图22-1示,本实验模块使用74LS374来控制列输入线的电平值。将74LS374的某输出置0,则对应的LED阴极端被置低。如图22-2示,本实验模块使用 74LS273来控制行输入线,并通过9013提供电流驱动。将74LS273的某输出置1,则对应的LED阳极端被置高。每次系统重新开启或总清后,74LS273输出为全0,LED显示被关闭。 通过编程控制各显示点对应LED阳极和阴极端的电平,就可以有效的控制各显示点的亮灭。 Fig 22-1 LED模块及列扫描电路

Fig 22-2 行扫描电路 Fig 22-3地址译码电路

本实验模块使用4块WTD3088组成16×16点阵,以满足汉字显示的要求。为了方便的控制四个单元,使用了一片74LS139译码,产生四个地址片选信号:CLKR1= CSLED,CLKR2= CSLED+1,用于行控制的两片74LS273;CLKC1= CSLED+2,CLKC2= CSLED+3,用于列控制的两片74LS374。 实验接线:按示例程序,模块的CSLED接51/96地址的8000H。 四.实验说明 使用高亮度LED发光管构成点阵,通过编程控制可以显示中英文字符、图形及视频动态图形。LED显示以其组构方式灵活、亮度高、技术成熟、成本低廉等特点在证券、运动场馆及各种室内/外显示场合得到广泛的应用。 所显示字符的点阵数据可以自行编写(即直接点阵画图),也可从标准字库(如ASC16、HZ16)中提取。后者需要正确掌握字库的编码方法和字符定位的计算。 实验盘片中“字符转换”子目录下提供的,可方便的将单个字符的码表从标准字库Asc16,Hzk16中提取出来。具体使用方法是运行上述可执行程序,根据提示输入所需字符(如是汉字还需要先启动dos下的汉字环境,如ucdos,pdos95等)。程序将该字符的码表提取出来,存放在该字符ASC或区位码为文件名称的.dat 文件中。用户只需将该文件中内容拷贝、粘贴到自己的程序中即可。但需要注意字节排列顺序、字节中每一位与具体显示点的一一对应关系,必要时还要对码表

字符汉字编码学案.doc

字符汉字编码学案 一、请同学们仔细观察下面的数据,发现石什么规律吗? 十进制二进制 00 11 210 311 4100 5101 6110 7111 8100 9100 1 10101 11101 1 12110 13110 1 14111 15111 1 161000 思考: 7> 〃个二进制位最大值是多少?数学公式为? 2、用〃个二进制位最多可以表示多少种不同的信息?数学公式为 3、要表示X个状态至少要用几位二进制? 二、二进制虽然复合计算机的特点,但不便于我们人类书写和记忆,转换成十进制乂费时费力,你有什么好的方法吗? 请同学们观察书木P5的图表,思考十六进制的特点

10U0011B=D 68D=B 110010B=H 43H=B 11 1011 B 12 1100 C 13 1101 D 14 1110 E 15 1111 F 1、从位数上来分析,十六进制和二进制位数上存在什么样的比例关系:? 2、 二进制、十进制、十六进制的标识分别是大写字母\\ 3、 小组探究任务:十进制与二进制互换: HOIOOIOB ==?H 7FH=? B (请同学们熟悉进位制的标识) 你觉得用十六进制来记录二进制的优点有哪些:? 4、 50D=B 110110B=D 1110011B=H 101H=B (选择手工或计算器来完成) 三、任务挑战: 1、(请分别用智能ABC 和智能拼音输入) 右图是演员王刚在影视作品《宰相刘罗锅》中的塑造的人物 9 . 另外大家认得这个“幼”字吗?它的读音是? 2、 同学们觉得上述现象的原因是? 3、 双击打开“验证字符的ASCII 码.exe”或“查询字符的编码.exe”,观 察26个英文字母 和十个数字所对应的编码;汉字能不能查看?例如输入“效实”,会有什么结果?为什么? 四、一探究竟 打开桌而上的快捷方式:? Ultra Edit,熟悉使用后,完成下列任务: 1、 完成学生活动手册中Plv 实践一>中的4. (1)、(2)、(3) (4),并在活动手册上做好相 关记录,思考其中的GBK 和GB2312指什么?可参考书本P7内容 2、 小组探究任务(结合刚才的实践活动和书本P6-P8的内容) (1)日前国际上通用的字符编码是 ___________ ,占―位二进制,最多能表示 个 字母符号等内容 (2)作为世界上三大古老文字之一的汉字,计算机乂是如何对其进行编码的?即编码的 名称是,占—位二进制,原因是? (3)拼音码、GB2312、处理码、字形码是同一种编码吗?为什么? 知识链接:汉字的编码(交换码)知多少: GB2312: 6763 个汉字(80 年)

汉字编码原理

1、汉字编码原理 到底怎么办到随机生成汉字的呢?汉字从哪里来的呢?是不是有个后台数据表,其中存放了所需要的所有汉字,使用程序随机取出几个汉字组合就行了呢?使用后台数据库先将所有汉字存起来使用时随机取出,这也是一种办法,但是中文汉字有这么多,怎么来制作呢?其实可以不使用任何后台数据库,使用程序就能做到这一切。要知道如何生成汉字,就得先了解中文汉字的编码原理。 1980年,为了使每一个汉字有一个全国统一的代码,我国颁布了第一个汉字编码的国家标准: GB2312-80《信息交换用汉字编码字符集》基本集,简称GB2312,这个字符集是我国中文信息处理技术的发展基础,也是国内所有汉字系统的统一标准。到了后来又公布了国家标准GB18030-2000《信息交换用汉字编码字符集基本集的扩充》,简称GB18030,编程时如果涉及到编码和本地化的朋友应该对GB18030很熟悉。这是是我国继GB2312-1980和GB13000-1993之后最重要的汉字编码标准,同时也是未来我国计算机系统必须遵循的基础性标准之一。 目前在中文WINDOWS操作系统中,.Net编程中默认的的代码页就是GB18030简体中文。但是事实上如果生成中文汉字验证码只须要使用GB2312字符集就已经足够了。字符集中除了我们平时大家都认识的汉字外,也包含了很多我们不认识平时也很少见到的汉字。如果生成中文汉字验证码中有很多我们不认识的汉字让我们输入,对于使用拼音输入法的朋友来说可不是好事,五笔使用者还能勉强根据汉字的长相打出来,呵呵!所以对于GB2312字符集中的汉字我们也不是全都要用。 中文汉字字符可以使用区位码来表示,见 汉字区位码表 https://www.wendangku.net/doc/cd11137580.html,/resource/gb2312tbl. htm 汉字区位码代码表 https://www.wendangku.net/doc/cd11137580.html,/resource/gb2312tbm.htm 如果链接不上可以搜一下汉字区码表. 其实这两个表是同一回事,只不过一个使用十六进制分区表示,一个使用区位所在的数字位置表示。例如“好”字的十六进制区位码是ba c3,前两位是区域,后两位代表位置,ba处在第26区,“好”处在此区汉字的第35位也就是c3位置,所以数字代码就是2635。这就是GB2312汉字区位原理。根据《汉字区位码表》我们可以发现第15区也就是AF区以前都没有汉字,只有少量符号,汉字都从第16区B0开始,这就是为什么GB2312字符集都是从16区开始的。 2、.Net程序处理汉字编码原理分析 在.Net中可以使用System.Text来处理所有语言的编码。在System.Text命名空间中包含众多编码的类,可供进行操作及转换。其中的Encoding类就是重点处理汉字编码的类。通过在.Net文档中查询Encoding类的方法我们可以发现所有和文字编码有关的都是字节数组,其中有两个很好用的方法: Encoding.GetBytes ()方法将指定的 String 或字符数组的全部或部分内容编码为字节数组 Encoding.GetString ()方法将指定字节数组解码为字符串。

Unicode汉字编码表

Unicode汉字编码表 1 Unicode编码表 Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, 比如汉字"经"的编码是0x7ECF,注意字符编码一般用十六进制来 表示,为了与十进制区分,十六进制以0x开头,0x7ECF转换成十进制 就是32463,UCS-2用两个字节来编码字符,两个字节就是16位二进制, 2的16次方等于65536,所以UCS-2最多能编码65536个字符。 编码从0到127的字符与ASCII编码的字符一样,比如字母"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编码是0x61,十进制也是97, 对于汉字的编码,事实上Unicode对汉字支持不怎么好,这也是没办法的, 简体和繁体总共有六七万个汉字,而UCS-2最多能表示65536个,才六万 多个,所以Unicode只能排除一些几乎不用的汉字,好在常用的简体汉字 也不过七千多个,为了能表示所有汉字,Unicode也有UCS-4规范,就是用 4个字节来编码字符,不过现在普遍采用的还是UCS-2,只用两个字节来 编码,看一下Unicode对汉字的编码:

------------------------------------------------------------------------ 2 汉字编码表 U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F ----------------------------------------------------- 4e00 一丁丂七丄丅丆万丈三上下丌不与丏 4e10 丐丑丒专且丕世丗丘丙业丛东丝丞丟 4e20 丠両丢丣两严並丧丨丩个丫丬中丮丯 4e30 丰丱串丳临丵丶丷丸丹为主丼丽举丿 4e40 乀乁乂乃乄久乆乇么义乊之乌乍乎乏 4e50 乐乑乒乓乔乕乖乗乘乙乚乛乜九乞也 4e60 习乡乢乣乤乥书乧乨乩乪乫乬乭乮乯 4e70 买乱乲乳乴乵乶乷乸乹乺乻乼乽乾乿 4e80 亀亁亂亃亄亅了亇予争亊事二亍于亏 4e90 亐云互亓五井亖亗亘亙亚些亜亝亞亟 4ea0 亠亡亢亣交亥亦产亨亩亪享京亭亮亯 4eb0 亰亱亲亳亴亵亶亷亸亹人亻亼亽亾亿 4ec0 什仁仂仃仄仅仆仇仈仉今介仌仍从仏 4ed0 仐仑仒仓仔仕他仗付仙仚仛仜仝仞仟 4ee0 仠仡仢代令以仦仧仨仩仪仫们仭仮仯 4ef0 仰仱仲仳仴仵件价仸仹仺任仼份仾仿 4f00 伀企伂伃伄伅伆伇伈伉伊伋伌伍伎伏 4f10 伐休伒伓伔伕伖众优伙会伛伜伝伞伟 4f20 传伡伢伣伤伥伦伧伨伩伪伫伬伭伮伯

UTF8与GBK字符编码之间的相互转换

UTF8与GBK字符编码之间的相互转换 C++ UTF8编码转换CChineseCode 一预备知识 1,字符:字符是抽象的最小文本单位。它没有固定的形状(可能是一个字形),而且没有值。“A”是一个字符,“€”(德国、法国和许多其他欧洲国家通用货币的标志)也是一个字符。“中”“国”这是两个汉字字符。字符仅仅代表一个符号,没有任何实际值的意义。 2,字符集:字符集是字符的集合。例如,汉字字符是中国人最先发明的字符,在中文、日文、韩文和越南文的书写中使用。这也说明了字符和字符集之间的关系,字符组成字符集(iso8859-1,GB2312/GBK,unicode)。 3,代码点:字符集中的每个字符都被分配到一个“代码点”。每个代码点都有一个特定的唯一数值,称为标值。该标量值通常用十六进制表示。 4,代码单元:在每种编码形式中,代码点被映射到一个或多个代码单元。“代码单元”是各个编码方式中的单个单元。代码单元的大小等效于特定编码方式的位数:UTF-8 :UTF-8 中的代码单元由8 位组成;在UTF-8 中,因为代码单元较小的缘故,每个代码点常常被映射到多个代码单元。代码点将被映射到一个、两个、三个或四个代码单元;UTF-16 :UTF-16 中的代码单元由16 位组成;UTF-16 的代码单元大小是8 位代码单元的两倍。所以,标量值小于 U+10000 的代码点被编码到单个代码单元中;UTF-32:UTF-32 中的代码单元由32 位组成;UTF-32 中使用的32 位代码单元足够大,每个代码点都可编码为单个代码单元;GB18030:GB18030 中的代码单元由8 位组成;在GB18030 中,因为代码单元较小的缘故,每个代码点常常被映射到多个代码单元。代码点将被映射到一个、两个或四个代码单元。 5,举例:“中国北京香蕉是个大笨蛋”这是我定义的aka字符集; 各字符对应代码点为: 北00000001 京00000010 香10000001 蕉10000010 是10000100 个10001000 大10010000 笨10100000 蛋11000000 中00000100 国00001000 下面是我定义的zixia 编码方案(8位),可以看到它的编码中表示了aka字符集的所有字符对应的代码单元; 北10000001 京10000010 香00000001 蕉00000010 是00000100 个00001000 大00010000 笨00100000 蛋01000000 中10000100 国10001000 所谓文本文件就是我们按一定编码方式将二进制数据表示为对应的文本如00000001000000100000010000001000000100000010000001000000这样的文件。我用一个支持zixia编码和aka字符集的记事本打开,它就按照编码方案显示为“香蕉是个大笨蛋” 如果我把这些字符按照GBK另存一个文件,那么则肯定不是这个,而是1100111111100011

编码问题

字符编码问题 编码方式: 一.iso8859-1(latin1) a)一个字节一个字符英文字母 二.gb2312 - gbk a)2个字节一个字符 gbk原生的兼容iso8859-1 三.Utf-8 - unicode字符集 3个字节一个字符兼容iso8859-1,不兼容其他码表 四.乱码:编码和解码用的码表不一样,也就是编码解码方式不一样 1.基础知识 计算机中储存的信息都是用二进制数表示的;而我们在屏幕上看到的英文、汉字等字符是二进制数转换之后的结果。通俗的说,按照何种规则将字符存储在计算机中,如'a'用什么表示,称为"编码";反之,将存储在计算机中的二进制数解析显示出来,称为"解码",如同密码学中的加密和解密。在解码过程中,如果使用了错误的解码规则,则导致'a'解析成'b'或者乱码。 字符集(Charset):是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。 字符编码(Character Encoding):是一套法则,使用该法则能够对自然语言的字符的一个集合(如字母表或音节表),与其他东西的一个集合(如号码或电脉冲)进行配对。即在符号集合与数字系统之间建立对应关系,它是信息处理的一项基本技术。通常人们用符号集合(一般情况下就是文字)来表达信息。而以计算机为基础的信息处理系统则是利用元件(硬件)不同状态的组合来存储和处理信息的。元件不同状态的组合能代表数字系

统的数字,因此字符编码就是将符号转换为计算机可以接受的数字系统的数,称为数字代码。 2.常用字符集和字符编码 常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。 2.1. ASCII字符集&编码 ASCII(A merican S tandard C ode for I nformation I nterchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其扩展版本EASCII 则可以勉强显示其他西欧语言。它是现今最通用的单字节编码系统(但是有被Unicode追上的迹象),并等同于国际标准ISO/IEC 646。 ASCII字符集:主要包括控制字符(回车键、退格、换行键等);可显示字符(英文大小写字符、阿拉伯数字和西文符号)。 ASCII编码:将ASCII字符集转换为计算机可以接受的数字系统的数的规则。使用7位(bits)表示一个字符,共128字符;但是7位编码的字符集只能支持128个字符,为了表示更多的欧洲常用字符对ASCII进行了扩展,ASCII扩展字符集使用8位(bits)表示一个字符,共256字符。ASCII字符集映射到数字编码规则如下图所示: 图1 ASCII编码表 图2 扩展ASCII编码表 ASCII的最大缺点是只能显示26个基本拉丁字母、阿拉伯数目字和英式标点符号,因此只能用于显示现代美国英语(而且在处理英语当中的外来词如na?ve、café、élite等等时,所有重音符号都不得不去掉,即使这样做会违反拼写规则)。而EASCII虽然解决了部份西

字符编码简介:ASCII,Unicode,UTF-8,GB2312

字符编码简介:ASCII,Unicode,UTF-8,GB2312 字符编码简介:ASCII,Unicode,UTF-8,GB2312 1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码,一直沿用至今。 ASCII码一共规定了128个字符的编码,比如空格“SPACE”是32(二进制00100000),大写的字母A是65(二进制01000001)。这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的1位统一规定为0。 2、非ASCII编码 英语用128个符号编码就够了,但是用来表示其他语言,128个符号是不够的。比如,在法语中,字母上方有注音符号,它就无法用ASCII码表示。于是,一些欧洲国家就决定,利用字节中闲置的最高位编入新的符号。比如,法语中的é的编码为130(二进制10000010)。这样一来,这些欧洲国家使用的编码体系,可以表示最多256个符号。 但是,这里又出现了新的问题。不同的国家有不同的字母,因此,哪怕它们都使用256个符号的编码方式,代表的字母却不一样。比如,130在法语编码中代表了é,在希伯来语编码中却代表了字母Gimel (?),在俄语编码中又会代表另一个符号。但是不管怎样,所有这些编码方式中,0—127表示的符号是一样的,不一样的只是128—255的这一段。至于亚洲国家的文字,使用的符号就更多了,汉字就多达10万左右。一个字节只能表示256种符号,肯定是不够的,就必须使用多个字节表达一个符号。比如,简体中文常见的编码方式是GB2312,使用两个字节表示一个汉字,所以理论上最多可以表示256x256=65536个符号。 中文编码的问题需要专文讨论,这篇笔记不涉及。这里只指出,虽然都是用多个字节表示一个符号,但是GB类的汉字编码与后文的Unicode和UTF-8是毫无关系的。

汉字编码表示与显示

汉字编码表示与显示 一、汉字的编码 1981年5月,我国国家标准总局颁布了《信息交换用汉字编码字符集》(GB2312-80),简称国家标准汉字编码,也叫国标码。国标码共收进标准字符7445个。其中一级汉字3755个,二级汉字3008个,共计6763个汉字。由于汉字的字符多,一个字节即8位二进制代码不足以表示所有的常用汉字。同时为了不与西文的ASCII码混淆,汉字国标码的每个汉字或符号都使用2个字节(16位二进制)代码来表示。西文字符采用一个字节表示,即ASCII码,一般只用七位来表示128个字符,而把最高位用作奇偶校验(或者不用)。 国标码介绍:在GB2312-80代码表中,纵向分为0~93,共94行;横向也是0~93,共94列。行与列分别用b7b6b5b4b3b2b1七位二进制码表示,第一字节表示行,第二字节表示列。其值从0100001到1111110(十六进制为21-7E)。这正是ASCII码的可打印字符的编码范围。国标码是将第一字节和第二字节连写而得。由于二进太长,一般用十六进制表示。 区位码介绍:在国标GB2312-80中,国标码除了用双七位二进制表示外,还可以表示成区位码的形式。即在国标代码表中,将行号称为区号,列号称为位号,分别有94个区和94个位。区号和位号用十进制表示,不足两位前面补0。这样每个汉字或符号都可用4位十进制表示。区位码因此可以用来作输入码。是汉字输入的基本编码方法之一。 机内码介绍:在计算机中双字节汉字与单字节西文字符混合使用、处理,汉字编码的各个字节若不予以特别标识,就会与单字节的ASCII码混淆不清;为此,将标识汉字的两个字节编码的最高位置为1,这种最高位为1的双字

计算机一级b选择题6(ascii码与汉字编码) (2)

ASCII码与汉字编码 1)下列关于ASCII编码的叙述中,正确的是B A)一个字符的标准ASCII码占一个字节,其最高二进制位总为1 B)所有大写英文字母的ASCII码值都小于小写英文字母‘a’的ASCII码值 C)所有大写英文字母的ASCII码值都小于小写英文字母‘a’的ASCII码值 D)标准ASCII码表有256个不同的字符编码 2)在下列字符中,其ASCII码值最大的一个是C A)9 B)Z C)d D) X 3)在一列字符中,其ASCII码值最小的一个是A A) 空格字符B)0 C)A D)a 4) 已知英文字母m的ASCII码值为6DH,那么字母q的ASCII码值是B A)70H B)71H C)72H D)6FH 5)已知英文字母m的ASCII码值为109,那么字母p的ASCII码值是A A)112 B)113 C)111 D)114 6)字符比较大小实际是比较它们的ASCII码值,正确的比较是B A)’A’比’B’大B)’H’比’h’小 C) ’F’比’D’小D) ’9’比’D’大 7)一个字符的标准ASCII码码长是B A)8bits B)7bits C)16bits D)6bits 8)在微机中,西文字符所采用的编码是B A)EBCDIC码B)ASCII码C)国标码D)BCD码 9)已知英文字母m的ASCII码值为6DH,那么ASCII码值为70H的英文字母是C

A)P B)Q C)p d)j 10)在标准ASCII码表中,已知英文字母D的ASCII码是01000100,英文字母A的ASCII 码是A A)01000001 B)01000010 C)01000011 D)01000000 11)在标准ASCII码表中,已知英文字母A的ASCII码是01000001,英文字母F的ASCII 码是D A)01000011 B)01000100 C)01000101 D)01000110 12)A的ASCII码是01000001,则英文字母E的ASCII码是C A)01000011 B)01000100 C)01000101 D)01000010 13)在标准的ASCII码表中,已知英文字母A的ASCII码是01000001, 英文字母D的ASCII码是B A)01000011 B)01000100 C)01000101 D)01000110 14)计算机的存储器中,组成一个字节(Byte)的二进制位(bit)个数是B A)4 B)8 C)16 D)32 15)标准ASCII码用7位二进制位表示一个字符的编码,其不同的编码共有B A)127个B)128个C)256个D)254个 16)已知三个字符为:a、X和5,按它们的ASCII码值升序排序,结果是D A)5.a.X B)a.5.X C)X.a.5 D)5.X.a 17)在标准ASCII编码表中,数字码、小写英文字母和大写英文字母的前后次序是C A)数字、小写英文字母、大写英文字母 B)小写英文字母、大写英文字母、数字 C)数字、大写英文字母、小写英文字母 D)大写英文字母、小写英文字母、数字

相关文档