阀门柔性传动装置:国标码的详细资料

来源:百度文库 编辑:神马品牌网 时间:2024/04/29 00:53:24
国标码GB2312_80分几级汉字,具体是什么。在内存中是如何表示的?汉字和字符分别是如何表示的?为什么一个字节中汉字的取值范围从33-126?

国标码
我国的汉字字量多,达五,六万,由于汉字数量远远大于七位编码所能表示的容量,根据国家标准GB2311规定:一个汉字必须用两个或两个以上的七位编码表示.
在GB2312-80(又称《信息交换用汉字编码字符集》)中,共收集了7445个图形字符,其中汉字为6763个(基本汉字集), 据1975年的查频统计,这6763个字的使用覆盖率可达99.99%,其中三,四千个常用汉字覆盖率达99.9%左右;一般符号,数字,拉丁字母,希腊字母,汉语拚音等682个.
GB2312-80目前广泛用于我国通用汉字系统的信息交换及硬软件设计工作中.其中汉字分为两级,一级常用汉字3755个,按汉语拚音字母排序;二级常用字3008个按部首排列.
在GB2312-80中,汉字的排布共分94行,每行94列.行序和列序均用7位二进制编码表示,并分别用一个字节存放,每个位序编码的最高位都增补一个"0".其中行序代码称为第一字节(高位字节),列序代码称为第二字节(低位字节),由行序代码和列序代码组合而成的双字节编码,称为GB2312-80字符集中对应位置处字符的国标码.
以双字节七位二进制代码组合而成的国标码,其行序代码(高位字节)和列序代码(低位字节)的表示是相互独立的,在编码转换过程中,不存在低位字节向高位字节进位的问题.
理论上,国标码的行序代码和列序代码的编码范围均为0100001~1111110,采用国标编码,共可表示94×94(即8836)个汉字.实际上,表中尚留有空位作为扩充之用.
国标码常采用十六进制书写,一个汉字在国标码中的编码是唯一的,所以国标码是一种无重码,也称整字编码.由于一个国标字符编码占用两个字节,所以又称"全角"编码.
例:表中一级汉字中的第一个汉字"啊" 的国标码编码为:
0110000 0100001 或书写成 30 21 H