国家卫生标准:ASCⅡ与GB2312-80的关系

来源:百度文库 编辑:神马品牌网 时间:2024/04/28 22:31:56
搜索得知GB2312-80是使用两个字节(16位二进制数)表示一个汉字的编码,共收录简化汉字及符号、字母、日文假名等共7445个图形字符,其中6763个汉字(一级汉字3755个,二级汉字3008个),同时还收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄罗斯语西里尔字母在内的682个全形字符.
对此我有两点疑问:
1.16位二进制数最多只能够表示65536(2^16)个不同的字符,那么怎么都有7445个图形字符呢?
2.两个字节,一个字节有7位二进制数,两个不是14位吗?16位是怎么来的?
望高手解答!

两字节的GB编码其实形如“1xxxxxxx1xxxxxxx”(按位)。编码为十六位,可以写入两种值的有十四位,每一个字节第一位必须为1,这是标记。因为,ASCII的第一位为0。注意:这里说的ASCII是美国标准,不是国际扩展版标准。(国际版含256字符,不是128)