汉字国际码把汉字分为哪些等级

汉字国际码把汉字分为哪些等级
汉字国际码把汉字分为一级汉字和二级汉字两个,其中一级汉字有3755个汉字,二级汉字有3008个汉字 。同时,GB2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符 。GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率 。对于人名、古汉语等方面出现的罕用字,GB2312不能处理,这导致了后来GBK及GB18030汉字字符集的出现 。
GB232-80汉字标码把汉字分成几等级1980年颁布了《信息交换用汉字编码字符集—基本集》的国标交GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;
6763 个汉字,字体为简化字,分成两级 。第一级汉字 3755 个,按拼音排序,约占近代文献汉字累计使用频度 99.9% 左右;二级汉字 3008 个,按部首、笔画排序 。一、二级汉字约占累计使用频度 99.99% 以上 。
202 个一般符号 。其中包括 1.~20.,(1)~(20),①~⑩,(-)~(+) 等 。
22 个数字 。其中 0~9 共 10 个,Ⅰ~Ⅻ 共 12 个 。
52 个拉丁字母 。其中大写字母 A~Z 26 个,小写字母 a~z 26 个 。
169 个日文假名 。其中平假名 83 个,片假名 86 个 。
48 个希腊字母 。其中大写字母 Α~Ω24 个,小写字母 α~ω 24 个 。
66 个俄文字母 。其中大写字母 А~Я33 个,小写字母 а~я 33 个 。
26 个汉语拼音符号,包括带声调符号和其它符号的字母 。
37 个汉语注音字母,ㄅ~ㄥ 。
汉子国际码(gb2312-80)规定的汉字编码,每个汉字用GB2312-80把汉字分成两个等级:一级汉字与二级汉字
区码:
1~8
是符号区,全角英文字母,希腊、日文、俄文等等,
9
区是造表符号
10~15
空,未定义,
16~55
一级字库
汉字3755个,采用拼音排序;
56-87
二级字库,汉字3008个,采用部首排序;
87~94空
每一个汉字有一个全国统一的代码 。
区位码是一个四位的十进制数,它的前两位叫做区码,后两位叫做位码 。
汉字库分布情况如下:
一级汉字
16-55区
二级汉字
56-87区
区位码加上2020H,就得到国标码 。
国标码加上8080H,就得到常用的计算机机内码 。
汉字国标码规定了一级汉字多少个二级汉字多少个为适应计算机处理汉字信息的需要,我国于1981年发布了《信息处理交换用汉字编码字符集
基本集》gb2312-80
gb2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(2oh),因此也称为区位码 。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区 。gb2312将收录的汉字分成两级:第一级是常用汉字计
3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列 。故而
gb2312最多能表示6763个汉字
国标码gb/t2312---1980中,共收录汉字和图形符号( )个国标码(GB2312-80)依据使用频度,把汉字分成一级常用汉字、二级次常用汉字两个等级 。
在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码,每个汉字使用2个字节 。整个字符集分成94个区,每区有94个位 。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码 。

汉字国际码把汉字分为哪些等级

文章插图

推荐阅读