您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息

gbk编码的范围是多少?

2024/3/22 2:45:08发布24次查看
gbk编码,是对gb2312编码的扩展,因此完全兼容gb2312-80标准。gbk编码依然采用双字节编码方案,其编码范围:8140-fefe(高字节从81到fe,低字节从40到fe),剔除xx7f码位,共23940个码位。
gbk编码共收录汉字和图形符号21886个,其中汉字(包括部首和构件)21003个,图形符号883个。gbk编码支持国际标准iso/iec10646-1和国家标准gb13000-1中的全部中日韩汉字,并包含了big5编码中的所有汉字。gbk编码方案于1995年12月15日正式发布,这一版的gbk规范为1.0版。
一、码位分配及顺序
gbk 亦采用双字节表示,总体编码范围为 8140-fefe,首字节在 81-fe 之间,尾字节在 40-fe 之间,剔除 xx7f 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。
全部编码分为三大部分:
1、汉字区。
包括:
a. gb 2312 汉字区。即 gbk/2: b0a1-f7fe。收录 gb 2312 汉字 6763 个,按原顺序排列。
b. gb 13000.1 扩充汉字区。包括:
 (1)、 gbk/3: 8140-a0fe。收录 gb 13000.1 中的 cjk 汉字 6080 个。
 (2) 、gbk/4: aa40-fea0。收录 cjk 汉字和增补的汉字 8160 个。cjk 汉字在前,按 ucs 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。
 (3) 、汉字“〇”安排在图形符号区gbk/5:a996。
2、图形符号区。
包括:
a. gb 2312 非汉字符号区。即 gbk/1: a1a1-a9fe。其中除 gb 2312 的符号外,还有 10 个小写罗马数字和 gb 12345 增补的符号。计符号 717 个。
b. gb 13000.1 扩充非汉字区。即 gbk/5: a840-a9a0。big-5 非汉字符号、结构符和“〇”排列在此区。计符号 166 个。
3、 用户自定义区:
分为(1)(2)(3)三个小区。
(1)、 aaa1-affe,码位 564 个。
(2) 、f8a1-fefe,码位 658 个。
(3) 、a140-a7a0,码位 672 个。
第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。
二、字形
gbk 对字形作了如下的规定:
1. 原则上与 gb 13000.1 g列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致。
2. 在 cjk 汉字认同规则的总框架内,对所有的 gbk 编码汉字实施“无重码正形”(“gb 化”);即在不造成重码的前提下,尽量采用中国新字形。
3. 对于超出 cjk 汉字认同规则的、或认同规则尚未明确规定的汉字,在 gbk 码位上暂安放旧字形。这样,在许多情况下 gbk 收入了同一汉字的新旧两种字形。
4. 非汉字符号的字形,凡 gb 2312 已经包括的,与 gb 2312 保持一致;超出 gb 2312 的部分,与 gb 13000.1 保持一致。
5. 带声调的拼音字母取半角形式。
以上就是gbk编码的范围是多少?的详细内容。
该用户其它信息

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录 Product