GBK、GB2312、GB18030

港控/mmm° 2022-02-21 12:09 506阅读 0赞

GBK、GB2312都是编码方式,都是双字节字符集,GB18030编码是一二四字节变长编码

GB:国标,国家标准

BIG5
支持繁体中文

GB2312
支持简体中文(GBK的子集)
共收录 6763 个汉字

GBK
支持简体、繁体中文,比GB2312收录更多汉字(GB18030的子集)
GBK 即汉字内码扩展规范,K 为汉语拼音 Kuo Zhan(扩展)中“扩”字的声母。英文全称 Chinese Internal Code Specification。

GBK 共收录 21886 个汉字和图形符号
包括:

  • GB 2312 中的全部汉字、非汉字符号。
  • BIG5 中的全部汉字。
  • 与 ISO 10646 相应的国家标准 GB 13000 中的其它 CJK 汉字,以上合计 20902 个汉字。
  • 其它汉字、部首、符号,共计 984 个。

GB18030:支持简体中文及繁体中文、韩文字和少数民族的文字,GB18030编码是一二四字节变长编码

GB 18030,全称:国家标准 GB 18030-2005《信息技术中文编码字符集》,是中华人民共和国现时最新的内码字集,是 GB 18030-2000《信息技术信息交换用汉字编码字符集基本集的扩充》的修订版。GB 18030 与 GB 2312-1980 和 GBK 兼容,共收录汉字70244个。

  1. UTF-8 相同,采用多字节编码,每个字可以由 1 个、2 个或 4 个字节组成。
  2. 编码空间庞大,最多可定义 161 万个字符。
  3. 支持中国国内少数民族的文字,不需要动用造字区。
  4. 汉字收录范围包含繁体汉字以及日韩汉字

发表评论

表情:
评论列表 (有 0 条评论,506人围观)

还没有评论,来说两句吧...

相关阅读

    相关 GB2312编码理解

        计算机信息交换使用汉字编码字符集是国家1980年发布,标准号为:GB2312-1980。     GB2312编码主要适用于汉字处理、汉字通讯等系统之间的信息交换。

    相关 GBK、GB2312GB18030

    GBK、GB2312都是编码方式,都是双字节字符集,GB18030编码是一二四字节变长编码 GB:国标,国家标准 BIG5: 支持繁体中文 GB2312: 支持简