新起点
未统一汉字列表
2020-06-28 06:31:20

有些字只是同一字在不同地区的写法,但因为原规格分离原则而只好分开编码。由于韩国KS X 1001:1998(U+F900-U+FA0B,268个字)、台湾Big5(U+FA0C-U+FA0D,2个字)、日本IBM 32(CP932变种;U+FA0E-U+FA2D,32个字)、韩国KS X 1001:2004(U+FA2E-U+FA2F个字)、日本JIS X 0213(U+FA30-U+FA6A,59个字)、ARIB STD-B24(U+FA6B-U+FA6D,3个字)和朝鲜KPS 10721-2000(U+FA70-U+FAD9,106个字)均有字形非常接近但编码上分离的字,为实现与这些标准的互换性而创立“兼容表意文字区”(Compatibility Ideographs)。值得注意的是原规格分离原则由“Unicode联盟决定把不正统的编入位于基本多文种平面的‘兼容表意文字区’”时起废弃,原因是台湾来源(T-source,即CNS 11643)有太多字形非常接近,按Unicode标准应该统一的字。这些字只有正统的会编入正式字集(包括扩展区),不正统的编入位于“第二辅助平面”的“兼容表意文字补充区”(Compatibility Ideographs Supplement)中。

以下是所有摘自ISO/IEC JTC1/SC2/WG2原规格分离原则文件之中有的字。

自上表发表后,WG2亦调查过其他汉字,认为以下属于基本多文种平面的汉字,亦可考虑收编到ISO 10646 Annex S3:

相关:

  • CJKV
  • 网站公告: