计算机中常见的汉字编码有哪些?
根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码。
1.外码(输入码)
外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。目前常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择。在后面的章节中,重点介绍智能全拼输入法和五笔字型输入法。
2.交换码(国标码)
计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。而二进制代码使用起来是不方便的,于是需要采用信息交换码。中国标准总局1981年制定了中华人民共和国国家标准GB2312–80《信息交换用汉字编码字符集–基本集》,即国标码。
区位码是国标码的另一种表现形式,把国标GB2312–80中的汉字、图形符号组成一个94×94的方阵,分为94个“区”,每区包含94个“位”,其中“区”的序号由01至94,“位”的序号也是从01至94。94个区中位置总数=94×94=8836个,其中7445个汉字和图形字符中的每一个占一个位置后,还剩下1391个空位,这1391个位置空下来保留备用。
3.机内码
根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。
4.汉字的字形码
字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字。
延伸阅读
汉字编码有哪些类型?
big5(繁体中文,台湾) gb2312(简体中文,提供大约6763常用字) gbk(gb2312的扩展,编码范围8140-FEFE,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个) gb18030(GB18030汉字库包含了27484个汉字。因此GB18030汉字库包含的汉字更多,但在系统支持上有限) 其中gb2312最通用
汉字字符编码是?
GB2312编码:1981年5月1日发布的简体中文汉字编码国家标准。GB2312对汉字采用双字节编码,收录7445个图形字符,其中包括6763个汉字。
BIG5编码:台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字,1984年实施。
GBK编码:1995年12月发布的汉字编码国家标准,是对GB2312编码的扩充,对汉字采用双字节编码。GBK字符集共收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字。
GB18030编码:2000年3月17日发布的汉字编码国家标准,是对GBK编码的扩充,覆盖中文、日文、朝鲜语和中国少数民族文字,其中收录27484个汉字。GB18030字符集采用单字节、双字节和四字节三种方式对字符编码。兼容GBK和GB2312字符集。
Unicode编码:国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。
汉字编码分为哪四种?
根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码。
1、外码:是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等。
2、交换码:计算机内部处理信息,用二进制代码表,需要采用信息交换码。
3、机内码:根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。
4、字形码:是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。
汉字国际码(GB2312-80)规定的汉字编码,每个汉字用多少个字节表示? 为什么?
四个 在使用GB2312的程序中,通常采用EUC储存方法,以便兼容于ASCII。浏览器编码表上的“GB2312”,通常都是指“EUC-CN”表示法。 每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”(也称“区字节)”,第二个字节称为“低位字节”(也称“位字节”)。
“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上 0xA0)。 由于一级汉字从16区起始,汉字区的“高位字节”的范围是0xB0-0xF7,“低位字节”的范围是0xA1-0xFE,占用的码位是 72*94=6768。其中有5个空位是D7FA-D7FE。 例如“啊”字在大多数程序中,会以两个字节,0xB0(第一个字节) 0xA1(第二个字节)储存。区位码=区字节+位字节(与区位码对比:0xB0=0xA0+16,0xA1=0xA0+1)。
gbk汉字编码查询?
gbk汉字编码的查询方法如下:
1.
“命”的GBK编码为:0xC3,0xFC)
2.
GBK编码表: B0 0 1 2 3 4 5 6 7 8 9 A B C D E F A啊阿 埃挨哎唉哀皑癌蔼矮艾碍爱隘 B鞍氨安俺按暗岸胺案肮昂盎凹敖熬翱 C袄傲奥懊澳芭捌扒叭吧笆八疤巴拔跋 D靶把耙坝霸罢爸白柏百摆佰败拜稗斑 E班搬扳般颁板版扮拌伴瓣半办绊邦帮 F梆榜膀绑棒磅蚌镑傍谤苞胞包褒剥 B1 0 1 2 3 4 5 6 7 8 9 A B C D E F A薄雹保堡饱宝抱报暴豹鲍爆杯碑悲 B卑北辈背贝钡倍狈备惫焙被奔苯本笨 C崩绷甭泵蹦迸逼鼻比鄙笔彼碧蓖蔽毕 D毙毖币庇痹闭敝弊必辟壁臂避陛鞭边 E编贬扁便变卞辨辩辫遍标彪膘表鳖憋 F别瘪彬斌濒滨宾摈兵冰柄丙秉饼炳 B2 0 1 2 3 4 5 6 7 8 9 A B
汉字编码表是怎么出来的?
汉字编码表是为了更好地上大众能够更方便的查找字。是通过专家按部首,偏旁,音序的规律编制的。