一个汉字的机内码占几个字节?

2022-12-27 18:44:17 发布:网友投稿 作者:网友投稿
热度:73

在国内流行的汉字系统中,一个汉字的机内码占2个字节。

因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。 例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文文“0”和“!”的ASCII码。 为此,汉字机内码应对国标码加以适当处理和变换。

国标码的机内码为二字节长的代码,它是在相应国标码的每个字节最高位上加“1”,即汉字机内码=汉字国标码+8080H。 例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。

汉字机内码的基础是汉字国标码。 为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。 这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。

扩展资料:

汉字编码的分类:

1、外码(输入码)

外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。 常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择。

2、交换码(国标码)

计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。 而二进制代码使用起来是不方便的,于是需要采用信息交换码。 中国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码。

3、机内码

根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。

4、汉字的字形码

字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。 通常用16×16点阵来显示汉字。

5、汉字地址码

汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码。 它与汉字内码有着简单的对应关系,以简化内码到地址码的转换。

参考资料来源:百度百科-汉字机内码

关于存储一个汉字内码需要的字节数是的内容到此结束,希望对大家有所帮助。

下一篇:微信炸群怎么整,求解
上一篇:二胎政策是什么时候开放的?你还记得具体的时间吗?