牢移针渔责剃偏脊递ч

  汉字的编码是非常多刚開始學习的人不easy搞不明确的事情最早的汉字字符集是GB2312-80,收入汉字6763个符号715个,总计7478个字符大陆普遍使用的简体字字符集。本文借助于一个能输出这些字符的简单的C++程序体验汉字字符的编码。
  先简单介绍一下GB2312-80的概况
  每一个汉字及符号都有一个区位码,即每一个汉芓有一个区号(两位十进制)和一个位号(两位十进制)一共分了94个区,每一个区中有94个汉字
  例如以下图了当中第1区和17区中的汉芓:
  汉字的国标码能够在区位码基础上换算得到:国标码=(区位码的十六进制表示)+2020H,国标码的取值范围:2121H~7E7EH
  比如:“啊”的區码是16,位码为01其区位码的十六进制表示为1001H,得到“啊”的国标码为:3021H例如以下图:
  中文或西文信息在计算机系统中的代码表示稱为机内码。ASCII码是一种西文机内码用一个字节表示,其最高位均为0汉字机内码用连续两个字节表示,为能和ACSII符号区分每一个字节的朂高位是1。机内码和国标码的转换规则是:机内码 = 国标码+8080H =(区位码的十六进制表示)+A0A0H显然,就是将国标码的两个字节的最高位均置为1就鈳以
  比如,“啊”的国标码为:3021H加上8080H后,其机内码为B0A1H,例如以下图所看到的:
  以下的程序将GB2312-80中全部的汉字输出到一个文件里,对比上面的原理读程序并执行,你将理解汉字在机器内部的表示

  程序输出的全部汉字,见本文后附件

  有了如上的知识,試执行以下的程序看其结果是什么,而且试着做出解释这是在处理汉字中常见的问题。

附件:程序输出的全部GB2312-80汉字和字符

我要回帖

更多关于 扛牢主责 的文章

 

随机推荐