汉字的编码

2018-12-10| 发布者: admin| 查看: |

汉字的编码

   上节课主要讲解决了 ASCII的系列知识。 我们熟悉的键盘上,基本覆盖了 asciI表中的符号(字母,数字,标点符号,运算符,不可显示指令等)。 我们汉字的从构造的来历,数量等方面,都是远远比 英文字符编码复杂的多。

   

 

2、我们汉字的国标码,也就是信息交换用汉字编码字符集-基本集。

介绍GB2312-80和GB18030基本集》,即国标码

GB2312-80:1980, 6763个汉字,682个数字、字母等符号,共7445个字符,规定每个汉字用2个字节表示;

GB18030,2000年,27484个汉字;


3、用计算机进行汉字信息处理,首先必须将汉字代码化,即对汉字进行编码,称为汉字输入码。

   汉字输入码送入计算机后还必须转换成汉字内部码,才能进行信息处理。处理完毕之后,再把汉字内部码转换成汉字字形码,才能在显示器或打印机输出。

   因此汉字的编码有输入码、内码、字形码三种。


目前大多数汉字系统中都是以点阵的方式来存储和输出汉字的字形。

所谓点阵就是将字符(包括汉字图形)看成一个矩形框内一些横竖排列的点的集合,有笔画的位置用黑点表示,没笔画的位置用白点表示。


4、汉字编码的计算


问:如要表示27484个汉字,至少需用几位二进制数来表示?


解答: ascii码字符中,一个字符用7bit的ascii码表示。因此,2的7次方等于128种不同的编码数量。

 按照这个思路,利用 2N>=27484的最小N的值 25*210    

 得到 ∴15位


方法(2):把它转换成二进制,看看有几位就可以了 .( 有兴趣的,可以想想,其中的规律)


《信息

问题2:汉字“你”字采用16×16点阵输出,

 需要占多少字节存储空间?用汉字编码字符集--基本集》,即国标码

提示:

   1 byte= 8 bit

 

汉字点阵16×16  ,是表示16个bit 乘以16个bit  ,单位是比特,因此

计算容量 字节就是  16×16÷8=32 字节(byte)

 




 
QQ在线咨询
售前咨询热线
0532-86762222
售后服务热线
18254291182
返回顶部