1、信息的编码信息的编码1.字符编码字符编码2.汉字编码汉字编码国际标准国际标准美国信息交换标准码美国信息交换标准码(American Standard Code for Information Interchange,简称:,简称:ASCII码码)规定:用规定:用7位二进制数来表示一个字符,共可表示位二进制数来表示一个字符,共可表示27=128种不同字符。种不同字符。ASCIIASCII码表码表码表码表字符编码字符编码0000000 0000001 0000010 0000011 1111111ASCII码表码表34个控制字符个控制字符10个阿拉伯数字个阿拉伯数字52个大小写英文字母个大小写英文
2、字母32个标点符号、运算符号个标点符号、运算符号128个字符个字符 0 1 0 1 0 0 0 0b7 b6 b5 b4 b3 b2 b1 b0“A”的的ASCII码码ASCII码码思考:n已知已知A的的ASCII码是码是1000001,请,请你推算一下你推算一下C的的ASCII码。码。n字符比较大小,字符比较大小,E和和P;D和和d谁大谁小。谁大谁小。n字符串比较大小,字符串比较大小,“boy”和和“cat”;“boy”和和“but”,谁大谁小。,谁大谁小。汉字编码汉字编码n n国家标准国家标准国家标准国家标准 1980年,我国颁布年,我国颁布信息交换用汉字编码字符集基信息交换用汉字编码字符
3、集基本集本集,即,即GB2312-80。规定:规定:用两个字节表示一个汉字用两个字节表示一个汉字,该集中共包含汉字该集中共包含汉字6763个,其它符号等个,其它符号等682个,共个,共7445个字符。这个字符集是我国中文信息处理技术的发展个字符。这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。基础,也是目前国内所有汉字系统的统一标准。1 2 3 4 94(位位)123494(区区)115区区1655区区5687区区8894区区第1655区:一级字库0 1 1 0 0 0 10 1 0 0 0 1 1“保保”的国标的国标码码b7 b6 b5 b4 b3 b2 b1
4、 b01 0 1 1 0 0 0 11 0 1 0 0 0 1 1“保保”的机内的机内码码b7 b6 b5 b4 b3 b2 b1 b0机内码:机内码:为了避免为了避免ASCII码和国标码同时使用时产生二义性问码和国标码同时使用时产生二义性问题,采用将国标码每个字节的最高位置题,采用将国标码每个字节的最高位置1,作为汉字机内码。,作为汉字机内码。这样既解决了汉字机内码与西文这样既解决了汉字机内码与西文ASCII之间的二义性,又使汉之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。字机内码与国标码具有极简单的对应关系。汉字编码补充知识汉字编码补充知识输入输入存储存储处理处理输出输出输入码
5、输入码机内码(唯一)机内码(唯一)字形码字形码如:区位码、全拼、双拼、如:区位码、全拼、双拼、五笔字型、智能五笔字型、智能ABC例:例:“保保”全拼:全拼:bao五笔字形:五笔字形:WKS二进制数形式二进制数形式汉字字形的点阵代码(字模码)汉字字形的点阵代码(字模码)如:如:16*16点阵,点阵,24*24,32*32,字库中存有每个汉字的点阵代码,字库中存有每个汉字的点阵代码,输出时检索字库,输出字模点阵输出时检索字库,输出字模点阵得到字形。得到字形。”保保“:10110001 10100011例:汉字“你”的输出输入输入存储存储处理处理输出输出智能智能ABCni机内码机内码1100010011100011输入码输入码字形码字形码计算机处理汉字的过程输入输入 输出输出()码()码()码思考:n如果用如果用8 8点阵来描述汉字点阵来描述汉字“开开”的字形,的字形,你能将其相应的编码补充完整吗?你能将其相应的编码补充完整吗?n存储该字形码共需存储该字形码共需 字节?字节?0 1 1 1 1 1 1 0