摘要:信息处理技术员在2017上半年开考,希赛小编给大家整理了一些信息处理技术员知识点精讲,以下是讲有关字符编码。希望对所有学员有所帮助。
>>>>>>希赛2017上半年软考公开课,解读考试趋势,报名不再迷茫
软考信息处理技术员在2017上半年开考,希赛小编给大家整理了一些信息处理技术员知识点精讲,以下是讲有关字符编码。希望对所有学员有所帮助。
1.字符的表示
常用美国信息交换标准字符码(ASCII)表示字符。常见的ASCII码为7位二进制代码,可以表示128种不同字符符号,它包括10个十进制数字、52个英文大小写字母、34个专用符号和32个控制符号,这128个符号中有96个是可打印的字符。
对于ASCII码来说,字节最左边的一位可以作为奇偶校验位,也可以直接设置为0,作为西文字符和汉字的区分标识。在某些应用中,需要使用ASCII码的高位信息,这种被扩充的编码方式称为扩展ASCII码,它采用8位二进制数表示一个字符,一共可以表示256个不同的字符。
2.汉字的表示
汉字字数繁多、字形复杂、读音多变,要想在计算机中表示汉字,最方便的方法是对汉字进行编码,汉字编码要与西文字符及其它字符有明显的区别。
(1)国标码。又称为汉字交换码,主要用于汉字信息处理系统之间或者通信系统之间的信息交换。1981年标准总局公布了GB2312-80,即《信息交换用汉字编码字符集基本集》,简称国标码(GB码)。该标准共收集常用汉字6763个,其中一级汉字3755个,按拼音排序。二级汉字3008个,按部首排序。另外还有各种图形符号682个,共计7445个。
(2)区位码。将国标码中的6763个汉字分为94个区,每个区中包含94个汉字(位)。每个汉字都对应一个区号和位号,二者组合在一起就构成了区位码。汉字区位码定长4位,前两位表示区号,后两位表示位号,二者都用十进制表示,范围都是01到94.
在区位码表中,第1到15区包含西文字母、数字和图形符号,以及用户自定义的专用符号(统称非汉字图形字符)。第16到55区为一级汉字。第56到87区为二级汉字。87区以上为空白区,可供造新字使用。
区位码与国标码不同,二者关系为:国标码=区位码(十六进制)+2020H.
(3)机内码。汉字处理系统要保证中西文兼容,以字节为单位时,ASCII码和国标码的较高位都是"0",其它7位有时候会相同,所以会产生二义性。汉字在计算机内部的惟一编码称为机内码,机内码编码时要避免该二义性。
机内码与国标码相同,长度都是二字节,它在相应国标码的每个字节较高位加"1",即:机内码=国标码+8080H
希赛网,拥有十五年软考培训经验,希赛网一直坚持自主研发,将丰富的软考培训经验有效融入教程研发过程,自成体系的软考在线题库(软考历年真题)、软考培训教材和软考视频教程,多样的培训方式包括面授、和,使考生的学习更具系统性,辅导更具针对性。采用全程督学机制,,软考平均通过率在全国。
软考备考资料免费领取
去领取