软考信息处理技术员教程知识点精讲之字符编码

信息处理技术员 责任编辑:小狐狸 2017-02-07

添加老师微信

备考咨询

加我微信

摘要:信息处理技术员在2017上半年开考,希赛小编给大家整理了一些信息处理技术员知识点精讲,以下是讲有关字符编码。希望对所有学员有所帮助。

       >>>>>>点击了解更多信息处理技术员培训视频

       >>>>>>点击了解更多信息处理技术员考试材料

       >>>>>>希赛2017上半年软考公开课,解读考试趋势,报名不再迷茫


       软考信息处理技术员在2017上半年开考,希赛小编给大家整理了一些信息处理技术员知识点精讲,以下是讲有关字符编码。希望对所有学员有所帮助。

       1.字符的表示

       常用美国信息交换标准字符码(ASCII)表示字符。常见的ASCII码为7位二进制代码,可以表示128种不同字符符号,它包括10个十进制数字、52个英文大小写字母、34个专用符号和32个控制符号,这128个符号中有96个是可打印的字符。

       对于ASCII码来说,字节最左边的一位可以作为奇偶校验位,也可以直接设置为0,作为西文字符和汉字的区分标识。在某些应用中,需要使用ASCII码的高位信息,这种被扩充的编码方式称为扩展ASCII码,它采用8位二进制数表示一个字符,一共可以表示256个不同的字符。

       2.汉字的表示

       汉字字数繁多、字形复杂、读音多变,要想在计算机中表示汉字,最方便的方法是对汉字进行编码,汉字编码要与西文字符及其它字符有明显的区别。

       (1)国标码。又称为汉字交换码,主要用于汉字信息处理系统之间或者通信系统之间的信息交换。1981年标准总局公布了GB2312-80,即《信息交换用汉字编码字符集基本集》,简称国标码(GB码)。该标准共收集常用汉字6763个,其中一级汉字3755个,按拼音排序。二级汉字3008个,按部首排序。另外还有各种图形符号682个,共计7445个。

       (2)区位码。将国标码中的6763个汉字分为94个区,每个区中包含94个汉字(位)。每个汉字都对应一个区号和位号,二者组合在一起就构成了区位码。汉字区位码定长4位,前两位表示区号,后两位表示位号,二者都用十进制表示,范围都是01到94.

       在区位码表中,第1到15区包含西文字母、数字和图形符号,以及用户自定义的专用符号(统称非汉字图形字符)。第16到55区为一级汉字。第56到87区为二级汉字。87区以上为空白区,可供造新字使用。

       区位码与国标码不同,二者关系为:国标码=区位码(十六进制)+2020H.

       (3)机内码。汉字处理系统要保证中西文兼容,以字节为单位时,ASCII码和国标码的较高位都是"0",其它7位有时候会相同,所以会产生二义性。汉字在计算机内部的惟一编码称为机内码,机内码编码时要避免该二义性。

       机内码与国标码相同,长度都是二字节,它在相应国标码的每个字节较高位加"1",即:机内码=国标码+8080H

       

       希赛网,拥有十五年软考培训经验,希赛网一直坚持自主研发,将丰富的软考培训经验有效融入教程研发过程,自成体系的软考在线题库软考历年真题)、软考培训教材软考视频教程,多样的培训方式包括面授、和,使考生的学习更具系统性,辅导更具针对性。采用全程督学机制,,软考平均通过率在全国。

更多资料
更多课程
更多真题
温馨提示:因考试政策、内容不断变化与调整,本网站提供的以上信息仅供参考,如有异议,请考生以权威部门公布的内容为准!

软考备考资料免费领取

去领取

!
咨询在线老师!