摘要:本文是2023年山东专升本计算机基础模拟题-ASCII码和汉字编码,学生在参加考试前可以多练习题目,争取拿到该部分的分数。具体请见下文。
2023年山东专升本计算机基础模拟题-ASCII码和汉字编码一
一 . 西文字符编码
目前计算机中使用最广泛的西文字符集及其编码是ASCII 字符集和ASCII 码,即美国国际信 息交换码。
1.标准 ASCII 字符集共收录了 96 个可打印字符, 32 个控制字符, 共 128 个。其编码规则 是 :用 7 位二进制数对每一个字符进行编码,在计算机内部则用字符的ASCII 码存储和 表示该字符。而计算机中一般是用 1 个字节来存储的,每个字节中多出来的最高位一般 保持为 0。
00000000 ------0
0 111 1111 ------127
常见的ASCII 字符要知道:
数字字符的ASCII 大写字符的ASCII 小写字符的ASCII
“0” 48 “A”…65 “a” …97
“1” …49 “b” …98
“9” …57
空格字符的ASCII 是32。
2.扩展 ASCII 码;将标准ASCII 最高位置1,得到十进制代码 128-255,称为扩展 ASCII,可代表扩展的另 128个字符。扩展的ASCII=标准的ASCII+扩展字符集。
二 . 汉字的编码
汉字的特点是数量大、字形复杂、同音字多。国家标准有一下几个:
GB2312: 1981 年颁布的第一个国家标准,所有字符在计算机内部都采用 2 个字节来表示, 每个字节的最高位规定为 1,不支持繁体字。
GBK:1995 年版本的,除了收录有GB2312 中的所有汉字和符号外,还收录了繁体字在 内的大量汉字和符号。与GB2312 向下兼容,即与GB2312 相同的字符,其编码也 相同。
UCS/Unicode; 是国际标准
GB18030: 与 GB2312、GBK 保持向下兼容,还扩充了UCS/Unicode 中的其它字符 Big5: 主要在台湾地区使用,支持繁体字。
以下讲解的是 GB2312-80 汉字编码
字汇组成
第一部分:字母、数字和各种符号共 682 个(包括拉丁字母、俄文、日文平假名与片假名、 希腊字母、汉语拼音等,统称为GB2312 图形符号),01-09 区。
第二部分:一级常用汉字共 3755 个,按汉语拼音排列,10-55 区。
第三部分:二级常用汉字(不太常用)共 3008 个,按偏旁部首排列,56-87区。
编码规则
区位码:每一个汉字或符号在码表中的位置用它所在的区号(行号)及位号(列号)来表示。区 号和位号分别用 1 个字节来表示。
例如:“大”的区号是20,位号是83,区位码是 2083 ,区位码一般用十进制表示
②机内码,将每个字符的国标码的两个字节的最高位都置“1”(相当于分别加上 128)即 得到机内码。
普通专升本备考资料免费领取
去领取
2024年专升本考试报名时间