摘要:下面是希赛软考学院为大家整理的软考程序员教程知识点精讲之汉字的内码,希望能帮助学友们。
>>>>>希赛网改版上线5周年庆,感恩钜惠!全场买就减,较高立减500,还有1元秒杀,5折限时抢购,众多“豪”礼等你来享,进入抢购!
下面是希赛软考网为大家整理的软考程序员教程知识点精讲之汉字的内码,希望能帮助学友们。具体内容如下:
汉字的内码
汉字和拼音文字不同,拼音文字只需要定义少量的字母和符号的编码即可完成所有文字的保存、显示任务。而汉字存在大量的单字,为了让计算机能够处理汉字,必须对汉字进行单独的编码。
1.汉字编码
汉字国标码(GB 2312-80)共收集常用汉字6 763个,其中一级汉字3 755个,按拼音排序;二级汉字3 008个,按部首排序;各种图形符号682个,共计7 445个。每个汉字、图形符号都采用两个字节表示,每个字节只使用低7位编码。可达到的最大容量是16 384个。
BIG5编码俗称"大五码",是普遍使用的繁体汉字的编码标准,包括440个符号,一级汉字5 401个,二级汉字7 652个,共计13 060个汉字。
GBK编码是中国大陆制定的中文编码扩展标准,该编码标准兼容GB 2312,共收录汉字21 003个、符号883个,并提供1 894个造字码位,其特点是简、繁体字融于一库。
GB 18030-2000在原来的GB 2312-80 编码标准和GBK编码标准的基础上进行扩充,增加了4字节部分的编码。向上则兼容ISO 10646,共有150多万个码位。它在原来的2万多汉字的基础上增加了7 000多个汉字的码位和字型,从而汉字达到27 000多个。它能有效地解决一些生、偏、难字的问题,适用于需要的人名、地名用字的系统。支持GB 13000.1-1993的全部中日韩(CJK)统一汉字字符和全部中日韩统一汉字Extension A和Extension B的字符。
2.机内码
汉字机内码采用的是两个字节的编码,而每个编码只使用低7位,这样就和ASCII混淆了,因此在机内表示时将每个字节的较高位置为1.
汉字机内码与国标码的关系为:机内码=国标码+8080H.例如,已知汉字"大"的国标码为3473H,其机内码为3473H+8080H=B4F3H.
如果每个点用1位,则存储一个24×24点阵的汉字需用24*24/8=72字节(1字节=8位)。
希赛软考网,拥有十四年软考培训经验,希赛网一直坚持自主研发,将丰富的软考培训经验有效融入教程研发过程,自成体系的软考在线题库(软考历年真题)、软考培训教材和软考视频教程,多样的培训方式包括在线辅导、面授、和,使考生的学习更具系统性,辅导更具针对性。采用全程督学机制,,软考平均通过率在全国。
软考不知道考啥科目?扫码测最适合你的报考科目

通关资源:软考各科历年真题 | 各科学习资料汇总 | 在线试题库【点击刷题】
免费课程:系统架构设计师报考指南 | 2026年高项备考指导课及精讲试听
热门活动: 新年新起点,大额满减有惊喜![]()
软考备考资料免费领取
去领取
专注在线职业教育25年