考试资讯

咨询热线8:00-24:00 400-0999-680

首页 考试资讯考研专业课 2021考研408计算机组成原理知识:字符与字符串

2021考研408计算机组成原理知识:字符与字符串

时间:2019-12-24 16:00:37 编辑:leichenchen

       计算机组成原理是2021计算机考研学子们,需要重点看的书目。下面,北京文都考研网为帮助备考2021计算机的考生,学好计算机组成原理。特意分享“2021考研408计算机组成原理知识:字符与字符串”,供考生参考。

2021考研408计算机组成原理知识:字符与字符串

由于计算机内部只能识别和处理二进制代码,所以字符和汉字都必须按照--定的规则用一组二进制编码来表示。

1.字符编码

字符编码方式有很多种,现在用的最广泛的是美国国家信息交换标准字符码(ASCII)。

标准的ASCII码用7位二进制表示一个字符,它包括10个十进制数字(0~9)、52个英文大写和小写字母(A~Z,a~z)、34个专用符号和32个控制符号,共计128个字符。在128个字符中有96个是可打印字符。

在计算机中,通常用一个字节来存放一个字符。对于ASCII码来说,一个学节右边的7位表示不同的字符代码,而最左边一位可以作奇偶校验位,用来检查错误,也可以用于西文字符和汉字的区分标识。

除标准ASCII字符编码外,许多公司还使用8位二进制编码来表示更大的字符集,如IBM公司就用8位扩展二进制编码的十进制交换码(EBCDIC码)来表示所用到的字符集。

2.字符串的存放

字符串 是指一串连续的字符。通常,它们在存储器中占用一片连续的空间,每个字节存放一个字符代码,字符串的所有元素(字符)在物理上是邻接的,这种字符串的存储方法称为向量法,它是最简单、最节省存储空间的方法。但是,当字符串需要进行删除和插入操作时,将花费较多的时间。

3.汉字编码

汉字的字数繁多,字形复杂,读音多变,常用的汉字就有7000个左右。要在计算机中表示汉字,最方便的方法是为汉字安排一个编码,而且要使这些编码与西文字符和其他字符有明显的区别。

(1)汉字国标码

汉字国标码亦可称为汉字交换码,主要用于汉字信息处理系统之间或者通信系统之间交换信息使用。1981年国家标准总局公布了GB2312-80,即《信息交换用汉字编码字符集基本集》,简称GB码。该标准共收集常用汉字6763个,其中--级汉字3755个,按拼音排序。二级汉字3008个,按部首排序。另外还有各种图形符号682个,共计7445个。

GB2312-80规定每个汉字、图形符号都用两个字节表示,每个字节只使用低7位编码,因此最多能表示出128×128=16 384个汉字。

(2)汉字区位码

区位码将汉字编码GB2312-80中的6763个汉字分为94个区,每个区中包含94个汉字(位),区和位组成一个二维数组,每个汉字在数组中对应一个为唯一的区位码。汉字的区位码定长4位,前两位表示区号,后两位表示位号,区号和位号用十进制数表示,区号从01到94,位号也从01到94。例如,“中”字在54区的48位上,其区位码为“54-48”,“国”字在25区的90位上,其区位码为“25-90”。

注意:

汉字区位码并不等于汉字国标码,它们两者之间的关系可用以下公式表示:

国标码=区位码(十六进制)+ 2020H

(3)汉字机内码

汉字可以通过不同的输入码输入,但在计算机内部其内码是唯一的。因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。

汉字机内码也是两字节长的代码,它是在相应国标码的每个字节最高位上加“1”,即:

汉字机内码=汉字国标码+ 8080H例如,上述“啊”字的国标码是3021H,其机内码则是B0A1H。

(4)汉字字形码

汉字字形码是指确定一个汉字字形点阵的代码,又叫汉字字模码或汉字输出码。在一个汉字点阵中,凡笔画所到之处,记为“1”,否则记为“0”。

       以上是北京文都考研网给出的“2021考研408计算机组成原理知识:字符与字符串”,希望对计算机考研儿们,复习计算机组成原理时,有一定的帮助!

推荐阅读:

2021考研408计算机组成原理知识汇总

2021考研408数据结构知识点总结

扫一扫

进考研专属交流群 获取更多考研干货资料

优先参加最新福利活动

我要吐槽

    • 文都考研课代表

    研友互动

    199管理类联考
      微信交流群

    396经济类联考
      微信交流群