tags: 计算机组成原理
数据与文字的表示方法
计算机中使用数据可分为两大类:
- 符号数据(ASCII,汉字,图形等等)
- 数值数据
那么,它们在计算机中是怎么存储的呢?这就是我们学习的目标
数值数据表示方法
数值数据常用的数据表示格式又有两种:
- 定点格式(数据范围有限,要求的处理硬件简单)
- 纯小数
- 纯整数
- 浮点格式(数据范围很大,要求的处理硬件复杂)
定点纯小数
第一个是符号位,紧跟着就是小数点(在定点纯小数中,小数点固定在符号位之后,不占位置),后面的就是数值
范围:
例子:1111表示-0.875
定点纯整数
第一个是符号位,后面的就是数值,小数点在数值的最后一位+1(小数点不占位置)
例子:1111表示的是-7
在计算机中常用定点纯整数表示,如果数据超出了范围,会溢出的:
浮点数的表示方法
为什么要有浮点数表示的方法呢?原因就是定点数表示方法的范围不够大。例如下面的数据,在定点计算机中是无法直接表示出来的
要让它能够送入定点计算机进行某种运算,就必须抽取它们的比例因子(数值部分绝对值小于1)
那么在计算机中就是这样表示一个数字了:把数的有效数字和数的范围在计算机中的一个存储单元中分别表示,数的小数点位置随比例因子的不同而在一定的范围内可以自由浮动。这就叫做浮点表示法
任何的一个数N可以写成这样:
我们在计算机上表示浮点数是这样的:
然而,阶符,阶码,数符,尾数存储的位数是不确定的,对于不同的系统可能存储数据的方式就不一样。
于是为了便于软件的移植,我们按照IEEE754的标准来存储浮点数数据:
术语解释:
- S是符号位,0表示正数,1表示负数
- E是阶码(也就是指数),它用移码来表示(移码容易比较大小),如果是32位的浮点数,就占8位,如果是64位的浮点数,就占11位
- 将浮点数的e转成在计算机保存浮点数的E,应该在指数e加上一个固定的偏移值127(E=e+127)【这是32位浮点数】,64位浮点数是加上1023的偏移值
- M是尾数,如果是32位的浮点数,就占23位,如果是64位的浮点数,就占52位
我们对浮点数的表示也做出了明确的规定:当尾数的值不为0时,尾数域的最高有效位为1
例子1:若浮点数x的754标准存储格式为(41360000)16,求其浮点数的十进制数值。
步骤:
- 先把保存在计算机的数据转换成二进制
- 0 1000 0010 011 0110 0000 0000 0000 0000
- 计算出指数e,e=E-127
- 二进制的1000 0010就是E,e=10000010-01111111=00000011=3
- S=0,e=3,M=0110110,再套公式,最后答案为:
例子2:将数(20.59375)10转换成754标准的32位浮点数的二进制存储格式。
步骤:
- 先把十进制转换成二进制
- 20.59375= 10100.10011
- 移动小数点,使其在1和2位之间
- 1.010010011*2的4次方
- e=4,E=4+127, S=0,M=010010011
- 最后得到32位浮点数的二进制存储格式为:
- 01000001101001001100000000000000
十进制数串的表示方法
大多较强的计算机都能直接处理十进制形式表示的数据,一般有两种形式:
- 字符串形式【一个字节存放一个十进制数位,为了指明这个数,需要给出起始地址和位数(串的长度)】
- 压缩的十进制数串形式【一个字节存放两个十进制数位】
原码,反码,补码,移码
有个知乎回答得很好:
计算机实际使用中用来运算和存储的都是补码
移码主要用于表示浮点数的阶码E,有利于比较两个指数的大小和对阶操作!
特点:移码和补码尾数相同,符号位相反
字符和字符串的表示方法
字符数据属于符号数据,国际上采用的字符系统是七单位的ASCII码
直接使用西文标准键盘输入汉字,进行处理,并显示打印汉字需要解决三种不同用途的编码:
- 输入编码
- 汉字内码
- 汉字字模码
如果您觉得这篇文章帮助到了您,可以给作者一点鼓励