tags: 计算机组成原理

数据与文字的表示方法

计算机中使用数据可分为两大类：

符号数据(ASCII,汉字，图形等等)

数值数据

那么，它们在计算机中是怎么存储的呢？这就是我们学习的目标

数值数据表示方法

数值数据常用的数据表示格式又有两种：

定点格式(数据范围有限，要求的处理硬件简单)
- 纯小数
- 纯整数

浮点格式(数据范围很大，要求的处理硬件复杂)

定点纯小数

第一个是符号位，紧跟着就是小数点(在定点纯小数中，小数点固定在符号位之后，不占位置)，后面的就是数值

范围：

例子：1111表示-0.875

定点纯整数

第一个是符号位，后面的就是数值，小数点在数值的最后一位+1(小数点不占位置)

例子：1111表示的是-7

在计算机中常用定点纯整数表示，如果数据超出了范围，会溢出的：

浮点数的表示方法

为什么要有浮点数表示的方法呢？原因就是定点数表示方法的范围不够大。例如下面的数据，在定点计算机中是无法直接表示出来的

要让它能够送入定点计算机进行某种运算，就必须抽取它们的比例因子(数值部分绝对值小于1)

那么在计算机中就是这样表示一个数字了：把数的有效数字和数的范围在计算机中的一个存储单元中分别表示，数的小数点位置随比例因子的不同而在一定的范围内可以自由浮动。这就叫做浮点表示法

任何的一个数N可以写成这样：

我们在计算机上表示浮点数是这样的：

然而，阶符，阶码，数符，尾数存储的位数是不确定的，对于不同的系统可能存储数据的方式就不一样。

于是为了便于软件的移植，我们按照IEEE754的标准来存储浮点数数据：

术语解释：

S是符号位，0表示正数，1表示负数

E是阶码(也就是指数),它用移码来表示(移码容易比较大小)，如果是32位的浮点数，就占8位，如果是64位的浮点数，就占11位
- 将浮点数的e转成在计算机保存浮点数的E，应该在指数e加上一个固定的偏移值127(E=e+127)【这是32位浮点数】，64位浮点数是加上1023的偏移值

M是尾数，如果是32位的浮点数，就占23位，如果是64位的浮点数，就占52位

我们对浮点数的表示也做出了明确的规定：当尾数的值不为0时，尾数域的最高有效位为1

例子1：若浮点数x的754标准存储格式为(41360000)16，求其浮点数的十进制数值。

步骤：

先把保存在计算机的数据转换成二进制
- 0 1000 0010 011 0110 0000 0000 0000 0000

计算出指数e,e=E-127
- 二进制的1000 0010就是E，e=10000010-01111111=00000011=3

S=0，e=3，M=0110110，再套公式，最后答案为：

例子2：将数(20.59375)10转换成754标准的32位浮点数的二进制存储格式。

步骤：

先把十进制转换成二进制
- 20.59375= 10100.10011

移动小数点，使其在1和2位之间
- 1.010010011*2的4次方

e=4,E=4+127, S=0,M=010010011

最后得到32位浮点数的二进制存储格式为：
- 01000001101001001100000000000000

十进制数串的表示方法

大多较强的计算机都能直接处理十进制形式表示的数据，一般有两种形式：

字符串形式【一个字节存放一个十进制数位，为了指明这个数，需要给出起始地址和位数(串的长度)】

压缩的十进制数串形式【一个字节存放两个十进制数位】

原码，反码，补码，移码

有个知乎回答得很好：

计算机实际使用中用来运算和存储的都是补码

移码主要用于表示浮点数的阶码E，有利于比较两个指数的大小和对阶操作！

特点：移码和补码尾数相同，符号位相反

字符和字符串的表示方法

字符数据属于符号数据，国际上采用的字符系统是七单位的ASCII码

直接使用西文标准键盘输入汉字，进行处理，并显示打印汉字需要解决三种不同用途的编码：

输入编码

汉字内码

汉字字模码

如果您觉得这篇文章帮助到了您，可以给作者一点鼓励