您现在的位置:首页 > 第一章 基本知识 第三节 计算机中的信息表示,存储容量、数制转换、ASCII码  
本章目录→第一章.基本知识
本章介绍计算机的一些基础知识。了解计算机的发展、特点及用途;认识计算机的主要组成部件及各部件的主要功能;掌握计算机中使用的数制和数制之间的转换;掌握中英文输入方法。
计算机概念、发展历史、分类、应用领域和基本原理 实训 初识中英文输入
计算机组成、结构和主要硬件 实训 键盘布局和主要键位的操作及功能
计算机中的信息表示,存储容量、数制转换、ASCII码 实训 计算机的组成与结构
中英文输入 实训 准确并快速地中英文输入
    实训 中英文录入测试
本节
教学目的
 
掌握信息的表示和存储;掌握存储容量的单位;掌握数制之间的转换,特别是二进制与十进制之间;了解ASCII码
重点
  掌握存储容量;二进制与十进制之间数据转换
难点
  二进制与十进制之间数据转换
教学方法
  讲授
实训
 
思考
  字符9的ASCII码的十进制为57,那么2的是多少?A与a比较,谁的ASCII码大?
课件
  数制转换工具
相关贴士
  一些练习题
  知名IT企业及其产品
 
   

关于存储的几个重要概念

:是计算机中存储数据的最小单位。指二进制数中的一个位数,其值为“0”或“1”,其英文名为“bit”。

计算机采用二进制,运算器运算的是二进制数,控制器发出的各种指令也表示成二进制数,存储器中存放的数据和程序也是二进制数,在网络上进行数据通信时发送和接收的还是二进制数。显然,在计算机内部到处都是由0和1组成的数据流(比特流)。

字节:是计算机存储容量的基本单位,计算机存储容量的大小是用字节的多少来衡量的。其英文名为“byte”,通常用“B”表示。

为了表示数据中的所有字符(字母、数字以及各种专用符号),需要7位或8位二进制数。因此,人们采用8位为1个字节。1个字节由8个二进制数位组成。字节是计算机中用来表示存储空间大小的基本容量单位。例如,计算机内存的存储容量,磁盘的存储容量等都是以字节为单位表示的。除用字节为单位表示存储容量外,还可以用千字节KB、兆字节MB以及GB等表示存储容量。

例如, 中文字符“学”表示为 00110001 00000111

要注意位与字节的区别:位是计算机中最小数据单位,字节是计算机中基本信息单位

字:是计算机内部作为一个整体参与运算、处理和传送的一串二进制数。是计算机进行信息交换、处理、存储的基本单元。通常由一个或几个字节组成。
字长:是计算机CPU一次处理数据的实际位数,是衡量计算机性能的一个重要指标。字长越长,一次可处理的数据二进制位越多,运算能力就越强,计算精度就越高。

容量单位换算

计3.5软盘存储容量:1.44MB
内存存储容量常见为:512MB、1GB

硬盘存储容量常见为:60GB、80GB、120GB、160GB、180GB。

数制

数制是用一组固定的数字和一套统一的规则来表示数目的方法。

二进制、十进制、八进制、十六进制、六十进制(每分钟60秒、每小时60分钟,即逢601),一般我们用( ) 角标表示不同进制的数。例如:十进制用( )10表示,二进制数用( )2表示。
R进制即是有R个基本符号,逢R进一。 例二进制基本符号有二个,为0、1;十进制基本符号有十个,为0、1、2、3、4、5、6、7、8、9
日常生活中最常用的数制是十进制。
计算机数据是二进制形式。

基数:一组固定不变的不重复数字的个数。例如:二进制数基数是2,十进制数基数为10

位权:某个位置上的数代表的数量大小。表示此数在整个数中所占的份量(权重)。

数位是指数码在一个数中所处的位置。

二进制数具有下列两个基本特点:两个不同的数字符号,即0和1;其基数为2;逢二进一。
每个数位上所能使用的数码为0和1两个数码。可用B(binary)来表示二进制。

十进制是人类最为方便的进制表示,但十进制应用在计算机上遇到了表示上的困难,10个不同符号表示和运算很复杂,在计算机中采用二进制原因如下:可行性,采用二进制,只有0和1两个状态,需要表示0、1两种状态的电子器件很多,如开关的接通和断开,晶体管的导通和截止、磁元件的正负剩磁、电位电平的高与低等都可表示0、1两个数码,使用二进制,电子器件具有实现的可行性;简易性,二进制只有两个基本符号,在数字的传输与处理时不容易出错,二进制数的运算法则少,运算简单,使计算机运算器的硬件结构大大简化(十进制的乘法九九口诀表55条公式,而二进制乘法只有4条规则);逻辑性,由于二进制0和1正好和逻辑代数的假(false)和真(true)相对应,有逻辑代数的理论基础,用二进制表示二值逻辑很自然。

十进制,十进位计数制,具有十个不同的数码符号0、1、2、3、4、5、6、7、8、9,其基数为10;十进制数的特点是逢十进一。可用D(decimal)来表示十进制。

八进制,八进位计数制,具有八个不同的数码符号0、1、2、3、4、5、6、7,其基数为8;八进制数的特点是逢八进一。

十六进制,十六进位计数制,具有十六个不同的数码符号0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F,其基数为16,十六进制数的特点是逢十六进一。

二进制转换为十进制

用计算机处理十进制数,必须先把它转化成二进制数才能被计算机所接受,同理,计算
结果应将二进制数转换成人们习惯的十进制数。这就产生了不同进制数之间的转换问题。

二进制转换为十进制
按权展开后,相加即得。
例: (101101)2=45       (1011.101)2=?


十进制转换为二进制
整数部分:除2取余,且除到商为0为止;先取余数低位,后取余数高位。

(43)10=(101011)2

(123)10=(1111011)2

小数部分:乘2取整,直到小数部分为0或达到所求精度为止(小数部分可能永远不会得到0),最先得到的整数排在最高位。

(241.43)10=(?)2 小数取4位

先算整数:

再算小数:

 

计算结果:(241.43)10=(11110001.0110)2

二进制的算术运算

二进制数的算术运算包括加减乘除四则运算,加法是基本运算,乘和除可以通过加减的移位来实现,减法实质是加上一个负数,主要应用是补码运算。以加法为例说明。

0+0=0

0+1=1

1+0=1

1+1=0(逢二进一,向高位进位)

由上可见,二进制的加法运算规则简单明了,运算的简单化也是计算机信息二进制化的原因之一。

ASCII码

◇计算机中的数据是用二进制表示的,而人们习惯用十进制数,那么输入输出时,符号、英文字母、阿位伯数字等数据就要进行十进制和二进制之间的转换处理,因此,必须采用一种编码的方法,由计算机自己来承担这种识别和转换工作。
◇编码是采用少量基本符号,选用一定的组合原则,以表示大量复杂多样的信息的技术。
◇编码过程就是实现将信息在计算机中转化为0和1二进制串的过程。

美国标准信息交换码
◇ 在西文领域的符号处理普遍采用的是ASCII码(American Standard Code for Information Interchange—美国标准信息交换码),已被国际标准化组织(ISO)认定为国际标准。
◇ 字符是计算机中最多的信息形式之一,是人与计算机进行通信、交互的重要媒介。
◇ 在计算机中,要为每个字符指定一个确定的编码,作为识别与使用这些字符的依据。◇ASCII码有7位版本和8位版本两种,国际上通用的是7位版本,7位版本的ASCII码有1 2 8个,只需用7个二进制位(2的7次幂=128)表示,其中控制字符34个,阿拉伯数字10个,大小写英文字母52个,各种标点符号和运算符号32个。
◇ 在计算机中实际用8位表示一个字符,最高位为“0”字母。可表示128个字符。

◇每个ASCII码以1个字节(Byte)储存,从0到数字127代表不同的常用符号,例如大写A的ASCII码是65,小写a则是97。
第48~57号为0~9阿拉伯数字;65~90号为26个大写英文字母;97~122号为26个小写英文字母。
其余为标点符号、运算符号、控制字符,例如控制符:LF(换行)、BEL(振铃)等。  
大写字母A的ASCII码就是十进制数65,数字0的ASCII就是48,小写字母a的ASCII码就是十进制数97
◎比较ASCII码:数字<大写英文字母<小写英文字母

下表中,ASCII是以十进制数表示。

ASCII

符号

ASCII

符号

ASCII

符号

ASCII

符号

0
nul
10
nl
20
dc4
30
re
1
soh
11
vt
21
nak
31
us
2
stx
12
ff
22
syn
32
sp
3
etx
13
er
23
etb
33
!
4
eot
14
so
24
can
34
"
5
enq
15
si
25
em
35
#
6
ack
16
dle
26
sub
36
$
7
bel
17
dc1
27
esc
37
%
8
bs
18
dc2
28
fs
38
&
9
ht
19
dc3
29
gs
39
`

ASCII

符号

ASCII

符号

ASCII

符号

ASCII

符号

40
(
40
(
50
2
60
<
41
)
41
)
51
3
61
=
42
*
42
*
52
4
62
>
43
+
43
+
53
5
63
?
44
,
44
,
54
6
64
@
45
-
45
-
55
7
65
A
46
.
46
.
56
8
66
B
47
/
47
/
57
9
67
C
48
0
48
0
58
:
68
D
49
1
49
1
59
;
69
E

ASCII

符号

ASCII

符号

ASCII

符号

ASCII

符号

70
F
80
P
90
Z
100
d
71
G
81
Q
91
[
101
e
72
H
82
R
92
\
102
f
73
I
83
S
93
]
103
g
74
J
84
T
94
^
104
h
75
K
85
U
95
_
105
i
76
L
86
V
96
'
106
j
77
M
87
W
97
a
107
k
78
N
88
X
98
b
108
l
79
O
89
Y
99
c
109
m

ASCII

符号

ASCII

符号

 

 

 

 

110
n
120
x
       
111
o
121
y
       
112
p
122
z
       
113
q
123
{
       
114
r
124
|
       
115
s
125
}
       
116
t
126
~
       
117
u
127
del
       
118
v
           
119
w
           

汉字编码
◇英文符号由以上所述编码表示即成。但汉字与西方文字不同,英文仅用26个英文字母和其他符号即可拼组成大量的单词、句子,这与计算机可以接受的信息形态和特点基本一致,所以处理起来比较容易。
◇ 英文字符在计算机上的输入及输出也非常简单,因此,英文字符的输入、存储、内部处理和输出都可以只用同一个编码(如ASCII码)。
◇ 汉字是一种象形文字,字数极多(现代汉字中仅常用字就有六、七千个,总字数高达5万个以上),且字形复杂。
◇ 要在计算机中处理汉字,必须解决以下几个问题:首先是汉字的输入,即如何把结构复杂的方块汉字输入到计算机中去,这是汉字处理的关键;其次,汉字在计算机内如何表示和存储?如何与西文兼容?最后,如何将汉字的处理结果从计算机内输出?
◇必须将汉字代码化,即对汉字进行编码,使之转换成键盘上具有的符号,一般是英文字母。
◇ 对应于上述汉字处理过程中的输入、内部处理及输出这三个主要环节,每一个汉字的编码都包括输入码、交换码、内部码和字形码。
◇ 在计算机的汉字信息处理系统中,处理汉字时要进行如下的代码转换:输入码→交换码→内部码→字形码。

汉字也是字符,与西文字符比较,汉字数量大,字形复杂,同音字多,这就给汉字在计算机内部的存储、传输、交换、输入、输出等带来了一系列的问题。为了能直接使用西文标准键盘输入汉字,必须为汉字设计相应的编码,以适应计算机处理汉字的需要。
国标码
◇1980年我国颁布了《信息交换用汉字编码字符集·基本集》代号为(GB2312-80 ),是国家规定的用于汉字信息处理使用的代码依据,这种编码称为国标码。
◇ 在国标码的字符集中共收录了6763个常用汉字和682个非汉字字符(图形、符号),其中一级汉字3755个,以汉语拼音为序排列,二级汉字3008个,以偏旁部首进行排列。用于汉字外码和内部码的交换
国标GB2312-80规定,所有的国标汉字与符号组成一个94×94的矩阵,在此方阵中,每一行称为一个“区” (区号为01~94 ),每一列称为一个“位” (位号为01~94 ),该方阵实际组成了一个94个区,每个区内有94个位的汉字字符集,每一个汉字或符号在码表中都有一个唯一的位置编码,叫该字符的区位码。
区位输入法:使用区位码方法输入汉字时,必须先在表中查找汉字并找出对应的代码,才能输入。区位码输入汉字的优点是无重码,而且输入码与内部编码的转换方便。

机内码
◇内部码是汉字在计算机内的基本表示形式,是计算机对汉字进行识别、存储、处理和传输所用的编码。
◇ 汉字的机内码是计算机系统内部对汉字进行存储、处理、传输统一使用的代码,又称为汉字内码。由于汉字数量多,一般用2个字节来存放汉字的内码。在计算机内汉字字符必须与英文字符区别开,以免造成混乱。
◇ 英文字符的机内码是用一个字节来存放ASCII码,一个ASCII码占一个字节的低7位,最高位为“0”,为了区分,汉字机内码中两个字节的最高位均置“ 1”。
例如,汉字“中”的国标码为5650H (01010110 01010000)2 ,机内码为D6D0H (1101011 0 11010000 )2 。

汉字输入码(外码)

◇为了将汉字通过键盘输入计算机而设计。
◇ 面向用户。
◇五笔输入法的码;拼音输入法的码。各自有自的编码规则。
◇目前,已申请专利的汉字输入编码方案有六、七百种之多,而且还不断有新的输入方法问世,以致于有"万码奔腾"之喻。
◇ 可把这些数量众多的输入码归纳为四大类:数字编码、拼音码、字形码和音形码。其中,目前应用最广泛的是拼音码和字形码。

汉字的字形码
◇字形码是表示汉字字形信息(汉字的结构、形状、笔划等)的编码,用来实现计算机对汉字的输出(显示、打印)。
◇ 每一个汉字的字形都必须预先存放在计算机内,例如GB2312国标汉字字符集的所有字符的形状描述信息集合在一起,称为字形信息库,简称字库。
◇ 通常分为点阵字库和矢量字库。目前汉字字形的产生方式大多是用点阵方式形成汉字,即是用点阵表示的汉字字形代码。
◇ 根据汉字输出精度的要求,有不同密度点阵。
◇ 汉字字形点阵有16×16点阵、24×24点阵、32×32点阵等。
◇ 汉字字形点阵中每个点的信息用一位二进制码来表示,“1”表示对应位置处是黑点,“0”表示对应位置处是空白。字形点阵的信息量很大,所占存储空间也很大,例如16×16点阵,每个汉字就要占32个字节(16×16÷8=32);24×24点阵的字形码需要用72字节(24×24÷8=72),
因此字形点阵只能用来构成“字库”,而不能用来替代机内码用于机内存储。
◇ 字库中存储了每个汉字的字形点阵代码,不同的字体(如宋体、仿宋、楷体、黑体等)对应着不同的字库。
◇ 在输出汉字时,计算机要先到字库中去找到它的字形描述信息,然后再把字形送去输出。

 

TOP】【打印】【关闭