当前位置：文档库 › 计算机系统结构课后习题答案

计算机系统结构课后习题答案

《计算机系统结构》习题解答

第一章(P33)

1.7-1.9（透明性概念），1.12-1.18（Amdahl定律），1.19、1.21、1.24（CPI/MIPS）

第二章(P124)

2.3、2.5、2.6（浮点数性能），2.13、2.15（指令编码）

第三章(P202)

3.3（存储层次性能），3.5（并行主存系统），3.15-3.15加1题（堆栈模拟），3.19中(3)(4)(6)(8)问（地址映象/替换算法--实存状况图）

第四章(P250)

4.5（中断屏蔽字表/中断过程示意图），4.8（通道流量计算/通道时间图）

第五章(P343)

5.9（流水线性能/时空图），5.15（2种调度算法）

第六章(P391)

6.6（向量流水时间计算），6.10（Amdahl定律/MFLOPS）

第七章(P446)

7.3、7.29（互连函数计算），7.6-7.14（互连网性质），7.4、7.5、7.26（多级网寻径算法），7.27（寻径/选播算法）

第八章(P498)

8.12（SISD/SIMD算法）

第九章(P562)

9.18（SISD/多功能部件/SIMD/MIMD算法）

(注：每章可选1-2个主要知识点，每个知识点可只选1题。有下划线者为推荐的主要知识点。)

第一章(P33)

1.7

(1)从指定角度来看，不必要了解的知识称为透明性概念。 (2)见下表，“√”为透明性概念，“P ”表示相关课文页数。

1.8见下表，“√”为透明性概念，“P ”表示相关课文页数。

1.9见下表，“√”表示都透明，“应”表示仅对应用程序员透明，“×”表示都不透明。

1.12 已知Se=20 , 求作Fe-Sn 关系曲线。将Se 代入Amdahl 定律得

n F S 20

1911

1.13 上式中令Sn=2，解出Fe=10/19≈0.526

1.14 上式中令Sn=10，解出Fe=18/19≈0.947

1.15 已知两种方法可使性能得到相同的提高，问哪一种方法更好。

(1)用硬件组方法，已知Se=40，Fe=0.7，解出Sn=40/12.7≈3.1496（两种方法得到的相同性能） (2)用软件组方法，已知Se=20，Sn=40/12.7，解出Fe=27.3/38≈0.7184（第二种方法的百分比）

(3)结论：软件组方法更好。因为硬件组需要将Se 再提高100%（20→40），而软件组只需将Fe 再提高1.84%（0.7→0.7184）。 1.17 57.34

.15

.01.01≈=

1.18 记f ── 时钟频率，T=1/f ── 时钟周期，B ── 带宽（Byte/s ）。方案一：)/(44

s Byte f T

B =?=

方案二：)/(5.3421

%252%752s Byte f T

B =??+?=

1.19 由各种指令条数可以得到总条数，以及各百分比，然后代公式计算。

Sn 20 1

∑===4

10i i IC IC

(1)∑==?+?+?+?=?

55.108.0215.0232.0245.01)(i i

i IC

IC CPI CPI

(2)806.2555.140

55.11040106

66≈=??=?=CPI f MIPS (3)（秒）003876.0400

.1106≈=?=

MIPS IC T

1.21 (1)24.21.081

2.0418.026.01=?+?+?+?=CPI

(2)86.1710

24.21040106

6≈??=?=CPI f MIPS

1.24 记Tc ── 新方案时钟周期，已知CPI = CPI i = 1 原时间 = CPI × IC × 0.95Tc = 0.95IC ×Tc 新时间 = （0.3×2/3+0.7）× IC × Tc = 0.9IC ×Tc 二者比较，新时间较短。

第二章(P124)

2.3（忽略P124倒1行～ P125第8行文字，以简化题意）已知2种浮点数，求性能指标。此题关键是分析阶码、尾数各自的最大值、最小值。

原图为数据在内存中的格式，阶码的小数点在其右端，尾数的小数点在其左端，遵守规格化要求。

由于尾数均为原码，原码的绝对值与符号位无关，所以最大正数与最小负数的绝对值相同，可用“±最大绝对值”回答；最小正数与最大负数的绝对值相同，可用“±最小绝对值”回答。

第1小问中，阶码全部位数为8，作无符号数看待真值为0～255，作移-127码看待真值为-127～+128；尾数（不计符号位）有23位小数，另加1位整数隐藏位，所以尾数绝对值为1.0～2.0 – 2-23

，有效位数p=24；

第2小问中，阶码全部位数为11，作无符号数看待真值为0～2047，作移-1023码看待真值为-1023～+1024；尾数（不计符号位）有52位小数，另加1位整数隐藏位，所以尾数绝对值为1.0～2.0 – 2-52，有效位数p=53。

最大绝对值为最大阶码与最大尾数绝对值的组合，最小绝对值为最小阶码与最小尾数绝对值的组合。代入相关公式后得最终结果如下表。

2.5

(1) r m = 2，r e = 2，p = 24（隐藏最高位）,q = 7。 (2) N max = 1.7×1038

，-|N|min = -1.47×10-39

δ ≤ 5.96×10-8

≈ 10

-7.22

，η = 100%

2.6

(1) 0.2 = 0.333333H ×160

设阶码为移-63码（即-26

+1，原题未指明）

0.2 = 0.110011001100110011001101B ×2-2

（其中最高有效位需隐藏）阶码为移-127码（即-27

+1）

(2) 符号位不变，（阶码 – 63）×4 + 127；尾数左规，除去最高位；

(3) 符号位不变，（阶码 – 127）/ 4 + 63；尾数补最高位，按除法余数右移若干位，左补0。

2.13 已知10条指令使用频度，求3种编码方法的平均码长与信息冗余量。

(1)此问中的“最优Huffman 编码法”实际是指码长下限，即信源的平均信息量──熵，代公式得H=2.9566。 (2)Huffman 编码性能如下表；

(3)2/8扩展编码是8/64/512法的变种，第一组2条指令，码长为2（1位扩展标志，1位编码）,第二组8条指令，码长为4（1位扩展标志，与第一组区别，加3位编码），编码性能如下表；

(4)3/7扩展编码是15/15/15法的变种，第一组3条指令，码长为2（共有4种组合，其中3种组合分别代表3条指令，留1种组合作为扩展前缀标志）,第二组7条指令，码长为5（2位固定的前缀扩展标志，与第一组区别，加3位编码，只用其中7种组合），编码性能如下表。

2.15

(1) 15条/63条/64条 (2) 14条/126条/128条

第三章(P202)

3.3 直接代公式计算存储层次性能指标。 (1)74ns ，38ns ，23.6ns (2)0.258，0.315，0.424 (3)T256K < T128K < T64K c256K > c128K > c64K

(4)19.092，11.97，10.0064。答案是256K 方案最优。

3.5 已知g

g K n

n )1(1--=

，其中g=0.1

依题意有2.0)1(12.0)1(111

+--=+≥--=++g

g K g g K n n n n

整理得0.9n

≥0.2，解出28.159

.0lg 2

.0lg ≈≤

，向下取整，得15；

按另一种题意理解是向上取整，得16，也对。

3.15 欲知可能的最高命中率及所需的最少主存页数，较好的办法是通过“堆栈模拟法”，求得命中次数随主存页数变化的函数关系。下图就是“堆栈模拟图”，其中“√”表示命中。

(1)H max =7/12≈58.3%

(2)n=4

(3)当1次页面访问代表连续1024次该页内存储单元访问时，后1023次单元访问肯定是命中的，而第1次单元访问的命中情况与这1次页面访问的命中情况相同。根据上图中最高命中情况，共有7次页命中（折算为7×1024次单元命中），5次页不命中（折算为5×1023次单元命中，也可写为5×1024-5），单元访问总次数为12×1024，故有： H cell =(12×1024-5)/(12×1024)=12283/12288≈99.96%

3.15加1题一个二级存储层次，采用全相联映象和最久没有使用算法，实存共5页，为2道程序分享，页地址流分别如下

P 1 = 1 2 3 4 1 3 2 1 P 2 = 1 2 3 4 2 2 3 3

试作2个实存分配方案，分别使2道程序满足 (1)命中率相同； (2)命中次数之和最大。

解：分别为2道程序作“堆栈模拟图”，其中“√”表示命中。

将两图结果综合，得到4个分配方案的命中率情况表如下

n=1 0 n=2 1 n=3

3 n=

4 7 n=5

1 2 3 4 1 3 2 1

n 1= 1

0 n 1= 2

0 n 1= 3

2 n 1= 4 4

n 2= 1 2 n 2= 2 2 n 2= 3 4 n 2= 4

结论如下

(1)命中率相同的方案是n 1= 3而n 2= 2；

(2)命中次数之和最大的方案是n 1= 4而n 2= 1。

3.19中(3)(4)(6)(8)问 (3)

(4)通过作“实存状况图”模拟各虚块的调度情况，可获得Cache 的块地址流序列。

此问最容易出错的地方是忽略“组相联”地址约束，将虚页装错实组。另外没有及时标注“*”号也容易导致淘汰对象错误。

(6)H=4/12≈33%

(8)做法同3.15题(3)问，H cell =(12×16-8)/(12×16)≈95.8%

第四章(P250)

4.5 已知中断服务次序为3-2-4-1，。 (1)中断屏蔽字表如下图； (2)中断过程示意图如右图。

4.8

(1)f=2×105

字节/秒，T=5us (2)Ts+Td=5us ，通道时间图如下。作图时

。

虚存实页 0 1 2 3 虚组0 0 0 √ √ 1 √ √ 虚组1 实组0 2 √ √ 虚 3 √ √ 虚组2 实组1

页 4 √ √ 5 √ √ 虚组3

6 √ √

√

(a)

(b) 对应关系表（√为有关系）

2 3 0 1 0 2 3 1 0 1 2 3

时间中断请求主程序 1级 2级 3级 4级

D1，D2 D3，D4

(3)5，160，20，40；

(4)D2丢失第一次请求的数据； (5)参见P245。

第五章(P343)

5.9 为了缩短运算时间，首先应考虑“最少切换算法”，即先执行完所有乘法（任务编号1-6）再执行加法（任务编号7-11），其次在加法中采用“最少相关算法”（即二叉树算法）。

记c 1=A 1×B 1，……，c 6=A 6×B 6，下图(a)是加法的计算顺序二叉树，注意任务10应该用前一级最早完成的任务7和8的结果，如果用任务9的结果则要推迟1拍启动，使总时间增加1拍。

根据时空图(b)得 TP = 11/(22Δt) = 1/(2Δt)

S = (6×4Δt + 5×4Δt)/(22Δt) = 2 E = (6×4Δt + 5×4Δt)/(6×22Δt) = 1/3

5.15 Δt=10ns=10-8

秒 (1)F={1，2，5}，C=(10011) (2)状态转移图如下图(a)所示。

(3)最小启动循环=（3）,最小平均启动距离=3Δt 。

(4)插入2个延迟，最小启动循环=（2）,最小平均启动距离=2Δt 。 (5)新预约表如下图(b)所示。

设优备先号级

D2 D3 D4 时间

(us)

F=c 1+c 2+c 3+c 4+c 5+c

6 6 5

8 9

4 3 10

(a)

(b)

(6)F={1，3，7}，C=(1000101)，状态转移图如下图(c)所示。

(7)插入前TP max = 1/3Δt = 1/30ns ，插入后TP max = 1/2Δt = 1/20ns 。

(8)插入前TP = 10/33Δt = 1/33ns ，插入后TP = 10/26Δt = 1/26ns ，如下图所示。

1 2 3 4 5 6 7 8

初态 4，6，≥8

初态 3，4，≥6

4，6，≥8

(a)

S 4 S 3 S 2 S 1

(a) 插入前

D D S 4 S 3 S 2 S 1

(b) 插入后

第六章(P391)

6.6（注意阅读P372倒数第9行－倒数第6行）

已知n=32，k 加=6，k 乘=7，k 访存=6，k 倒数=14，启动、输出延迟各1。求各小题总拍数。

(4) V0 ← 存储器链接 V1 ← 1 / V0

链接

V3 ← V1 + V2 链接

V5 ← V3 * V4 访存倒数

加乘

8 16 8 9 31

总拍数=72（各条依次链接）

(3) V0 ← 存储器

并行

V3 ← V1 + V2 链接

V4 ← V0 * V3 V6 ← V4 + V5 串行访存加乘

8 9 31 8 31

总拍数=87（第4

条功能部件冲突）

(1) V0 ← 存储器 V1 ← V2 + V3 并行 V4 ← V5 * V6 加

乘 (2) V2 ← V0 * V1

并行

V3 ← 存储器

V4 ← V2 + V3 串行（P372）乘加

6.10 已知向量速率Rv = 10MFLOPS ，标量速率Rs = 1MFLOPS ，并记α为可向量化百分比。 (1) 推导法1：使用Amdahl 定律，在这里可将标量速率Rs 作为原速率，局部加速后的速率为向量速率Rv ，于是局部加速比Se=10，全局加速比为

n S S α

α+

)1(1

再根据加速比的定义，

n R R S α=

，所以有

S R S R R e

n s α

αα)1(=

?=。

（若将向量速率Rv

作为原速率，局部减速后的速率为标量速率Rs

，则局部加速比Se=0.1，推出的全局加速比Sn 同上式。）推导法

v v

v N N N N N +=

，

则-1 + 所以：s

v s v a

R R R N

R N N T N R 1)1(11

)1(?-+?=

?-+?==

αααα

或者：

v a R R R 1

)1(11?-+?=αα

(5) V0 ← 存储器 V1 ← V2 + V3 并行 V4 ← V5 * V6 s0 ← s1 + s2

串行

加乘总拍数=48（标量看成1个分量的向量） (6) V3 ← 存储器并行 V2 ← V0 + V1

串行

s0 ← s2 + s3

并行

V3 ← V1 * V4 加乘总拍数=79（标量看成1个分量的向量） (7) V3 ← 存储器

并行 V2 ← V0 + V1 链接

V4 ← V2 * V3 存储器 ← V4

串行访存加乘

8 9 31 8 31

总拍数=87（第4条功能部件冲突）

(8) V0 ← 存储器

链接 V2 ← V0 + V1 V3 ← V2 * V1 串行 V5 ← V3 * V4 串行访存加乘

8 8 31 9 31 9 31

总拍数=127（Vi 冲突，功能部件冲突）

(2) 已知Rv = 10MFLOPS ，Rs = 1MFLOPS ，

MFLOPS MFLOPS R a α

αα91010

)1(1.01-=-+=

Ra 与α的关系图如右图所示。

(3) 已知Ra = 7.5MFLOPS ，解出

%9696.015

13910)5.711(910=≈?=-=

α (4) 已知Ra = 2MFLOPS ，α = 0.7，解出

)(5.313.02

7.01

)1(1MFLOPS R R R s

a v =?-=

?--=

αα

第七章(P446)

7.3 已知输入端编号13 = 1101B 。 (1)Cube 3(1101B) = 0101B = 5

(2)PM2+3(13) = (13 + 23

)mod 16 = 21 mod 16 = 5 (3)PM2+0(13) = (13 - 20)mod 16 = 12 (4)Shuffle(1101B) = 1011B = 11

(5)Shuffle(Shuffle(1101B)) = Shuffle(1011B) = 0111B = 7

7.4 用多级混洗―交换网络，n = 4，拓扑结构同教材P410图7.21(e)，控制信号=1010B ，自左向右各级交换开关状态依次为交换―直连―交换―直连。

7.5 输入结点编号j = 9，f(j) = j ⊕控制信号 = 1001B ⊕1100B = 0101B = 5，答为5号处理机。

7.6 直连状态时：编号在第i 位不同的结点之间不能通信；交换状态时：编号在第i 位相同的结点之间不能通信。

7.7 用单级混洗―交换网可实现，总共混洗3步。

证：设矩阵A = (a ij )8×8按行展开依次存放在64个单元中，则任意元素a ij 的地址为8i + j ，而a ji 的地址为8j + i 。按混洗函数的定义，3次混洗后，shuffle 3

(8i + j) = 8×(8i + j) mod 63 = i + 8j ，也就说将元素a ij 地址变换成a ji 的地址。由于a ij 是矩阵中的任意元素，所以3次混洗可实现矩阵转置(a ij )T

8×8=(a ji )8×8。

7.8 最多5级，因为对于任给的输入结点编号j=X 6X 5X 4X 3X 2X 1X 0，PM2I 多级网络中i=2级的功能是PM2±2(j)=j ±22

mod 128，±22

运算只有可能改变j 中的X 6～X 2，所以最多使用Cube 6～Cube 2就能实现代换了。

7.9 由于N = 16，即n = 4，每个结点编号用4位二进制数表示。PM2±0函数功能是对结点编号加1或减1，其结果最多可将编号的4位都取反（如1111B + 1 = 0000B ），所以用每步只能对1位取反的单级立方体网络来模仿，最差情况下要4步。

7.10 用混洗―交换网络模拟Cube 网。

当模拟Cube 0功能时，只需一次交换即可完成；而模拟Cube i 且i ≠0时，需先作n – i 步混洗，再作1步交换，最后作i 步混洗才能完成，共计n + 1步。

综上所述，下限为1步，上限为n + 1步。

10 1 0

1 α

7.11 求单级立方体网络和单级混洗―交换网络的最大广播步数，这两种网络的最大广播步数与最大距离（即直径）相同。 (1)单级立方体网络直径 = n （Cube n-1～Cube 0各1次）； (2)单级混洗―交换网络直径 = 2n-1（n-1次混洗，n 次交换）。

7.12 已知N = 16，用多级立方体网络或者多级混洗―交换网络均能实现，两者可以互相模拟，对同一置换的寻径算法相同，控制信号也相同，下面以多级立方体网络为例分析。 4组4元交换：f 1 = Cube 1Cube 0； 2组8元交换：f 2 = Cube 2Cube 1Cube 0； 1组16元交换：f 3 = Cube 3Cube 2Cube 1Cube 0；利用Cube 函数的结合律、交换律以及同一律（又称自反律）可以推得

f = f 1f 2f 3 = Cube 3Cube 1Cube 0

拓扑结构图略（可参考7.26题的多级混洗―交换网络拓扑结构图）。

网络开关使用级控方式，控制信号为1011B （其中bit i 控制级i ，“0”表示直连，“1”表示交换）。

7.13 N = 8的蝶式置换。 (1) f(X 2X 1X 0) = X 0X 1X 2；

(2) 至少需2次通过，每次都是N 个数据同时发送，同时接收，中途不储存； (3) 控制信号的设置有4种方案，如下所示。其中“0”表示直连，“1”表示交换。

101 100 001 101 000 000 000 000 000 000 000 000 101 100 001 101 000 000 000 000 101 100 001 101 101 100

001 101

000 000

7.14

(1) 共N!种； (2) 一次通过有2

种不同；

(3) N = 8时，百分比 =

%16.10%100!

88%100!4

≈?=?N N N

7.26(1)～(3)； (1)见下图实线。

(2)见下图虚线；不会阻塞，因为两条路径的控制信号都是1110，形成级控模式，所以不会阻塞。

(3)一次通过实现的置换数为16 8

= 4294967296，全部置换数为N! = 20922789888000，前者约占后者的0.02%。

7.27

(1) 已知N = 64，n = 6，源结点s = 101101B ，目的结点d = 011010B ，方向矢量r = s ⊕d = 110111B ，以低维度优先顺序寻径，路径为 s = 101101B → 101100B → 101110B → 101010B → 111010B → 011010B = d （下划线为当前寻径维）

(2) 求给定无向图中2棵选播树（即生成树）。 (i) 求最小成本生成树（通道数最少），可考虑Prim 算法、Kruskal 算法或标记法。一个参考操作方法是：先对临近结点群分别构造最短子树，然后在子树之间作最短互连。

(ii) 求由结点(3,5)出发的单源最短路径生成树（各距离最短），可考虑贪心算法。对X-Y 网格图来说，从树根到某一树叶的任何路径只要在各维均无反向移动即为最短路径（满足此条件的最短路径有多条）。要得到单一树根对于多片树叶的综合最短路径，可以先分别作出各条单播最短路径，然后在不增加各路径长度的前提下，尽可能地进行路段合并。

这两小问结果如下图所示（其中b 图第一步必须选择向下，而不能向右）。

(a)

(b)

(3) 求作超立方体贪心选播树。

7.29 已知N = 256，n = 8，起始结点编号

j = 123 = 01111011B 。根据混

级3 级2 级1 级0 0000 0000 0001 0001 0010 0010 0011 0011 0100 0100 0101 0101 0110 0110 0111 0111 1000 1000 1001 1001 1010 1010 1011 1011 1100 1100 1101 1101 1110 1110 1111 1111

0,7 1,7 2,7 3,7 4,7 5,7 6,7 7,7

第八章(P498)

8.12 问题为S=A1×B1+……+A32×B32，其中T 乘=4Δt ，T 加=2Δt ，T 传=1Δt 。

(1) 在串行计算机上，各操作不论是否相关均不能重叠，总时间恒等于各操作单独时间之和，所以不必考虑运算顺序。T=32·T 乘

+31·T 加=(32×4+31×2)Δt=190Δt

(2) 设此双向环可以并行传送（即为“移数环”，因为SIMD 系统各种数据操作都能并行）。按平均分配原则，每个结点内有4对数据。

首先在各结点用串行算法它们的相乘与求和，需时T 1=4·T 乘+3·T 加=(4×4+3×2)Δt=22Δt ；

然后用二叉树并行算法将8个结点中的部分和相加（见下图），其中并行加法需3次，每次时间相同，而并行传送3次的每次时间却随距离倍增，依次为1、2、4步，所以有T 2=(1+2+4)·T 传+3·T 加=(7×1+3×2)Δt=13Δt ；

总时间T=T 1+T 2=35Δt

第九章(P562)

9.18 问题为S=(A1+B1)×……×(A8+B8)，其中T 加=30ns ，T 乘=50ns ，T 传=10ns 。

将加法记为任务1-8，乘法记为任务9-15。

(1) 在串行计算机上，同8.12题1问分析，共计15步运算，T=8·T 加+7·T 乘=(8×30+7×50)ns=590ns 。 (2) 多功能部件SISD 计算机的工作方式可参考P346题18(3)。为了充分利用加法器与乘法器的可并行性，尽量让加法与乘法交替进行，可自左向右顺序运算（见下图）。T=2·T 加+7·T 乘=(2×30+7×50)ns=410ns

(3) 同8.12题2问，设单向环可以并行传送（即为“移数环”，理由同8.12题2问）。

s = s 1 + s 2 + s 3 + s 4 + s 5 + s 6 + s 7 + s 8

①.右传20步加法1步 ②.右传21步加法1步 ③.右传22步加法1步

A2 B2 A1 B1

T=T 加+3·T 乘+(1+2+4)·T 传=(30+3×50+7×10)ns=250ns

(4)在全互连网络上，任意两个结点之间的距离均为1步，所以任何置换都能在1步完成，故 T=T 加+3·T 乘+(1+1+1)·T 传=(30+3×50+3×10)ns=210ns

1 2 3 4 5 6 7 8

10 20

10 10

传送

计算机系统结构课后答案

1、数据结构和机器的数据表示之间是什么关系？确定和引入数据表示的基本原则是什么？答：数据表示是能由硬件直接识别和引用的数据类型。数据结构反映各种数据元素或信息单元之间的结构关系。数据结构要通过软件映象变换成机器所具有的各种数据表示实现，所以数据表示是数据结构的组成元素。不同的数据表示可为数据结构的实现提供不同的支持，表现在实现效率和方便性不同。数据表示和数据结构是软件、硬件的交界面。除基本数据表示不可少外，高级数据表示的引入遵循以下原则：（1）看系统的效率有否提高，是否养活了实现时间和存储空间。（2）看引入这种数据表示后，其通用性和利用率是否高。 2、标志符数据表示与描述符数据表示有何区别？描述符数据表示与向量数据表示对向量数据结构所提供的支持有什么不同？答：标志符数据表示指将数据类型与数据本身直接联系在一起，让机器中每个数所都带类型樗位。其优点是：（1）简化了指令系统和程序设计；（2）简化了编译程序；（3）便于实现一致性校验；（4）能由硬件自动变换数据类型；（5）支持数据库系统的实现与数据类型无关；（6）为软件调试和应用软件开发提供支持。缺点是：（1）会增加程序所点的主存空间；（2）在微观上对机器的性能（运算速度）不利。数据描述符指数据的描述与数据分开存放，描述所访问的数据是整块还是单个的，及访问该数据块或数据元素的地址住处它具备标志符数据表示的优点，并减少了标志符数据表示所占的空间，为向量和数组结构的实现提供支持。数据描述符方法优于标志符数据表示，数据的描述与数据分开，描述所访问的数据是整块还是单个的，及访问该数据块或数据元素的地址信息，减少了樗符数据表示所占的窨。用描述符方法实现阵列数据的索引比用变址方法实现要方便，且便于检查出程序中的阵列越界错误。但它不能解决向量和数组的高速运算问题。而在有向量、数组数据表示的向量处理机上，硬件上设置有丰富的赂量或阵列运算指令，配有流水或阵列方式处理的高速运算器，不仅能快速形成向量、数组的元素地址，更重要的是便于实现把向量各元素成块预取到中央处理机，用一条向量、数组指令流水或同时对整个向量、数组高速处理．如让硬件越界判断与元素运算并行。这些比起用与向量、阵列无关的机器语言和数据表示串行实现要高效的多。 3、堆栈型机器与通用寄存器型机器的主要区别是什么？堆栈型机器系统结构为程序调用的哪些操作提供了支持？答：有堆栈数据表示的机器称为堆栈机器。它与一般通用寄存器型机器不同。通用寄存器型

计算机系统结构考试计算题

3.12 有一指令流水线如下所示（1）求连续输入10条指令，该流水线的实际吞吐率和效率；（2）该流水线的“瓶颈”在哪一段？请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少？解：（1） 2200(ns)2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n T P 1pipeline -== 45.45%11 5 4400T P m t T P E m 1 i i ≈=? =?? =∑= （2）瓶颈在3、4段。 ? 变成八级流水线（细分） 850(ns)509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n T P 1pipeline -== 58.82%17 10 8400T P m ti T P E m 1 i ≈=? =?? =∑= ? 重复设置部件出 50ns 50ns 100ns 200ns

)(ns 85 1 T n T P 1pipeline -== 58.82%17 10885010400E ≈=??= 3.13 4段组成，3段时，一次，然4段。如果需要的时间都是，问：（1）当在流水线的输入端连续地每时间输入任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每输入一个任务，连续处理 10个任务时的实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高该流水线的吞吐率？仍连续处理10个任务时，其吞吐率提高多少？（2） t ?t ?2

计算机系统结构习题解答

《计算机系统结构》习题解答第一章(P33) 1.7 (1)从指定角度来看，不必要了解的知识称为透明性概念。 1.8见下表，“√”为透明性概念，“P ”表示相关课文页数。 1.12 已知Se=20 , 求作Fe-Sn 关系曲线。将Se 代入Amdahl 定律得 e n F S 20 19 11 -= 1.13 上式中令Sn=2，解出Fe=10/19≈0.526 1.14 上式中令Sn=10，解出Fe=18/19≈0.947 1.15 已知两种方法可使性能得到相同的提高，问哪一种方法更好。 (1)用硬件组方法，已知Se=40，Fe=0.7，解出Sn=40/12.7≈3.1496（两种方法得到的相同性能） (2)用软件组方法，已知Se=20，Sn=40/12.7，解出Fe=27.3/38≈0.7184（第二种方法的百分比） (3)结论：软件组方法更好。因为硬件组需要将Se 再提高100%（20→40），而软件组只需将Fe 再提高1.84%（0.7→0.7184）。 Sn 20 1

1.17 57.34 .15 5 9.01.01≈= + = n S 1.18 记f ── 时钟频率，T=1/f ── 时钟周期，B ── 带宽（Byte/s ）。方案一：)/(44 11s Byte f T B =?= 方案二：)/(5.3421 %252%752s Byte f T B =??+?= 1.19 由各种指令条数可以得到总条数，以及各百分比，然后代公式计算。 ∑===4 1 510i i IC IC (1)∑==?+?+?+?=? = 4 1 55.108.0215.0232.0245.01)(i i i IC IC CPI CPI (2)806.2555.140 10 55.11040106 66≈=??=?=CPI f MIPS (3)（秒）003876.040055 .110 6 ≈=?= MIPS IC T 1.21 (1)24.21.0812.0418.026.01=?+?+?+?=CPI (2)86.171024.21040106 6 6≈??=?= CPI f MIPS 1.24 记Tc ── 新方案时钟周期，已知CPI = CPI i = 1 原时间 = CPI × IC × 0.95Tc = 0.95IC ×Tc 新时间 = （0.3×2/3+0.7）× IC × Tc = 0.9IC ×Tc 二者比较，新时间较短。第二章(P124) 2.3（忽略P124倒1行～ P125第8行文字，以简化题意）已知2种浮点数，求性能指标。此题关键是分析阶码、尾数各自的最大值、最小值。原图为数据在内存中的格式，阶码的小数点在其右端，尾数的小数点在其左端，遵守规格化要求。

计算机系统结构习题及答案

第1章计算机系统结构的基本概念 1、有一个计算机系统可按功能分成4级，每级的指令互不相同，每一级的指令都比其下一级的指令在效能上强M倍，即第i级的一条指令能完成第i-1级的M条指令的计算量。现若需第i级的N条指令解释第i+1级的一条指令，而有一段第1级的程序需要运行Ks，问在第 2、3和4级上一段等效程序各需要运行多长时间？答：第2级上等效程序需运行：(N/M)*Ks。第3级上等效程序需运行：(N/M)*(N/M)*Ks。第4级上等效程序需运行：(N/M)*(N/M)*(N/M)*Ks。 2、硬件和软件在什么意义上是等效的？在什么意义上又是不等效的？试举例说明。答：软件和硬件在逻辑功能上是等效的，原理上，软件的功能可用硬件或固件完成，硬件的功能也可用软件模拟完成。只是反映在速度、价格、实现的难易程度上这两者不同。 3、试以实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系与影响。答：计算机系统结构、计算机组成、计算机实现互不相同，但又相互影响。（1）计算机的系统结构相同，但可采用不同的组成。如IBM370系列有115、125、135、158、168等由低档到高档的多种型号机器。从汇编语言、机器语言程序设计者看到的概念性结构相同，均是由中央处理机/主存，通道、设备控制器，外设4级构成。其中，中央处理机都有相同的机器指令和汇编指令系统，只是指令的分析、执行在低档机上采用顺序进行，在高档机上采用重叠、流水或其它并行处理方式。（2）相同的组成可有多种不同的实现。如主存器件可用双极型的，也可用MOS型的；可用VLSI单片，也可用多片小规模集成电路组搭。（3）计算机的系统结构不同，会使采用的组成技术不同，反之组成也会影响结构。如为实现A:=B+CD:=E*F,可采用面向寄存器的系统结构，也可采用面向主存的三地址寻址方式的系统结构。要提高运行速度，可让相加与相乘并行，为此这两种结构在组成上都要求设置独立的加法器和乘法器。但对面向寄存器的系统结构还要求寄存器能同时被访问，而对面向主存的三地址寻址方式的系统结构并无此要求，倒是要求能同时形成多个访存操作数地址和能同时访存。又如微程序控制是组成影响结构的典型。通过改变控制存储器中的微程序，就可改变系统的机器指令，改变结构。如果没有组成技术的进步，结构的进展是不可能的。综上所述，系统结构的设计必须结合应用考虑，为软件和算法的实现提供更多更好的支持，同时要考虑可能采用和准备采用的组成技术。应避免过多地或不合理地限制各种组成、实现技术的采用和发展，尽量做到既能方便地在低档机上用简单便宜的组成实现，又能在高档机上用复杂较贵的组成实现，这样，结构才有生命力；组成设计上面决定于结构，下面受限于实现技术。然而，它可与实现折衷权衡。例如，为达到速度要求，可用简单的组成但却是复杂的实现技术，也可用复杂的组成但却是一般速度的实现技术。前者要求高性能的器件，后者可能造成组成设计复杂化和更多地采用专用芯片。组成和实现的权衡取决于性能价格比等因素；结构、组成和实现所包含的具体内容随不同时期及不同的计算机系统会有差异。软件的硬化和硬件的软件都反映了这一事实。VLSI的发展更使结构组成和实现融为一体，难以分开。 4、什么是透明性概念？对计算机系统结构，下列哪些是透明的？哪些是不透明的？存储器的模m交叉存取；浮点数据表示；I/O系统是采用通道方式还是外围处理机方式；数据总线宽度；字符行运算指令；阵列运算部件；通道是采用结合型还是独立型；PDP-11系列的单总线结构；访问方式保护；程序性中断；串行、重叠还是流水控制方式；堆栈指令；存储器最小编址单位；Cache存储器。答：透明指的是客观存在的事物或属性从某个角度看不到。透明的有：存储器的模m交叉存取；数据总线宽度；阵列运算部件；通道是采用结合型还是独立型；PDP-11系列的单总线结构；串行、重叠还是流水控制方式；Cache存储器。不透明的有：浮点数据表示；I/O系统是采用通道方式还是外围处理机方式；字符行运算指令；访问方式保护；程序性中断；堆栈指令；存储器最小编址单位。P.S. 属于计算机系统结构的属性有：数据表示、寻址方式、寄存器组织、指令系统、存储组织、中断机构、I/O结构、保护机构等。属于组成的属性有：数据通路宽度、专用部件设置、功能部件并行度、控制机构的组成方式，可靠性技术等。它着眼于机器内各事件的排序方式，控制机构的功能及部件间的关系。属于实现的属性有：部件的物理结构、器件、模块的划分与连接、微组装技术、信号传输技术等，它着眼于器件技术和微组装技术。 5、从机器（汇编）语言程序员看，以下哪些是透明的？指令地址寄存器；指令缓冲器；时标发生器；条件寄存器；乘法器；主存地址寄存器；磁盘外设；先行进位链；移位器；通用寄存器；中断字寄存器。答：透明的有：指令缓冲器、时标发生器、乘法器、主存地址寄存器、先进先出链、移位器 6、下列哪些对系统程序员是透明的？哪些对应用程序员是透明的？系列机各档不同的数据通路宽度；虚拟存储器；Cache存储器；程序状态字；“启动I/O”指令；“执行”指令；指令缓冲寄存器。答:对系统程序员透明的有：虚拟存储器；Cache存储器；程序状态字；对应用程序员透明的有：系列机各档不同的数据通路宽度；“启动I/O”指令；“执行”指令；指令缓冲寄存器。该题答案纯属本人个人见解。对系统程序员透明是否意味着有计算机系统结构透明，而对应用程序员透明则对应着对计算机组成透明呢？----lanjing 以下摘自南京大学出版社出版，李学干主编的辅导书

计算机系统结构课后答案unit3

第3章总线、中断与输入输出系统 3.1．简要举出集中式串行链接，定时查询和独立请求3种总线控制方式的优缺点。同时分析硬件产生故障时通讯的可靠性。答：集中式串行链连接方式。其过程为： ①所有部件都经公共的“总线请求”线向总线控制器发使用总线申请。 ②当“总线忙”信号未建立时，“总线请求”才被总线控制器响应，送出“总线可用”信号，它串行地通过每个部件。 ③如果某部件未发过“总线请求”，则它将“总线可用”信号往下一部件转，如果某部件发过“总线请求”，则停止“总线可用”信号的传送。 ④该部件建立“总线忙”，并除去“总线请求”，此时该部件获得总线使用权，准备传送数据。 ⑤数据传送期间，“总线忙”维持“总线可用”的建立。 ⑥传送完成后，该部件去除“总线忙”信号和“总线可用”信号。 ⑦当“总线请求”再次建立时，就开始新的总线分配过程。优点：①选择算法简单；②控制总线数少；③可扩充性好；④可靠性高。缺点：①对“总线可用”线及其有关电路失效敏感，②不灵活；③总线中信号传送速度慢。集中式定时查询方式，过程： ①总线上每个部件通过“总线请求”发请求。 ②若“总线忙”信号未建立，则计数器开始计数，定时查询个部件，以确定是谁发的请求。 ③当查询线上的计数值与发出请求的部件号一致时，该部件建立“总线忙”，计数停止，查询也停止。除去“总线请求”，该部件获得总线使用权。 ④“总线忙”维持到数据传送完毕。 ⑤数据传送完，去除“总线忙”。 ⑥当“总线请求”线上有新的请求，就开始下一个总线分配过程。优点：①优先次序灵活性强；②可靠性高。缺点：①控制线数较多；②扩展性较差；③控制较为复杂；④总线分配受限于计数信号，不能很高。集中式独立请求方式，过程：

计算机系统结构试卷B

《计算机系统结构B卷》一、填空题（每小题1.5分，共30分）。 1．对系列机而言，必须保证做到软件，力争做到软件向上兼容。 2．由软件实现的计算机称之为。 3. 多处理机系统按组织形式分有三种，功能分布是多处理机系统分工方式。 4．依据从哪一层开始设计，计算机体系结构设计的主要方法有三种，占据主导地位的是设计。 5. 在先行控制方式实现流水线的处理器中，有先行指令、先行操作、先行读数和后行写数等四个缓冲栈，缓冲深度最大的是。 6.按流水线的功能多寡分，可分为单功能流水线和。 7. 用于表示非线性流水线中的任务对未进入流水线的后继任务流入流水线的时间间隔的约束称为。 8.中断转移相关处理的基本方法包括不精确断点法和。 9. 互连网络中任意两个结点之间距离的最大值称为。 10．在多级交叉开关互联网络中，交叉开关的控制方式有、组控制和单元控制。 11. 在多计算机系统的互连网络中，通信模式包括、选播、广播和会议等四种。 12. 描述网络寻径效率常用的两个参数是通道流量和。 13．自定义数据表示包括标志符和两种数据表示。 14. 浮点数尾数基值越大，浮点数表示的数据范围。 15. 根据运算类型指令操作数存储方法不同，指令集结构可分为堆栈型、累加器型和。 16. 标量处理机是否高度并行是以指令级并行度（ILP）为来区分。 17．存储系统的基本存储层次有、主存储器和辅助存储器。 18. 采用并行存储器的目的是。 19. 从时间开销来看，伪命中的时间正常命中的时间。 20. 增加Cache存储系统的相联度，可降低Cache的不命中率，但会增加Cache 的。

二、简答题(每小题6分，共30分)。 1．多计算机系统和多处理机系统的差别有哪几方面？其中最根本的差别是哪个方面？ 2. 什么是流水线相关？流水线相关可分为哪几大类？ 3. 什么是动态互连网络？动态互连网络的互联形式有哪几种？ 4. 指令系统设计包括哪两个方面？指令格式优化设计的目的是什么？ 5. 维护Cache与主存一致性的更新算法有哪些? 三、分析题(第一小题8分，第二小题12分，共20分)。 1．某种处理机10条指令的使用频度分别为：0.25，0.20，0.15，0.10，0.08，0.08，0.05，0.04 ，0.03 ，0.02，试画出该处理机进行Huffman编码时的一棵Huffman树。 2. 在某采用全相联映象、相联目录表实现地址变换Cache存储器中，Cache 的容量是8KB，主存是由4个存储体组成的低位交叉访问存储器，主存总容量是32MB，每一个存储体的字长是32位，。（1）写出主存地址和Cache地址的格式，并标出各字段的长度。（2）说明目录表的行数、相联比较的位数和目录表的宽度。四、计算题(第一小题8分，第二小题12分，共20分)。 1. 设16个处理器编号分别为0、1、……、15，用单级互连网络连接，当互连函数分别为：（1）Cube3、（2）PM+3、（3）Shuffle（Shuffle）时，第13号处理器分别与哪一个处理器相连? 2. 有一条5个功能段的线性动态多功能流水线如图所示，其中1→2→3→5功能段组成加法流水线，1→4→5功能段组成乘法流水线，设每个功能段的延迟时间均相等为△t。用这条流水线计算F=4 1() i i i a b = + ∏，画出流水线时空图，并计算流水线的实际吞吐率、加速比和效率。 Z

计算机系统结构_课后答案

习题一 1、解释下列术语计算机系统的外特性：通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性，即由他们所看到的计算机的基本属性（概念性结构和功能特性）。计算机系统的内特性：计算机系统的设计人员所看到的基本属性，本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。模拟：模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。可移植性：在新型号机出台后，原来开发的软件仍能继续在升级换代的新型号机器上使用，这就要求软件具有可兼容性，即可移植性。可兼容性是指一个软件可不经修改或只需少量修改，便可由一台机器移植到另一台机器上运行，即同一软件可应用于不同环境。 Amdahl 定律：系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度，取决于这种执行方式被使用的频度或占总执行时间的比例。虚拟机（Virtual Machine ）：指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。 6、 7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%，为了增强该操作的性能，可采用两种不同的方法：一种是增加专门的硬件，可使求浮点数平方根操作的速度提高为原来的20倍；另一种方法是提高所有浮点运算指令的速度，使其为原来的2倍，而浮点运算指令的执行时间在总执行时间中占30%。试比较这两种方法哪一种更好些。答：增加硬件的方法的加速比23.120 /2.0)2.01(1 1=+-= p S , 另一种方法的加速比176.12 /3.0)3.01(1 2=+-=p S ，经计算可知Sp1>Sp2第一种方法更好些。 9、假设高速缓存Cache 的工作速度为主存的5倍，且Cache 被访问命中的概率

计算机体系结构习题答案解析

第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构：按照计算机语言从低级到高级的次序，把计算机系统按功能划分成多级层次结构，每一层以一种不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序，然后再在这低一级机器上运行，实现程序的功能。解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整个程序。计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。透明性：在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。系统加速比：对系统中某部分进行改进时，改进后系统性能提高的倍数。 Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。 CPI：每条指令执行的平均时钟周期数。测试程序套件：由各种不同的真实应用程序构成的一组测试程序，用来测试计算机在各个方面的处理性能。存储程序计算机：冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中，机器一旦启动，就能按照程序指定的逻辑顺序执行这些程序，自动完成由程序所描述的处理工作。系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。软件兼容：一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。向上（下）兼容：按某档计算机编制的程序，不加修改就能运行于比它高（低）档的计算机。向后（前）兼容：按某个时期投入市场的某种型号计算机编制的程序，不加修改地就能

完整版计算机体系结构课后习题原版答案_张晨曦著

第1章计算机系统结构的基本概念 (1) 第2章指令集结构的分类 (10) 第3章流水线技术 (15) 第4章指令级并行 (37) 第5章存储层次 (55) 第6章输入输出系统 (70) 第7章互连网络 (41) 第8章多处理机 (45) 第9章机群 (45) 第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构：按照计算机语言从低级到高级的次序，把计算机系统按功能划分成多级层次结构，每一层以一种不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序，然后再在这低一级机器上运行，实现程序的功能。

解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整个程序。计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。系统加速比：对系统中某部分进行改进时，改进后系统性能提高的倍数。 Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。

计算机系统结构期末考试题目

第一章： 1.计算机系统结构的定义答：由程序设计者看到的一个计算机系统的属性，即概念性结构和功能特性。 2.透明性概念答：在计算机技术中，一种本来是存在的事物或属性，但从某种角度看似乎不存在，称为透明性现象。 3.兼容性向后兼容兼容性：同一个软件可以不加修改地运行于系统结构相同的各档机器，可获得相同的结果，差别只在于不同的运行时间。向后兼容：按某个时期投入市场的某种型号机器编制的程序，不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律答：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答：每条指令的平均时钟周期数。 6.MIPS 答：每秒百万条指令数！MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答：每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念答： 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分答：①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD （实际不存在）④多指令流多数据流MIMD 10.计算机系统设计的定量原理（四个）答：①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算答：CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长加速比=（采用改进措施后的性能）/（没有采用改进措施前的性能） =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点硬件实现：速度快、成本高；灵活性差、占用内存少软件实现：速度低、复制费用低；灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

计算机系统结构基本习题和答案

计算机系统结构基本习题和答案填空题 1、从（使用语言的）角度可以将系统看成是按（功能）划分的多个机器级组成的层次结构。 2、计算机系统结构的层次结构由高到低分别为（应用语言机器级，高级语言机器级，汇编语言机器级，操作系统机器级，传统机器语言机器级，微程序机器级）。 3、应用程序语言经（应用程序包）的（翻译）成高级语言程序。 4、高级语言程序经（编译程序）的（翻译）成汇编语言程序。 5、汇编语言程序经（汇编程序）的（翻译）成机器语言程序。 6、在操作系统机器级，一般用机器语言程序（解释）作业控制语句。 7、传统机器语言机器级，是用（微指令程序）来（解释）机器指令。 8、微指令由（硬件）直接执行。 9、在计算机系统结构的层次结构中，机器被定义为（能存储和执行相应语言程序的算法和数据结构）的集合体。 10、目前M0由（硬件）实现，M1用（微程序（固件））实现，M2到M5大多用（软件）实现。以（软件）为主实现的机器成为虚拟机。（虚拟机）不一定全用软件实现，有些操作也可用（固件或硬件）实现。 11、透明指的是（客观存在的事物或属性从某个角度看不到），它带来的好处是（简化某级的设计），带来的不利是（无法控制）。 12、计算机系统结构也称（计算机体系结构），指的是（传统机器级的系统结构）。它是（软件和硬件/固件）的交界面，是机器语言汇编语言程序设计者或编译程序设计者看到的（机器物理系统）的抽象。 13、计算机组成指的是（计算机系统结构的逻辑实现），包括（机器级内的数据流和控制流）的组成及逻辑设计等。计算机实现指的是（计算机组成的物理实现），它着眼于（器件）技术和（微组装）技术。14、确定指令系统中是否要设乘法指令属于（计算机系统结构），乘法指令是用专门的高速乘法器实现还是用加法器实现属于（计算机组成），乘法器和加法-移位器的物理实现属于（计算机实现）。 15、主存容量与编址方式的确定属于（计算机系统结构），主存是否采用多体交叉属于（计算机组成），主存器件的选定属于（计算机实现）。 16、设计何种系列机属于（计算机系统结构），系列机内不同型号计算机的组织属于（计算机组成）。 17、是否采用通道方式输入输出的确定属于（计算机系统结构），通道采用结合型还是独立型属于（计算机组成）。 18、对PDP-11或V AX-11来说，单总线结构属于（计算机系统结构），其机器级的I/O连接和使用方式属于（计算机组成）。 19、由于计算机组成和计算机实现关系密切，有人称它们为（计算机实现），即计算机系统的（逻辑实现）和（物理实现）。 20、计算机系统结构可有（由上而下）、（由下而上）和（由中间开始）三种不同的设计思路。 21、“由中间开始”设计的“中间”是指（层次结构中的软硬交界面），目前多数是在（传统机器级）与（操作系统级）之间。 22、除了分布处理，MPP和机群系统外，并行处理计算机按其基本结构特征可分为（流水线计算机）、（阵列处理机）、（多处理机）、（数据流计算机）四种不同的结构。 23、费林按指令流和数据流的多倍性把计算机系统分类，这里的多倍性指（系统瓶颈部件上处于同一执行阶段的指令或数据的最大可能个数）。 24、费林分类法能反映出大多数计算机的并行工作方式和结构特点，但只能对（控制流）机器分类，不能对（数据流）机器分类，而且对（流水线处理机）的分类不确切。 25、我们把（着眼于软、硬件功能分配和确定程序设计所看到的机器级界面的计算机系统结构）称为从程序设计者看的计算机系统结构，而把（着眼于如何更好、更合理地实现分配给硬件的功能的计算机组成）称为从计算机设计者看的计算机系统能够结构。

计算机系统结构考试题库及答案

计算机系统结构试题及答案一、选择题（50分，每题2分，正确答案可能不只一个，可单选或复选） 1.（CPU周期、机器周期）是内存读取一条指令字的最短时间。 2.（多线程、多核）技术体现了计算机并行处理中的空间并行。 3.（冯?诺伊曼、存储程序）体系结构的计算机把程序及其操作数据一同存储在存储器里。 4.（计算机体系结构）是机器语言程序员所看到的传统机器级所具有的属性，其实质是确定计算机系统中软硬件的界面。 5.（控制器）的基本任务是按照程序所排的指令序列，从存储器取出指令操作码到控制器中，对指令操作码译码分析，执行指令操作。 6.（流水线）技术体现了计算机并行处理中的时间并行。 7.（数据流）是执行周期中从内存流向运算器的信息流。 8.（指令周期）是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机，使用（晶体管）作为电子器件。 10.1960年代中期开始出现的第三代计算机，使用（小规模集成电路、中规模集成电路）作为电子器件。 11.1970年代开始出现的第四代计算机，使用（大规模集成电路、超大规模集成电路）作为电子器件。 12.Cache存储器在产生替换时，可以采用以下替换算法：（LFU算法、 LRU算法、随机替换）。

13.Cache的功能由（硬件）实现，因而对程序员是透明的。 14.Cache是介于CPU和（主存、内存）之间的小容量存储器，能高速地向CPU提供指令和数据，从而加快程序的执行速度。 15.Cache由高速的（SRAM）组成。 16.CPU的基本功能包括（程序控制、操作控制、时间控制、数据加工）。 17.CPU的控制方式通常分为：（同步控制方式、异步控制方式、联合控制方式）反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是：（在功能部件内部采用同步控制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下，尽可能多地采用异步控制方式）。 19.CPU的同步控制方式有时又称为（固定时序控制方式、无应答控制方式）。 20.CPU的异步控制方式有时又称为（可变时序控制方式、应答控制方式）。 21.EPROM是指（光擦可编程只读存储器）。 22.MOS半导体存储器中，（DRAM）可大幅度提高集成度，但由于（刷新）操作，外围电路复杂，速度慢。 23.MOS半导体存储器中，（SRAM）的外围电路简单，速度（快），但其使用的器件多，集成度不高。 24.RISC的几个要素是（一个有限的简单的指令集、CPU配备大量的通用寄存器、强调对指令流水线的优化）。

计算机系统结构课后习题四、五答案

习题四 1.教材P88 存储层次的访问效率e计算公式。 e=T A1/(H T A1+(1-H) T A2) e H T A1+ e(1-H) T A2= T A1 H T A1+ (1-H) T A2= T A1/ e H T A1 -H T A2= T A1/ e- T A2 H (T A1 - T A2) = T A1/ e- T A2 H = T A1/ e- T A2/ (T A1 - T A2) H = T A1(1/ e- T A2/ T A1)/ T A1 (1- T A2/ T A1) H = (1/ e- T A2/ T A1)/ (1- T A2/ T A1) 把题意的条件带入，命中率H=(1/ e- T A2/ T A1)/ (1- T A2/ T A1) =(1/ 0.8- 10-2/ 10-7)/ (1- 10-2/ 10-7) =0.999999975 实际上，这样高的命中率是极难达到的。在主辅存之间增设一级存储器，让其速度介于主存辅存之间，让主存与中间级的访问时间比为1：100，中间级与辅存之间的访问时间比为1：1000，将它们配上相应辅助软硬件，组成一个三级存储层次，这样，可以使第1级主存的命中率降低到 H=(1/ 0.8- 10-5/ 10-7)/ (1- 10-5/ 10-7) =0.997 1.教材P84 每个存储周期能访问到的平均字数 B=(1-(1-λ)m)/λ=(1-0.7532)/0.25 ≈4 既每个存储周期能访问到的平均字数为4。若将λ=25%，m=16代入得

B=(1-(1-λ)m)/λ=(1-0.7516)/0.25 =3.96 既每个存储周期能访问到的平均字数为3.96。可见，模数m不宜太大，否则性能改进不大。 3．教材P81。m个存储体并行的最大频宽B m=W*m/T M，根据题意，实际频宽要低于最大频宽。即实际频宽≤0.6最大频宽。 4*106B/s≤0.6*4 B*m/(2*10-6 s) 4≤0.6* m*4/2 2≤0.6* m 3.333≤ m m取2的幂，即m为4。 4.教材P91。根据题意，画出页表。虚存页号实页号装入位 0 3 1 1 1 1 2 2 0 3 3 0 4 2 1 5 1 0 6 0 1 7 0 0 ⑴发生页面失效的全部虚页号就是页映像表中所有装入位为0的行所对应的虚页号的集合。本题为2，3，5，7。 ⑵按以下虚地址计算主存实地址的情况列表虚地址虚存页号页内位移装入位实页号页内位移实地址 0 0 0 1 3 0 （3*1024+0）3072 3728（3*1024+656） 3 656 0 页面失效页面失效无 1023（0*1024+1023）0 1023 1 3 1023 （3*1024+1023）4095 1024（1*1024+0） 1 0 1 1 0 （1*1024+0）1024 2055（2*1024+7） 2 7 0 页面失效页面失效无 7800（7*1024+632）7 632 0 页面失效页面失效无

(完整版)计算机系统结构试题及答案

计算机系统结构复习题单选及填空：计算机系统设计的主要方法 1、由上往下的设计（top-down） 2、由下往上的设计（bottom-up） 3、从中间开始（middle-out） Flynn分类法把计算机系统的结构分为以下四类：（1）单指令流单数据流（2）单指令流多数据流（3）多指令流单数据流 (4) 多指令流多数据流堆栈型机器：CPU 中存储操作数的单元是堆栈的机器。累加器型机器：CPU 中存储操作数的单元是累加器的机器。通用寄存器型机器：CPU 中存储操作数的单元是通用寄存器的机器。名词解释：虚拟机：用软件实现的机器叫做虚拟机，但虚拟机不一定完全由软件实现，有些操作可以由硬件或固件（固件是指具有软件功能的固件）实现。系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。兼容机：它是指由不同公司厂家生产的具有相同系统结构的计算机。流水线技术：将一个重复的时序过程，分解成为若干个子过程，而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。单功能流水线：指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。多功能流水线：指各段可以进行不同的连接，以实现不同的功能的流水线。顺序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。乱序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同，允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错序流水线、异步流水线。吞吐率：在单位时间内流水线所完成的任务数量或输出结果的数量。指令的动态调度：

是指在保持数据流和异常行为的情况下，通过硬件对指令执行顺序进行重新安排，以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。指令的静态调度：是指依靠编译器对代码进行静态调度，以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。超标量：一种多指令流出技术。它在每个时钟周期流出的指令条数不固定，依代码的具体情况而定，但有个上限。超流水：在一个时钟周期内分时流出多条指令。多级存储层次：采用不同的技术实现的存储器，处在离CPU不同距离的层次上，各存储器之间一般满足包容关系，即任何一层存储器中的内容都是其下一层（离CPU更远的一层）存储器中内容的子集。目标是达到离CPU最近的存储器的速度，最远的存储器的容量。写直达法：在执行写操作时，不仅把信息写入Cache中相应的块，而且也写入下一级存储器中相应的块。写回法：只把信息写入Cache中相应块，该块只有被替换时，才被写回主存。集中式共享多处理机：也称为对称式共享存储器多处理SMP。它一般由几十个处理器构成，各处理器共享一个集中式的物理存储器，这个主存相对于各处理器的关系是对称的，分布式共享多处理机：它的共享存储器分布在各台处理机中，每台处理机都带有自己的本地存储器，组成一个“处理机-存储器”单元。但是这些分布在各台处理机中的实际存储器又合在一起统一编址，在逻辑上组成一个共享存储器。这些处理机存储器单元通过互连网络连接在一起，每台处理机除了能访问本地存储器外，还能通过互连网络直接访问在其他处理机存储器单元中的“远程存储器”。多Cache一致性：多处理机中，当共享数据进入Cache，就可能出现多个处理器的Cache中都有同一存储器块的副本，要保证多个副本数据是一致的。写作废协议：在处理器对某个数据项进行写入之前，它拥有对该数据项的唯一的访问权。写更新协议：当一个处理器对某数据项进行写入时，它把该新数据广播给所有其它Cache。这些Cache用该新数据对其中的副本进行更新。机群：是一种价格低廉、易于构建、可扩放性极强的并行计算机系统。它由多台同构或异构

计算机体系结构课后答案

计算机体系结构课后答案【篇一：计算机体系结构习题(含答案)】 1、尾数用补码、小数表示，阶码用移码、整数表示，尾数字长p=6（不包括符号位），阶码字长q=6（不包括符号位），为数基值rm=16，阶码基值re=2。对于规格化浮点数，用十进制表达式写出如下数据（对于前11项，还要写出16进值编码）。（1）最大尾数（8）最小正数（2）最小正尾数（9）最大负数（3）最小尾数（10）最小负数（4）最大负尾数（11）浮点零（5）最大阶码（12）表数精度（6）最小阶码（13）表数效率（7）最大正数（14）能表示的规格化浮点数个数 2．一台计算机系统要求浮点数的精度不低于10-7.2，表数范围正数不小于1038，且正、负数对称。尾数用原码、纯小数表示，阶码用移码、整数表示。 (1) 设计这种浮点数的格式 (2) 计算（1）所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。 3．某处理机要求浮点数在正数区的积累误差不大于2-p-1 ，其中，p是浮点数的尾数长度。 (1) 选择合适的舍入方法。

(2) 确定警戒位位数。 (3) 计算在正数区的误差范围。 4．假设有a和b两种不同类型的处理机，a处理机中的数据不带标志符，其指令字长和数据字长均为32位。b处理机的数据带有标志符，每个数据的字长增加至36位，其中有4位是标志符，它的指令数由最多256条减少到不到64条。如果每执行一条指令平均要访问两个操作数，每个存放在存储器中的操作数平均要被访问8次。对于一个由1000条指令组成的程序，分别计算这个程序在a处理机和b处理机中所占用的存储空间大小（包括指令和数据），从中得到什么启发？ 5．一台模型机共有7条指令，各指令的使用频率分别为35%，25%，20%，10%，5%，3%和2%，有8个通用数据寄存器，2个变址寄存器。 (1) 要求操作码的平均长度最短，请设计操作码的编码，并计算所设计操作码的平均长度。 6．某处理机的指令字长为16位，有双地址指令、单地址指令和零地址指令3类，并假设每个地址字段的长度均为6位。 (1) 如果双地址指令有15条，单地址指令和零地址指令的条数基本相同，问单地址指令和零地址指令各有多少条？并且为这3类指令分配操作码。 (2) 如果要求3类指令的比例大致为1：9：9，问双地址指令、单地址指令和零地址指令各有多少条？并且为这3类指令分配操作码。 7．别用变址寻址方式和间接寻址方式编写一个程序，求c=a+b，其中，a与b都是由n个元素组成的一维数组。比较两个程序，并回答下列问题： (1) 从程序的复杂程度看，哪一种寻址方式更好？

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页共 24 页计算机科学系《计算机系统结构》期末考试试卷（A 卷） 2、此试卷适用于计算机科学与技术本科专业。一单选题：(10分，每题1分) 1、 ."启动I/O"指令是主要的输入输出指令，是属于（ B ） A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、输入输出系统硬件的功能对(B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、全相联地址映象是指（A ） A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定，组内任何虚页可装入任何实页位

置 D.组间可任意装入，组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关，则（B ） A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是（B） A.专属软件范畴，与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是（C ） A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断《计算机系统结构》期末考试试卷A卷第 3 页共 24 页