当前位置：文档库 › 计算机体系结构复习题

计算机体系结构复习题

1.7 将计算机系统中某一功能的处理速度加快10倍，但该功能的处理时间仅为整个系统运行时间的40%，则采用此增强功能方法后，能使整个系统的性能提高多少？

解由题可知：可改进比例 = 40% = 0.4 部件加速比 = 10 根据Amdahl 定律可知：

()5625.110

.04.011

-=系统加速比

采用此增强功能方法后，能使整个系统的性能提高到原来的1.5625倍。

1.8计算机系统中有三个部件可以改进，这三个部件的部件加速比为：

部件加速比1=30；部件加速比2=20；部件加速比3=10

（1）如果部件1和部件2的可改进比例均为30%，那么当部件3的可改进比例为多少时，系统加速比才可以达到10？

（2）如果三个部件的可改进比例分别为30%、30%和20%，三个部件同时改进，那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少？

解：（1）在多个部件可改进情况下，Amdahl 定理的扩展：

∑∑

i n S F F S )1(1

已知S 1＝30，S 2＝20，S 3＝10，S n ＝10，F 1＝0.3，F 2＝0.3，得：

）

（）（10/20/0.330/0.30.30.3-11

1033F F +++++=

得F 3＝0.36，即部件3的可改进比例为36%。

（2）设系统改进前的执行时间为T ，则3个部件改进前的执行时间为：（0.3+0.3+0.2）T = 0.8T ，不可改进部分的执行时间为0.2T 。

已知3个部件改进后的加速比分别为S 1＝30，S 2＝20，S 3＝10，因此3个部件改进后的执行时间为：

T T

T T T n 045.010

2.020

3.0303.0'=++=

改进后整个系统的执行时间为：Tn = 0.045T+0.2T = 0.245T

那么系统中不可改进部分的执行时间在总执行时间中占的比例是：

82.0245.02.0=T

3.4 设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段，每个阶段所需

的时间分别为△t 、△t 和2△t 。分别求出下列各种情况下，连续执行N 条指令所需的时间。

（1）顺序执行方式；

（2）只有“取指令”与“执行指令”重叠；（3）“取指令”、“分析指令”与“执行指令”重叠。解：（1）每条指令的执行时间为：△t ＋△t ＋2△t ＝4△t

连续执行N 条指令所需的时间为：4N △t

（2）连续执行N 条指令所需的时间为：4△t ＋3（N-1）△t ＝（3N ＋1）△t （3）连续执行N 条指令所需的时间为：4△t ＋2（N-1）△t ＝（2N ＋2）△t

4.2 简述Tomasulo算法的基本思想。

答：核心思想是：①记录和检测指令相关，操作数一旦就绪就立即执行，把发生RAW 冲突的可能性减小到最少；②通过寄存器换名来消除W AR冲突和W AW冲突。寄存器换名是通过保留站来实现，它保存等待流出和正在流出指令所需要的操作数。

基本思想：只要操作数有效，就将其取到保留站，避免指令流出时才到寄存器中取数据，这就使得即将执行的指令从相应的保留站中取得操作数，而不是从寄存器中。指令的执行结果也是直接送到等待数据的其它保留站中去。因而，对于连续的寄存器写，只有最后一个才真正更新寄存器中的内容。一条指令流出时，存放操作数的寄存器名被换成为对应于该寄存器保留站的名称（编号）。

?Consider a program with the given characteristics

?Instruction count (I-Count) = 106 instructions

?30% of instructions are loads and stores

?D-cache miss rate is 5% and I-cache miss rate is 1%

?Miss penalty is 100 clock cycles for instruction and

data caches

?Compute combined misses per instruction and memory

stall cycles

?Combined misses per instruction in I-Cache and D-Cache

?1% + 30% ?5% = 0.025 combined misses per instruction

?Equal to 25 misses per 1000 instructions

?Memory stall cycles

?0.025 ? 100 (miss penalty) = 2.5 stall cycles per

instruction

?Total memory stall cycles = 106? 2.5 = 2,500,000

CPI with Memory Stalls

? A processor has CPI of 1.5 without any memory stalls

? Cache miss rate is 2% for instruction and 5% for data

? 20% of instructions are loads and stores

? Cache miss penalty is 100 clock cycles for I-cache and D-cache

? What is the impact on the CPI? ? Answer:

Mem Stalls per Instruction =0.02×100 + 0.2×0.05×100 = 3 CPI MemoryStalls =1.5 + 3 = 4.5 cycles per instruction

CPI MemoryStalls / CPI PerfectCache =4.5 / 1.5 = 3

Processor is 3 times slower due to memory stall cycles CPI NoCache =1.5 + (1 + 0.2) × 100 = 121.5 (a lot worse)

3.13有一个流水线由4段组成，其中每当流经第3段时，总要在该段循环一次，然后才能流到第4段。如果每段经过一次所需要的时间都是，问：

（1）当在流水线的输入端连续地每时间输入任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每输入一个任务，连续处理10个任务

时的实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高该流水线的吞吐率？仍连续处理10个任务时，其

吞吐率提高多少？

解：（1）会发生流水线阻塞情况。

（2）

t ?t ?t ?2

54.35%

5045T P E 2310

T n

T p 23T 21T P pipeline

pipeline max ≈=??=??==?=?=t t

t t

（3）重复设置部件

t t ??=??==75

1410T n

T P pipeline

吞吐率提高倍数＝t

t ??231075＝1.64

3.17 假设各种分支指令数占所有指令数的百分比如下：

现有一条段数为4的流水线，无条件分支在第二个时钟周期结束时就被解析出来，而条件分支要到第三个时钟周期结束时才能够被解析出来。第一个流水段是完全独立于指令类型的，即所有类型的指令都必须经过第一个流水段的处理。请问在没有任何控制相关的情况下，该流水线相对于存在上述控制相关情况下的加速比是多少？

解：没有控制相关时流水线的平均CPI ＝1 存在控制相关时：由于无条件分支在第二个时钟周期结束时就被解析出来，而条件分支要到第3个时钟周期结束时才能被解析出来。所以：

段

? 14

（1）若使用排空流水线的策略，则对于条件分支，有两个额外的stall，对无条件分支，有一个额外的stall：

CPI = 1+20%*2+5%*1 = 1.45

加速比S=CPI/1 = 1.45

（2）若使用预测分支成功策略，则对于不成功的条件分支，有两个额外的stall，对无条件分支和成功的条件分支，有一个额外的stall 1：

CPI = 1+20%*(60%*1+40%*2) +5%*1 = 1.33

加速比S=CPI/1 = 1.33

（3）若使用预测分支失败策略，则对于成功的条件分支，有两个额外的stall；对无条件分支，有一个额外的stall；对不成功的条件分支，其目标地址已经由PC 值给出，不必等待，所以无延迟：

CPI = 1+20%*(60%*2 + 40%*0) +5%*1 = 1.29

加速比S=CPI/1 = 1.29

4.4 假设有一条长流水线，仅仅对条件转移指令使用分支目标缓冲。假设分支预测错误的开销为4个时钟周期，缓冲不命中的开销为3个时钟周期。假设：命中率为90%，预测精度为90%，分支频率为15%，没有分支的基本CPI为1。

（1）求程序执行的CPI。

（2）相对于采用固定的2个时钟周期延迟的分支处理，哪种方法程序执行速度更快？

解：（1）程序执行的CPI = 没有分支的基本CPI（1）+ 分支带来的额外开销

分支带来的额外开销是指在分支指令中，缓冲命中但预测错误带来的开销与缓冲没有命中带来的开销之和。

分支带来的额外开销= 15% * (90%命中×10%预测错误×4 + 10％没命中×3)= 0.099 所以，程序执行的CPI ＝1 ＋0.099 = 1.099

（2）采用固定的2 个时钟周期延迟的分支处理CPI = 1 + 15%×2 = 1.3

由（1）（2）可知分支目标缓冲方法执行速度快。

4.9 设指令流水线由取指令、分析指令和执行指令3个部件构成，每个部件经过的时间为△t，连续流入12条指令。分别画出标量流水处理机以及ILP均为4的超标量处理机、超长指令字处理机、超流水处理机的时空图，并分别计算它们相对于标量流水处理机的加速比。

解：标量流水处理机的时空图：

执行完12条指令需T1＝14△t。

超标量流水处理机与超长指令字处理机的时空图：

超标量流水处理机中，每一个时钟周期同时启动4条指令。执行完12条指令需T 2＝5△t ，相对于标量流水处理机的加速比为：

8.2514212=?Λ==t

t T T S

超长指令字处理机中，每4条指令组成一条长指令，共形成3条长指令。执行完12条

指令需T 3＝5△t ，相对于标量流水处理机的加速比为：

8.2514313=?Λ==t

t T T S

超流水处理机的时空图：

超流水处理机中，每1/4个时钟周期启动一条指令。执行完12条指令需T 4＝5.75△t ，相对于标量流水处理机的加速比为：

435.2.75514414=?Λ==t

t T T S

时间

超标量处理机时空图

时间

超长指令字处理机时空图

4、（10分）假定我们有一台计算机，如果所有的cache访问都命中的话，它的CPI是2.0。唯一的数据访问指令是store和load，它们占指令总数的40％，不命中损失是25个时钟周期，不命中率是2％。如果所有的指令访问cache都命中的话，那么机器的速度是存在cache不命中时的多少倍？

首先计算所有cache访问都命中时计算机的性能：

CPU执行时间＝（CPU时钟周期＋内存停机周期）×时钟周期时长

＝（IC×CPI＋0）×时钟周期时长

＝ IC×2.0×时钟周期时长

现在计算考虑cache不命中在内的真实计算机性能，我们先计算内存停机周期：内存停机周期＝IC×每条指令访问内存的次数×不命中率×不命中损失

＝IC×（1＋0.4）×0.02×25

＝IC×0.7

其中（1＋0.4）代表每条指令访问一次内存,而占指令总数40%的store和load 访问两次内存,所以平均每条指令访问访问(1+0.4)次内存。这样总的性能是：CPU执行时间=（IC×2.0＋IC×0.7）×时钟周期时长

= IC×2.7×时钟周期时长

性能提高的比是执行时间之比的倒数：

cache不命中考虑在内的CPU执行时间/cache访问全部命中的CPU执行时间为：2.7×IC×时钟周期时长/2.0×IC×时钟周期时长＝1.35

cache访问全部命中时的速度是有cache不命中时机器速度的1.35倍。

5、（10分）假设某台机器访问存储器都是cache命中，那么它的CPI等于2。还假设只有Load和Store指令才能访问存储器数据，这两种指令的数目占整个程序的40%。如果访问存储器时出现cache缺失，则一次缺失需要花费25个时钟周期。问这台机器在所有指令都cache命中情况比有2%缺失情况快几倍？

根据题意，在程序的执行过程中平均每条指令需要一次取指令和0.4次访问数据。因此，在有2% cache缺失时，由于cache缺失带来的额外开销为：

这台机器在所有指令都cache命中时，CPU执行时间为：

而在有2%缺失情况时，CPU执行时间为：

所以这台机器在所有指令都cache命中情况比有2%缺失情况快

1、（12分）在一台单流水线处理机上执行下面的程序。每条指令都要经过“取

指令”、“译码”、“执行”和“写结果”4个流水段，每个流水段的延迟时间都是5ns。执行部件的输出端有直接数据通路与它的输入端相连接，执行部件产生的条件码也直接送入控制器。

K1： MOVE R1, #4 ；R1←向量长度4

K2：LOOP：MOVE R2, A(R1) ；R2←A向量的一个元素

K3： ADD R0, R2 ；R0←(R0)＋(R2)

K4： DNE R1, LOOP ；R1←(R1)－1,若(R1)≠0转向LOOP

K5： MOVE SUN，R0 ；SUN←(R0)，保存结果

(1)列出指令之间的所有数据相关，包括读写、写读和写写数据相关。

(2)采用预测转移不成功的静态分支预测技术，画出指令流水线的时空图(可

用指令序号表示)，并计算流水线的吞吐率、加速比和效率。

(3)采用预测转移成功的静态分支预测技术，计算指令流水线的吞吐率、加速

比和效率。

1、解:

(1)指令K1与指令K2之间关于R1的写读数据相关（第1次循环）

指令K1与指令K4之间关于R1的写读数据相关（第1次循环）

指令K1与指令K4之间关于R1的写写数据相关（第1次循环）

指令K2与指令K3之间关于R2的写读数据相关（每次循环内）

指令K2与指令K4之间关于R1的读写数据相关（第次循环内）

指令K3与指令K5之间关于R0的写读数据相关（最后一次循环）

另外，相邻循环体之间的数据相关还有：

指令K4与下一循环的指令K2之间关于R1的写读数据相关

指令K3与下一循环的指令K2之间关于R2的读写数据相关

指令K2与下一循环的指令K2之间关于R2的写写数据相关

指令K3与下一循环的指令K3之间关于R0的写读数据相关

指令K3与下一循环的指令K3之间关于R0的读写数据相关

指令K3与下一循环的指令K3之间关于R0的写写数据相关

指令K4与下一循环的指令K4之间关于R1的写读数据相关

指令K4与下一循环的指令K4之间关于R1的读写数据相关

指令K4与下一循环的指令K4之间关于R1的写写数据相关

(2)采用预测转移不成功的静态分支预测技术

执行

译码

.04

234

)243(43.223

)243()

(1222352

43=??+?==?+?==?+?=

E S MIPS ns TP 效率：加速比：吞吐率：

(3)采用预测转移成功的静态分支预测技术

执行译码74

.04194

)243(95.219

)243()

(1471952

43=??+?==?+?==?+?=

E S MIPS ns TP 效率：加速比：吞吐率：

4、（12分）某RISC处理机的工作主频为500MHz，有一个Cache和一个主存储器，Cache的存取周期为2ns，主存储器的存取周期为20ns，Cache的命中率为99%，有20%的LOAD/STORE指令，并假设处理机速度的瓶颈完全在存储系统。

(1)求理想情况(Cache的命中率为100%)下的CPI。

(2)计算该RISC处理机的实际MIPS速率。

(3)如果处理机的工作主频提高到1GHz，计算实际CPI和MIPS速率。

4、解答：

(1)

CPI=(2ns+2ns?20%)?500MHz=1.2

(2)

MIPS=1/(2ns?99%+20ns?1%+2ns?20%?99%+20ns?20%?1%)

=1/2.616ns=382.3

(3)

CPI=(2ns?99%+20ns?1%+2ns?20%?99%+20ns?20%?1%)?1GHz

=2.616ns?1GHz=2.616

MIPS=1/2.616ns=382.3

5.10 假设对指令Cache的访问占全部访问的75%；而对数据Cache的访问占全部访问的25%。Cache的命中时间为1个时钟周期，失效开销为50 个时钟周期，在混合Cache中一次load或store操作访问Cache的命中时间都要增加一个时钟周期，32KB的指令Cache 的失效率为0.39%，32KB的数据Cache的失效率为4.82%，64KB的混合Cache的失效率为1.35%。又假设采用写直达策略，且有一个写缓冲器，并且忽略写缓冲器引起的等待。试问指令Cache和数据Cache容量均为32KB的分离Cache和容量为64KB的混合Cache相比，哪种Cache的失效率更低？两种情况下平均访存时间各是多少？

解：（1）根据题意，约75%的访存为取指令。

因此，分离Cache的总体失效率为：（75%×0.15%）＋（25%×3.77%）＝1.055%；

容量为128KB的混合Cache的失效率略低一些，只有0.95%。

（2）平均访存时间公式可以分为指令访问和数据访问两部分：

平均访存时间＝指令所占的百分比×（读命中时间＋读失效率×失效开销）＋数据所占的百分比×（数据命中时间＋数据失效率×失效开销）

所以，两种结构的平均访存时间分别为：

分离Cache的平均访存时间＝75%×（1＋0.15%×50）＋25%×（1＋3.77%×50）

＝（75%×1.075）＋（25%×2.885）＝1.5275

混合Cache的平均访存时间＝75%×（1＋0.95%×50）＋25%×（1＋1＋0.95%×50）＝（75%×1.475）＋（25%×2.475）＝1.725

因此，尽管分离Cache的实际失效率比混合Cache的高，但其平均访存时间反而较低。分离Cache提供了两个端口，消除了结构相关。

5.11 给定以下的假设，试计算直接映象Cache和两路组相联Cache的平均访问时间以及CPU的性能。由计算结果能得出什么结论？

（1）理想Cache情况下的CPI为2.0，时钟周期为2ns，平均每条指令访存1.2次；

（2）两者Cache容量均为64KB，块大小都是32字节；

（3）组相联Cache中的多路选择器使CPU的时钟周期增加了10％；

（4）这两种Cache的失效开销都是80ns；

（5）命中时间为1个时钟周期；

（6） 64KB 直接映象Cache 的失效率为1.4％，64KB 两路组相联Cache 的失效率为1.0％。解：平均访问时间＝命中时间＋失效率×失效开销平均访问时间1-路=2.0+1.4% *80=3.12ns

平均访问时间2-路=2.0*(1+10%)+1.0% *80=3.0ns 两路组相联的平均访问时间比较低

CPU time =（CPU 执行+存储等待周期）*时钟周期

CPU time =IC （CPI 执行+总失效次数/指令总数*失效开销） *时钟周期 =IC （（CPI 执行*时钟周期）+（每条指令的访存次数*失效率*失效开销*时钟周期）） CPU time 1-way =IC(2.0*2+1.2*0.014*80)＝5.344IC CPU time 2-way =IC(2.2*2+1.2*0.01*80)＝5.36IC 相对性能比：

=--1way

time 2way time CPU CPU 5.36/5.344=1.003

直接映象cache 的访问速度比两路组相联cache 要快1.04倍，而两路组相联Cache 的平均性能比直接映象cache 要高1.003倍。因此这里选择两路组相联。二、（10分）判断题： 1、对计算机系统中经常使用的基本单元功能，宜于用软件来实现，这样可降低系统的成本。( F )

2、由于RISC 简化了指令系统，因此，RISC 上的目标程序比CISC 上的目标程序要短一些，程序执行的时间就会少一些。（F ）

3、流水线调度是看如何调度各任务进入流水线的时间，使单功能线性流水线有高的吞吐率和效率。（ T ）

4、无论采用什么方法，只要消除流水线的瓶颈段，就能提高流水线的吞吐率和效率。( F )

5、在满足Cache 与主存的一致性方面，写回比写直达法好。（ F ）

6、在多处理机上，各个任务的执行时间不同时，在个处理机总的运行时间均衡的前提下，取不均匀分配，让各处理机所分配的任务数要么尽量的多，要么尽量的少，这样，才可使总的运行时间减少。（ F ）

7、Cache 组相联映象的块冲突概率比直接映象的高。（ F ）

8、要使线性流水线的实际吞吐率接近于理想的最大吞吐率，应将子过程数分得越多越好。（F ）

9、在系列机内可以将单总线改为双总线，以减少公共总线的使用冲突。( F )

1．（×）由于流水线的最大加速比等于流水线深度，所以增加流水段数总可以增大流水

线加速比。 2．（√）流水线深度受限于流水线的延迟和额外开销。

3．（√）编译器可以通过重新排列代码的顺序来消除相关引起的暂停。 4．（√）多级存储层次是利用程序局部性原理来设计的。 5．（√）“Cache－主存”层次：弥补主存速度的不足。 6．（√）“主存－辅存”层次：弥补主存容量的不足。

7．（√）写调块策略是用于写操作失效时的策略。

8．（√）写合并是提高写缓冲利用率的技术。

9．（√）相联度越高，冲突失效就越少。

10．（×）强制性失效和容量失效也受相联度的影响。

11．（×）容量失效却随着容量的增加而增加。

12．（√）2:1的Cache经验规则说明容量为N 的直接映象Cache的失效率约等于大小为N/2 的两路组相联Cache的失效率。

13．（√）一些降低失效率的方法会增加命中时间或失效开销。

14．（×）具有越低失效率的计算机系统性能越高。

15．（×）具有越低平均访存时间的系统性能越高。

16．（×）具有越低失效率的存储系统性能越高。

17．（√）具有越低平均访存时间的存储系统性能越高。

18．（×）Victim Cache是位于CPU和Cache间的又一级Cache。

19．（×）伪相联cache取直接映象及组相联两者的优点，命中时间小，失效开销低。

20．（√）伪相联cache具有快速命中与慢速命中两种命中时间。

21．（×）预取必须和正常访存操作并行才有意义。

22．（√）预取必须和正常指令的执行并行才有意义。

23．（√）数据对存储位置的限制比指令的少，因此更便于编译器优化。

24．（√）Cache中的写缓冲器导致对存储器访问的复杂化。

25．（√）Cache命中时间往往会直接影响到处理器的时钟频率。

26．（√）采用容量小、结构简单的Cache会减小cache的命中时间。

27．（√）写操作流水化会减小cache的命中时间。

28．（√）组相联或直接映象Cache中才可能存在冲突失效。

29．（√）TLB是页表转换查找缓冲器。

30．（√）TLB中的内容是页表部分内容的一个副本。

31．（×）程序的时间局部性指程序即将用到的信息很可能与目前正在使用的信息在空间上相邻或者临近。

32．（×）程序的空间局部性指程序即将用到的信息很可能就是目前正在使用的信息。

33．（√）Amdahl定律揭示的性能递减规则说明如果仅仅对计算机中的一部分做性能改进，则改进越多，系统获得的效果越小。

34．（×）Amdahl定律中“可改进比例”指可改进部分在改进系统计算时间中所占的比例。

35．（√）Amdahl定律中“部件加速比”指可改进部分改进以后性能的提高。36．（√）执行时间不是唯一的性能指标，但它是最普遍的性能表示形式。

37．（×）RISC结构的机器性能一定要比CISC结构的机器性能高。

38．（×）平均每条指令的执行周期数（CPI）与程序无关。

39．（√）CPU性能公式中指令条数（IC）与指令集格式和编译器有关。

40．（√）CPU的组织在一定程度上会影响CPU所能达到的频率。

41．（√）解释执行比翻译执行花的时间多，但存储空间占用较少。

42．（×）计算机体系结构设计这不必关心指令集具体实现。

一、选择题：

1、在计算机系统结构来看，机器语言程序员看到的机器属性是（C ）。

A)计算机软件所要完成的功能B)计算机硬件的全部组成

C)编程要用到的硬件知识D)计算机各部件的硬件实现

2、对汇编语言程序员透明的是（A ）。

A)I/O方式中的DMA访问方式B)浮点运算

C)程序性中断D)存取操作数

4、在提高CPU性能的问题上，从系统结构角度，可以（C）。P10

A)提高时钟频率B)减少程序指令条数

C)减少每条指令的时钟周期数D)减少程序指令条数和减少每条指令的时钟周期数

5、能实现指令、程序、任务级并行的计算机系统属于（D）。

A)SISD B)SIMD C)MISD D)MIMD

6、计算机系统结构不包括（A ）。P4

A)主存速度B)机器工作状态C)信息保护D)数据表示

10、推出系列机的新机器，不能更改的是（A ）。

A)原有指令的寻址方式和操作码B)系统的总线的组成

C)数据通路宽度D)存储芯片的集成度

11、在流水机器中，全局性相关是指（D）。

A)先写后读相关B)先读后写相关C)指令相关D)由转移指令引起的相关

12、下列说法不正确的是（D）。

A)线性流水线是单功能流水线B)动态流水线是多功能流水线

C)静态流水线是多功能流水线D)动态流水线只能是单功能流水线

14、在系统结构设计中，提高软件功能实现的比例会（C）。

A)提高解题速度B)减少需要的存储容量C)提高系统的灵活性D)提高系统的性能价格比

计算机体系结构试题库—简答题

计算机体系结构试题库简答题（100题） 1．简述CISC结构计算机的缺点。答： ●在CISC结构的指令系统中，各种指令的使用频率相差悬殊。据统计，有20％的指令使用频率最大，占运行时间的80％。也就是说，有80％的指令在20％的运行时间内才会用到。 ●CISC结构指令系统的复杂性带来了计算机体系结构的复杂性，这不仅增加了研制时间和成本，而且还容易造成设计错误。 ●CISC结构指令系统的复杂性给VLSI设计增加了很大负担，不利于单片集成。 ●CISC结构的指令系统中，许多复杂指令需要很复杂的操作，因而运行速度慢。 ●在CISC结构的指令系统中，由于各条指令的功能不均衡性，不利于采用先进的计算机体系结构技术（如流水技术）来提高系统的性能。 2．RISC结构计算机的设计原则。答： A.选取使用频率最高的指令，并补充一些最有用的指令； B.每条指令的功能应尽可能简单，并在一个机器周期内完成； C.所有指令长度均相同； D.只有load和store操作指令才访问存储器，其它指令操作均在寄存器之间进行； E.以简单有效的方式支持高级语言。 3．影响现代微处理器主频提升的主要原因由哪些？答：线延迟、功耗。 4．指令集格式设计时，有哪三种设计方法？答：固定长度编码、可变长编和混合编码）三种设计方法。

5．简述存储程序计算机（冯·诺依曼结构）的特点。答：（1）机器以运算器为中心。（2）采用存储程序原理。（3）存储器是按地址访问的、线性编址的空间。（4）控制流由指令流产生。（5）指令由操作码和地址码组成。（6）数据以二进制编码表示，采用二进制运算。 6．在进行计算机系统设计时，一个设计者应该考虑哪些因素对设计的影响？答：在进行计算机系统设计时，设计者应该考虑到如下三个方面因素的影响： ●技术的发展趋势； ●计算机使用的发展趋势； ●计算机价格的发展趋势。 7．简述程序翻译技术的特点。答：翻译技术是先把N+1级程序全部变换成N级程序后，再去执行新产生的N级程序，在执行过程中N+1级程序不再被访问。 8．简述程序解释技术的特点。答：解释技术是每当一条N+1级指令被译码后，就直接去执行一串等效的N级指令，然后再去取下一条N+1级的指令，依此重复进行。 9．经典体系结构的定义是什么？计算机体系结构是机器级程序员所看到的计算机的属性，即概念性结构与功能特性。10．“线延迟墙”指的是什么？

计算机体系结构解

————————————————————————————————作者：————————————————————————————————日期：

第一章计算机组成原理本部分要求掌握计算机方面的基础知识，包括计算机的发展、计算的系统组成、基本组成和工作原理、计算机的数制数据表示以及运算校验、指令系统以及计算机系统的安全等基础性的知识。内容多而且复杂，尤其是有关计算机硬件方面的内容，很细而且灵活性不高，知识量相当大，掌握这部分一定要多下功夫，学会取舍、把握重点、抓住要害。 1.1 考试大纲及历年考题知识点 1.1.1 大纲要求考试要求： 1 掌握数据表示、算术和逻辑运算； 2 掌握计算机体系结构以及各主要部件的性能和基本工作原理考试范围 1 计算机科学基础 1.1 数制及其转换二进制、十进制和十六进制等常用制数制及其相互转换 1.2 数据的表示 ?数的表示（原码、反码、补码、移码表示，整数和实数的机内表示，精度和溢出）?非数值表示（字符和汉字表示、声音表示、图像表示） ?校验方法和校验码（奇偶校验码、海明校验码、循环冗余校验码） 1.3 算术运算和逻辑运算 ?计算机中的二进制数运算方法 ?逻辑代数的基本运算和逻辑表达式的化简 2．计算机系统知识 2.1 计算机系统的组成、体系结构分类及特性 ?CPU 和存储器的组成、性能和基本工作原理 ?常用I/O 设备、通信设备的性能，以及基本工作原理 ?I/O 接口的功能、类型和特性 ?I/O 控制方式（中断系统、DMA、I/O 处理机方式） ?CISC/RISC，流水线操作，多处理机，并行处理 2.2 存储系统 ?主存-Cache 存储系统的工作原理 ?虚拟存储器基本工作原理，多级存储体系的性能价格 ?RAID 类型和特性 2.3 安全性、可靠性与系统性能评测基础知识 ?诊断与容错 ?系统可靠性分析评价 ?计算机系统性能评测方式 1.2 计算机科学基础 1.2.1 数制及其转换 1、R 进制转换成十进制的方法按权展开法:先写成多项式,然后计算十进制结果. 举例： (1101.01)2=1×2^3+1×2^2+0×2^1+1×2^0+ 0×2^-1+1×2^-2 =8+4+1+0.25=13.25 (237)8=2×8^2+3×8^1+7×8^0 =128+24+7=159 (10D)16=1×16^2+13×16^0=256+13=269

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。（1）流水线把一个处理过程分解为若干个子过程，每个子过程由一个专门的功能部件来实现。因此，流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件，并依靠它们的并行工作来提高吞吐率。（2）流水线中各段的时间应尽可能相等，否则将引起流水线堵塞和断流。（3）流水线每一个功能部件的前面都要有一个缓冲寄存器，称为流水寄存器。（4）流水技术适合于大量重复的时序过程，只有在输入端不断地提供任务，才能充分发挥流水线的效率。（5）流水线需要有通过时间和排空时间。在这两个时间段中，流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法？答：细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示：（1 用两给出条指（1）（24? 变八级流水线（细分） ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成，其中每当流过第三段时，总要在该段循环一次，然后才能流到第4段。如果每段经过一次所需的时间都是△t ，问：（1）当在流水线的输入端连续地每△t 时间输入一个任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每2△t 输入一个任务，连续处理10个任务时，其实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高流水线的吞吐率？人连续处理10个任务时，其吞吐率提高多少？解：（1）会发生流水线阻塞情况。

（2）（3）重复设置部件吞吐率提高倍数＝ t t ??2310 75 ＝1.64 3.5 有一条动态多功能流水线由5段组成，加法用1、3、4、5段，乘法用1、2、5段，第2段的时间为2△t ，其余各段的时间均为△t ，而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ，画出时空图，并计算其吞吐率、加速比和效率。＋B 4；再计算由图可见，它在18个△t 时间中，给出了7个结果。所以吞吐率为：如果不用流水线，由于一次求积需3△t ，一次求和需5△t ，则产生上述7个结果共需（4×5+3×3）△t =29△t 。所以加速比为：该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得： 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。段23 时间入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机体系结构期末复习

计算机体系结构期末复习资料 1.并行性：是指在同一时刻或者是同一时间间隔内完成两种或两种以上性质相同或不同的工作。 2.CPI：每条指令执行时所花费的平均时钟周期。 3.体系结构：即计算机的属性，即概念性结构与功能特性。 4.Amdahl定理：加快某部件执行速度所获得的系统性能加速比，受限于该部件在系统中所占的重要性。 5.信息存储的整数边界：信息在主存中存放的起始地址必须是该信息（字节数）的整数倍。 6.指令系统的正交性：指在指令中各个不同含义的字段，在编码时应互不相关，相互独立。 7.流水线技术：是指将一个重复的时序过程，分解成为若干子过程，而每个过程都可有效在其专用功能段上与其他子过程同时执行。 8.定向技术：在某条指令产生一个结果之前，其他指令并不直接需要该计算结果，如果能将该计算结果从其他产生的地方直接送到其他指令需要它的地方，那么就可以避免暂停的技术就叫定向技术。 9.相关：衡量两个随机变量之间相关程度的指标。 10.向量流水处理机：是指处理机具有向量数据表示并通过向量指令对向量的各元素进行处理。、

11.定向：将计算结果从其产生的地方直接送到其他指令需要它的地方，或所有需要它的功能单元，避免暂停。 12.指令集的并行：当指令之间不存在相关时，它们在流水线中是可以重叠起来并行执行。 13.记分牌技术：流出和读操作数。在没有结构冲突时,尽可能早地执行没有数据冲突的指令,实现每个时钟周期执行一条指令。如果某条指令被暂停,而后面的指令与流水线中正在执行或被暂停的指令都不相关,是这些指令可以跨越它,继续流出和执行下去。 14.Tomasulo算法：寄存器换名是通过保留站和流出逻辑来共同完成,当指令流出时,如果其操作数还没有计算出来,则该指令中相应的寄存器换名将产生这个操作数的保留站的标识。因此,指令流出到保留站后,其操作数寄存器或者换成了数据本身,或换成了保留站的标识,和寄存器无关。后面指令对该寄存器的写入操作就不会产生WAR冲突。 15.替换算法：由于主存中的块比Cache中的块多，所以当要从主存中调一个块到Cache中时，会出现该块所映象到的一组（或一个）Cache块已全部被占用的情况。这时，需要被迫腾出其中的某一块，以接纳新调入的块。

计算机体系结构期末考试试题及答案

填空题 1.从2002年以来，计算机性能的年增长率下降到了约30％。其主要原因是：①大功耗问题； ②可以进一步有效地开发的指令级并行性已经很少；③存储器访问速度的提高缓慢。 2. 可移植性是指一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。实现可移植性的常用方法有3种：系列机，模拟和仿真，统一高级语言。 2.通用寄存器型指令集结构计算机在灵活性和提高性能方面有明显的优势。主要体现在①寄存器的访问速度比存储器快；②对编译器而言，能更加容易有效地分配和使用寄存器；③寄存器可以用来存放变量。 3.MIPS的数据寻址方式只有立即数寻址和偏移量寻址。 4.向量处理机的结构由所采用的向量处理方式决定。有两种典型的结构；存储器-存储器型结构和寄存器-寄存器型结构。 5.Cache-主存层次的工作由硬件实现，对系统程序员是透明的。 6.降低Cache不命中率最直接的方法是增加Cache的容量。不过，这种方法不但会增加成本，而且还可能增加命中时间，这种方法在片外Cache中用得比较多。 7.大多数磁盘阵列的组成可以由以下两个特征来区分：数据交叉存放的粒度、冗余数据的计算方法以及在磁盘阵列中的存放方式。 8.时延和带宽是用来评估互连网络性能的两个基本指标。时延包括通信时延和网络时延。 9.计算机系统可分为SISD、SIMD、MISD和MIMD四类，许多早期并行处理机是SIMD计算机，近年来，MIMD已经成为通用多处理机系统结构的选择。这是因为MIMD具有灵活性，并且MIMD 能充分利用现有微处理器的性价比优势。判断题 1.从计算机语言的角度，系统结构把计算机系统按功能划分成多级层次结构，其中，第2级是操作系统虚拟机，第３级是汇编语言虚拟机。（错） 2.计算机系统中提高并行性的3种途径中，资源重复是在并行性概念中引入时间因素，加快硬件周转而赢得时间。（错） 3.指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的指令的CPI。（对） 4.指令条数多，通常超过200条，是设计RISC的原则之一。（错） 5.根据流水线中各功能段之间是否有反馈回路，可把流水线分为线性流水线和非线性流水线。（对） 6.在多级存储体系中，“主存一辅存”层次的存储管理实现主要由软件实现。（对） 7.失效率和平均访存时间都可评价存储系统的性能，它们都和机器的硬件速度有关。(错) 8.RAID的特点有容量大，速度快、可靠性高，同时保存数据无冗余信息。(对) 9.在多处理机的互连网络中，交叉开关网络属于动态互连网络。（对） 10.机群是一种价格低廉、易于构建、可扩缩性极强的并行计算机系统。（对）名词解释 1.RISC 精简指令集计算机是一种执行较少类型计算机指令的微处理器 2.请求字优先调块时，首先向存储器请求CPU所要的请求字。请求字一旦到达，就立即送往CPU，让CPU继续执行，同时从存储器调入该块的其余部分。 3.单一系统映像

计算机系统结构有详细答案

(仅供参考，不作为考试标准)，选择题分，每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员。意________，应当注提系在计算机统设计时，为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法象联组，相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路令指条下析分后推C) 令指条下行执后推D) 流的用采，时关据数到，中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通，测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码经多级网络串联来实现全排列网络，只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

计算机系统结构网上作业

计算机系统结构作业参考答案一、 1、试述现代计算机系统的多级层次结构。计算机系统具有层次性，它由多级层次结构组成。从功能上计算机系统可分为五个层次级别：第一级是设计级。这是一个硬件级，它由机器硬件直接执行。第二级是一般机器级，也称为机器语言级。它由微程序解释系统.这一级是硬件级。第三级是操作系统级，它由操作系统程序实现。这些操作系统由机器指令和广义指令组成，这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。第四级是汇编语言级。它给程序人员提供一种符号形式的语言，以减少程序编写的复杂性。这一级由汇编程序支持执行。第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。答：一般原则： (1)确定指令系统时，只选择使用频度很高的指令及少量有效支持操作系统，高级语言及其它功能的指令，大大减少指令条数，一般使之不超过100条； (2)减少寻址方式种类，一般不超过两种； (3)让所有指令在一个机器周期内完成； (4)扩大通用寄存器个数，一般不少于32个，尽量减少访存次数； (5)大多数指令用硬联实现，少数用微程序实现； (6)优化编译程序，简单有效地支持高级语言实现。

基本技术： (1)按RISC一般原则设计，即确定指令系统时，选最常用基本指令，附以少数对操作系统等支持最有用的指令，使指令精简。编码规整，寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现，功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即：为了减少访存，减化寻址方式和指令格式，简有效地支持高级语言中的过程调用，在RISC机器中设有大量寄存嚣，井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令，即可让本条指令执行与下条指令预取在时间上重叠。另外，将转移指令与其前面的一条指令对换位置，让成功转移总是在紧跟的指令执行之后发生，使预取指令不作废，节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配，减少访存次数。不仅要利用常规手段优化编译，还可调整指令执行顺序，以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别（1）全相连映像主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分，Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同，Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关，Cache必须对每个块和块自身的地址加以存储。当请求数据时，Cache控制器要把请求地址同所有的地址加以比较，进行确认。（2）直接映像把主存分成若干区，每区与Cache大小相同。区内分块，主存每个区中块的大小和Cache 中块的大小相等，主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中，即相同块号的位置。主存地址分为三部分：区号、块号和块内地址，Cache地址分为：块号和块内地址。直接映像方式下，数据块只能映像到Cache中唯一指定的位置，故不存在替换算法的问题。它不同于全相连Cache，地址仅需比较一次。（3）区别：全相连映像比较灵活，块冲突率低，只有在Cache中的块全部装满后才会出现冲突，Cache 利用率高。但地址变换机构复杂，地址变换速度慢，成本高。直接映像的地址变换简单、速度快，可直接由主存地址提取出Cache地址。但不灵活，块冲突率较高，Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成？

系统结构期末考试试题及答案

得分评分人填空题: （20分，每题2 分）单选题：（10分，每题1分） A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置《计算机系统结构》期末考试试卷（A ）得分注：1、共100分，考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令，是属于（ A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、输入输出系统硬件的功能对（B ）是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、全相联地址映象是指（A ） C. 组之间固定，组内任何虚页可装入任何实页位置 D.组间可任意装入，组内是固定装入 4、（ C ）属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关，则（ B ） A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是（B ） A.专属软件范畴，与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、指令执行结果出现异常引起的中断是（ C ） A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是（A ） A.直接 B .组相联 C .段相联 D .全相联 9、组相联映象、LRU 替换的Cache 存储器，不影响 Cache 命中率的是（B ） A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、流水处理机对全局性相关的处理不包括（C ） A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

计算机体系结构试题汇总

计算机系统结构姓名：学号：一、简答题（每小题10分，共20分） 1．简述使用物理地址进行DMA存在的问题，及其解决办法。 2．从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较（列表）。二、（60分）现有如下表达式： Y＝a ×X 其中：X和Y是两个有64个元素的32位的整数的向量，a为32位的整数。假设在存储器中，X和Y的起始地址分别为1000和5000，a的起始地址为6000。 1．请写出实现该表达式的MIPS代码。 2．假设指令的平均执行时钟周期数为5，计算机的主频为500 MHz，请计算上述MIPS 代码（非流水化实现）的执行时间。 3．将上述MIPS代码在MIPS流水线上（有正常的定向路径、分支指令在译码段被解析出来）执行，请以最快执行方式调度该MIPS指令序列。注意：可以改变操作数，但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图，计算调度前和调度后的MIPS代码序列执行所需的时钟周期数，以及调度前后的MIPS流水线执行的加速比。 4．根据3的结果说明流水线相关对CPU性能的影响。三、（20分）请分析I/O对于性能的影响有多大？假设： 1．I/O操作按照页面方式进行，每页大小为16 KB，Cache块大小为64 B；且对应新页的地址不在Cache中；而CPU不访问新调入页面中的任何数据。 2．Cache中95%被替换的块将再次被读取，并引起一次失效；Cache使用写回方法，平均50%的块被修改过；I/O系统缓冲能够存储一个完整的Cache块。 3．访问或失效在所有Cache块中均匀分布；在CPU和I/O之间，没有其他访问Cache 的干扰；无I/O时，每1百万个时钟周期中，有15,000次失效；失效开销是30个时钟周期。如果替换块被修改过，则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

计算机体系结构参考1

第一题选择题 1．SIMD是指（B） A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2．下列那种存储设备不需要编址？D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3．按照计算机系统层次结构，算术运算、逻辑运算和移位等指令应属于（A）级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4．早期的计算机系统只有定点数据表示，因此硬件结构可以很简单。但是这样的系统有明显的缺点，下面哪一个不是它的缺点：B A．数据表示范围小 B．单个需要的计算时钟周期多 C．编程困难 D．存储单元的利用率很低 7．下面哪个页面替换算法实际上是不能够实现的？D A）随机页面替换算法 B）先进先出替换算法 C）最久没有使用算法 D）最优替换算法

9．指令优化编码方法，就编码的效率来讲，那种方法最好？C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10．在早期冯·诺依曼计算机特征中，机器以（C）为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A．先进先出顺序访问 B．按地址访问 C．无地址访问 D．按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段，每—段分别只有—个部件可供使用，并且执行时间分别为Δt、2Δt和3Δt，连续执行n条指令所需要花费的最短时间约为( C )。（假设“取指令”、“分析”和“执行”可重叠，并假设n足够大） A．6 nΔt B．2 nΔt C．3 nΔt D．nΔt 6、下列计算机不属于RISC计算机的是（C ）。 A．SUN：Ultra SPARC

高级计算机体系结构作业汇总(非标准答案)

1.Explain the Concepts Computer Architecture 系统结构由程序设计者所看到的一个计算机系统的属性。即计算机系统的软硬件界面。 Advanced CA 高级系统结构新型计算机系统结构。基于串行计算机结构，研究多指令多数据计算机系统，具有并发、可扩展和可编程性。为非冯式系统结构。 Amdahl law Amdahl定律系统中某部件由于采用某种方式时系统性能改进后，整个系统性能的提高与该方式的使用频率或占的执行时间的比例有关。 SCALAR PROCESSING 标量处理机在同一时间内只处理一条数据。 LOOK-AHEAD 先行技术通过缓冲技术和预处理技术，解决存储器冲突，使运算器能够专心与数据的运算，从而大幅提高程序的执行速度。 PVP 向量型并行计算处理机以流水线结构为主的并行处理器。 SMP 对称多处理机系统任意处理器可直接访问任意内存地址,使用共享存储器，访问延迟、带宽、机率都是等价的。MPP 大规模并行计算机系统物理和逻辑上均是分布内存，能扩展至成百上千处理器，采用专门设计和定制的高通信带宽和低延迟的互联网络。 DSM 分布式共享存储系统内存模块物理上局部于各个处理器内部,但逻辑上是共享存储的。 COW 机群系统每个节点都是一个完整的计算机，各个节点通过高性能网络相互连接，网络接口和I/O总线松耦合连接，每个节点有完整的操作系统。 GCE 网格计算环境利用互联网上的计算机的处理器闲置处理能力来解决大型计算问题的一种科学计算。 CISC 复杂指令集计算机

通过设置一些复杂的指令，把一些原来由软件实现的常用功能改用硬件实现的指令系统实现，以此来提高计算机的执行速度。 RISC 精简指令集计算机尽量简化计算机指令功能，只保留那些功能简单，能在一个节拍内执行完的指令，而把复杂指令用段子程序来实现。 VMM 虚拟机监视器作为软硬件的中间层，在应用和操作系统所见的执行环境之间。 SUPERCOMPUTER 超级计算机数百数千甚至更多的处理器组成的能计算普通计算机不能完成的大型复杂问题的计算机。SVM 共享虚拟存储器存储器虚拟化为一个共享的存储器，并提供单一的地址空间。 MAINFRAME 大型计算机作为大型商业服务器，一般用于大型事务处理系统，特别是过去完成的且不值得重新编写的数据库应用系统方面。 COMPUTER SYSTEM ON CHIP 片上计算机系统在单个芯片上集成的一个完整系统。 PARALLEL ARCHITECTURE INTO SINGLE CHIP 单片并行结构在单个芯片上采用的并行体系结构 MOORE law Moore定律当价格不变时，集成电路上可容纳的晶体管数目，约每隔18个月便会增加一倍，性能也将提升一倍。 UMA 一致存储访问采用集中式存储的模式，提供均匀的存储访问。 NUMA 非一致存储访问内存模块局部在各个结点内部，所有局部内存模块构成并行机的全局内存模块。 COMA 全高速缓存存储访问采用分布式存储模式，通过高速缓存提供快速存储访问。 CC-NUMA 全高速缓存非一致性均匀访问存在专用硬件设备保证在任意时刻，各结点Cache中数据与全局内存数据的一致性。NORMA 非远程存储访问

计算机系统结构期末考试题目

第一章： 1.计算机系统结构的定义答：由程序设计者看到的一个计算机系统的属性，即概念性结构和功能特性。 2.透明性概念答：在计算机技术中，一种本来是存在的事物或属性，但从某种角度看似乎不存在，称为透明性现象。 3.兼容性向后兼容兼容性：同一个软件可以不加修改地运行于系统结构相同的各档机器，可获得相同的结果，差别只在于不同的运行时间。向后兼容：按某个时期投入市场的某种型号机器编制的程序，不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律答：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答：每条指令的平均时钟周期数。 6.MIPS 答：每秒百万条指令数！MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答：每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念答： 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分答：①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD（实际不存在）④多指令流多数据流MIMD 10.计算机系统设计的定量原理（四个）答：①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算答：CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长加速比=（采用改进措施后的性能）/（没有采用改进措施前的性能） =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点硬件实现：速度快、成本高；灵活性差、占用内存少软件实现：速度低、复制费用低；灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页共 24 页计算机科学系《计算机系统结构》期末考试试卷（A 卷） 2、此试卷适用于计算机科学与技术本科专业。一单选题：(10分，每题1分) 1、 ."启动I/O"指令是主要的输入输出指令，是属于（ B ） A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、输入输出系统硬件的功能对(B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、全相联地址映象是指（A ） A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定，组内任何虚页可装入任何实页位

置 D.组间可任意装入，组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关，则（B ） A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是（B） A.专属软件范畴，与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是（C ） A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断《计算机系统结构》期末考试试卷A卷第 3 页共 24 页

完整版计算机体系结构课后习题原版答案_张晨曦著

第1章计算机系统结构的基本概念 (1) 第2章指令集结构的分类 (10) 第3章流水线技术 (15) 第4章指令级并行 (37) 第5章存储层次 (55) 第6章输入输出系统 (70) 第7章互连网络 (41) 第8章多处理机 (45) 第9章机群 (45) 第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构：按照计算机语言从低级到高级的次序，把计算机系统按功能划分成多级层次结构，每一层以一种不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序，然后再在这低一级机器上运行，实现程序的功能。

解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整个程序。计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。系统加速比：对系统中某部分进行改进时，改进后系统性能提高的倍数。 Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。

计算机体系结构习题答案解析

第1章计算机系统结构的基本概念 1.1 解释下列术语层次机构：按照计算机语言从低级到高级的次序，把计算机系统按功能划分成多级层次结构，每一层以一种不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序，然后再在这低一级机器上运行，实现程序的功能。解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整个程序。计算机系统结构：传统机器程序员所看到的计算机属性，即概念性结构与功能特性。透明性：在计算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现：计算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。系统加速比：对系统中某部分进行改进时，改进后系统性能提高的倍数。 Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。 CPI：每条指令执行的平均时钟周期数。测试程序套件：由各种不同的真实应用程序构成的一组测试程序，用来测试计算机在各个方面的处理性能。存储程序计算机：冯·诺依曼结构计算机。其基本点是指令驱动。程序预先存放在计算机存储器中，机器一旦启动，就能按照程序指定的逻辑顺序执行这些程序，自动完成由程序所描述的处理工作。系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的计算机。软件兼容：一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。向上（下）兼容：按某档计算机编制的程序，不加修改就能运行于比它高（低）档的计算机。向后（前）兼容：按某个时期投入市场的某种型号计算机编制的程序，不加修改地就能

2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷 (总分：100分，时间：100分钟) 姓名：周元华专业：计算机科学与技术学号： 18260070164016 学习中心：上海弘成一、填空题（每空1分，共14分） 1.高速缓冲存储器的地址映象方式有三种，它们分别是：全向量方式，直接相联方式，组相连方式。 2.虚拟存储器的三种管理方式是段式管理，页式管理和段页式管理。 3.从主存的角度来看，“Cache—主存”层次的目的是为了提高速度，而“主存—辅存”层次的目的是为了扩大容量 4.根据指令间的对同一寄存器读和写操作的先后次序关系，数据相关冲突可分为读与写（RAM）、写与读（WAR）和写与写（WAW）三种类型。 5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容二、名词解释（每题2分，共16分）计算机体系结构：计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。其中计算机理论组成部分并不单与某一个实际硬件相挂钩，如存储部分就包括寄存器、内存、硬盘等。兼容机：兼容机，就是由不同公司厂家生产的具有相同系统结构的计算机。简单点说，就是非厂家原装，而改由个体装配而成的机器，其中的元件可以是同一厂家出品，但更多的是整合各家之长的计算机。写直达法：写直达法一般指全写法。全写法（write-through）：又称写直达法、写穿法，透写法，Cache使用方式之一。高速缓冲存储器: 高速缓冲存储器（Cache）其原始意义是指存取速度比一般随机存取记忆体（RAM）来得快的一种RAM，一般而言它不像系统主记忆体那样使用DRAM技术，而使用昂贵但较快速的SRAM 技术，也有快取记忆体的名称。高速缓冲存储器是存在于主存与CPU之间的一级存储器，由静态存储芯片(SRAM)组成，容量比较小但速度比主存高得多，接近于CPU的速度。在计算机存储系统的层次结构中，是介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。高速缓冲存储器最重要的技术指标是它的命中率。延迟转移技术：在转移指令之后插入一条或几条有效的指令。当程序执行时，要等这些插入的指令执行完成之后，才执行转移指令，因此，转移指令好像被延迟执行了，这种技术称为延迟转移技术。线性流水线：线性流水线就是由一整套工艺串联而成的生产线。流水线又称为装配线,一种工业上的生产方式，指每一个生产单位只专注处理某一个片段的工作，以提高工作效率及产量；按照流水线的输送方式大体可以分为：皮带流水装配线、板链线、倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线。输送线的传输方式有同步传输的/（强制式），也可以是非同步传输/（柔性式），根据配置的选择，可以实现装配和输送的要求。输送线在企业的批量生产中不可或缺。流水线的吞吐率：流水线的吞吐率是单位时间内流水线处理的任务数。并行性：并行性是指计算机系统具有可以同时进行运算或操作的特性，在同一时间完成两种或两种以上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发性指两个或两个以上事件在同一时间间隔发生。三、简答题(每题5分，共30分） 1.如有一个经解释实现的计算机，可以按功能划分成4级。每一级为了执行一条指令需要下一级的N条指令解释。若执行第一级的一条指令需K(ns)时间，那么执行第2、3、4级的一条指令各需要用多少时间(ns)? 答：第1级：1条1级指令 K ns 第2级：1条2级指令N条1级指令 1*N*K ns = NK ns 第3级：1条3级指令N条2级指令 1*N*NK ns =N2K ns 第4级：1条4级指令N条3级指令 1*N*NNK ns =N3K ns 2.根据Amdahl定律，系统加速比由哪两个因素决定？答：系统加速比依赖于两个因素：（1）可改进比例：可改进部分在原系统计算时间中所占的比例（2）部件加速比：可改进部分改进以后的性能提高 3.简述组相联映象规则。答：(1)主存与缓存分成相同大小的数据块。(2)主存和Cache 按同样大小划分成组。(3)主存容量是缓存容量的整数倍,将主存空间按缓冲区的大小分成区，主存中每一区的组数与缓存的组数相同 4.引起Cache与主存内容不一致的原因是什么？为了保持Cache 的一致性，在单计算机系统中一般采取哪些措施？答：不一致的原因：（1）由于CPU写Cache，没有立即写主存（2）由于I/O处理机或I/O设备写主存采取措施：（1）全写法，亦称写直达法（WT法-Write through）方法：在对Cache进行写操作的同时，也对主存该内容进行写入（2）写回法（WB法-Write back）方法：在CPU执行写操作时，只写入Cache，不写入主存。 5.按照同一时间内各段之间的连接方式来分，流水线可分为哪两类？答：（1）静态流水线：在同一时间内，流水线的各段只能按同一种功能的连接方式工作。（2）动态流水线：在同一时间内，当某些段正在实现某种运算时，另一些段却在实现另一种运算。 6.Flynn分类法是根据什么对计算机进行分类的？将计算机分成哪几类？答：Flynn分类法，根据计算机中指令和数据的并行状况把计算机分成：（1）单指令流单数据流（SISD.；（2）单指令流多数据流（SIMD.；（3）多指令流单数据流（MISD.；（4）多指令流多数据流（MIMD.。四、问答与计算题（第1题10分，第2、3题每题15分共40分） 1.一个有快表和慢表的页式虚拟存储器，最多有64个用户，每个用户最多要用1024个页面，每页4K字节，主存容量8M字节。（1）写出多用户虚地址的格式，并标出各字段的长度。（2）写出主存地址的格式，并标出各字段的长度。

计算机体系结构模拟试题二汇总

模拟试题二课程名称计算机系统结构适用班级：考试时间120分钟班级学号姓名一、单项选择题(本大题共10小题，每小题2分，共20分。在每小题的四个备选答案中选出一个符合题意的，并将其前面的序号填在题后的括号内。) 1.输入输出系统硬件的功能对（）是透明的。 ①操作系统程序员②应用程序员③系统结构设计人员④机器语言程序设计员 2."启动I/O"指令是主要的输入输出指令，是属于（） ①目态指令②管态指令③目态、管态都能用的指令④编译程序只能用的指令 3.全相联地址映象是指（） ①任何虚页都可装入主存中任何实页的位置 ②一个虚页只装进固定的主存实页位置 ③组之间是固定的，而组内任何虚页可以装入任何实页位置 ④组间可任意装入，组内是固定装入 4.（）属于MIMD系统结构。 ①各处理单元同时受同一个控制单元的管理 ②各处理单元同时接受同一个控制单元送来的指令 ③多处理机和多计算机系统 ④阵列处理机 5.在下列方法中，指令并行度不能大于1的是（）。 ①超级流水②超标量③超长指令字④标量流水线 6.设16个处理器编号分别为0，1，2，…，15用Cube3互联函数时，第10号处理机与第( )

号处理机相连. ①11 ②8 ③l4 ④2 7.若输入流水线的指令既无局部性相关，也不存在全局性相关，则（） ①可获得高的吞吐率和效率②流水线的效率和吞吐率恶化 ③出现瓶颈④可靠性提高 8.对于共享主存的多处理机系统，在各个CPU都带有自己的Cache的情况下，为保证处理机所带Cache的一致性，可采用的方法有（） ①写直达法②写回法③播写法④堆栈法 9.下面哪种相关不是流水线顺序流动方式所具有的（） ①数据相关②指令相关③先读后写④先写后读 10.下面关于Omega网络和多级立方体网络的说法错误的是（） ①Omega网络采用四功能单元 ②Omega网络和多级立方体网络的控制方式是不一样的 ③Omega网络可以实现一个处理单元与多个处理单元的同时连接 ④Omega网络和多级立方体网络的级编号顺序正好相反。二、填空题(本大题共10小题，每小题1分，共10分。把答案填在题中横线上。) 1.为提高计算机系统的并行性，可通过的技术途径有__________、资源重复和资源共享。 2.按弗林(Michael J.Flynn)的观点，计算机系统可分为SISD、、MISD 和MIMD四大类。 3.为提高访Cache的命中率，Cache的预取算法可以有恒预取法和___________预取法。 4.衡量主存性能的指标是访问时间、存储周期和__________。 5.要实现两条指令在时间上重叠解释，首先是以增加硬件为代价的，其次，还要处理好指令之间可能存在的。 6.互连网络的交换方法主要有线路交换、包交换、线路/包交换，SIMD互连网络多采用交换，多处理机常采用包交换。 7.为同时解释相邻两条或多条指令，常用的控制方式是重叠和____________。 8.数组多路通道与设备之间的数据传送的基本单位是_____。 9.多级互连网络的交换开关控制方式主要有三种，分别是______、单元控制和部分级控制。 10.多处理机系统按照连接的紧密程度主要分两大类，分别是___________和松散耦合多处理