文档库 最新最全的文档下载
当前位置:文档库 › 计算机系统结构试题.doc

计算机系统结构试题.doc

计算机系统结构试题.doc
计算机系统结构试题.doc

第一章:

1.试述 Flynn分类的4种计算机系统结构有何特点。

2.假设高速缓存Cache 工作速度为主存的 5 倍,且 Cache 被访问命中的概率为90%,

则采用 Cache 后,能使整个存储系统获得多高的加速比?

3.某工作站采用时钟频率为 15 MHz、处理速率为 10 MIPS 的处理机来执行一个已知混合程序。

假定每次存储器存取为 1 周期延迟,试问:

(1)此计算机的有效 CPI 是多少?

(2)假定将处理机的时钟提高到30 MHz,但存储器子系统速率不变。这样,每次存储器

存取需要两个时钟周期。如果30%指令每条只需要一次存储存取,而另外5%每条需要两次存储存取,并假定已知混合程序的指令数不变,并与原工作站兼容,试求改进后的处理机性能。

4.处理机的时钟30 MHz

CPI。

(1)计算在单处理机上用上述跟踪数据运行程序的平均

(2)根据( 1)所得 CPI,计算相应的 MIPS 速率。

1、解释图中各控制信号的作用。

2、各流水级存放控制信号的流水线寄存器有何异同?

3、设流水线模型机采用load 前推和数据前推,按时钟周期画出以下指令序列的时序图,标示出前推示意。

load r2, 12(r3)

addi r4, r2, 10

and r1, r2, r4

store r1, 10(r5)

4、给出节PPT中图的 BDEPEN控制信号的真值表。

半期:

1、

FPMUL对系统性能提高更大。假定FPMUL 操

试分析采用哪种设计方案实现求浮点数除法

作占整个测试程序执行时间的15%。

一种设计方案是增加专门的FPMUL硬件,可以将FPMUL操作的速度加快到10 倍;

另一种设计方案是提高所有FP 运算指令的执行速度,使得 FP指令的执行速度加快为原来的倍,设 FP 运算指令在总执行时间中占40%。( 3 分)

解:对这两种设计方案的加速比分别进行计算。

增加专门 FPDIV 硬件方案: F = 15% = , S

e = 10

e

S FPDIV = 1/(+10)=1/ =

提高所有 FP 运算指令速度方案: F e = 40% = , S e =

S FP = 1/(+ = 1/ =

增加专门 FPDIV 硬件方案的加速比更高,对系统性能提高更大。

2. 设流水线模型机结构如下图所示,采用 load 前推和数据前推(包括 store 指令)。假设模

型机使用 subicc 指令,它将根据减法结果设置标志寄存器Z 的内容为 0 或为 1;其它的 ALU 计算指令不影响Z。指令 bne 的控制相关处理采用插入nop 指令的策略。( 7 分)

带有内部前推及load 相关暂停功能的流水线处理机

设有以下指令序列:

Lop: load r1, 100(r3)

addi r2, r1, 10

store r2, 100(r3)

subicc r5, r5, 1

bne r5,lop ;如果 r5 的内容不为 0,则转 Lop

(1)按时钟周期画出以上指令序列第 1 次循环执行及转移到“ load r1, 100(r3) ”指令,在模型机中执行的时序图,标出内部前推示意。(3 分)

(2)如果以上指令序列在流水线CPU执行,当第2 条指令“ addi r2, r1, 10”进入 EXE 级时,试给出ADEPEN、 BDEPEN信号的值、 WB级信号 SLD的值。( 2 分)ADEPEN = BDEPEN = SLD=

(3)设模型机采用延迟转移,调整以上指令序列的顺序,使得指令序列在模型机中执行时只有最小停顿,写出调整后的指令序列(不需要画时序图)。(2 分)

解:( 1)

Store r3,100,r2 add MEM

(2) ADEPEN = 3 或( 11)BDEPEN = 1或(01)SLD=1

(3)

Lop: load r1, 100(r3)

subicc r5, r5, 1

addi r2, r1, 10

bne r5,lop

store r2, 100(r3)

第四章:

1、浮点流水线延迟如PPT例 4-1 ,将下面的循环展开并进行指令调度,直到没有任何延迟。LOOP: LD F0,0(R1);

MULD F0,F0,F2;

LD F4,0(R2);

ADDD F0,F0,F4;

SD F0,0(R2);

DSUBI R1,R1,#8;

DSUBI R2,R2,#8;

BNEZ R1, R0 , LOOP;

2、按 PPT 例 4-4 中的一段指令代码和记分牌信息初始状态,试给出SUBD指令写结果前各

记录表的状态。

LD F6 , 34(R2)

LD F2 , 45(R3)

MULTD F0,F2,F4

SUBD F8,F6,F2

DIVD F10,F0,F6

ADDD F6,F8,F2

3、采用 Tomasulo 算法,按PPT例 4-6 中的一段指令代码和各表的初始状态,试给出SUBD 指令写结果前的指令状态、保留站状态和寄存器状态。

第五章:

某个计算机系统有128 字节的高速缓存。它采用每块有8 个字节的 4 路组相联映射。物

理地址大小是32 位,最小可寻址单位是 1 个字节。( 1)画图说明高速缓存的组织并指明物

理地址与高速缓存地址的关系;( 2)可以将地址 000010AFH分配给高速缓存的哪一组?( 3)假如地址 000010AFH和 FFFF7AxyH可以同时分配给同一个高速缓存组,地址中的 x 与 y 的值为多少?

假设对指令Cache 的访问占全部访问的75%,而对数据Cache 的访问占全部访问的25%。Cache 的命中时间为 1 个时钟周期,失效开销为50 个时钟周期,在混合Cache 中一次 LOAD 或 STORE操作访问Cache 的命中时间都要增加一个时钟周期,32KB 的指令 Cache 的失效率为%, 32 KB的数据 Cache 的失效率为 %, 64 KB的混合 Cache 的失效率为 %。又假设采用写直达策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。试问指令Cache 和数据 Cache 容量均为 32 KB的分离 Cache 和容量为 64 KB的混合 Cache 相比,哪种 Cache 的失效率更低?

两种情况下平均访存时间各是多少?

给定以下的假设,试计算直接映象Cache 和两路组相联Cache 的平均访问时间以及CPU 的性能。由计算结果能得出什么结论?

(1)理想 Cache 情况下的CPI 为,时钟周期为 2 ns ,平均每条指令访存次。

(2)两者 Cache 容量均为 64KB,块大小都是 32B。

(3)组相联 Cache 中的多路选择器使 CPU的时钟周期增加了 10%。

(4)这两种 Cache 的失效开销都是 80 ns 。

(5)命中时间为 1 个时钟周期。

(6) 64 KB 直接映象 Cache 的失效率为 %, 64 KB 两路组相联 Cache 的失效率为 %。

思考题:数据Cache 容量为 16KB,块大小为32B,最小寻址单位 1 字节,采用两路组相

联映像方式。

设 Cache 的物理地址为36 位。计算索引位数、标识位数、块内偏移量。

相关文档