当前位置：文档库 › 计算机体系结构课后答案

计算机体系结构课后答案

【篇一：计算机体系结构习题(含答案)】

1、尾数用补码、小数表示，阶码用移码、整数表示，尾数字长p=6（不包括符号位），阶码字长q=6（不包括符号位），为数基值

rm=16，阶码基值re=2。对于规格化浮点数，用十进制表达式写出

如下数据（对于前11项，还要写出16进值编码）。

（1）最大尾数（8）最小正数

（2）最小正尾数（9）最大负数

（3）最小尾数（10）最小负数

（4）最大负尾数（11）浮点零

（5）最大阶码（12）表数精度

（6）最小阶码（13）表数效率

（7）最大正数（14）能表示的规格化浮点数个数

2．一台计算机系统要求浮点数的精度不低于10-7.2，表数范围正

数不小于1038，且正、负数对称。尾数用原码、纯小数表示，阶码

用移码、整数表示。

(1) 设计这种浮点数的格式

(2) 计算（1）所设计浮点数格式实际上能够表示的最大正数、最大

负数、表数精度和表数效率。

3．某处理机要求浮点数在正数区的积累误差不大于2-p-1 ，其中，p是浮点数的尾数长度。

(1) 选择合适的舍入方法。

(2) 确定警戒位位数。

(3) 计算在正数区的误差范围。

4．假设有a和b两种不同类型的处理机，a处理机中的数据不带

标志符，其指令字长和数据字长均为32位。b处理机的数据带有标

志符，每个数据的字长增加至36位，其中有4位是标志符，它的指

令数由最多256条减少到不到64条。如果每执行一条指令平均要访

问两个操作数，每个存放在存储器中的操作数平均要被访问8次。

对于一个由1000条指令组成的程序，分别计算这个程序在a处理机

和b处理机中所占用的存储空间大小（包括指令和数据），从中得

到什么启发？

5．一台模型机共有7条指令，各指令的使用频率分别为35%，25%，20%，10%，5%，3%和2%，有8个通用数据寄存器，2个变址寄存器。

(1) 要求操作码的平均长度最短，请设计操作码的编码，并计算所设计操作码的平均长度。

6．某处理机的指令字长为16位，有双地址指令、单地址指令和零地址指令3类，并假设每个地址字

段的长度均为6位。

(1) 如果双地址指令有15条，单地址指令和零地址指令的条数基本相同，问单地址指令和零地址指令各有多少条？并且为这3类指令分配操作码。

(2) 如果要求3类指令的比例大致为1：9：9，问双地址指令、单地址指令和零地址指令各有多少条？并且为这3类指令分配操作码。 7．别用变址寻址方式和间接寻址方式编写一个程序，求c=a+b，其中，a与b都是由n个元素组成的一维数组。比较两个程序，并回答下列问题：

(1) 从程序的复杂程度看，哪一种寻址方式更好？

(2) 从硬件实现的代价看，哪一种寻址方式比较容易实现？

(3) 从对向量运算的支持看，哪一种寻址方式更好？

8．假设x处理机的数据不带标志符，其指令字长和数据字长均为32位。y处理机的数据带有标志符，每个数据的字长增加至35位，其中有3位是标志符，其指令字长由32位减少至30位。并假设一条指令平均访问两个操作数，每个操作数平均被访问r次。现有一个程序，它的指令条数为i，分别计算在这两种不同类型的处理机中程序所占用的存储空间，并加以比较。

9．一种浮点数表示方式的精度不低于10-19，能表示的最大正数不小于104000，而且正负数对称。尾数用原码、小数表示，阶码用移码、整数表示，尾数和阶码的基值都是2。

(1)设计这种浮点数的格式，给出各字段的名称和长度。

(2)计算(1)所设计的浮点数格式能够表示的最大正数、最大负数和表示数的精度。

(3)如果在运算器中没有设置硬件警戒位，则这种浮点数可能采用了哪一种舍入方法？给出这种舍入方法的舍入规则，在正数区的误差范围和积累误差。

10．有研究人员指出，如果在采用通用寄存器结构的计算机里加入

寄存器-存储器寻址方式可能提高计算机效率。做法是用：

add r2, 0(rb)

代替指令序列

load r1, 0(rb)

add r2, r2, r1

假定使用新的指令能使时钟周期增加10%，并且假定只对时钟产生

影响，而不影响cpi那么：

(1) 采用新的指令，要达到与原来同样的性能需要去掉的load操作

所占的百分比？(假定load指令占总指令的22.8%)

(2) 举出一种多指令序列，该序列不能使用上述的寄存器-存储器寻

址方式。即使得load r1后面紧接着执行对r1的操作（该操作可以

是任意某一操作码），但这一指令序列不能被一条指令（假定存在

这条指令）代替。

11．试比较下面4种不同类型的指令结构的存储效率：

(1) 累加型：所有的操作都在单个寄存器和单个内存地址之间进行

(2) 存储器-存储器型：每个指令的3个操作数都在内存中进行

(3) 堆栈型：所有的操作都在栈顶进行。只有push和pop操作会访问内存，其它的指令执行时都会删除栈中的操作数，然后写入执行

结果。

(4) 通用寄存器型：所有的操作都在寄存器中进行。这些寄存器-寄

存器指令中的每个指令都包含3个操作数。通用寄存器一共有16个，寄存器标志符占4位长。

为比较存储效率，我们对以上4种指令集作了如下约定：

操作码占一个字节（8位）

内存地址占2个字节（16位）

操作数占4字节（32位）

所有指令的长度都以整数个字节计算

另外，还假定访问内存不使用其它的优化措施，变量a、b、c和d

的初值都已经放在内存中。针对以上4种不同的指令系统，回答下

列问题：

(1) 分别用汇编指令写出下面3个赋值语句：

a =

b + c;

b = a + c;

d = a – b;

(2) 分别计算所执行指令的字节数和转移内存数据的字节数，并指出如果根据代码的大小来计算的话，哪种结构的效率是最高的？如果按需要的总内存带宽（代码+数据）来计算，又是哪种结构的效率最高？

12．考虑为dlx结构的计算机增加一个新的寻址模式。即使得地址模式增加两个寄存器和一个11位长的带符号的偏移量来得到有效地址。这样，编译器就会用新的寻址模式来代替

add r1, r1, r2

lw rd, 0(r1) (或是store指令)

如果已知在dlx结构的计算机上对测得一些程序的load和store指令分别平均占26%和9%，在此基础上，计算：

(1) 假定10%的load和store指令可以用新的寻址模式代替，那么采用新的寻址模式后的指令计数与采用前之比为多少？

(2) 如果新的寻址模式使得时钟周期增长5%，那么采用了新的寻址模式的机器和未采用新的寻址模式的机器相比，哪种机器会更快一些，快多少？

1、解答：

在尾数采用补码、小数表示且p=6，阶码采用移码、整数表示且

q=6，尾数基rm为16，阶码基re为2的情况下：

(1) 最大尾数为：1－rm-p＝1－16-6，0.ffffff

(2) 最小正尾数为：1/rm＝1/16，0.100000

(3) 最小尾数为： -1， 1.000000

(4) 最大负尾数为：-(rm-1 + rm-p)＝(16-1 + 16-6)，1.efffff

(5) 最大阶码为：req－1＝26－1＝63，7f，包括符号位共7个1

(6) 最小阶码为：-req＝-26＝-64，00，包括符号位共7个0

(7) 最大正数为：(1－16-6)1663，7fffffff

(8) 最小正数为：16-65，00100000

(9) 最大负数为：-(16-1 + 16-6) 16-64，80efffff

(10) 最小负数为：-1663，ff000000

(11) 浮点零为：00000000

(12) 表数精度为：16-5/2＝2-21

(13) 表数效率为：15/16＝93.75％

2、解答:

(1)取尾数和阶码的基都为2，即：rm=2 且 re=2

根据表示数精度的要求：

于是可以取p=24；

根据表示数范围的要求：

即

因此可以取q＝7

数据格式可以表示如下（尾数采用隐藏位）：

－24(2)能够表示的最大正数：（1－2

能够表示的最大负数：－2

表示数的精度：2－24－129）2127，，，

表数效率：100%。

3、解答：

(1) 舍入方法：下舍上入法、查表法

(2) 警戒位位数：2位

(3) 正数区的误差范围：-2-p-1(1-2-g+1) ~ 2-p-1

4、解答:

我们可以计算出数据的大致数量：

1000条指令访问的数据总数为1000*2=2000个；

对于a处理机，所用的存储空间的大小为：

由此我们可以看出，由于数据的平均访问次数要大于指令，所以，

通过改进数据的格式来减少指令的长度，可以减少总的存储空间大

小。

5、解答:

(1) 要使得到的操作码长度最短，应采用huffman编码，构造huffman树如下：

由此可以得到7条指令的编码分别如下：

【篇二：计算机体系结构课后习题原版答案_张晨曦著】s=txt>1.1 解释下列术语

计算机系统结构：传统机器程序员所看到的计算机属性，即概念性

结构与功能特性。

计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数

据流和控制流的组成以及逻辑设计等。

计算机实现：计算机组成的物理实现，包括处理机、主存等部件的

物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。

系统加速比：对系统中某部分进行改进时，改进后系统性能提高的

倍数。

amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执行时间的百分比。

并行性：计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠，就存在并行性。它包括同时性与并发性两种含义。

1.2 试用实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系。

答：如在设计主存系统时，确定主存容量、编址方式、寻址范围等属于计算机系统结构。确定主存周期、逻辑上是否采用并行主存、逻辑设计等属于计算机组成。选择存储芯片类型、微组装技术、线路设计等属于计算机实现。

计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成的物理实现。一种体系结构可以有多种组成。一种组成可以有多种实现。

1.6 某台主频为400mhz的计算机执行标准测试程序，程序中指令类型、执行数量和平均时钟周期数如下：

1.7 将计算机系统中某一功能的处理速度加快10倍，但该功能的处理时间仅为整个系统运行时间的40%，则采用此增强功能方法后，能使整个系统的性能提高多少？

解由题可知：可改进比例 = 40% = 0.4部件加速比 = 10 根据amdahl定律可知：

系统加速比??1.5625

0.4

?1?0.4??

采用此增强功能方法后，能使整个系统的性能提高到原来的1.5625倍。

1.8 计算机系统中有三个部件可以改进，这三个部件的部件加速比为：

部件加速比1=30；部件加速比2=20；部件加速比3=10

（1）如果部件1和部件2的可改进比例均为30%，那么当部件3的可改进比例为多少时，系统加速比才可以达到10？

（2）如果三个部件的可改进比例分别为30%、30%和20%，三个

部件同时改进，那么系统中不可加速部分的执行时间在总执行时间

中占的比例是多少？

解：（1）在多个部件可改进情况下，amdahl定理的扩展：

sn?

(1?

?fi)??

已知s1＝30，s2＝20，s3＝10，sn＝10，f1＝0.3，f2＝0.3，得： 10?

1（-0.3?0.3?f3）?（0.3/30?0.3/20?f3/10）

得f3＝0.36，即部件3的可改进比例为36%。

（2）设系统改进前的执行时间为t，则3个部件改进前的执行时间为：（0.3+0.3+0.2）t = 0.8t，不可改进部分的执行时间为0.2t。

已知3个部件改进后的加速比分别为s1＝30，s2＝20，s3＝10，

因此3个部件改进后的执行时间为：

tn?

0.3t0.3t0.2t

???0.045t 302010

改进后整个系统的执行时间为：tn = 0.045t+0.2t = 0.245t

那么系统中不可改进部分的执行时间在总执行时间中占的比例是：

0.2t

?0.82

0.245t

1.9 假设某应用程序中有4类操作，通过改进，各操作获得不同的

性能提高。具体数据如下表所示：

（2）各类操作单独改进后，程序获得的加速比分别是多少？（3）4类操作均改进后，整个程序的加速比是多少？

解：根据amdahl定律sn?1fe

(1?fe)?

可得

4类操作均改进后，整个程序的加速比：

sn??2.16

(1??fi)??si

第2章指令集结构的分类

2.1 解释下列术语

堆栈型机器：cpu 中存储操作数的单元是堆栈的机器。

累加器型机器：cpu 中存储操作数的单元是累加器的机器。

通用寄存器型机器：cpu 中存储操作数的单元是通用寄存器的机器。

2.2 区别不同指令集结构的主要因素是什么？根据这个主要因素可

将指令集结构分为哪3类？

答：区别不同指令集结构的主要因素是cpu中用来存储操作数的存

储单元。据此可将指令系统结构分为堆栈结构、累加器结构和通用

寄存器结构。

2.4指令集应满足哪几个基本要求？

答：对指令集的基本要求是：完整性、规整性、高效率和兼容性。

完整性是指在一个有限可用的存储空间内，对于任何可解的问题，

编制计算程序时，指令集所提供的指令足够使用。

规整性主要包括对称性和均匀性。对称性是指所有与指令集有关的

存储单元的使用、操作码的设置等都是对称的。均匀性是指对于各

种不同的操作数类型、字长、操作种类和数据存储单元，指令的设

置都要同等对待。

高效率是指指令的执行速度快、使用频度高。

2.7简述risc指令集结构的设计原则。

答（1）选取使用频率最高的指令，并补充一些最有用的指令；（2）每条指令的功能应

尽可能简单，并在一个机器周期内完成；（3）所有指令长度均相同；（4）只有load和store操作指令才访问存储器，其它指令操作均

在寄存器之间进行； (5) 以简单有效的方式支持高级语言。

2.10通常有哪几种指令格式，请简述其适用范围。

答： (1) 变长编码格式。如果系统结构设计者感兴趣的是程序的目

标代码大小，而不是性能，就可以采用变长编码格式。（2）固定长

度编码格式。如果感兴趣的是性能，而不是程序的目标代码大小，

则可以选择固定长度编码格式。 (3) 混合型编码格式。需要兼顾降低

目标代码长度和降低译码复杂度时，可以采用混合型编码格式。

第3章流水线技术

3.1解释下列术语

流水线：将一个重复的时序过程，分解成为若干个子过程，而每一

个子过程都可有效地在其专用功能段上与其它子过程同时执行。

吞吐率：在单位时间内流水线所完成的任务数量或输出结果的数量。流水线的加速比：使用顺序处理方式处理一批任务所用的时间与按

流水处理方式处理同一批任务所用的时间之比。

数据相关：考虑两条指令i和j，i在j的前面，如果下述条件之一成立，则称指令j与指令i数据相关：

（1）指令j使用指令i产生的结果；

（2）指令j与指令k数据相关，而指令k又与指令i数据相关。

数据冲突：当指令在流水线中重叠执行时，因需要用到前面指令的

执行结果而发生的冲突。

定向：用来解决写后读冲突的。在发生写后读相关的情况下，在计

算结果尚未出来之前，后面等待使用该结果的指令并不见得是马上

就要用该结果。如果能够将该计算结果从其产生的地方直接送到其

它指令需要它的地方，那么就可以避免停顿。

链接技术：具有先写后读相关的两条指令，在不出现功能部件冲突

和vi冲突的情况下，可以把功能部件链接起来进行流水处理，以达

到加快执行的目的。

分段开采：当向量的长度大于向量寄存器的长度时，必须把长向量

分成长度固定的段，然后循环分段处理，每一次循环只处理一个向

量段。

3.3 简述先行控制的基本思想。答：先行控制技术是把缓冲技术和

预处理技术相结合。缓冲技术是在工作速度不固定的两个功能部件

之间设置缓冲器，用以平滑它们的工作。预处理技术是指预取指令、对指令进行加工以及预取操作数等。

采用先行控制方式的处理机内部设置多个缓冲站，用于平滑主存、

指令分析部件、运算器三者之间的工作。这样不仅使它们都能独立

地工作，充分忙碌而不用相互等待，而且使指令分析部件和运算器

分别能快速地取得指令和操作数，大幅度地提高指令的执行速度和

部件

的效率。这些缓冲站都按先进先出的方式工作，而且都是由一组若

干个能快速访问的存储单元和相关的控制逻辑组成。

采用先行控制技术可以实现多条指令的重叠解释执行。

3.4 设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段，每个阶段所需的时间分别为△t、△t和2△t 。分别求出下列各种情况下，连续执行n条指令所需的时间。

（1）顺序执行方式；

（2）只有“取指令”与“执行指令”重叠；（3）“取指令”、“分析指令”与“执行指令”重叠。解：（1）每条指令的执行时间为：△t＋△t＋2△t＝4△t

连续执行n条指令所需的时间为：4n△t

（2）连续执行n条指令所需的时间为：4△t＋3（n-1）△t＝（3n ＋1）△t （3）连续执行n条指令所需的时间为：4△t＋2（n-1）△t＝（2n＋2）△t

3.5 简述流水线技术的特点。答：流水技术有以下特点：（1）流水线把一个处理过程分解为若干个子过程，每个子过程由一个专门的功能部件来实现。因此，流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件，并依靠它们的并行工作来提高吞吐率。

（2）流水线中各段的时间应尽可能相等，否则将引起流水线堵塞和断流。（3）流水线每一个功能部件的前面都要有一个缓冲寄存器，称为流水寄存器。

（4）流水技术适合于大量重复的时序过程，只有在输入端不断地提供任务，才能充分发挥流水线的效率。

（5）流水线需要有通过时间和排空时间。在这两个时间段中，流水线都不是满负荷工作。

3.6 解决流水线瓶颈问题有哪两种常用方法？答：细分瓶颈段与重复设置瓶颈段

3.10 简述三种向量处理方式，它们对向量处理机的结构要求有何不同？

答 (1)横向处理方式：若向量长度为n，则水平处理方式相当于执行n次循环。若使用流水线，在每次循环中可能出现数据相关和功能转换，不适合对向量进行流水处理。 (2)纵向处理方式：将整个向量按相同的运算处理完毕之后，再去执行其他运算。适合对向量进行流水处理，向量运算指令的源/目向量都放在存储器内，使得流水线运算部件的输入、输出端直接与存储器相联，构成m-m型的运算流水线。 (3)纵横处理方式：把长度为n的向量分为若干组，每组长度为n，组内按纵向方式处理，依次处理各组，组数为「n/n」，适合流

水处理。可设长度为n的向量寄存器，使每组向量运算的源/目向量

都在向量寄存器中，流水线的运算部件输入、输出端与向量寄存器

相联，构成r-r型运算流水线。

3.11 可采用哪些方法来提高向量处理机的性能？答：可采用多种方法：

（1）设置多个功能部件，使它们并行工作；（2）采用链接技术，加快一串向量指令的执行；

【篇三：计算机体系结构课后详解王志英】

=txt>1.1 解释下列术语层次机构：按照计算机语言从低级到高级的

次序，把计算机系统按功能划分成多级层次结构，每一层以一种不

同的语言为特征。这些层次依次为：微程序机器级，传统机器语言

机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。

虚拟机：用软件实现的机器。

翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等

效的程序，然后再在这低一级机器上运行，实现程序的功能。

解释：对于高一级机器上的程序中的每一条语句或指令，都是转去

执行低一级机器上的一段等效程序。执行完后，再去高一级机器取

下一条语句或指令，再进行解释执行，如此反复，直到解释执行完

整个程序。

计算机系统结构：传统机器程序员所看到的计算机属性，即概念性

结构与功能特性。

在计算机技术中，把这种本来存在的事物或属性，但从某种角度看

又好像不存在的概念称为透明性。

计算机组成：计算机系统结构的逻辑实现，包含物理机器级中的数

据流和控制流的组成以及逻辑设计等。

计算机实现：计算机组成的物理实现，包括处理机、主存等部件的

物理结构，器件的集成度和速度，模块、插件、底板的划分与连接，信号传输，电源、冷却及整机装配技术等。

系统加速比：对系统中某部分进行改进时，改进后系统性能提高的

倍数。

amdahl定律：当对一个系统中的某个部件进行改进后，所能获得

的整个系统性能的提高，受限于该部件的执行时间占总执行时间的

百分比。

程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。

cpi：每条指令执行的平均时钟周期数。

测试程序套件：由各种不同的真实应用程序构成的一组测试程序，用来测试计算机在各个方面的处理性能。

系列机：由同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的

计算机。

软件兼容：一个软件可以不经修改或者只需少量修改就可以由一台计算机移植到另一台计算机上运行。差别只是执行时间的不同。

向上（下）兼容：按某档计算机编制的程序，不加修改就能运行于比它高（低）档的计算机。

向后（前）兼容：按某个时期投入市场的某种型号计算机编制的程序，不加修改地就能运行于在它之后（前）投入市场的计算机。

兼容机：由不同公司厂家生产的具有相同系统结构的计算机。

模拟：用软件的方法在一台现有的计算机（称为宿主机）上实现另一台计算机（称为虚拟机）的指令系统。

仿真：用一台现有计算机（称为宿主机）上的微程序去解释实现另一台计算机（称为目标机）的指令系统。

并行性：计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠，就存在并行性。它包括同时性与并发性两种含义。

时间重叠：在并行性概念中引入时间因素，让多个处理过程在时间上相互错开，轮流重叠地使用同一套硬件设备的各个部分，以加快硬件周转而赢得速度。

资源重复：在并行性概念中引入空间因素，以数量取胜。通过重复设置硬件资源，大幅度地提高计算机系统的性能。

资源共享：这是一种软件方法，它使多个任务按一定时间顺序轮流使用同一套硬件设备。

耦合度：反映多机系统中各计算机之间物理连接的紧密程度和交互作用能力的强弱。

紧密耦合系统：又称直接耦合系统。在这种系统中，计算机之间的物理连接的频带较高，一般是通过总线或高速开关互连，可以共享主存。

松散耦合系统：又称间接耦合系统，一般是通过通道或通信线路实现计算机之间的互连，可以共享外存设备（磁盘、磁带等）。计算机之间的相互作用是在文件或数据集一级上进行。

异构型多处理机系统：由多个不同类型、至少担负不同功能的处理

机组成，它们按照作业要求的顺序，利用时间重叠原理，依次对它

们的多个任务进行加工，各自完成规定的功能动作。

同构型多处理机系统：由多个同类型或至少担负同等功能的处理机

组成，它们同时处理同一作业中能并行执行的多个任务。

计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组

成的物理实现。一种体系结构可以有多种组成。一种组成可以有多

种实现。

1.3 计算机系统结构的flynn分类法是按什么来分类的？共分为哪几类？答：flynn分类法是按照指令流和数据流的多倍性进行分类。把计算机系统的结构分为：（1）单指令流单数据流sisd （2）单指

令流多数据流simd （3）多指令流单数据流misd

（4）多指令流多数据流mimd

1.5 分别从执行程序的角度和处理数据的角度来看，计算机系统中

并行性等级从低到高可分为哪几级？

答：从处理数据的角度来看，并行性等级从低到高可分为：

（1）字串位串：每次只对一个字的一位进行处理。这是最基本的串行处理方式，不存在并行性；

（2）字串位并：同时对一个字的全部位进行处理，不同字之间是串行的。已开始出现并行性；

（3）字并位串：同时对许多字的同一位（称为位片）进行处理。这种方式具有较高的并行性；

（4）全并行：同时对许多字的全部位或部分位进行处理。这是最高一级的并行。从执行程序的角度来看，并行性等级从低到高可分为：（1）指令内部并行：单条指令中各微操作之间的并行；（2）指令

级并行：并行执行两条或两条以上的指令；

（3）线程级并行：并行执行两个或两个以上的线程，通常是以一个进程内派生的多个线程为调度单位；

（4）任务级或过程级并行：并行执行两个或两个以上的过程或任务（程序段），以子程序或进程为调度单元；

（5）作业或程序级并行：并行执行两个或两个以上的作业或程序。 1.6 某台主频为400mhz的计算机执行标准测试程序，程序中指令

类型、执行数量和平均时钟周期数如下：

1.7 将计算机系统中某一功能的处理速度加快10倍，但该功能的处

理时间仅为整个系统运行时间的40%，则采用此增强功能方法后，

能使整个系统的性能提高多少？

解由题可知：可改进比例 = 40% = 0.4部件加速比 = 10

根据amdahl定律可知：

系统加速比

?1?0.4??

0.410

?1.5625

采用此增强功能方法后，能使整个系统的性能提高到原来的1.5625倍。

1.8 计算机系统中有三个部件可以改进，这三个部件的部件加速比为：

部件加速比1=30；部件加速比2=20；部件加速比3=10

（1）如果部件1和部件2的可改进比例均为30%，那么当部件3

的可改进比例为多少时，系统加速比才可以达到10？

（2）如果三个部件的可改进比例分别为30%、30%和20%，三个

部件同时改进，那么系统中不可加速部分的执行时间在总执行时间

中占的比例是多少？

解：（1）在多个部件可改进情况下，amdahl定理的扩展：

sn?

(1?

fisi

?fi)??

已知s1＝30，s2＝20，s3＝10，sn＝10，f1＝0.3，f2＝0.3，得： 10?

1（-0.3?0.3?f3）?（0.3/30?0.3/20?f3/10）

得f3＝0.36，即部件3的可改进比例为36%。

（2）设系统改进前的执行时间为t，则3个部件改进前的执行时间为：（0.3+0.3+0.2）t = 0.8t，不可改进部分的执行时间为0.2t。

已知3个部件改进后的加速比分别为s1＝30，s2＝20，s3＝10，

因此3个部件改进后的执行时间为：

tn?

0.3t30

0.3t20

0.2t10

?0.045t

改进后整个系统的执行时间为：tn = 0.045t+0.2t = 0.245t

那么系统中不可改进部分的执行时间在总执行时间中占的比例是：

0.2t0.245t

?0.82

1.9 假设某应用程序中有4类操作，通过改进，各操作获得不同的

性能提高。具体数据如下表所示：

（2）各类操作单独改进后，程序获得的加速比分别是多少？（3）

4类操作均改进后，整个程序的加速比是多少？解：根据amdahl

定律sn?

1(1?fe)?

fese

可

4类操作均改进后，整个程序的加速比：

sn?

(1?

?fi)??

fisi

?2.16

第2章指令集结构的分类

2.1 解释下列术语

堆栈型机器：cpu 中存储操作数的单元是堆栈的机器。

累加器型机器：cpu 中存储操作数的单元是累加器的机器。

通用寄存器型机器：cpu 中存储操作数的单元是通用寄存器的机器。 cisc：复杂指令集计算机

risc：精简指令集计算机

寻址方式：指令系统中如何形成所要访问的数据的地址。一般来说，寻址方式可以指明指令中的操作数是一个常数、一个寄存器操作数

或者是一个存储器操作数。

数据表示：硬件结构能够识别、指令系统可以直接调用的那些数据

结构。

2.2 区别不同指令集结构的主要因素是什么？根据这个主要因素可将指令集结构分为哪

3类？

答：区别不同指令集结构的主要因素是cpu中用来存储操作数的存储单元。据此可将指令系统结构分为堆栈结构、累加器结构和通用寄存器结构。

计算机系统结构三四章作业及答案

3.1 简述流水线技术的特点。（1）流水线把一个处理过程分解为若干个子过程，每个子过程由一个专门的功能部件来实现。因此，流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件，并依靠它们的并行工作来提高吞吐率。（2）流水线中各段的时间应尽可能相等，否则将引起流水线堵塞和断流。（3）流水线每一个功能部件的前面都要有一个缓冲寄存器，称为流水寄存器。（4）流水技术适合于大量重复的时序过程，只有在输入端不断地提供任务，才能充分发挥流水线的效率。（5）流水线需要有通过时间和排空时间。在这两个时间段中，流水线都不是满负荷工作。 3.2 解决流水线瓶颈问题有哪两种常用方法？答：细分瓶颈段与重复设置瓶颈段 3.3 有一条指令流水线如下所示：（1 用两给出条指（1）（24? 变八级流水线（细分） ? 重复设置部件 )(ns 85 1 T n TP 1pipeline -== 3.4 有一个流水线由4段组成，其中每当流过第三段时，总要在该段循环一次，然后才能流到第4段。如果每段经过一次所需的时间都是△t ，问：（1）当在流水线的输入端连续地每△t 时间输入一个任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每2△t 输入一个任务，连续处理10个任务时，其实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高流水线的吞吐率？人连续处理10个任务时，其吞吐率提高多少？解：（1）会发生流水线阻塞情况。

（2）（3）重复设置部件吞吐率提高倍数＝ t t ??2310 75 ＝1.64 3.5 有一条动态多功能流水线由5段组成，加法用1、3、4、5段，乘法用1、2、5段，第2段的时间为2△t ，其余各段的时间均为△t ，而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。现在该流水线上计算 ∏=+4 1 )(i i i B A ，画出时空图，并计算其吞吐率、加速比和效率。＋B 4；再计算由图可见，它在18个△t 时间中，给出了7个结果。所以吞吐率为：如果不用流水线，由于一次求积需3△t ，一次求和需5△t ，则产生上述7个结果共需（4×5+3×3）△t =29△t 。所以加速比为：该流水线的效率可由阴影区的面积和5个段总时空区的面积的比值求得： 3.6 在一个5段流水线处理机上,各段执行时间均为△t,需经9△t 才能完成一个任务,其预约表如下所示。段23 时间入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A × B C ×D

计算机体系结构期末复习

计算机体系结构期末复习资料 1.并行性：是指在同一时刻或者是同一时间间隔内完成两种或两种以上性质相同或不同的工作。 2.CPI：每条指令执行时所花费的平均时钟周期。 3.体系结构：即计算机的属性，即概念性结构与功能特性。 4.Amdahl定理：加快某部件执行速度所获得的系统性能加速比，受限于该部件在系统中所占的重要性。 5.信息存储的整数边界：信息在主存中存放的起始地址必须是该信息（字节数）的整数倍。 6.指令系统的正交性：指在指令中各个不同含义的字段，在编码时应互不相关，相互独立。 7.流水线技术：是指将一个重复的时序过程，分解成为若干子过程，而每个过程都可有效在其专用功能段上与其他子过程同时执行。 8.定向技术：在某条指令产生一个结果之前，其他指令并不直接需要该计算结果，如果能将该计算结果从其他产生的地方直接送到其他指令需要它的地方，那么就可以避免暂停的技术就叫定向技术。 9.相关：衡量两个随机变量之间相关程度的指标。 10.向量流水处理机：是指处理机具有向量数据表示并通过向量指令对向量的各元素进行处理。、

11.定向：将计算结果从其产生的地方直接送到其他指令需要它的地方，或所有需要它的功能单元，避免暂停。 12.指令集的并行：当指令之间不存在相关时，它们在流水线中是可以重叠起来并行执行。 13.记分牌技术：流出和读操作数。在没有结构冲突时,尽可能早地执行没有数据冲突的指令,实现每个时钟周期执行一条指令。如果某条指令被暂停,而后面的指令与流水线中正在执行或被暂停的指令都不相关,是这些指令可以跨越它,继续流出和执行下去。 14.Tomasulo算法：寄存器换名是通过保留站和流出逻辑来共同完成,当指令流出时,如果其操作数还没有计算出来,则该指令中相应的寄存器换名将产生这个操作数的保留站的标识。因此,指令流出到保留站后,其操作数寄存器或者换成了数据本身,或换成了保留站的标识,和寄存器无关。后面指令对该寄存器的写入操作就不会产生WAR冲突。 15.替换算法：由于主存中的块比Cache中的块多，所以当要从主存中调一个块到Cache中时，会出现该块所映象到的一组（或一个）Cache块已全部被占用的情况。这时，需要被迫腾出其中的某一块，以接纳新调入的块。

计算机系统结构考试计算题

3.12 有一指令流水线如下所示（1）求连续输入10条指令，该流水线的实际吞吐率和效率；（2）该流水线的“瓶颈”在哪一段？请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少？解：（1） 2200(ns)2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n T P 1pipeline -== 45.45%11 5 4400T P m t T P E m 1 i i ≈=? =?? =∑= （2）瓶颈在3、4段。 ? 变成八级流水线（细分） 850(ns)509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n T P 1pipeline -== 58.82%17 10 8400T P m ti T P E m 1 i ≈=? =?? =∑= ? 重复设置部件出 50ns 50ns 100ns 200ns

)(ns 85 1 T n T P 1pipeline -== 58.82%17 10885010400E ≈=??= 3.13 4段组成，3段时，一次，然4段。如果需要的时间都是，问：（1）当在流水线的输入端连续地每时间输入任务时，该流水线会发生什么情况？（2）此流水线的最大吞吐率为多少？如果每输入一个任务，连续处理 10个任务时的实际吞吐率和效率是多少？（3）当每段时间不变时，如何提高该流水线的吞吐率？仍连续处理10个任务时，其吞吐率提高多少？（2） t ?t ?2

计算机体系结构复习计算题

1. 将计算机系统中某一功能的处理速度加快10倍，但该功能的处理时间仅为整个系统运行时间的40%，则采用此增强功能方法后，能使整个系统的性能提高多少根据Amdahl 定律可知：系统加速比＝＝＝由题可知：可改进比例 = 40% = 部件加速比 = 10 系统加速比 = 采用此增强功能方法后，能使整个系统的性能提高倍。 2. 假设一台计算机的I/O 处理占10％，当其CPU 性能改进到原来的10倍时，而I/O 性能仅改进为原来的两倍时，系统总体性能会有什么改进加速比＝1/（10%/2+90%/10）= 本题反映了Amdahl 定律，要改进一个系统的性能要对各方面性能都进行改进，不然系统中最慢的地方就成为新系统的瓶颈。 3. 双输入端的加、乘双功能静态流水线有1、2、3、4四个子部件，延时分别为Δt, Δt, 2Δt, Δt ，“加”由1→2→4组成，“乘”由1 →3→4组成，输出可直接返回输入或锁存。现执行 ∑=*+4 1 ])[(i i i i c b a （1）画出流水时空图，标出流水线输入端数据变化情况。（2）求运算全部完成所需的时间和流水线效率。（3）找出瓶颈子过程并将其细分，重新画出时空图并计算流水时间和效率。（1）（2）由上图可知，全部运算完的时间是23Δt 。 92 37 23437=???= t t η （3）部件 ① ② ③ ④ ⑤ ⑥ 结果输入 a 1 a 2 a 3 a 4 a 1+b 1 a 2+b 2 a 3+b 3 a 4+b 4 ① ③ ⑤ b 1 b 2 b 3 b 4 c 1 c 2 c 3 c 4 ② ④ ⑥ Δt 4 3 2 1

计算机系统结构网上作业

计算机系统结构作业参考答案一、 1、试述现代计算机系统的多级层次结构。计算机系统具有层次性，它由多级层次结构组成。从功能上计算机系统可分为五个层次级别：第一级是设计级。这是一个硬件级，它由机器硬件直接执行。第二级是一般机器级，也称为机器语言级。它由微程序解释系统.这一级是硬件级。第三级是操作系统级，它由操作系统程序实现。这些操作系统由机器指令和广义指令组成，这些广义指令是操作系统定义和解释的软件指令。这一级也称混合级。第四级是汇编语言级。它给程序人员提供一种符号形式的语言，以减少程序编写的复杂性。这一级由汇编程序支持执行。第五级是高级语言级。这是面向用户为编写应用程序而设置的。这一级由各种高级语言支持。 2、试述RISC设计的基本原则和采用的技术。答：一般原则： (1)确定指令系统时，只选择使用频度很高的指令及少量有效支持操作系统，高级语言及其它功能的指令，大大减少指令条数，一般使之不超过100条； (2)减少寻址方式种类，一般不超过两种； (3)让所有指令在一个机器周期内完成； (4)扩大通用寄存器个数，一般不少于32个，尽量减少访存次数； (5)大多数指令用硬联实现，少数用微程序实现； (6)优化编译程序，简单有效地支持高级语言实现。

基本技术： (1)按RISC一般原则设计，即确定指令系统时，选最常用基本指令，附以少数对操作系统等支持最有用的指令，使指令精简。编码规整，寻址方式种类减少到1、2种。 (2)逻辑实现用硬联和微程序相结合。即大多数简单指令用硬联方式实现，功能复杂的指令用微程序实现。 (3)用重叠寄存器窗口。即：为了减少访存，减化寻址方式和指令格式，简有效地支持高级语言中的过程调用，在RISC机器中设有大量寄存嚣，井让各过程的寄存器窗口部分重叠。 (4)用流水和延迟转移实现指令，即可让本条指令执行与下条指令预取在时间上重叠。另外，将转移指令与其前面的一条指令对换位置，让成功转移总是在紧跟的指令执行之后发生，使预取指令不作废，节省一个机器周期。 (5)优化设计编译系统。即尽力优化寄存器分配，减少访存次数。不仅要利用常规手段优化编译，还可调整指令执行顺序，以尽量减少机器周期等。 3、试述全相联映像与直接映像的含义及区别（1）全相连映像主存中任何一个块均可以映像装入到Cache中的任何一个块的位置上。主存地址分为块号和块内地址两部分，Cache地址也分为块号和块内地址。Cache的块内地址部分直接取自主存地址的块内地址段。主存块号和Cache块号不相同，Cache块号根据主存块号从块表中查找。Cache保存的各数据块互不相关，Cache必须对每个块和块自身的地址加以存储。当请求数据时，Cache控制器要把请求地址同所有的地址加以比较，进行确认。（2）直接映像把主存分成若干区，每区与Cache大小相同。区内分块，主存每个区中块的大小和Cache 中块的大小相等，主存中每个区包含的块的个数与Cache中块的个数相等。任意一个主存块只能映像到Cache中唯一指定的块中，即相同块号的位置。主存地址分为三部分：区号、块号和块内地址，Cache地址分为：块号和块内地址。直接映像方式下，数据块只能映像到Cache中唯一指定的位置，故不存在替换算法的问题。它不同于全相连Cache，地址仅需比较一次。（3）区别：全相连映像比较灵活，块冲突率低，只有在Cache中的块全部装满后才会出现冲突，Cache 利用率高。但地址变换机构复杂，地址变换速度慢，成本高。直接映像的地址变换简单、速度快，可直接由主存地址提取出Cache地址。但不灵活，块冲突率较高，Cache空间得不到充分利用。 4. 画出冯?诺依曼机的结构组成？

系统结构期末考试试题及答案

得分评分人填空题: （20分，每题2 分）单选题：（10分，每题1分） A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置《计算机系统结构》期末考试试卷（A ）得分注：1、共100分，考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令，是属于（ A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、输入输出系统硬件的功能对（B ）是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、全相联地址映象是指（A ） C. 组之间固定，组内任何虚页可装入任何实页位置 D.组间可任意装入，组内是固定装入 4、（ C ）属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关，则（ B ） A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是（B ） A.专属软件范畴，与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、指令执行结果出现异常引起的中断是（ C ） A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是（A ） A.直接 B .组相联 C .段相联 D .全相联 9、组相联映象、LRU 替换的Cache 存储器，不影响 Cache 命中率的是（B ） A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、流水处理机对全局性相关的处理不包括（C ） A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

计算机系统结构计算题

计算题用一条4段浮点加法器流水线求8个浮点数的和：Z ＝A ＋B ＋C ＋D ＋E ＋F ＋G ＋H 解： Z ＝[(A ＋B)＋(C ＋D)]＋[(E ＋F)＋(G ＋H)] 例设在下图所示的静态流水线上计算：流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中，试计算其吞吐率、加周期 1 2 3 规格化尾数加对阶求阶差时间A C E G A+B E+F A+B+C+D 7个浮点加法共用了15个时钟周期。流水线的吞吐率为：TP n T t t k ==?=?7150471?? 流水线的加速比为：S T T t t k ==???=?04715187?? 流水线的效率为：E T k T t t k =?=????=?047415047?? 乘法加减法时间段输入 A 1 B 1 A 2 B 2 A 3 B 3 A 4 B 4 A B C D A ×B C ×D 1 2 3 4

（3）计算性能在18个△t 时间中，给出了7个结果。吞吐率为：不用流水线，由于一次求和需6△t ，一次求积需则产生上述7个结果共需（4×6+3×4）△t = 36△t 加速比为流水线的效率例有一条动态多功能流水线由5段组成，加法用1、3、4、5 段，乘法用1、2、5段，第2段的时间为2△t ，其余各段时间均为△t ，而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。若在该流水线上计算: 试计算其吞吐率、加速比和效率。 (1) 选择适合于流水线工作的算法应先计算A 1×B 1、A 2×B 2、A 3×B 3和A 4×B 4；再计算(A 1×B 1)＋(A 2×B 2) (A 3×B 3)＋(A 4×B 4)；然后求总的累加结果。 (2) 画出时空图 (3) 计算性能非线性流水线例5.3：一条4功能段的非线性流水线，每个功能段的延迟时间都相等，它的预约表如下： (1)写出流水线的禁止向量和初始冲突向量。乘法加法 t TP ?=18756.11828≈??=t t S 31.018 54344≈??+?=E

《计算机系统结构》练习题C

《计算机系统结构》练习题C 一、填空题 1.Flynn分类法将计算机系统结构分成四类，即( )、（）、（）、（）。 2.软件兼容有（）、（）、（）、（）四种，其中（）是系列机的根本特征。 3.相关有三种类型，包括（）、（）、（）。 4.存储层次结构设计技术的基本依据是（），它包括（）和（）。 5.“主存-辅存”层次的目的是为了弥补主存的（）的不足；“Cache-主存”层次的目的是为了弥补主存（）的不足。二. 简要回答下列各题 1. 计算机系统结构的Flynn分类法是按什么来分类的？共分为哪几类？ 2. 指令集结构设计所涉及的内容有哪些？ 3. 多级存储层次： 4. 同步总线及其优缺点？ 5. 指令的执行可采用顺序执行、重叠执行和流水线三种方式，它们的主要区别是什么？各有何优缺点。 6. 试比较三种通道的优缺点及适用场合。三、某台主频为400MHz的计算机执行标准测试程序，程序中指令类型、执行数量和平均时钟周期数如下：求该计算机的有效CPI、MIPS和程序执行时间。四、有一指令流水线如下所示出 50ns 50ns 100ns 200ns （1）求连续输入10条指令，该流水线的实际吞吐率和效率；（2）该流水线的“瓶颈”在哪一段？五、（1）（2）若通道的最大流量等于实际工作流量，求通道的工作周期Ts+T D。六、应用题 1．计算机系统有3个部件可以改进，这3个部件的加速比如下：部件加速比S1 = 30，部件加速比S2=20，部件加速比S3=10 问：（1）简述Amdahl定律。（2）如果部件1和部件2的可改进比例分别为30%，那么当部件3的可改进比例为多少时，系统的加速比才能超过10？

高级计算机体系结构作业汇总(非标准答案)

1.Explain the Concepts Computer Architecture 系统结构由程序设计者所看到的一个计算机系统的属性。即计算机系统的软硬件界面。 Advanced CA 高级系统结构新型计算机系统结构。基于串行计算机结构，研究多指令多数据计算机系统，具有并发、可扩展和可编程性。为非冯式系统结构。 Amdahl law Amdahl定律系统中某部件由于采用某种方式时系统性能改进后，整个系统性能的提高与该方式的使用频率或占的执行时间的比例有关。 SCALAR PROCESSING 标量处理机在同一时间内只处理一条数据。 LOOK-AHEAD 先行技术通过缓冲技术和预处理技术，解决存储器冲突，使运算器能够专心与数据的运算，从而大幅提高程序的执行速度。 PVP 向量型并行计算处理机以流水线结构为主的并行处理器。 SMP 对称多处理机系统任意处理器可直接访问任意内存地址,使用共享存储器，访问延迟、带宽、机率都是等价的。MPP 大规模并行计算机系统物理和逻辑上均是分布内存，能扩展至成百上千处理器，采用专门设计和定制的高通信带宽和低延迟的互联网络。 DSM 分布式共享存储系统内存模块物理上局部于各个处理器内部,但逻辑上是共享存储的。 COW 机群系统每个节点都是一个完整的计算机，各个节点通过高性能网络相互连接，网络接口和I/O总线松耦合连接，每个节点有完整的操作系统。 GCE 网格计算环境利用互联网上的计算机的处理器闲置处理能力来解决大型计算问题的一种科学计算。 CISC 复杂指令集计算机

通过设置一些复杂的指令，把一些原来由软件实现的常用功能改用硬件实现的指令系统实现，以此来提高计算机的执行速度。 RISC 精简指令集计算机尽量简化计算机指令功能，只保留那些功能简单，能在一个节拍内执行完的指令，而把复杂指令用段子程序来实现。 VMM 虚拟机监视器作为软硬件的中间层，在应用和操作系统所见的执行环境之间。 SUPERCOMPUTER 超级计算机数百数千甚至更多的处理器组成的能计算普通计算机不能完成的大型复杂问题的计算机。SVM 共享虚拟存储器存储器虚拟化为一个共享的存储器，并提供单一的地址空间。 MAINFRAME 大型计算机作为大型商业服务器，一般用于大型事务处理系统，特别是过去完成的且不值得重新编写的数据库应用系统方面。 COMPUTER SYSTEM ON CHIP 片上计算机系统在单个芯片上集成的一个完整系统。 PARALLEL ARCHITECTURE INTO SINGLE CHIP 单片并行结构在单个芯片上采用的并行体系结构 MOORE law Moore定律当价格不变时，集成电路上可容纳的晶体管数目，约每隔18个月便会增加一倍，性能也将提升一倍。 UMA 一致存储访问采用集中式存储的模式，提供均匀的存储访问。 NUMA 非一致存储访问内存模块局部在各个结点内部，所有局部内存模块构成并行机的全局内存模块。 COMA 全高速缓存存储访问采用分布式存储模式，通过高速缓存提供快速存储访问。 CC-NUMA 全高速缓存非一致性均匀访问存在专用硬件设备保证在任意时刻，各结点Cache中数据与全局内存数据的一致性。NORMA 非远程存储访问

计算机系统结构期末考试题目

第一章： 1.计算机系统结构的定义答：由程序设计者看到的一个计算机系统的属性，即概念性结构和功能特性。 2.透明性概念答：在计算机技术中，一种本来是存在的事物或属性，但从某种角度看似乎不存在，称为透明性现象。 3.兼容性向后兼容兼容性：同一个软件可以不加修改地运行于系统结构相同的各档机器，可获得相同的结果，差别只在于不同的运行时间。向后兼容：按某个时期投入市场的某种型号机器编制的程序，不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律答：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答：每条指令的平均时钟周期数。 6.MIPS 答：每秒百万条指令数！MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答：每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念答： 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分答：①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD（实际不存在）④多指令流多数据流MIMD 10.计算机系统设计的定量原理（四个）答：①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算答：CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长加速比=（采用改进措施后的性能）/（没有采用改进措施前的性能） =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点硬件实现：速度快、成本高；灵活性差、占用内存少软件实现：速度低、复制费用低；灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

《计算机体系结构》期末复习题标准答案

《计算机体系结构》期末复习题答案

————————————————————————————————作者：————————————————————————————————日期：

《计算机体系结构》期末复习题答案系别_________ 班级_________ 姓名__________ 学号__________ 一、填空题（每空1分） 1.按照弗林（Flynn）分类法，计算机系统可以分为4类：SISD计算机、（SIMD计算机）、（MISD计算机）和（MIMD计算机）。 2. 改进之后的冯?诺依曼计算机的只要特点是存储器为中心，总线结构，分散控制。 3. 当前计算机系统中的存储系统是一个层次结构，其各层分别为：（通用寄存器，高速缓存，主存，辅存，脱机大容量存储器）。 4.高速缓冲存储器的地址映象方式有三种，它们分别是：（全向量方式，直接相联方式，组相联方式）。 5.虚拟存储器的三种管理方式是（段式管理，页式管理和段页式管理）。 6.目前计算机中常用数据有（用户定义数据，系统数据和指令数据）三种类型。 7.通常可能出现的流水线的相关性有（资源相关，数据相关和控制相关）。 8.解决中断引起的流水线断流的方法有（不精确断点法和精确断点法）。 9.目前向量处理机的系统结构有两种：（存储器－存储器型和寄存器－寄存器型）。 10.通用计算机基本指令分为5类，它们分别是：（数据传送类，运算类，程序控制类，输入输出类，处理机控制和调试类）。 11．执行指令x1=x2+x3；x4=x1-x5会引起（RAW）类型的数据相关，执行指令x5=x4*x3；x4=x0+x6会引起（W AR）类型的数据相关，执行指令x6=x1+x2；x6=x4*x5会引起（WA W）类型的数据相关。 12．多计算机网络中，通常出现的4种通信模式是（单播模式，选播模式，广播模式和会议模式）。 13.传统的冯?诺依曼计算机是以控制驱动方式工作，以数据驱动方式工作的典型计算机是（数据流计算机），以需求驱动方式工作的典型计算机是（归约机），以模式匹配驱动方式工作的典型计算机是（人工智能计算机）。二、名词解释（每题2分） 1.计算机体系结构：计算机系统结构就是计算机的机器语言程序员或编译程序编写者所看到的外特性，是硬件子系统的概念结构及其功能特性。 2.系列机：所谓系列机是指同一厂家生产的具有相同的系统结构，但采取了不同的组成和实现的技术方案，形成了不同型号的多种机型。 3.模拟: 模拟是指用软件的方法在一台计算机上，实现另一台计算机的指令系统，被模拟的机器是不存在的，称为虚拟机，执行模拟程序的机器称宿主机。 4.程序的局部性原理: 程序访问局部性原理说明了计算机在程序执行过程中呈现出的一种规律，即程序往往重

计算机体系结构_第一次作业

计算机体系结构第一章 1.11 Availability is the most important consideration for designing servers, followed closely by scalability and throughput. a. We have a single processor with a failures in time(FIT) of 100. What is the mean time to failure (MTTF) for this system? b. If it takes 1 day to get the system running again, what is the availability of the system? c. Imagine that the government, to cut costs, is going to build a supercomputer out of inexpensive computers rather than expensive, reliable computers. What is the MTTF for a system with 1000 processors? Assume that if one fails, they all fail. 答： a. 平均故障时间(MTTF)是一个可靠性度量方法，MTTF的倒数是故障率，一般以每10亿小时运行中的故障时间计算(FIT)。因此由该定义可知1/MTTF=FIT/10＾9，所以MTTF=10^9/100=10^7。b. 系统可用性=MTTF/(MTTF+MTTR)，其中MTTR为平均修复时间，在该题目中表示为系统重启时间。计算10^7/(10^7+24)约等于1. c. 由于一个处理器发生故障，其他处理器也不能使用，所以故障率为原来的1000倍，所以MTTF值为单个处理器MTTF的1/1000即10^7/1000=10^4。 1.14 In this exercise, assume that we are considering enhancing

2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷 (总分：100分，时间：100分钟) 姓名：周元华专业：计算机科学与技术学号： 18260070164016 学习中心：上海弘成一、填空题（每空1分，共14分） 1.高速缓冲存储器的地址映象方式有三种，它们分别是：全向量方式，直接相联方式，组相连方式。 2.虚拟存储器的三种管理方式是段式管理，页式管理和段页式管理。 3.从主存的角度来看，“Cache—主存”层次的目的是为了提高速度，而“主存—辅存”层次的目的是为了扩大容量 4.根据指令间的对同一寄存器读和写操作的先后次序关系，数据相关冲突可分为读与写（RAM）、写与读（WAR）和写与写（WAW）三种类型。 5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容二、名词解释（每题2分，共16分）计算机体系结构：计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。其中计算机理论组成部分并不单与某一个实际硬件相挂钩，如存储部分就包括寄存器、内存、硬盘等。兼容机：兼容机，就是由不同公司厂家生产的具有相同系统结构的计算机。简单点说，就是非厂家原装，而改由个体装配而成的机器，其中的元件可以是同一厂家出品，但更多的是整合各家之长的计算机。写直达法：写直达法一般指全写法。全写法（write-through）：又称写直达法、写穿法，透写法，Cache使用方式之一。高速缓冲存储器: 高速缓冲存储器（Cache）其原始意义是指存取速度比一般随机存取记忆体（RAM）来得快的一种RAM，一般而言它不像系统主记忆体那样使用DRAM技术，而使用昂贵但较快速的SRAM 技术，也有快取记忆体的名称。高速缓冲存储器是存在于主存与CPU之间的一级存储器，由静态存储芯片(SRAM)组成，容量比较小但速度比主存高得多，接近于CPU的速度。在计算机存储系统的层次结构中，是介于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。高速缓冲存储器最重要的技术指标是它的命中率。延迟转移技术：在转移指令之后插入一条或几条有效的指令。当程序执行时，要等这些插入的指令执行完成之后，才执行转移指令，因此，转移指令好像被延迟执行了，这种技术称为延迟转移技术。线性流水线：线性流水线就是由一整套工艺串联而成的生产线。流水线又称为装配线,一种工业上的生产方式，指每一个生产单位只专注处理某一个片段的工作，以提高工作效率及产量；按照流水线的输送方式大体可以分为：皮带流水装配线、板链线、倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线。输送线的传输方式有同步传输的/（强制式），也可以是非同步传输/（柔性式），根据配置的选择，可以实现装配和输送的要求。输送线在企业的批量生产中不可或缺。流水线的吞吐率：流水线的吞吐率是单位时间内流水线处理的任务数。并行性：并行性是指计算机系统具有可以同时进行运算或操作的特性，在同一时间完成两种或两种以上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发性指两个或两个以上事件在同一时间间隔发生。三、简答题(每题5分，共30分） 1.如有一个经解释实现的计算机，可以按功能划分成4级。每一级为了执行一条指令需要下一级的N条指令解释。若执行第一级的一条指令需K(ns)时间，那么执行第2、3、4级的一条指令各需要用多少时间(ns)? 答：第1级：1条1级指令 K ns 第2级：1条2级指令N条1级指令 1*N*K ns = NK ns 第3级：1条3级指令N条2级指令 1*N*NK ns =N2K ns 第4级：1条4级指令N条3级指令 1*N*NNK ns =N3K ns 2.根据Amdahl定律，系统加速比由哪两个因素决定？答：系统加速比依赖于两个因素：（1）可改进比例：可改进部分在原系统计算时间中所占的比例（2）部件加速比：可改进部分改进以后的性能提高 3.简述组相联映象规则。答：(1)主存与缓存分成相同大小的数据块。(2)主存和Cache 按同样大小划分成组。(3)主存容量是缓存容量的整数倍,将主存空间按缓冲区的大小分成区，主存中每一区的组数与缓存的组数相同 4.引起Cache与主存内容不一致的原因是什么？为了保持Cache 的一致性，在单计算机系统中一般采取哪些措施？答：不一致的原因：（1）由于CPU写Cache，没有立即写主存（2）由于I/O处理机或I/O设备写主存采取措施：（1）全写法，亦称写直达法（WT法-Write through）方法：在对Cache进行写操作的同时，也对主存该内容进行写入（2）写回法（WB法-Write back）方法：在CPU执行写操作时，只写入Cache，不写入主存。 5.按照同一时间内各段之间的连接方式来分，流水线可分为哪两类？答：（1）静态流水线：在同一时间内，流水线的各段只能按同一种功能的连接方式工作。（2）动态流水线：在同一时间内，当某些段正在实现某种运算时，另一些段却在实现另一种运算。 6.Flynn分类法是根据什么对计算机进行分类的？将计算机分成哪几类？答：Flynn分类法，根据计算机中指令和数据的并行状况把计算机分成：（1）单指令流单数据流（SISD.；（2）单指令流多数据流（SIMD.；（3）多指令流单数据流（MISD.；（4）多指令流多数据流（MIMD.。四、问答与计算题（第1题10分，第2、3题每题15分共40分） 1.一个有快表和慢表的页式虚拟存储器，最多有64个用户，每个用户最多要用1024个页面，每页4K字节，主存容量8M字节。（1）写出多用户虚地址的格式，并标出各字段的长度。（2）写出主存地址的格式，并标出各字段的长度。

计算机体系结构参考1

第一题选择题 1．SIMD是指（B） A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2．下列那种存储设备不需要编址？D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3．按照计算机系统层次结构，算术运算、逻辑运算和移位等指令应属于（A）级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4．早期的计算机系统只有定点数据表示，因此硬件结构可以很简单。但是这样的系统有明显的缺点，下面哪一个不是它的缺点：B A．数据表示范围小 B．单个需要的计算时钟周期多 C．编程困难 D．存储单元的利用率很低 7．下面哪个页面替换算法实际上是不能够实现的？D A）随机页面替换算法 B）先进先出替换算法 C）最久没有使用算法 D）最优替换算法

9．指令优化编码方法，就编码的效率来讲，那种方法最好？C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10．在早期冯·诺依曼计算机特征中，机器以（C）为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A．先进先出顺序访问 B．按地址访问 C．无地址访问 D．按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段，每—段分别只有—个部件可供使用，并且执行时间分别为Δt、2Δt和3Δt，连续执行n条指令所需要花费的最短时间约为( C )。（假设“取指令”、“分析”和“执行”可重叠，并假设n足够大） A．6 nΔt B．2 nΔt C．3 nΔt D．nΔt 6、下列计算机不属于RISC计算机的是（C ）。 A．SUN：Ultra SPARC

计算机系统结构练习题及答案

计算机系统结构练习题及答案第一章计算机系统结构的基本概念 (一)单项选择题(在下列每小题的四个备选答案中，只有一个答案是正确的) 1. 计算机系统多级层次中，从下层到上层，各级相对顺序正确的应当是___。 A. 汇编语言机器级――操作系统机器级――高级语言机器级 B. 微程序机器级――传统机器语言机器级――汇编语言机器级 C. 传统机器语言机器级――高级语言机器级――汇编语言机器级 D. 汇编语言机器级――应用语言机器级――高级语言机器级答案:B 难度:1 初级、中级适于级别: 2. 汇编语言源程序变换成机器语言目标程序是经___ 来实现的。 .A. 编译程序解释 B. 汇编程序解释 C. 编译程序翻译 D. 汇编程序翻译答案:D 难度:1 适于级别:初级、中级 3. 直接执行微指令的是___。 A. 汇编程序 B. 编译程序 C. 硬件 D. 微指令程序答案: C 难度:1 适于级别:初级、中级

4. 对系统程序员不透明的应当是___。 A. Cache存贮器 B. 系列机各档不同的数据通路宽度 C. 指令缓冲寄存器 D. 虚拟存贮器答案: D 难度:1 适于级别:初级、中级 5. 对应用程序员不透明的是___。 A. 先行进位链 B. 乘法器 C. 指令缓冲器 D. 条件码寄存器答案:D 难度:1 适于级别:初级、中级。 6. 对机器语言程序员透明的是___ A. 中断字 B. 主存地址寄存器 C. 通用寄存器 D. 条件码答案:B 难度:1 适于级别:初级 7. 计算机系统结构不包括___。 A. 主存速度 B. 机器工作状态 C. 信息保护 D. 数据表示答案: A 难度:1 适于级别:初级、中级

计算机系统结构第1-8章部分作业答案复习课程

计算机系统结构第1-8章部分作业答案

第一章 1.6 某台主频为400MHz 的计算机执行标准测试程序，程序中指令类型、执行数量和平均时钟周期数如下：求该计算机的有效CPI 、MIPS 和程序执行时间。解：（1）CPI ＝(45000×1＋75000×2＋8000×4＋1500×2) / 129500＝1.776 (或 259 460 ) （2）MIPS 速率＝f/ CPI ＝400/1.776 ＝225.225MIPS (或 259 5180 MIPS) （3）程序执行时间= (45000×1＋75000×2＋8000×4＋1500×2)／ 400=575μs 1.9 假设某应用程序中有4类操作，通过改进，各操作获得不同的性能提高。具体数据如下表所示：（1）改进后，各类操作的加速比分别是多少？（2）各类操作单独改进后，程序获得的加速比分别是多少？（3）4类操作均改进后，整个程序的加速比是多少？解：根据Amdahl 定律Se Fe Fe S n + -= )1(1可得

4类操作均改进后，整个程序的加速比： 2.16)1(1 ≈+-=∑∑i i i n S F F S 1.10 第二章变长编码，哈夫曼编码第三章 3.12 有一条指令流水线如下所示：（1）求连续输入10条指令的情况下，该流水线的实际吞吐率和效率。（2）该流水线的瓶颈在哪一段？请采用两种不同的措施消除此瓶颈。对于你所给出的两种新的流水线，连续输入10条指令时，其实际吞吐率和效率各是多少？解：（1）本题主要考察对各功能段用时不等的线性流水线的性能计算公式的掌握情况。 2200(ns) 2009200)10050(50t n t T max k i i =?++++=?-+?=∑=)1(1 流水 )(ns 220 1 T n TP 1-==流水

计算机体系结构期末试卷及答案

课程测试试题（ A 卷） ----------------------以下为教师填写-------------------- I、命题院（部）：信息科学与工程学院 II、课程名称：计算机体系结构 III、测试学期：2014－2015学年度第2学期 IV、测试对象：信息学院计算机、网络专业 2012 级班 V、问卷页数（A4）： 3 页 VI、答卷页数（A4）： 4 页 VII、考试方式：闭卷（开卷、闭卷或课程小论文，请填写清楚） VIII、问卷内容：一、填空题（共30分，20空，每空分） 1、现代计算机系统是由（）和（）组成的十分复杂的系统。 2、计算机系统应能支持软件可移植，实现可移植性的常用方法有3种，即（），（），统一高级语言。 3、可以将当前大多数通用寄存器型指令集结构进一步细分为3种类型，即（）、（）和存储器-存储器型指令集结构。 4、MIPS指令DADDIU R14，R5，#6属于（）类型的指令格式；MIPS指令 SD R4，300（R5）属于（）类型的指令格式。 5、描述流水线的工作，常采用时空图的方法。在时空图中，横坐标表示（），纵坐标代表（）。 6、在MIPS指令实现的简单数据通路中，在WB周期中，有两大类指令执行操作：（）和（）指令。 7、存储器的层次结构中，“Cache－主存”层次是为了弥补主存（）的不足，“主存－辅存”层次是为了弥补主存（）的不足。 8、Cache实现的映像规则有全相联映像、（）和（）三种。 9、反映存储外设可靠性能的参数有可靠性、（）和（）。 10、根据系统中处理器个数的多少，可把现有的MIMD计算机分为两类，每一类代表了一种存储器的结构和互连策略。第一类机器称为（）结构，第二类机器具有（）。二、判断题（每小题1分，共10分） 1、从计算机语言的角度，系统结构把计算机系统按功能划分成多级层次结构，其中，第2级是操作系统虚拟机，第3级是汇编语言虚拟机。（） 2、计算机系统中提高并行性的3种途径中，资源重复是在并行性概念中引入时间因素，加快硬件周转而赢得时间。（） 3、指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的指令的CPI。（） 4、指令条数多，通常超过200条，是设计RISC的原则之一。（） 5、根据流水线中各功能段之间是否有反馈回路，可把流水线分为线性流水线和非线性流水线。（） 6、在多级存储体系中，“cache——主存”层次的存储管理实现主要由软件件实现。

计算机体系结构试题汇总

计算机系统结构姓名：学号：一、简答题（每小题10分，共20分） 1．简述使用物理地址进行DMA存在的问题，及其解决办法。 2．从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较（列表）。二、（60分）现有如下表达式： Y＝a ×X 其中：X和Y是两个有64个元素的32位的整数的向量，a为32位的整数。假设在存储器中，X和Y的起始地址分别为1000和5000，a的起始地址为6000。 1．请写出实现该表达式的MIPS代码。 2．假设指令的平均执行时钟周期数为5，计算机的主频为500 MHz，请计算上述MIPS 代码（非流水化实现）的执行时间。 3．将上述MIPS代码在MIPS流水线上（有正常的定向路径、分支指令在译码段被解析出来）执行，请以最快执行方式调度该MIPS指令序列。注意：可以改变操作数，但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图，计算调度前和调度后的MIPS代码序列执行所需的时钟周期数，以及调度前后的MIPS流水线执行的加速比。 4．根据3的结果说明流水线相关对CPU性能的影响。三、（20分）请分析I/O对于性能的影响有多大？假设： 1．I/O操作按照页面方式进行，每页大小为16 KB，Cache块大小为64 B；且对应新页的地址不在Cache中；而CPU不访问新调入页面中的任何数据。 2．Cache中95%被替换的块将再次被读取，并引起一次失效；Cache使用写回方法，平均50%的块被修改过；I/O系统缓冲能够存储一个完整的Cache块。 3．访问或失效在所有Cache块中均匀分布；在CPU和I/O之间，没有其他访问Cache 的干扰；无I/O时，每1百万个时钟周期中，有15,000次失效；失效开销是30个时钟周期。如果替换块被修改过，则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。