文档库 最新最全的文档下载
当前位置:文档库 › 清华大学计算机系统结构课后习题解答

清华大学计算机系统结构课后习题解答

清华大学计算机系统结构课后习题解答
清华大学计算机系统结构课后习题解答

《计算机系统结构》习题解答

目录

第一章(P33)

1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)

第二章(P124)

2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)

第三章(P202)

3.3(存储层次性能),3.5(并行主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法--实存状况图)

第四章(P250)

4.5(中断屏蔽字表/中断过程示意图),4.8(通道流量计算/通道时间图)

第五章(P343)

5.9(流水线性能/时空图),5.15(2种调度算法)

第六章(P391)

6.6(向量流水时间计算),6.10(Amdahl定律/MFLOPS)

第七章(P446)

7.3、7.29(互连函数计算),7.6-7.14(互连网性质),7.4、7.5、7.26(多级网寻径算法),7.27(寻径/选播算法)

第八章(P498)

8.12(SISD/SIMD算法)

第九章(P562)

9.18(SISD/多功能部件/SIMD/MIMD算法)

(注:每章可选1-2个主要知识点,每个知识点可只选1题。有下划线者为推荐的主要知识点。)

第一章(P33)

1.7

(1)从指定角度来看,不必要了解的知识称为透明性概念。 (2)见下表,“√”为透明性概念,“P ”表示相关课文页数。

1.8见下表,“√”为透明性概念,“P ”表示相关课文页数。

1.9见下表,“√”表示都透明,“应”表示仅对应用程序员透明,“×”表示都不透明。

1.12 已知Se=20 , 求作Fe-Sn 关系曲线。 将Se 代入Amdahl 定律得

e

n F S 20

1911

-=

1.13 上式中令Sn=2,解出Fe=10/19≈0.526

1.14 上式中令Sn=10,解出Fe=18/19≈0.947

1.15 已知两种方法可使性能得到相同的提高,问哪一种方法更好。

(1)用硬件组方法,已知Se=40,Fe=0.7,解出Sn=40/12.7≈3.1496(两种方法得到的相同性能) (2)用软件组方法,已知Se=20,Sn=40/12.7,解出Fe=27.3/38≈0.7184(第二种方法的百分比)

(3)结论:软件组方法更好。因为硬件组需要将Se 再提高100%(20→40),而软件组只需将Fe 再提高1.84%(0.7→0.7184)。 1.17 57.34

.15

5

9

.01.01≈=

+

=

n

S

Sn 20 1 0

1 Fe

1.18 记f ── 时钟频率,T=1/f ── 时钟周期,B ── 带宽(Byte/s )。 方案一:)/(44

11

s Byte f T

B =?=

方案二:)/(5.3421

%252%752s Byte f T

B =??+?=

1.19 由各种指令条数可以得到总条数,以及各百分比,然后代公式计算。

∑===4

1

5

10i i IC IC

(1)∑==?+?+?+?=?

=4

1

55.108.0215.0232.0245.01)(i i

i IC

IC CPI CPI

(2)806.2555.140

10

55.11040106

66≈=??=?=CPI f MIPS (3)(秒)003876.040055

.110

6

≈=?=

MIPS IC T 1.21 (1)24.21.0812.0418.026.01=?+?+?+?=CPI

(2)86.171024.21040106

66≈??=?=

CPI f MIPS

1.24 记Tc ── 新方案时钟周期,已知CPI = CPI i = 1 原时间 = CPI × IC × 0.95Tc = 0.95IC ×Tc 新时间 = (0.3×2/3+0.7)× IC × Tc = 0.9IC ×Tc 二者比较,新时间较短。

第二章(P124)

2.3(忽略P124倒1行 ~ P125第8行文字,以简化题意)已知2种浮点数,求性能指标。 此题关键是分析阶码、尾数各自的最大值、最小值。

原图为数据在内存中的格式,阶码的小数点在其右端,尾数的小数点在其左端,遵守规格化要求。

由于尾数均为原码,原码的绝对值与符号位无关,所以最大正数与最小负数的绝对值相同,可用“±最大绝对

值”回答;最小正数与最大负数的绝对值相同,可用“±最小绝对值”回答。

第1小问中,阶码全部位数为8,作无符号数看待真值为0~255,作移-127码看待真值为-127~+128;尾数(不计符号位)有23位小数,另加1位整数隐藏位,所以尾数绝对值为1.0~2.0 – 2-23

,有效位数p=24; 第2小问中,阶码全部位数为11,作无符号数看待真值为0~2047,作移-1023码看待真值为-1023~+1024;尾数(不计符号位)有52位小数,另加1位整数隐藏位,所以尾数绝对值为1.0~2.0 – 2-52

,有效位数p=53。 最大绝对值为最大阶码与最大尾数绝对值的组合,最小绝对值为最小阶码与最小尾数绝对值的组合。代入相关公式后得最终结果如下表。

2.5

(1) r m = 2,r e = 2,p = 24(隐藏最高位),q = 7。 (2) N max = 1.7×1038

,-|N|min = -1.47×10-39

δ ≤ 5.96×10-8 ≈ 10

-7.22

,η = 100%

2.6

(1) 0.2 = 0.333333H ×160

设阶码为移-63码(即-26

+1,原题未指明)

0.2 = 0.110011001100110011001101B ×2-2

(其中最高有效位需隐藏) 阶码为移-127码(即-27

+1)

(2) 符号位不变,(阶码 – 63)×4 + 127;尾数左规,除去最高位;

(3) 符号位不变,(阶码 – 127)/ 4 + 63;尾数补最高位,按除法余数右移若干位,左补0。

2.13 已知10条指令使用频度,求3种编码方法的平均码长与信息冗余量。

(1)此问中的“最优Huffman 编码法”实际是指码长下限,即信源的平均信息量──熵,代公式得H=2.9566。 (2)Huffman 编码性能如下表;

(3)2/8扩展编码是8/64/512法的变种,第一组2条指令,码长为2(1位扩展标志,1位编码),第二组8条指令,码长为4(1位扩展标志,与第一组区别,加3位编码),编码性能如下表;

(4)3/7扩展编码是15/15/15法的变种,第一组3条指令,码长为2(共有4种组合,其中3种组合分别代表3条指令,留1种组合作为扩展前缀标志),第二组7条指令,码长为5(2位固定的前缀扩展标志,与第一组区别,加3位编码,只用其中7种组合),编码性能如下表。

2.15

(1) 15条/63条/64条 (2) 14条/126条/128条

第三章(P202)

3.3 直接代公式计算存储层次性能指标。 (1)74ns ,38ns ,23.6ns (2)0.258,0.315,0.424 (3)T256K < T128K < T64K c256K > c128K > c64K

(4)19.092,11.97,10.0064。答案是256K 方案最优。

3.5 已知g

g K n

n )1(1--=

,其中g=0.1

依题意有2.0)1(12.0)1(111

+--=+≥--=++g

g K g g K n n n n

整理得0.9n

≥0.2,解出28.159

.0lg 2

.0lg ≈≤

n

,向下取整,得15;

按另一种题意理解是向上取整,得16,也对。

3.15 欲知可能的最高命中率及所需的最少主存页数,较好的办法是通过“堆栈模拟法”,求得命中次数随主存页数变化的函数关系。下图就是“堆栈模拟图”,其中“√”表示命中。

(1)H max =7/12≈58.3%

(2)n=4

(3)当1次页面访问代表连续1024次该页内存储单元访问时,后1023次单元访问肯定是命中的,而第1次单元

n=1 0 n=2 1 n=3 3 n=4 7 n=5

7

访问的命中情况与这1次页面访问的命中情况相同。根据上图中最高命中情况,共有7次页命中(折算为7×1024次单元命中),5次页不命中(折算为5×1023次单元命中,也可写为5×1024-5),单元访问总次数为12×1024,故有:

H cell =(12×1024-5)/(12×1024)=12283/12288≈99.96%

3.15加1题 一个二级存储层次,采用全相联映象与最久没有使用算法,实存共5页,为2道程序分享,页地址流分别如下

P 1 = 1 2 3 4 1 3 2 1 P 2 = 1 2 3 4 2 2 3 3

试作2个实存分配方案,分别使2道程序满足 (1)命中率相同; (2)命中次数之与最大。

解:分别为2道程序作“堆栈模拟图”,其中“√”表示命中。

将两图结果综合,得到4个分配方案的命中率情况表如下

结论如下

(1)命中率相同的方案是n 1= 3而n 2= 2;

n 1= 1

0 n 1= 2

0 n 1= 3 2 n 1= 4

4

n 2= 1 2 n 2= 2 2 n 2= 3 4 n 2= 4

4

(2)命中次数之与最大的方案是n 1= 4而n 2= 1。

3.19中(3)(4)(6)(8)问 (3)

(4)通过作“实存状况图”模拟各虚块的调度情况,可获得Cache 的块地址流序列。

此问最容易出错的地方是忽略“组相联”地址约束,将虚页装错实组。另外没有及时标注“*”号也容易导致淘

汰对象错误。 (6)H=4/12≈33%

(8)做法同3.15题(3)问,H cell =(12×16-8)/(12×16)≈95.8%

第四章(P250)

4.5 已知中断服务次序为3-2-4-1,。 (1)中断屏蔽字表如下图; (2)中断过程示意图如右图。

虚存

实页 0 1 2 3 虚组0 0 √ √ 1 √ √ 虚组1 实组0 2 √ √ 虚 3 √ √ 虚组2 实组1

页 4 √ √ 5 √ √ 虚组3

6 √ √

7

(a) 虚页集合与实页集合的对应关系

(b) 对应关系表(√为有关系)

C=

2

3

1

2

3

1

1

2

3

时间 中断请求 主程序

1级 2级 3级 4级

D1,D2 D3,D4

4.8

(1)f=2×105

字节/秒,T=5us

(2)Ts+Td=5us ,通道时间图如下。作图时注意:至少要画到最慢设备的第二次请求出现,才能确定是否丢失数据(因为响应优先级低的设备较易丢失数据)。

(3)5,160,20,40;

(4)D2丢失第一次请求的数据; (5)参见P245。

第五章(P343)

5.9 为了缩短运算时间,首先应考虑“最少切换算法”,即先执行完所有乘法(任务编号1-6)再执行加法(任务编号7-11),其次在加法中采用“最少相关算法”(即二叉树算法)。

记c 1=A 1×B 1,……,c 6=A 6×B 6,下图(a)是加法的计算顺序二叉树,注意任务10应该用前一级最早完成的任务7与8的结果,如果用任务9的结果则要推迟1拍启动,使总时间增加1拍。

设 优 备 先 号

D1 D2 D3 D4 时间

(us) 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170

F=c 1+c 2+c 3+c 4

+c 5+c 6 6 5 7 8 9

4 3 10 2

1

11

(a)

(b)

根据时空图(b)得 TP = 11/(22Δt) = 1/(2Δt)

S = (6×4Δt + 5×4Δt)/(22Δt) = 2 E = (6×4Δt + 5×4Δt)/(6×22Δt) = 1/3

5.15 Δt=10ns=10-8

秒 (1)F={1,2,5},C=(10011) (2)状态转移图如下图(a)所示。

(3)最小启动循环=(3),最小平均启动距离=3Δt 。

(4)插入2个延迟,最小启动循环=(2),最小平均启动距离=2Δt 。 (5)新预约表如下图(b)所示。

(6)F={1,3,7},C=(1000101),状态转移图如下图(c)所示。

(7)插入前TP max = 1/3Δt = 1/30ns ,插入后TP max = 1/2Δt = 1/20ns 。

(8)插入前TP = 10/33Δt = 1/33ns ,插入后TP = 10/26Δt = 1/26ns ,如下图所示。

6

4,6,≥8

(a)

(b)

(c)

S4

S3

S2

S1 (a) 插入前

D

D

S4

S3

S2

S1 (b) 插入后

第六章(P391)

6.6(注意阅读P372倒数第9行-倒数第6行)

已知n=32,k 加=6,k 乘=7,k 访存=6,k 倒数=14,启动、输出延迟各1。求各小题总拍数。

(4) V0 ← 存储器 链接 V1 ← 1 / V0

链接

V3 ← V1 + V2

链接

V5 ← V3 * V4

乘总拍数=72(各条依次链接)

(3) V0 ← 存储器

并行

V3 ← V1 + V2 链接

V4 ← V0 * V3 加 乘

总拍数=87(第4条功能部件冲突)

(1) V0 ← 存储器 V1 ← V2 + V3 并行 V4 ← V5 * V6 加 乘 总拍数=40(并行执行,以最长指令为准) (2) V2 ← V0 * V1

并行

V3 ← 存储器

V4 ← V2 + V3 串行(P372) 乘 加总拍数=79(第3条错过时机,不能链接)

6.10 已知向量速率Rv = 10MFLOPS ,标量速率Rs = 1MFLOPS ,并记α为可向量化百分比。

(1) 推导法1:使用Amdahl 定律,在这里可将标量速率Rs 作为原速率,局部加速后的速率为向量速率Rv ,于是局部加速比Se=10,全局加速比为

e

n S S α

α+

-=

)1(1

再根据加速比的定义,s

n

R R S α

=

,所以有MIPS S R S R R e

s

n s α

α

αα9.011

)1(-=

+

-=

?=。

(5) V0 ← 存储器 V1 ← V2 + V3

并行 V4 ← V5 * V6 s0 ← s1 + s2

串行

加 乘

总拍数=48(标量看成1个分量的向量) (6) V3 ← 存储器 并行 V2 ← V0 + V1

串行

s0 ← s2 + s3

并行

V3 ← V1 * V4

加 乘 总拍数=79(标量看成1个分量的向量) (7) V3 ← 存储器

并行 V2 ← V0 + V1 链接

V4 ← V2 * V3 存储器 ← V4

串行 加 乘 总拍数=87(第4条功能部件冲突)

(8) V0 ← 存储器

链接 V2 ← V0 + V1 V3 ← V2 * V1 串行 V5 ← V3 * V4 串行 加 乘 总拍数=127(Vi 冲突,功能部件冲突)

(若将向量速率Rv 作为原速率,局部减速后的速率为标量速率Rs ,则局部加速比Se=0.1,推出的全局加速比Sn 同上式。)

推导法2:为了推导,定义T 为总时间,N 为总任务数。于是有平均速率Ra = 吞吐率TP = N/T 。记N = Nv + Ns ,且s

v v

v N N N N N +==

α

,则s

v s

s N N N N N +==

-α1,于是有Nv = α·N 与Ns = (1-α)·N

显然:总时间s

v s s v v s v R N R N R N R N T T T

?-+?=+=

+=)1(αα

所以:s

v s v a

R R R N

R N N T N R 1)1(11

)1(?-+?=

?-+?==

αααα

或者:

s

v a R R R 1

)1(11?-+?=αα

(2) 已知Rv = 10MFLOPS ,Rs = 1MFLOPS ,

MFLOPS MFLOPS R a α

αα91010)1(1.01-=-+=

Ra 与α的关系图如右图所示。

(3) 已知Ra = 7.5MFLOPS ,解出

%9696.015

13910)5.711(910=≈?=-=

α (4) 已知Ra = 2MFLOPS ,α = 0.7,解出

)(5.313.02

1

7.01

)1(1MFLOPS R R R s

a v =?-=

?--=

αα

第七章(P446)

7.3 已知输入端编号13 = 1101B 。 (1)Cube 3(1101B) = 0101B = 5

(2)PM2+3(13) = (13 + 23

)mod 16 = 21 mod 16 = 5 (3)PM2+0(13) = (13 - 20)mod 16 = 12 (4)Shuffle(1101B) = 1011B = 11

(5)Shuffle(Shuffle(1101B)) = Shuffle(1011B) = 0111B = 7

7.4 用多级混洗―交换网络,n = 4,拓扑结构同教材P410图7.21(e),控制信号=1010B ,自左向右各级交换开Ra

10 1 0

1 α

关状态依次为交换―直连―交换―直连。

7.5 输入结点编号j = 9,f(j) = j⊕控制信号 = 1001B⊕1100B = 0101B = 5,答为5号处理机。

7.6 直连状态时:编号在第i位不同的结点之间不能通信;

交换状态时:编号在第i位相同的结点之间不能通信。

7.7 用单级混洗―交换网可实现,总共混洗3步。

证:设矩阵A = (a ij)8×8按行展开依次存放在64个单元中,则任意元素a ij的地址为8i + j,而a ji的地址为8j + i。按混洗函数的定义,3次混洗后,shuffle3(8i + j) = 8×(8i + j) mod 63 = i + 8j,也就说将元素a ij地址变换成a ji的地址。由于a ij是矩阵中的任意元素,所以3次混洗可实现矩阵转置(a ij)T8×8=(a ji)8×8。

7.8 最多5级,因为对于任给的输入结点编号j=X6X5X4X3X2X1X0,PM2I多级网络中i=2级的功能是PM2±2(j)=j±22mod 128,±22运算只有可能改变j中的X6~X2,所以最多使用Cube6~Cube2就能实现代换了。

7.9 由于N = 16,即n = 4,每个结点编号用4位二进制数表示。PM2±0函数功能是对结点编号加1或减1,其结果最多可将编号的4位都取反(如1111B + 1 = 0000B),所以用每步只能对1位取反的单级立方体网络来模仿,最差情况下要4步。

7.10 用混洗―交换网络模拟Cube网。

当模拟Cube0功能时,只需一次交换即可完成;而模拟Cube i且i≠0时,需先作n –i步混洗,再作1步交换,最后作i步混洗才能完成,共计n + 1步。

综上所述,下限为1步,上限为n + 1步。

7.11 求单级立方体网络与单级混洗―交换网络的最大广播步数,这两种网络的最大广播步数与最大距离(即直径)相同。

(1)单级立方体网络直径 = n(Cube n-1~Cube0各1次);

(2)单级混洗―交换网络直径 = 2n-1(n-1次混洗,n次交换)。

7.12 已知N = 16,用多级立方体网络或者多级混洗―交换网络均能实现,两者可以互相模拟,对同一置换的寻径算法相同,控制信号也相同,下面以多级立方体网络为例分析。

4组4元交换:f1 = Cube1Cube0;

2组8元交换:f2 = Cube2Cube1Cube0;

1组16元交换:f3 = Cube3Cube2Cube1Cube0;

利用Cube函数的结合律、交换律以及同一律(又称自反律)可以推得

f = f1f2f3 = Cube3Cube1Cube0

拓扑结构图略(可参考7.26题的多级混洗―交换网络拓扑结构图)。

网络开关使用级控方式,控制信号为1011B(其中bit i控制级i,“0”表示直连,“1”表示交换)。

7.13 N = 8的蝶式置换。 (1) f(X 2X 1X 0) = X 0X 1X 2;

(2) 至少需2次通过,每次都是N 个数据同时发送,同时接收,中途不储存; (3) 控制信号的设置有4种方案,如下所示。其中“0”表示直连,“1”表示交换。

101 100 001 101 000 000 000 000 000 000 000 000 101 100 001 101 000 000 000 000 101 100 001 101 101 100

001 101

000 000

000 000

7.14

(1) 共N!种; (2) 一次通过有2

N

N

种不同;

(3) N = 8时,百分比 =

%16.10%100!

88%100!4

2

≈?=?N N N

7.26(1)~(3); (1)见下图实线。

(2)见下图虚线;不会阻塞,因为两条路径的控制信号都是1110,形成级控模式,所以不会阻塞。

(3)一次通过实现的置换数为16 8

= 4294967296,全部置换数为N! = 20922789888000,前者约占后者的0.02%。

7.27

(1) 已知N = 64,n = 6,源结点s = 101101B ,目的结点d = 011010B ,方向矢量r = s ⊕d = 110111B ,以低维度优先顺序寻径,路径为 s = 101101B → 101100B → 101110B → 101010B → 111010B → 011010B = d (下划线为当前寻径维) (2) 求给定无向图中2棵选播树(即生成树)。

(i) 求最小成本生成树(通道数最少),可考虑Prim 算法、Kruskal 算法或标记法。一个参考操作方法是:先对临近结点群分别构造最短子树,然后在子树之间作最短互连。

(ii) 求由结点(3,5)出发的单源最短路径生成树(各距离最短),可考虑贪心算法。对X-Y 网格图来说,从树根到某一树叶的任何路径只要在各维均无反向移动即为最短路径(满足此条件的最短路径有多条)。要得到单一树根对于多片树叶的综合最短路径,可以先分别作出各条单播最短路径,然后在不增加各路径长度的前提下,尽可能地进行路段合并。

级3 级2 级1 级0 0000

0000 0001 0001 0010 0010 0011 0011 0100 0100 0101 0101 0110 0110 0111 0111 1000 1000 1001 1001 1010 1010 1011 1011 1100 1100 1101 1101 1110 1110 1111 1111

这两小问结果如下图所示(其中b 图第一步必须选择向下,而不能向右)。

(a)

(b)

(3) 求作超立方体贪心选播树。

7.29 已知N = 256,n = 8,起始结点编号j = 123 = 01111011B 。根据混洗函数的循环移位性质,Shuffle 10

(j) = Shuffle 2

(j) = 11101101B = 237

第八章(P498)

8.12 问题为S=A1×B1+……+A32×B32,其中T 乘=4Δt ,T 加=2Δt ,T 传=1Δt 。

(1) 在串行计算机上,各操作不论是否相关均不能重叠,总时间恒等于各操作单独时间之与,所以不必考虑运算顺序。T=32·T 乘+31·T 加=(32×4+31×2)Δt=190Δt

(2) 设此双向环可以并行传送(即为“移数环”,因为SIMD 系统各种数据操作都能并行)。 按平均分配原则,每个结点内有4对数据。

首先在各结点用串行算法它们的相乘与求与,需时T 1=4·T 乘+3·T 加=(4×4+3×2)Δt=22Δt ;

然后用二叉树并行算法将8个结点中的部分与相加(见下图),其中并行加法需3次,每次时间相同,而并

行传送3次的每次时间却随距离倍增,依次为1、2、4步,所以有T 2=(1+2+4)·T 传+3·T 加=(7×1+3×2)Δt=13Δt ;

总时间T=T 1+T 2=35Δt

第九章(P562)

9.18 问题为S=(A1+B1)×……×(A8+B8),其中T 加=30ns ,T 乘=50ns ,T 传=10ns 。

将加法记为任务1-8,乘法记为任务9-15。

(1) 在串行计算机上,同8.12题1问分析,共计15步运算,T=8·T 加+7·T 乘=(8×30+7×50)ns=590ns 。 (2) 多功能部件SISD 计算机的工作方式可参考P346题18(3)。 为了充分利用加法器与乘法器的可并行性,尽量让加法与乘法交替进行,可自左向右顺序运算(见下图)。T=2·T 加+7·T 乘=(2×30+7×50)ns=410ns

(3) 同8.12题2问,设单向环可以并行传送(即为“移数环”,理由同8.12题2问)。

s = s 1 + s 2 + s 3 + s 4 + s 5 + s 6 + s 7 + s 8

①.右传20步 加法1步 ②.右传21步 加法1步 ③.右传22步 加法1步

A2 B2 A1 B1

T=T 加+3·T 乘+(1+2+4)·T 传=(30+3×50+7×10)ns=250ns

(4)在全互连网络上,任意两个结点之间的距离均为1步,所以任何置换都能在1步完成,故 T=T 加+3·T 乘+(1+1+1)·T 传=(30+3×50+3×10)ns=210ns

8

计算机系统结构课后答案

1、数据结构和机器的数据表示之间是什么关系?确定和引入数据表示的基本原则是什么? 答:数据表示是能由硬件直接识别和引用的数据类型。数据结构反映各种数据元素或信息单元之间的结构关系。数据结构要通过软件映象变换成机器所具有的各种数据表示实现,所以数据表示是数据结构的组成元素。不同的数据表示可为数据结构的实现提供不同的支持,表现在实现效率和方便性不同。数据表示和数据结构是软件、硬件的交界面。 除基本数据表示不可少外,高级数据表示的引入遵循以下原则:(1)看系统的效率有否提高,是否养活了实现时间和存储空间。(2)看引入这种数据表示后,其通用性和利用率是否高。 2、标志符数据表示与描述符数据表示有何区别?描述符数据表示与向量数据表示对向量数据结构所提供的支持有什么不同? 答:标志符数据表示指将数据类型与数据本身直接联系在一起,让机器中每个数所都带类型樗位。其优点是:(1)简化了指令系统和程序设计;(2)简化了编译程序;(3)便于实现一致性校验;(4)能由硬件自动变换数据类型;(5)支持数据库系统的实现与数据类型无关;(6)为软件调试和应用软件开发提供支持。缺点是:(1)会增加程序所点的主存空间;(2)在微观上对机器的性能(运算速度)不利。 数据描述符指数据的描述与数据分开存放,描述所访问的数据是整块还是单个的,及访问该数据块或数据元素的地址住处它具备标志符数据表示的优点,并减少了标志符数据表示所占的空间,为向量和数组结构的实现提供支持。 数据描述符方法优于标志符数据表示,数据的描述与数据分开,描述所访问的数据是整块还是单个的,及访问该数据块或数据元素的地址信息,减少了樗符数据表示所占的窨。用描述符方法实现阵列数据的索引比用变址方法实现要方便,且便于检查出程序中的阵列越界错误。但它不能解决向量和数组的高速运算问题。而在有向量、数组数据表示的向量处理机上,硬件上设置有丰富的赂量或阵列运算指令,配有流水或阵列方式处理的高速运算器,不仅能快速形成向量、数组的元素地址,更重要的是便于实现把向量各元素成块预取到中央处理机,用一条向量、数组指令流水或同时对整个向量、数组高速处理.如让硬件越界判断与元素运算并行。这些比起用与向量、阵列无关的机器语言和数据表示串行实现要高效的多。 3、堆栈型机器与通用寄存器型机器的主要区别是什么?堆栈型机器系统结构为程序调用的哪些操作提供了支持? 答:有堆栈数据表示的机器称为堆栈机器。它与一般通用寄存器型机器不同。通用寄存器型

计算机系统结构考试计算题

3.12 有一指令流水线如下所示 (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。 对于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1) 2200(ns)2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1 T n T P 1pipeline -== 45.45%11 5 4400T P m t T P E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 ? 变成八级流水线(细分) 850(ns)509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n T P 1pipeline -== 58.82%17 10 8400T P m ti T P E m 1 i ≈=? =?? =∑= ? 重复设置部件 出 50ns 50ns 100ns 200ns

)(ns 85 1 T n T P 1pipeline -== 58.82%17 10885010400E ≈=??= 3.13 4段组成,3段时,一次,然4段。如果 需要的时间都是,问: (1) 当在流水线的输入端连续地每时间输入任务时,该流水线会发生 什么情况? (2) 此流水线的最大吞吐率为多少?如果每输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少? (3) 当每段时间不变时,如何提高该流水线的吞吐率?仍连续处理10个 任务时,其吞吐率提高多少? (2) t ?t ?2

课后习题答案

第一章 液压传动概述 液压传动系统由哪几部分组成各组成部分的作用是什么 解答:液压传动由以下四部分组成: (1)动力元件(液压泵):它是把原动机输出的机械能转换成油液压力能的元件。作用:给液压系统提供压力油,是液压系统的心脏。 (2)执行元件:包括液压缸和液压马达等。 作用:把油液的压力能转换成机械能以驱动工作机构的元件。 (3)控制元件:包括压力、方向、流量控制阀。作用:是对液压系统中油液的压力、流量和流动方向进行控制和调节的元件。 (4)辅助元件:除上述三项以外的、液压系统中所需的其它装置。如油箱、滤油器、油管、管接头等。作用:保证液压系统有效工作,寿命长。 第二章 液压泵和液压马达 要提高齿轮泵的压力需解决哪些关键问题通常都采用哪些措施 解答:(1)困油现象: 采取措施:在两端盖板上开卸荷槽。(2)径向不平衡力:采取措施:缩小压油口直径;增大扫膛处的径向间隙; 过渡区连通;支撑上采用滚针轴承或滑动轴承。(3)齿轮泵的泄漏: 采取措施:采用断面间隙自动补偿装置。 齿轮泵的模数 mm m 4=,齿数9=z ,齿宽mm B 18=,在额定压力下,转速min 2000r n =时,泵的 实际输出流量min 30L Q =,求泵的容积效率。 解答:()() 2 2630 0.876.6~7 6.69418200010v t q q q zm bn η-= ===????? YB63型叶片泵的最高压力MPa P 3.6max =,叶片宽度mm B 24=,叶片厚度mm 25.2=δ,叶片数 12=Z ,叶片倾角?=13θ,定子曲线长径mm R 49=,短径mm r 43=,泵的容积效率9.0=v η,机械效率 90.0=m η,泵轴转速min 960r n =,试求:(1) 叶片泵的实际流量是多少(2)叶片泵的输出功率是多少 解答: (1) ()()()()() 22 223 322cos 20.0490.04320.0490.0430.024120.0249600.9cos131.0210v R r q R r bz Bn m s πηφπ-??=--???? ?-?? =--?????????? =? (2) 633 6.310 1.0210 6.4210N pq -==???=?出 斜盘式轴向柱塞泵的斜盘倾角?=20β,柱塞直径mm d 22=,柱塞分布圆直径mm D 68=,柱塞数7=z ,机械效率90.0=m η,容积效率97.0=v η,泵转速min 1450r n =,泵输出压力MPa p 28=,试计算:(1)平

计算机系统结构有详细答案

(仅供参考,不作为考试标准), 选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员 。意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速 。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同 栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法 象联组,相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高 是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路 令指条下析分后推C) 令指条下行执后推D) 流的用采,时关据数到,中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

计算机系统结构课后答案unit3

第3章总线、中断与输入输出系统 3.1.简要举出集中式串行链接,定时查询和独立请求3种总线控制方式的优缺点。同时分析硬件产生故障时通讯的可靠性。 答:集中式串行链连接方式。其过程为: ①所有部件都经公共的“总线请求”线向总线控制器发使用总线申请。 ②当“总线忙”信号未建立时,“总线请求”才被总线控制器响应,送出“总线可用”信号,它串行地通过每个部件。 ③如果某部件未发过“总线请求”,则它将“总线可用”信号往下一部件转,如果某部件发过“总线请求”,则停止“总线可用”信号的传送。 ④该部件建立“总线忙”,并除去“总线请求”,此时该部件获得总线使用权,准备传送数据。 ⑤数据传送期间,“总线忙”维持“总线可用”的建立。 ⑥传送完成后,该部件去除“总线忙”信号和“总线可用”信号。 ⑦当“总线请求”再次建立时,就开始新的总线分配过程。 优点:①选择算法简单;②控制总线数少;③可扩充性好;④可靠性高。 缺点:①对“总线可用”线及其有关电路失效敏感,②不灵活;③总线中信号传送速度慢。 集中式定时查询方式,过程: ①总线上每个部件通过“总线请求”发请求。 ②若“总线忙”信号未建立,则计数器开始计数,定时查询个部件,以确定是谁发的请求。 ③当查询线上的计数值与发出请求的部件号一致时,该部件建立“总线忙”,计数停止,查询也停止。除去“总线请求”,该部件获得总线使用权。 ④“总线忙”维持到数据传送完毕。 ⑤数据传送完,去除“总线忙”。 ⑥当“总线请求”线上有新的请求,就开始下一个总线分配过程。 优点:①优先次序灵活性强;②可靠性高。 缺点:①控制线数较多;②扩展性较差;③控制较为复杂;④总线分配受限于计数信号,不能很高。 集中式独立请求方式,过程:

计算机系统结构试卷B

《计算机系统结构B卷》 一、填空题(每小题1.5分,共30分)。 1.对系列机而言,必须保证做到软件,力争做到软件向上兼容。 2.由软件实现的计算机称之为。 3. 多处理机系统按组织形式分有三种,功能分布是多处理机系统分工方式。 4.依据从哪一层开始设计,计算机体系结构设计的主要方法有三种,占据主导地位的是设计。 5. 在先行控制方式实现流水线的处理器中,有先行指令、先行操作、先行读数和后行写数等四个缓冲栈,缓冲深度最大的是。 6.按流水线的功能多寡分,可分为单功能流水线和。 7. 用于表示非线性流水线中的任务对未进入流水线的后继任务流入流水线的时间间隔的约束称为。 8.中断转移相关处理的基本方法包括不精确断点法和。 9. 互连网络中任意两个结点之间距离的最大值称为。 10.在多级交叉开关互联网络中,交叉开关的控制方式有、组控制和单元控制。 11. 在多计算机系统的互连网络中,通信模式包括、选播、广播和会议等四种。 12. 描述网络寻径效率常用的两个参数是通道流量和。 13.自定义数据表示包括标志符和两种数据表示。 14. 浮点数尾数基值越大,浮点数表示的数据范围。 15. 根据运算类型指令操作数存储方法不同,指令集结构可分为堆栈型、累加器型和。 16. 标量处理机是否高度并行是以指令级并行度(ILP)为来区分。 17.存储系统的基本存储层次有、主存储器和辅助存储器。 18. 采用并行存储器的目的是。 19. 从时间开销来看,伪命中的时间正常命中的时间。 20. 增加Cache存储系统的相联度,可降低Cache的不命中率,但会增加Cache 的。

二、简答题(每小题6分,共30分)。 1.多计算机系统和多处理机系统的差别有哪几方面?其中最根本的差别是哪个方面? 2. 什么是流水线相关?流水线相关可分为哪几大类? 3. 什么是动态互连网络?动态互连网络的互联形式有哪几种? 4. 指令系统设计包括哪两个方面?指令格式优化设计的目的是什么? 5. 维护Cache与主存一致性的更新算法有哪些? 三、分析题(第一小题8分,第二小题12分,共20分)。 1.某种处理机10条指令的使用频度分别为:0.25,0.20,0.15,0.10,0.08,0.08,0.05,0.04 ,0.03 ,0.02,试画出该处理机进行Huffman编码时的一棵Huffman树。 2. 在某采用全相联映象、相联目录表实现地址变换Cache存储器中,Cache 的容量是8KB,主存是由4个存储体组成的低位交叉访问存储器,主存总容量是32MB,每一个存储体的字长是32位,。 (1)写出主存地址和Cache地址的格式,并标出各字段的长度。 (2)说明目录表的行数、相联比较的位数和目录表的宽度。 四、计算题(第一小题8分,第二小题12分,共20分)。 1. 设16个处理器编号分别为0、1、……、15,用单级互连网络连接,当互连函数分别为:(1)Cube3、(2)PM+3、(3)Shuffle(Shuffle)时,第13号处理器分别与哪一个处理器相连? 2. 有一条5个功能段的线性动态多功能流水线如图所示,其中1→2→3→5功能段组成加法流水线,1→4→5功能段组成乘法流水线,设每个功能段的延迟时间 均相等为△t。用这条流水线计算F=4 1() i i i a b = + ∏,画出流水线时空图,并计算流水线的实际吞吐率、加速比和效率。 Z

图论 张先迪 李正良 课后习题答案

习题一 作者---寒江独钓 1.证明:在n 阶连通图中 (1) 至少有n-1条边; (2) 如果边数大于n-1,则至少有一条闭迹; (3) 如果恰有n-1条边,则至少有一个奇度点。 证明: (1) 若G 中没有1度顶点,由握手定理: ()2()21v V G m d v n m n m n ∈= ≥?≥?>-∑ 若G 中有1度顶点u ,对G 的顶点数作数学归纳。 当n=2时,结论显然;设结论对n=k 时成立。 当n=k+1时,考虑G-u,它仍然为连通图,所以,边数≥k-1.于是G 的边数≥k. (2) 考虑G 中途径: 121:n n W v v v v -→→→→L 若W 是路,则长为n-1;但由于G 的边数大于n-1,因此,存在v i 与v j ,它们相异,但邻接。于是: 1i i j i v v v v +→→→→L 为G 中一闭途径,于是 也就存在闭迹。 (3) 若不然,G 中顶点度数至少为2,于是由握手定理: ()2()21v V G m d v n m n m n ∈= ≥?≥?>-∑ 这与G 中恰有n-1条边矛盾! 2.(1)2n ?12n 2?12n ?1 (2)2n?2?1 (3) 2n?2 。 证明 :u 1的两个邻接点与v 1的两个邻接点状况不同。所以, 两图不同构。 4.证明下面两图同构。 u 1 v 1

证明:作映射f : v i ? u i (i=1,2….10) 容易证明,对?v i v j ∈E ((a)),有f (v i v j,),=,u i,u j,∈,E,((b)) (1≤ i ≤ 10, 1≤j ≤ 10 ) 由图的同构定义知,图(a)与(b)是同构的。 5.指出4个顶点的非同构的所有简单图。 分析:四个顶点的简单图最少边数为0,最多边数为6,所以 可按边数进行枚举。 (a) v 2 v 3 u 4 u (b)

计算机系统结构专业简历

计算机系统结构专业简历 写简历时:使用语言力求平实、客观、精炼,篇幅视工作所限为1-2页,工作年限5年以下,通常以1页为宜;工作年限在5年以上,通常为2页。以下是小编为大家搜集整理提供到的计算机系统结构专业简历内容,希望对您有所帮助。欢迎阅读参考学习! 计算机系统结构专业简历俞xx 一年以上工作经验|男|25岁(1991年7月17日) 居住地:南京 电话:138*******(手机) E-mail:XXX 最近工作[7个月] 公司:XX有限公司 行业:网络游戏 职位:游戏策划师 最高学历 学历:本科 专业:计算机系统结构 学校:南京理工大学 自我评价 本人品行端正,谦虚谨慎,吃苦耐劳,综合素质好。交际、沟通能力较强,拥有创新思维,有团队精神并能承受较大的工作

压力。性格直爽、乐观、自信的我,为人坦城、做事认真、接受与理解力强,爱好唱歌、爬山等。对于自己要做的事情一定会尽心尽力尽职尽责将其做到最好,不管在任何环境下都能用最短的时间去适应。 求职意向 到岗时间:可随时到岗 工作性质:全职 希望行业:网络游戏 目标地点:南京 期望月薪:面议/月 目标职能:游戏策划师 工作经验 2015/2 – 2015/9:XX有限公司[7个月] 所属行业:网络游戏 策划部游戏策划师 1.参与项目的战斗设计,完成第二版角色动作、技能、战斗打击效果设计及跟进。 2.参与部分关卡设计,包括场景排布和怪物场景内刷新规则,怪物AI和技能的设计。 3.针对项目第二版新手引导流程设计与优化,对项目各个系统功能的BUG测试修复以及体验优化。 2014/6 – 2015/1:XX有限公司[7个月] 所属行业:网络游戏

完整版计算机体系结构课后习题原版答案_张晨曦著

第1章计算机系统结构的基本概念 (1) 第2章指令集结构的分类 (10) 第3章流水线技术 (15) 第4章指令级并行 (37) 第5章存储层次 (55) 第6章输入输出系统 (70) 第7章互连网络 (41) 第8章多处理机 (45) 第9章机群 (45) 第1章计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。

计算机系统结构期末考试题目

第一章: 1.计算机系统结构的定义 答:由程序设计者看到的一个计算机系统的属性,即概念性结构和功能特性。 2.透明性概念 答:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,称为透明性现象。 3.兼容性向后兼容 兼容性:同一个软件可以不加修改地运行于系统结构相同的各档机器,可获得相同的结果,差别只在于不同的运行时间。 向后兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律 答:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答:每条指令的平均时钟周期数。 6.MIPS 答:每秒百万条指令数!MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答:每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念 答: 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分 答:①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD (实际不存在)④多指令流多数据流MIMD 10.计算机系统设计的定量原理(四个) 答:①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算 答:CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长 加速比=(采用改进措施后的性能)/(没有采用改进措施前的性能) =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点 硬件实现:速度快、成本高;灵活性差、占用内存少 软件实现:速度低、复制费用低;灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

课后习题及答案

1 文件系统阶段的数据管理有些什么缺陷试举例说明。 文件系统有三个缺陷: (1)数据冗余性(redundancy)。由于文件之间缺乏联系,造成每个应用程序都有对应的文件,有可能同样的数据在多个文件中重复存储。 (2)数据不一致性(inconsistency)。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎,就可能使同样的数据在不同的文件中不一样。 (3)数据联系弱(poor data relationship)。这是由文件之间相互独立,缺乏联系造成的。 2 计算机系统安全性 (1)为计算机系统建立和采取的各种安全保护措施,以保护计算机系统中的硬件、软件及数据; (2)防止其因偶然或恶意的原因使系统遭到破坏,数据遭到更改或泄露等。 3. 自主存取控制缺点 (1)可能存在数据的“无意泄露” (2)原因:这种机制仅仅通过对数据的存取权限来进行安全控制,而数据本身并无安全性标记 (3)解决:对系统控制下的所有主客体实施强制存取控制策略 4. 数据字典的内容和作用是什么 数据项、数据结构 数据流数据存储和加工过程。 5. 一条完整性规则可以用一个五元组(D,O,A,C,P)来形式化地表示。 对于“学号不能为空”的这条完整性约束用五元组描述 D:代表约束作用的数据对象为SNO属性; O(operation):当用户插入或修改数据时需要检查该完整性规则; A(assertion):SNO不能为空; C(condition):A可作用于所有记录的SNO属性; P(procdure):拒绝执行用户请求。 6.数据库管理系统(DBMS)

:①即数据库管理系统(Database Management System),是位于用户与操作系统之间的 一层数据管理软件,②为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更 新及各种数据控制。 DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面 向对象型DBMS。 7.关系模型:①用二维表格结构表示实体集,②外键表示实体间联系的数据模型称为关系模 型。 8.联接查询:①查询时先对表进行笛卡尔积操作,②然后再做等值联接、选择、投影等操作。 联接查询的效率比嵌套查询低。 9. 数据库设计:①数据库设计是指对于一个给定的应用环境,②提供一个确定最优数据模 型与处理模式的逻辑设计,以及一个确定数据库存储结构与存取方法的物理设计,建立起 既能反映现实世界信息和信息联系,满足用户数据要求和加工要求,又能被某个数据库管 理系统所接受,同时能实现系统目标,并有效存取数据的数据库。 10.事务的特征有哪些 事务概念 原子性一致性隔离性持续性 11.已知3个域: D1=商品集合=电脑,打印机 D3=生产厂=联想,惠普 求D1,D2,D3的卡尔积为: 12.数据库的恢复技术有哪些 数据转储和和登录日志文件是数据库恢复的

计算机系统结构_课后答案

习题一 1、解释下列术语 计算机系统的外特性:通常所讲的计算机系统结构的外特性是指机器语言程序员或编译程序编写者所看到的外特性,即由他们所看到的计算机的基本属性(概念性结构和功能特性)。 计算机系统的内特性:计算机系统的设计人员所看到的基本属性,本质上是为了将有关软件人员的基本属性加以逻辑实现的基本属性。 模拟:模拟方法是指用软件方法在一台现有的计算机上实现另一台计算机的指令系统。 可移植性:在新型号机出台后,原来开发的软件仍能继续在升级换代的新型号机器上使用,这就要求软件具有可兼容性,即可移植性。可兼容性是指一个软件可不经修改或只需少量修改,便可由一台机器移植到另一台机器上运行,即同一软件可应用于不同环境。 Amdahl 定律:系统中对于某一部件采用某种更快的执行方式所能获得的系统性能改进程度,取决于这种执行方式被使用的频度或占总执行时间的比例。 虚拟机(Virtual Machine ):指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。 6、 7、假定求浮点数平方根的操作在某台机器上的一个基准测试程序中占总执行时间的20%,为了增强该操作的性能,可采用两种不同的方法:一种是增加专门的硬件,可使求浮点数平方根操作的速度提高为原来的20倍;另一种方法是提高所有浮点运算指令的速度,使其为原来的2倍,而浮点运算指令的执行时间在总执行时间中占30%。试比较这两种方法哪一种更好些。 答:增加硬件的方法的加速比23.120 /2.0)2.01(1 1=+-= p S , 另一种方法的加速比176.12 /3.0)3.01(1 2=+-=p S ,经计算可知Sp1>Sp2第一种方 法更好些。 9、假设高速缓存Cache 的工作速度为主存的5倍,且Cache 被访问命中的概率

计算机系统结构考试题库及答案

计算机系统结构试题及答案 一、选择题(50分,每题2分,正确答案可能不只一个,可单选 或复选) 1.(CPU周期、机器周期)是内存读取一条指令字的最短时间。 2.(多线程、多核)技术体现了计算机并行处理中的空间并行。 3.(冯?诺伊曼、存储程序)体系结构的计算机把程序及其操作数 据一同存储在存储器里。 4.(计算机体系结构)是机器语言程序员所看到的传统机器级所具 有的属性,其实质是确定计算机系统中软硬件的界面。 5.(控制器)的基本任务是按照程序所排的指令序列,从存储器取 出指令操作码到控制器中,对指令操作码译码分析,执行指令操作。 6.(流水线)技术体现了计算机并行处理中的时间并行。 7.(数据流)是执行周期中从内存流向运算器的信息流。 8.(指令周期)是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机,使用(晶体管)作为电子器件。 10.1960年代中期开始出现的第三代计算机,使用(小规模集成电路、 中规模集成电路)作为电子器件。 11.1970年代开始出现的第四代计算机,使用(大规模集成电路、超 大规模集成电路)作为电子器件。 12.Cache存储器在产生替换时,可以采用以下替换算法:(LFU算法、 LRU算法、随机替换)。

13.Cache的功能由(硬件)实现,因而对程序员是透明的。 14.Cache是介于CPU和(主存、内存)之间的小容量存储器,能高 速地向CPU提供指令和数据,从而加快程序的执行速度。 15.Cache由高速的(SRAM)组成。 16.CPU的基本功能包括(程序控制、操作控制、时间控制、数据加 工)。 17.CPU的控制方式通常分为:(同步控制方式、异步控制方式、联合 控制方式)反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是:(在功能部件内部采用同步控 制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下,尽可能多地采用异步控制方式)。 19.CPU的同步控制方式有时又称为(固定时序控制方式、无应答控 制方式)。 20.CPU的异步控制方式有时又称为(可变时序控制方式、应答控制 方式)。 21.EPROM是指(光擦可编程只读存储器)。 22.MOS半导体存储器中,(DRAM)可大幅度提高集成度,但由于(刷 新)操作,外围电路复杂,速度慢。 23.MOS半导体存储器中,(SRAM)的外围电路简单,速度(快),但 其使用的器件多,集成度不高。 24.RISC的几个要素是(一个有限的简单的指令集、CPU配备大量的 通用寄存器、强调对指令流水线的优化)。

-计算机系统结构(有详细答案)

(仅供参考,不作为考试标准), 选择题(30分,每题2分) 计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 C)机器语言或汇编语言程序员D)高级语言程序员 在计算机系统设计时,为了提高系统性能,应当注意________。 A)加快经常性使用指令的执行速度 B)要特别精心设计少量功能强大的指令 C)要减少在数量上占很小比例的指令的条数 D)要加快少量指令的速度 重叠寄存器技术主要用于解决在RISC系统中因________而导致的问题。 A)JMP指令影响流水线 B)CALL指令的现场保护 C)只有LOAD和STORE指令带来的访问存储器不便 D)存储器访问速度 为使流水计算机运行效率高________ A)各过程段时间要不同B)连续处理的任务类型应该不同 C)连续处理的任务类型应该相同D)连续处理的任务数尽可能少不属于堆栈型替换算法的是________。 A)近期最少使用法B)近期最久未用法 C)先进先出法D)页面失效频率法 与全相联映象相比,组相联映象的优点是________。 A)目录表小B)块冲突概率低C)命中率高D)主存利用率高"一次重叠"中消除"指令相关"最好的方法是________。 A)不准修改指令B)设相关专用通路 C)推后分析下条指令D)推后执行下条指令 流水操作中,遇到数据相关时,采用的解决办法有________。 A)用优化编译器检测,通过指令重新排序的办法 B)数据重定向技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 C)多级混洗交换网络D)上述任何网络 虫蚀寻径以流水方式在各寻径器是顺序传送的是________。 授课:XXX

计算机体系结构课后答案

计算机体系结构课后答案

计算机体系结构课后答案 【篇一:计算机体系结构习题(含答案)】 1、尾数用补码、小数表示,阶码用移码、整数表示,尾数字长p=6(不包括符号位),阶码字长q=6(不包括符号位),为数基值rm=16,阶码基值re=2。对于规格化浮点数,用十进制表达式写出如下数据(对于前11项,还要写出16进值编码)。 (1)最大尾数(8)最小正数 (2)最小正尾数(9)最大负数 (3)最小尾数(10)最小负数 (4)最大负尾数(11)浮点零 (5)最大阶码(12)表数精度 (6)最小阶码(13)表数效率 (7)最大正数(14)能表示的规格化浮点数个数 2.一台计算机系统要求浮点数的精度不低于10-7.2,表数范围正数不小于1038,且正、负数对称。尾数用原码、纯小数表示,阶码用移码、整数表示。 (1) 设计这种浮点数的格式 (2) 计算(1)所设计浮点数格式实际上能够表示的最大正数、最大负数、表数精度和表数效率。 3.某处理机要求浮点数在正数区的积累误差不大于2-p-1 ,其中,p是浮点数的尾数长度。 (1) 选择合适的舍入方法。

(2) 确定警戒位位数。 (3) 计算在正数区的误差范围。 4.假设有a和b两种不同类型的处理机,a处理机中的数据不带标志符,其指令字长和数据字长均为32位。b处理机的数据带有标志符,每个数据的字长增加至36位,其中有4位是标志符,它的指令数由最多256条减少到不到64条。如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。对于一个由1000条指令组成的程序,分别计算这个程序在a处理机和b处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发? 5.一台模型机共有7条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8个通用数据寄存器,2个变址寄存器。 (1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。 6.某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令3类,并假设每个地址字 段的长度均为6位。 (1) 如果双地址指令有15条,单地址指令和零地址指令的条数基本相同,问单地址指令和零地址指令各有多少条?并且为这3类指令分配操作码。 (2) 如果要求3类指令的比例大致为1:9:9,问双地址指令、单地址指令和零地址指令各有多少条?并且为这3类指令分配操作码。 7.别用变址寻址方式和间接寻址方式编写一个程序,求c=a+b,其中,a与b都是由n个元素组成的一维数组。比较两个程序,并回答下列问题: (1) 从程序的复杂程度看,哪一种寻址方式更好?

计算机系统结构期末考试试题及其答案

计算机系统结构期末考试试题及其答案

《计算机系统结构》期末考试试卷A 卷第 2 页 共 24 页 计算机科学系《计算机系统结构》期末考试试卷(A 卷) 2、此试卷适用于计算机科学与技术本科专业。 一 单选题:(10分,每题1分) 1、 ."启动I/O"指令是主要的输入输出指 令,是属于( B ) A.目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对(B )是透 明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间固定,组内任何虚页可装入任何实页位

置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D.阵列处理机 5、多处理机上两个程序段之间若有先写 后读的数据相关,则(B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、计算机使用的语言是(B) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D.属于符号化的机器指令 7、指令执行结果出现异常引起的中断是 (C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 《计算机系统结构》期末考试试卷A卷第 3 页共 24 页

张清华图论课后题答案.

第1章 图论预备知识 1.1 解:(1) p={φ,{a},{b},{c},{a,b},{a,c},{b,c},{a,b,c}} (2) p={,{a},{{b,c}},{a,{b,c}}} (3) p={,{}} (4) p={,{},{{}},{,{}}} (5)p={,{{a,b}},{{a,a,b}},{{a,b,a,b}},{{a,b},{a,a,b}},{{a,b},{a,b,a,b}},{{a,b},{a,a,b},{a,b,a,b}}} 1.2 解:(1) 真 (2) 假 (3)假 (4)假 1.3 解:(1) 不成立,A={1} B={1,2} C={2} (2) 不成立,A={1} B={1,2} C={1,3} 1.4 证明:设(x,y)∈(A ∩B)X(C ∩D) 说明x ∈A ∩B,y ∈C ∩D 由于 x ∈A,y ∈C 所以 (x,y) ∈A X C 由于x ∈B,y ∈D 所以 (x,y) ∈B X D 所以 (x,y) ∈(A X C )∩(B X D ) 反过来,如果(x,y )∈(A X C) ∩(B X D ) 由于 (x,y) ∈(A X C )所以 x ∈A,y ∈C 由于 (x,y) ∈(B X D )所以x ∈B,y ∈D 所以x ∈(A ∩B) y ∈(C ∩D) 所以 (x,y) ∈(A ∩B)X(C ∩D) 所以(A ∩B)X(C ∩D)= (A X C) ∩(B X D ) 1.5 解:Hasse 图 φφφφφφφφφ

极大元{9,24,10,7} 极小元{3,2,5,7} 最大元{24} 最小元{2} 1.6 解 (2)关系图为: (3)不存在最大元,最小元为{2} 1.7 解:(1)R={<1,1>,<2,2>,<3,3>,<4,4>,<1,2>,<2,1>,<2,3>,<3,2>} (2)略 (3)I A ?R 故R 是自反的。 <1,2>∈R <2,3>R 但是<1,3> ?R 故不满足传递性 1.8 解:(1) 不成立 A={1} B={2} C={3} D={4} 则左式={<1,3>,<1,4>,<2,3>,<2,4>} 右式={<1,3>,<2,4>} (2) 不成立 A={1,3} B={1} C={2,4} D={2} 则左式={<3,4>} 右式={<1,4>,<3,2>,<3,4>} (3) 不成立 A={1} B={2} C={3} D={4} 则左式={<1,3>,<1,4>,<2,3>,<2,4>} 右式={<1,3>,<2,4>} (4) 成立 证明:设 ∈(A-B)X C ?x (A-B)∧ y C ?x A ∧x B ∧ y C A X C ∧ B X C (A X C)-(B XC) 故得 (A-B )X C=(A X C )-(B X C ) ∈∈∈∈∈∈?∈∈?∈

计算机体系结构课后习题

第1章 计算机系统结构的基本概念 试用实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系。 答:如在设计主存系统时,确定主存容量、编址方式、寻址范围等属于计算机系统结构。确定主存周期、逻辑上是否采用并行主存、逻辑设计等属于计算机组成。选择存储芯片类型、微组装技术、线路设计等属于计算机实现。 计算机组成是计算机系统结构的逻辑实现。计算机实现是计算机组成的物理实现。一种体系结构可以有多种组成。一种组成可以有多种实现。 计算机系统设计中经常使用的4个定量原理是什么?并说出它们的含义。 答:(1)以经常性事件为重点。在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权和资源使用权,以得到更多的总体上的改进。(2)Amdahl 定律。加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。(3)CPU 性能公式。执行一个程序所需的CPU 时间 = IC ×CPI ×时钟周期时间。(4)程序的局部性原理。程序在执行时所访问地址的分布不是随机的,而是相对地簇聚。 计算机系统中有三个部件可以改进,这三个部件的部件加速比为: 部件加速比1=30; 部件加速比2=20; 部件加速比3=10 (1) 如果部件1和部件2的可改进比例均为30%,那么当部件3的可改进比例为多少时,系统加速比才可以达到10? (2) 如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少? 解:(1)在多个部件可改进情况下,Amdahl 定理的扩展: ∑∑+-= i i i n S F F S )1(1 已知S 1=30,S 2=20,S 3=10,S n =10,F 1=,F 2=,得: ) ()(10/20/0.330/0.30.30.3-11 1033F F +++++= 得F 3=,即部件3的可改进比例为36%。 (2)设系统改进前的执行时间为T ,则3个部件改进前的执行时间为:(++)T = ,不可改进部分的执行时间为。 已知3个部件改进后的加速比分别为S 1=30,S 2=20,S 3=10,因此3个部件改进后的执行时间为: T T T T T n 045.010 2.020 3.0303.0'=++= 改进后整个系统的执行时间为:Tn = + = 那么系统中不可改进部分的执行时间在总执行时间中占的比例是: 82.0245.02.0=T T 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。具体数据如下表所示: 操作类型 程序中的数量 (百万条指令) 改进前的执行时间 (周期) 改进后的执行时间 (周期)

计算机系统结构考试计算题

有一指令流水线如下所示 入 1 2 3 4 出 50ns 50ns 100ns 200ns (1) 求连续输入10条指令,该流水线的实际吞吐率和效率; (2) 该流水线的“瓶颈”在哪一段请采取两种不同的措施消除此“瓶颈”。对 于你所给出的两种新的流水线,连续输入10条指令时,其实际吞吐率和效率各是多少 解:(1) 2200(ns) 2009200)10050(50t )1n (t T max m 1 i i pipeline =?++++=?-+?=∑= )(ns 220 1T n TP 1pipeline -== 45.45%11 5 4400TP m t TP E m 1 i i ≈=? =?? =∑= (2)瓶颈在3、4段。 变成八级流水线(细分) 850(ns) 509850t 1)(n t T max m 1 i i pipeline =?+?=?-+?=∑= )(ns 85 1 T n TP 1pipeline -== 58.82%17 10 8400TP m ti TP E m 1 i ≈=? =?? =∑= 重复设置部件 1 2 3_1 3_2 4_1 4_4 入 出

)(ns 851T n TP 1pipeline -== 58.82%17 10 8 85010400E ≈=??= 有一 4段组成,其3段时,总次,然后流到第4段。如果 需要的时间都是t ?,问: (1) 当在流水线的输入端连续地每t ?时间输入任务时,该流水线会发生 什么情况 (2) 此流水线的最大吞吐率为多少如果每t ?2输入一个任务,连续处理 10个任务时的实际吞吐率和效率是多少 (3) 当每段时间不变时,如何提高该流水线的吞吐率仍连续处理10个任 务时,其吞吐率提高多少 (2)

1 《邓稼先》课后习题参考答案

1 《邓稼先》课后习题参考答案 思考探究 一、通读全文,把握文意,回答下列问题。 1.初读课文时,哪些句段最让你感动?反复细读后,再想想这些内容是否最 能体现全文所要表达的思想情感。 2.找出文中表现奥本海默与邓稼先两人不同个性、品质的词语及细节,思考 作者为什么要进行对比,通过对比得出了怎样的结论。 参考答案:1.作者饱含真情,于字里行间高度赞扬了邓稼先深沉的爱国主义精神和将个人生命奉献给祖国国防事业的崇高情怀。这样的句段很多,如:“对这一转变做出了巨大贡献的,有一位长期以来鲜为人知的科学家——邓稼先。”“一次井下突然有一个信号测不到了,大家十分焦虑,人们劝他回去,他只说了一句话:‘我不能走。’”…… 2.文中的奥本海默与邓稼先两人的个性、品质截然不同。奥本海默是 锋芒毕露,读研究生时就常打断别人的报告,即便到了中年,成了名人,有时还会这样。而邓稼先“是一个最不要引人注目的人物”“忠厚平实”“真诚坦白,从不骄人”“没有小心眼儿,一生喜欢‘纯’字所代表的品格”“最有中国农民的朴实气质”;“他没有私心,人们绝对相信他”,“文革”中能说服两派群众组织,能说服工宣队、军宣队。作者把奥本海默与邓稼先进行对比,鲜明地突出邓稼先的精神品质,自然而然地得出结论:“邓稼先是中国几千年传统文化孕育出来的有最高奉献精神的儿子”“邓稼先是中国共产党的理想党员”。 二、有感情地朗读课文第五部分,想一想:这部分开头引用《吊古战场文》, 有什么作用?结尾处又引用儿时学到的“‘五四’时代的一首歌”,表达了怎样的情感? 参考答案:课文第五部分开头引用《吊古战场文》,把读者引入中国历史的深处,让人从中国传统文化的角度去思考。结尾处引用自己儿时学到的“‘五四’时代的一首歌”,说明了邓稼先就是一个典型的中国男儿,他有着为祖国而献身的崇高的精神品质。

相关文档
相关文档 最新文档