文档库 最新最全的文档下载
当前位置:文档库 › 自考计算机系统结构试题-小炒

自考计算机系统结构试题-小炒

自考计算机系统结构试题-小炒
自考计算机系统结构试题-小炒

一、选择题

1、对汇编语言程序员,下列(A )不是透明的。

A: 中断字寄存器 B: 乘法器 C: 移位器 D: 指令缓冲器

2、假设对A机器指令系统的每条指令的解释执行可直接由B机

器的一段微程序解释执行,则A称为(D )。

A: 仿真机 B: 宿主机 C: 虚拟机 D: 目标机

3、 1. 查看下面三条指令:V3←A;V2←V0+V1;V4←V2*V3;假

设向量长度小于64,且前后其他的指令均没有相关性,数据进入和

流出每个功能部件,包括访问存储器都需要一拍的时间,假设向

量的长度为N。三条指令全部采用串行的方法,那么执行的时间是:A: 3N+20 B: 3N+21 C: 3N+22 D: 3N+23

4、某向量处理机有16个向量寄存器,其中V0-V5种分别存放有

向量A,B,C,D,E,F,向量的长度是8,向量各元素均为浮点数;处理

部件采用两个单功能流水线,加法功能部件时间为2拍,乘法功

能部件时间为3拍。采用类似CRAY-1的链接技术,先计算(A+B)*C,

在流水线不停的情况下,接着计算(D+E)*F。求此链接流水线的通

过时间是多少拍?(设寄存器出入各需1拍)

A: 8 B: 9 C: 17 D: 18

5、设有一个4个处理器的MIMD系统,假设在系统中访存取指和

取数的时间可以忽略不计;加法与乘法分别需要2拍和4拍;在

MIMD系统中处理器(机)之间每进行一次数据传送的时间为1拍;

在MIMD系统中,每个PE都可以和其它PE有直接的的通路。

求利用此系统计算表达式所需

的节拍数。

A: 23 B: 12 C: 11 D: 10

6、以下哪些是周期窃取方式的特点?

A : 硬件结构简单

B : 硬件结构复杂

C : 数据输入或输出过程中占用了CPU时间

D : 数据输入或输出过程中不占用CPU时间

7、从下列有关Cache的描述中,选出应填入空格中的正确答案:

(1)今有甲、乙两台计算机,甲计算机的Cache存取时间为50ns,

主存储器为2us;乙计算机的Cache存储时间为100ns,主存储器

为1.2us。设Cache的命中率均为95%,则甲计算机的平均存取

时间为__A_ns;乙计算机的平均存取时间为__B_ns。

(2)在Cache中,经常采用直接映象或组相联映象两种方式,在

Cache容量相等的情况下,前者比后者的命中率__C__。

选项 A :

147.5 153.5 155 180

选项 B :

147.5 153.5 155 180

选项 C :

高低相等

8、有研究人员指出,如果在采用通用寄存器指令集结构的计算

机里加入寄存器—存储器寻址方式可能提高计算机效率,做法就

是用指令ADD R2,0(Rb)代替指令序列LOAD R1,0(Rb) ADD

R2,R2,R1假定使用新的指令能使时钟周期增加10%,并且假定只

对时钟产生影响,而不影响CPI那么采用新指令,要达到与原来

同样的性能需要去掉的LOAD操作所占的百分比?(提示:去掉的

是与ADD指令连用的LOAD指令,假定未采用新指令前LOAD指令

占总指令的22.8%)A: 39% B: 36% C: 40% D: 39.8%

9、下述的几个需要解决的问题中,那个是向量处理机所最需要

关心的?

A: 计算机指令的优化技术

B: 设计满足运算器带宽要求的存储器

C: 如何提高存储器的利用率,增加存储器系统的容量

D: 纵横处理方式的划分问题

10、一台单处理机可以以标量方式运行,也可以以向量方式运行。

在向量方式情况下,计算可比标量方式快18倍。设某基准程序在

此计算机上运行的时间是T。另外,已知T的25%用于向量方式,

其余机器时间则以标量方式运行。那么在上述条件下与完全不用

向量方式的条件下相比的加速比是:

A: 3 B: 3.43 C: 3.33 D: 以上均不正确

11、给定1个采用完全混洗互连网络,并有256个PE的SIMD机

器,加入执行混洗互连函数10次,则原来在PE123中的数据将被

送往何处?

A: PE237 B: PE222 C: PE111 D: PE175

12、

设计一种采用加、乘和数据寻径操作的算法,计算表达式

。假设加法和乘法分别需要2个和4个

单位时间,从存储器取指令、取数据、译码的时间忽略不计,所

有的指令和数据已经装入有关的PE。现有一台串行计算机,有一

个加法器,一个乘法器,问最短多少单位时间计算出s?

A: 192ns B: 130ns C: 128ns D: 以上结果都不对

13、下列功能,那些一般由硬件实现?

A : 第一次关CPU中断

B : 返回中断点

C : 第一次开CPU中断

D : 保存中断点

14、星形网络的网络直径和链路数分别为()和()。

选项 1 :

N-1 N/2 2 N(N-1)/2

选项 2 :

N-1 N/2 2 N(N-1)/2

16、在计算机系统结构来看,机器语言程序员看到的机器属性是

(D)。

A)计算机软件所要完成的功能B)计算机硬件的全部组

C)编程要用到的硬件知识D)计算机各部件的硬件

实现

17、在提高CPU性能的问题上,从系统结构角度,可以(D)。

A)提高时钟频率B)

减少程序指令条数

C)减少每条指令的时钟周期数D)减少程序

指令条数和减少每条指令的时钟周期数

18、计算机系统结构不包括(C )。

A)主存速度B)机器工作状态C)信息保护

D)数据表示

19、推出系列机的新机器,不能更改的是(A)。

A)原有指令的寻址方式和操作码B)

系统的总线的组成

C)数据通路宽度

D)存储芯片的集成度

20、在系统结构设计中,提高软件功能实现的比例会(C)。

A)提高解题速度 B)减少需要的存储容量 C)提高系统的灵活性

D)提高系统的性能价格比

21、重叠寄存器技术主要用于解决在RISC系统中因( C )而导

致的问题。

A)JMP指令影响流水线

B)CALL指令的现场保护

C)只有LOAD和STORE指令带来的访问存储器不便D)

存储器访问速度

22、不属于堆栈型替换算法的是(C )。

A)近期最少使用法B)近期最久未用法 C)先

进先出法D)页面失效频率法

23、与全相联映象相比,组相联映象的优点是(B)。

A)目录表小B)块冲突概率低C)命中率高

D)主存利用率高

24、最能确保提高虚拟存储器访主存的命中率的改进途径是(D)。

A)增大辅存容量

B)采用FIFO替换算法并增大页面

C)改用LRU替换算法并增大页面D)改用LRU

替换算法并增大页面数

25、"一次重叠"中消除"指令相关"最好的方法是( A )。

A)不准修改指令B)设相关专用通路C)推后分析下条指令

D)推后执行下条指令

26、在流水机器中,全局性相关是指(D)。

A)先写后读相关B)先读后写相关C)指令相关

D)由转移指令引起的相关

27、下列说法不正确的是(D)。

A)线性流水线是单功能流水线B)

动态流水线是多功能流水线

C)静态流水线是多功能流水线D)

动态流水线只能是单功能流水线

28、16个处理器编号为0、1、…、15,采用单级Cube3互连网络

互连,与13号处理器相连的处理器号是()。

A)2 B)3

C)4 D)5

29、经多级网络串联来实现全排列网络,只能用(C)。

A)多级立方体网络B)多级PM2I网络C)多级混洗

交换网络D)上述任何网络

30、经3级立方体网络对0-7八个端子(0 1 2 3 4 5 6 7)排列,

进行模8移4变换,得到的这八个端子新的排列应当是()。

A)(2 3 4 5 6 7 0 1)B)

(4 5 6 7 0 1 2 3)

C)(1 2 3 0 5 6 7 4)D)

(1 0 3 2 5 4 7 6)

31、虫蚀寻径以流水方式在各寻径器是顺序传送的是(C)。

A)消息B)包C)片

D)字节

32、能实现指令、程序、任务级并行的计算机系统属于(D )。

A)SISD B)SIMD C)MISD

D)MIMD

33、多处理机主要实现的是(B)。

A)指令级并行B)任务级并行C)操作级并行D)操作步骤的并行

34、BSP计算机的并行处理机有16个处理单元,并行存储器的存储体个数为(D )。

A)16 B)1

C)32 D)17

35、S2MP(可扩展共享存储器)系统的存储器结构是(D)。

A)交叉编址的并行存储器B)均匀访问存储器

C)非均匀访问存储器D)基于NUMA 的虚拟共享存储器

1.存储系统:计算机中由存放程序和数据的各种存储设备、

控制部件及管理信息调度的设备(硬件)和算法(软件)

所组成的系统。

2.兼容机:又叫组装机,是计算机用户根据需求,自己购买

计算机硬件设备,并组装到一起的计算机。

3.平均启动距离:

4.堆栈型替换算法:对任意一个程序的页地址流作两次主存

页面数分配,分别分配m个和n个主存页面,并且有m≤n。

如果在任何时刻t,主存页面数集合Bt都满足关系:Bt

(m)í Bt(n),则这类算法称为堆栈型替换算法。

简单地说,堆栈型算法的基本思想是:随着分配给程序的

主存页面数增加,主存的命中率也提高,至少不下降。

最久没有使用法LRU算法、最优替换法OPT算法、页面失效频率法PFF

5.直接网络:是指网络中的处理器是点到点连接的,也被称

作静态网络,可称作基于寻径器的网络,因为所有的结点

都有一个寻径器用来处理结点间的消息通信。

6.仿真:用A机(宿主机)中的一段微程序来解释实现

B机(目标机)指令系统中每一条指令而实现B机指

令系统的方法称仿真,它是有部份硬件参与解释

过程的。

7.Amdahl定律:系统优化某部件所获得的系统性能的

改善程度,取决于该部件被使用的频率,或所占

总执行时间的比例。

8.MFLOPS:每秒百万个浮点操作)衡量计算机系统的主

要技术指标之一。MFLOPS=操作浮点数/(执行时

间*10E6)(10E6位10的6次方)。

9.Flynn分类法:计算机系统结构的一种分类方法.按照同

时执行的指令流与数据流在系统中的数目,将系统结构分

为:SISD单指令单数据流,SIMD多指令流多数据流,MISD

多指令流单数据流,MIMD多指令流多数据流。

10.动态互连网络:设置有源开关,可以根据需要借助控制信

号对连接通路加以重新组合实现所所要求通信模式的网

11.结点度:与节点相连接的边(即链路或通道)数。

12.间接网络:网络中的结点不是通过直接相连的通道进行消

息通信,而是通过网络的开关机构进行。

五、简述题

1.超标量处理机的特点

超标量处理机一般具有多于一条的流水线,一台m度的超标量处

理机可同时发射m条指令,指令的发射等待时间为1个时钟,指

令的并行度为m。

2.程序中有哪两类相关,分别可以采取什么方法来解决?

程序中可能出现下两类相关:数据相关:数据相关指在执行本条

指令的过程中,如果用到的指令、操作数、变址偏移量等是前面

指令的执行结果,则必须等待前面的指令执行完成,并把结果写

到主存或通用寄存器中之后,本条指令才能开始执行。可以采取

设置专用数据通路、延迟执行等方法来解决数据相关。

控制相关:控制相关指由条件分支指令、转子程序指令、中断等

引起的相关。可以采取静态分支预测技术、动态分支预测技术、

提前形成条件码等来解决控制相关。

六、综述题

1.Cache一致性问题主要由哪些可能的因素有关?

共享可写数据引起的不一致,进程迁移引起的不一致,I/O 传输

引起的不一致

2.在先行控制方式处理机中,为了保证处理机的最大性能,

对于控制相关(包括短循环)采取了哪些应对措施?

采用硬件或软件的办法尽量避免数据相关发生;在确保指令正确

执行的前提下,推后指令分析;设置相关专用通路来解决数据梯

3.数据类型、数据表示和数据结构之间的关系是什么?在设

计一个计算机系统时,确定数据表示的原则主要有哪几

个?

数据表示研究的是计算机硬件能够直接识别,可以被指令系统直

接调用的那些数据类型。数据结构研究的是面向系统软件,面向

就用领域所需要处理的各种数据类型,研究这些数据类型的逻辑

结构和物理结构之间的关系,并给出相应的算法。数据表示和数

据结构都是数据类型的子集。原则:一是缩短程序的运行时间,

二是减少CPU与主存储器之间的通信量,三是这种数据表示的通

用性和利用率。

4.从机器(汇编)语言程序员看,以下哪些是透明的?指令

地址寄存器;指令缓冲器;时标发生器;条件码寄存器;

乘法器;主存地址寄存器;磁盘外设;先行进位链;移位

器;通用寄存器;中断字寄存器;

参考答案:透明的有:指令缓冲器、时标发生器、乘法器、先行

进位链、移位器

5.用具体例子来说明计算机系统结构、计算机组成和计算机

实现三个概念

计算机系统结构、计算机组成和计算机实现是三个不同的概念。

系统结构是计算机系统的软、硬件的界面;计算机组成是计算机

系统结构的逻辑实现;计算机实现是计算机组成的物理实现。

6.综述线性流水线和非线性流水线的异同?

线性流水线段间无反馈或越过的通路,非线性流水线则有反馈回

路或前越通路。

在线性流水线中,由于每一个任务在流水线的每一功能段中都流

过一次,而且仅流过一次,因此,可以在每一个时钟周期向流水

线输入一个新任务。在非线性流水中,由于存在有反馈回路,当

一个任务在流水线中流过时,在同一个功能段中可能要经过多次。

因此,就不能每一个时钟周期向流水线输入一个新任务。线性流

水线是将流水线的各段逐个串接起来。非线性流水线经常用于递

归调用,或构成多功能流水线。其性能指标有吞吐率、加速比和

效率。

7.虚拟机:通过软件模拟的具有完整硬件系统功能的、运行

在一个完全隔离环境中的完整计算机系统。

8.程序访问的局部性

局部性的实质是:根据程序的最近情况,可以较精确地预测出最

近的将来将要用到哪些指令和数据。

9、分别用变址寻址方式和间接寻址方式编写一个程序,求C=A+B,

其中,A与B都是由n个元素组成的一维数组。比较两个程序,并

回答下列问题:

(1)从程序的复杂程度看,哪一种寻址方式更好?

(2)从硬件实现的代价看,哪一种寻址方式比较容易实现?

(3)从对向量运算的支持看,哪一种寻址方式更好?

参考答案:(1)变址寻址方式(2)间接寻址方式(3)变

址寻址方式

10、简述SIMD计算机的分布式存储器与共享存储器的异同。

参考答案:SIMD计算机的分布式存储器与共享存储器的相同点都

存在互联网络。不同点式在共享内存方案中,共享的多体并行存

储器通过对准网络与各处理单元相连。在分布内存方案中,每个

处理单元有自己的本地存储器,处理单元有自己的本地存储器,

处理单元之间的数据通过数据寻径网络完成。

11、根据多台外围设备共享通道的不同情况,通道可分为那三种

类型?

参考答案:字节多路通道、选择通道、数组多路通道。

12、简述流水线技术的特点

参考答案:流水线技术具有以下特点:

⑴流水过程由多个相联系的子过程组成,每个过程称为流水线的"

级"或"段"。

⑵流水技术适合于大量重复的时序过程。

13、简述现代计算机系统的分类方法及其机制:

14、在先行控制技术和流水线处理机中,程序中有哪两类相关,

分别可以采取什么方法来解决?

数据相关:数据相关指在执行本条指令的过程中,如果用到的指

令、操作数、变址偏移量等是前面指令的执行结果,则必须等待

前面的指令执行完成,并把结果写到主存或通用寄存器中之后,

本条指令才能开始执行。可以采取设置专用数据通路、延迟执行

等方法来解决数据相关。

控制相关:控制相关指由条件分支指令、转子程序指令、中断等

引起的相关。可以采取静态分支预测技术、动态分支预测技术、

提前形成条件码等来解决控制相关。

七、填空题

1.浮点数据表示方式要研究的核心内容是数据字长与这

种数据表示方式的表数范围、表数精度、和表数

效率之间的关系。

2.体系结构设计者在决定哪些基本功能用指令来实现时主

要考虑的因素有三个,它们是:速度、价格和

灵活性。

3.确定哪些数据类型用数据表示来实现的原则主要有三个,

一个是缩短程序的运行时间,另一个是减少CPU与主存

储器之间的通信量,第三个是这种数据表示的通用性和利

用率。

4.优化目标程序的指标主要有两个:一个是缩短程序的长

度,即减少程序的空间开销,另一个是缩短程序的执行

时间,即减少程序的时间开销。

5.减少指令平均执行周期数是RISC思想的精华。

6.并行存储器产生访问冲突的根源主要有两个,一个是程

序中有转移指令,另一个是数据的随机性。

7.存储器的性能通常用速度、容量、价

格三个主要指标来表示。

8.先行控制技术的关键是缓冲技术和

预处理技术。

9.根据计算机的不同侧面特征可以将计算机作各种不同的

分类,课本上介绍的三种分类法分别是: Flynn分类

法,冯氏分类法, Handler分类法。

10.虚拟存储器中有三种地址空间,它们分别是:虚拟地

址空间,主存储器的地址空间,辅存地址空

间。

11.在采用先行控制方式的处理机中,一般要设置四个先行指

令缓冲栈,它们分别是:先行指令缓冲栈、先行

读数栈、先行操作栈和后行写数栈。

12.在采用先行控制方式的处理机中,数据相关主要有四种,

分别是:指令相关,主存操作数相关,通用寄存器相关,

变址相关。

13.可以从两个方面来开发处理机内部的并行性,一个是所谓

的空间并行性、即在一个处理机内设置多个独立的操

作部件,并让这些部件并行工作;另一个是时间并行

性。

14.衡量流水线性能的主要指标有吞吐率、加速比

和效率。

15.提高向量处理机性能的常用技术可以有: 较好地维持向

量/标量性能平衡、可扩展性随处理机数目的增加而提

高、增加存储器系统的容量和性能、提供高性能的

I/O 和易访问的网络。

16.软件和硬件的成本各由两部分组成,它们是:一次性开

发成本、和每个部件的生产成本。

17.浮点数据表示的尾数基值rm 、尾数长度p 和阶

码长度q 三个主要性质都与浮点数的表数范围,表数

精度,表数效率有关。

18.设计指令系统时,功能方面最基本要求是:数据传送类

指令、运算类指令、和程序类指令。

19.目前在RISC处理机中主要采用如下几种技术,它们是:

延时转移指令、指令取消技术、和重叠寄存器窗

口技术、以及指令流调整技术。20.设计处理机的基本任务之一是缩短解释指令的时间,通常

提高指令执行速度的途径有三种,它们分别是:搞高处

理机的工作主频、采用更好的算法和设计更好的功能部

件、多条指令并行执行,称为指令级并行技术。

21.通常把先行控制方式中的先行指令缓冲栈、先行读数

栈、先行操作栈、和后行写数栈统称为先行控制

器。

22.指令级并行技术又有三种实现的基本方法:第一种是采

用流水线技术,第二种是在一个处理机中设置多个独

立的功能部件,第三种是超长指令字技术。

23.短循环程序应该满足的三个条件是:1、循环体的长度

小于等于先行指令缓冲栈的深充;2、循环次数的控制采

用计数转移指令实现;3、控制循环的条件转移指令一般

是向后转移的指令。

24.在下列常用术语后面,写出相应的中文名称:

VLSI 超大规模集成电路 MPP 大规模并行处理机

RISC 精简指令系统 DMA 直接存储器访问

25外设接口的主要功能是数据缓冲功能、中断管理功能、

信号转换功能。

25.在由n台计算机构成的并行计算机中,其运行程序的加速

比比一般都小于n,其主要原因是执行时间缩短和

功能部件的利用率提高。

26.从计算机系统结构的发展和演变来看,早期的计算机是

以、运算器为中心的系统结构,而近代的计算机是以、

存储器为中心的系统结构。

27.从广义上将,计算机中引入并行性有三种基本途径,分别

是时间重叠,、资源重叠,、资源共享。

28.在指令格式中,采用扩展操作码设计方案的目的是。

29.在多级存储体系中,Cache存储器的主要功能是高速地

向CPU提供指令和数据加速程序的执行速度,虚拟存储

器的主要功能是虚拟地扩大主存容量,提高软件开发效

率。

30.浮点数据表示方式要研究的核心内容是数据字长与这

种数据表示方式的表数范围、表数精度、和表数效

率之间的关系。

31.设阶码8位(最左一位为符号位),用移码表示,尾数为24

位(最左一位为符号位)、用规格化补码表示,则它所能表示的

最大正数的阶码为,尾数为;绝对值最小

的负数的阶码为,尾数为。(以上回答

均用二进制书写)。

八、计算题

1、某工作站采用时钟频率f为15MHz,处理速率为10MIPS的处

理机来执行一个已知混合程序。假定每次存储器存取为1周期延

迟。如果假定将处理机的时钟频率f提高到30MHz,但存储器子系

统速率不变。这样,每次存储器存取需要两个时钟周期,如果30%

指令每条只需要一次存储存取,而另外5%每条需要两次存储存取,

还假定已知混合程序的指令数不变,并与原工作站兼容,试求改

进后的处理机性能。

参考答案:(a) 时钟频率之后需要增加一个时钟周期;同样,另

外5%的指令需要增加两个时钟周期。CPInew= (改进前执行混合

程序的所需时钟周期数+ 30%×1×指令数+ 5%×2×指令数) /

指令数 = 改进前有效CPI + 30%×1 + 5%×2= 1.5 +如题所述,

30%的指令需要一次存储存取,则这些指令在处理器提高 0.3 +

0.1= 1.9

处理速率MIPS= fnew / (CPInew×106) = 30×106/(1.9×106) =

15.79 MIPS

假设混合程序的指令数为IC, 则有

可见, 改进后工作站性能提高了。

2、有一台磁盘机,其平均寻道时间为30ms,平均等待时间为10ms,

数据传输率为500B/ms,磁盘机上存放着1000件每件3000B的数

据,先欲把一件件数据取走,更新后放回原地。另外使用CPU更

新信息所需的时间为4ms,并且更新时间同输入输出操作不相重

叠。求:

(1) 更新磁盘上全部数据需要多长时间?

(2) 若磁盘机转速和数据传输率都提高一倍,更新全部数据需多

少时间?

参考答案:

1)94s 2)80s

3、超标量机、超流水线机、超标量超流水线机都能开发指令级

的并行性。假设这3种机器的流水线都为4段,每段均为1个时

钟周期。还假设超标量处理机每个时钟周期可同时启动3条指令,

超流水线机每隔1/3个时钟周期启动一条指令,超标量超流水线

机每次启动3条指令,每隔1/3个时钟周期启动一次指令。现有9

条指令的代码序列,问这3种机器各需要多少个时钟周期才能执

行完毕,求各流水线的效率。画出时空图。

参考答案:

(1)超标量处理机

每次发射3条指令,3次发射完毕,共需要4+3-1=6个时

钟周期

效率为9×4/(6×3×4)=50%

时空图略

(2)超流水线处理机

每次发射1条指令,每个时钟周期发射3条指令,则第9条

指令在8/3个时钟周期处发射,共需要8/3+4=6.67个时钟周期

效率为9×4/(6.67×3×4)=45%

(3)超标量超流水线处理机

每次发射3条指令,每个时钟周期发射3次指令,则最后一

次指令在2/3个时钟周期处发射,共需要2/3+4=4.67个时钟周

效率为9×4/(4.67×3×4×3)=21.4%

4、 30.日本FOCOM向量处理机VP-200具有流水线链接和并行化

功能。它有2条存储流水线到向量寄存器,两者可以并行工作。

此外尚有加法和乘法流水线。各流水线间均可以链接操作。若现

在要在Vp-200向量机上实现以下的向量操作:

A(I)=B(I) ×C(I)+D(I) ×E(I)+F(I) ×G(I)

I=1,2,…,N。假定所有流水线的延迟时间都相等,取/存操作转换

时将有t的流水线重构延迟时间。求完成操作所需要的时间。

参考答案:

4N+t

5、1台向量计算机1次只能以下述两种执行方式中的一种运行:

一种是向量方式,执行速度Rv为10MFLOPS;另一种是标量方式,

执行速度Rs为1MFLOPS。设α是该计算机的典型程序代码中可向量化部分的百分比。

(a)推导出该计算机平均执行速度R的公式

(b)要使R达到7.5MFLOPS,问向量化百分比α应多大?

(c)假设Rs=1MFLOPS,α=0.7,要使R达到2MFLOPS,问Rv应为多大?

参考答案:

(a )

(b)R=7.5,则,α=0.963

(c ),

MFLOPS

6、一台模型机共有7条指令,各指令的使用频率分别为45%,30%,15%,5%,3%,1%和1%,要求操作码的平均长度最短(操作码的位数为整数)。

(1)请设计操作码的编码,并计算所设计操作码的平均长度。(2)如果采用3位固定编码,与你设计的编码相比,信息冗余量为多少?

参考答案:

(1)1.97(2)34%

7、某虚拟存储器的用户编程空间共32个页面,每页1KB,主存为16KB.假定某时刻该用户页表中已调入主存的页面的虚页号和物理页号对照表如下,求虚地址0A5CH,1A5CH对应的物理地址.

参考答案:

由虚空间为32KB,实空间为16KB,每页为1KB可得以下地址空间分配表:

0页:0000H——03FFH 1页:0400H——07FFH 2页:0800H——0BFFH

3页:0C00H——0FFFH 4页:1000H——13FFH 5页:1400H——17FFH

6页:1800H——1BFFH ---------------------------------- 3 2页:7C00H——7FFFH

由上可以看出0A5C在虚空间的第2页,查表得物理页号为4,实地址空间为1000H——13FFH,第4页与第2页空间差距为2KB,故得物理地址:0A5CH+0800H=125CH。同理可求得1A5CH在虚空间第6页,查表出现页面失效。

计算机系统结构模拟试题(5)

计算机组成原理模拟试题(2) 一、填空题:04分,每题02分 1、X=-0.1001 [X]原=_____________ [X]补=_____________[-X]补=_____________ Y=0.0101 [Y]原=_____________ [Y]补=_____________ [-Y]补=_____________ [X+Y]补=_____________ 2、对西文输出的字符设备,在计算机的内存储器中存储的是字符数据的每个字符的_____________码,输出(包括显示或打印)的则是每个字符的_____________,设备中的字符发生器的主要功能是解决从字符的_____________码和字符的_____________间的对应关系。 二、单选题:20分,每题02分 3、32 x 32点阵汉字的机内编码需要。 A: 16个字节 B: 32个字节 C: 32×2个字节 D: 32×4个字节 4、某机字长32位,采用原码定点整数表示,符号位为1位,数值位为31位,则可表示的最大正整数为,最小负整数为。 A: B: C: D: 5、在定点二进制运算器中,减法运算一般通过来实现。 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 6、在浮点数运算中产生溢出的原因是。 A: 运算过程中最高位产生了进位或借位 B: 参加运算的操作数超出了机器的表示范围 C: 运算的结果的阶码超出了机器的表示范围 D: 寄存器的位数太少,不得不舍弃最低有效位 7、无论如何划分计算机的功能部件,控制器部件中至少含有。 A: PC、IP B: PC、IR C: IR、IP D: AR、IP 8、某存储器容量为32K×16位,则 A: 地址线为16根,数据线为32根 B: 地址线为32根,数据线为16根

北邮高级计算机系统结构实验二三四五

实验二指令流水线相关性分析 ·实验目的 通过使用WINDLX模拟器,对程序中的三种相关现象进行观察,并对使用专用通路,增加运算部件等技术对性能的影响进行考察,加深对流水线和RISC处理器的特点的理解。 ·实验原理: 指令流水线中主要有结构相关、数据相关、控制相关。相关影响流水线性能。·实验步骤 一.使用WinDLX模拟器,对做如下分析: (1)观察程序中出现的数据/控制/结构相关。指出程序中出现上述现象的指令组合。 (2)考察增加浮点运算部件对性能的影响。 (3)考察增加forward部件对性能的影响。 (4)观察转移指令在转移成功和转移不成功时候的流水线开销。 ·实验过程 一.使用WinDLX模拟器,对做如下分析: } 浮点加、乘、除部件都设置为1,浮点数运算部件的延时都设置为4,如图1: 图1 初始设置 将和加载至WinDLX中,如图2示。

图2 加载程序 1.观察程序中出现的数据/控制/结构相关;指出程序中出现上述现象的指令组合。 1)数据相关 点击F7,使程序单步执行,当出现R-Stall时停止,运行过程中出现下图3所示,输入整数6。 图3 输入整数6 @ 打开Clock Diagram,可以清楚的看到指令执行的流水线如图4所示。 图4 指令流水线 双击第一次出现R-Stall的指令行,如图5所示。

图5 指令详细信息 对以上出现的情况分析如下: 程序发生了数据相关,R-Stall(R-暂停)表示引起暂停的原因是RAW。 lbu r3,0×0(r2) 要在WB周期写回r3中的数据;而下一条指令 & seqi r5,r3,0×a 要在intEX周期中读取r3中的数据。 上述过程发生了WR冲突,即写读相关。为了避免此类冲突, seq r5,r4,0×a的intEX指令延迟了一个周期进行。 由此,相关指令为: 2)控制相关 由图6可以看出,在第4时钟周期:第一条指令处于MEM段,第二条命令处于intEX段,第三条指令出于aborted状态,第四条命令处于IF段。 图 6 指令流水线 }

自考计算机系统结构试题及答案解析

自考计算机系统结构试题及答案解析

4月高等教育自学考试全国统一命题考试 计算机系统结构试卷 (课程代码02325) 本试卷共3页,满分l00分,考试时间l50分钟。考生答题注意事项: 1.本卷所有试题必须在答题卡上作答。答在试卷上无效,试卷空白处和背面均可作草稿纸. 2.第一部分为选择题。必须对应试卷上的题号使用2B铅笔将“答题卡”的相应代码涂黑。3.第二部分为非选择题。必须注明大、小题号,使用0.5毫米黑色字迹签字笔作答。 4.合理安排答题空间,超出答题区域无效。 第一部分选择题 一、单项选择题(本大题共10小题,每小题1分,共10分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其选出并将“答题卡” 的相应代码涂黑。未涂、错涂或多涂均无分。1.以软件为主实现的机器称为p26 A.模型机器B.模拟机 C.虚拟机器

D.实际机器 2.下列关于系列机软件兼容描述正确的是p40 A.系列机软件必须保证向后兼容,力争向前兼容 B.系列机软件必须保证向下兼容,力争向前兼容 C.系列机软件必须保证向前兼容,力争向上兼容 D.系列机软件必须保证向下兼容,力争向后兼容 3.浮点数阶值采用二进制p位、尾数基值位r m,则该浮点数的最大阶值为p63 A.2p B.2p-1 C.2p-1 D.2p-1-1 4.为了使任何时候所需的信息都只用一个存储周期访问到,信息在主存中存放的地址要求是p73 A.地址最低位为0 B.地址最高位为0 C.该信息宽度的一半

D.该信息宽度的整数倍 5.存储器的最大频宽是指p98 A.存储器瞬时访问的频宽 B.存储器最大的传输速率 C.存储器连续访问时的频宽 D.存储器的实际传输速率 6.总线控制定时查询方式的控制线的线数为p111 A.┌log2N┐B.1+┌log2N ┐ C.2+┌log2N┐D.3+┌log2N┐ 7. 存储层次构成的主要依据是p127 A.CPU的速度B.主存器件 C.程序设计语言D.程序的局部性 8.相联存储器的访问依据是 A.内容B.地址 C.速度D.周期

计算机系统结构模拟试题5

计算机组成原理模拟试题(2)一、填空题:04分,每题02分 =_____________ [X]补=_____________补-X][1、 X=-0.1001 [X]原 =_____________ =_____________ =_____________ [-Y]补Y]原=_____________ []补 Y=0.0101 [Y ]补=_____________ [X+Y对西文输出的字符设备,在计算机的内存储器中存储的是 字符数据的每个字符的、 2,设备中的字符_____________(包括显示或打印)的则是每个字 符的码,输出_____________间的对应关_____________发生器的主要功能是解决从字符的 _____________码和字符的系。分二、单选题:20分,每题02 。3、 32 x 32点阵汉 字的机内编码需要 A: 16个字节 B: 32个字节 2个字节 C: 32×个字节 D: 32×4位,则可表示位,数值位为314、某机字长32位,采 用原码定点整数表示,符号位为1 。,最小负整数为的最大正整数为 A: B: C: D: 来实现。 5、在定点二进制运算器中,减法运算一般通过 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 。 6、在浮点数运算中产生溢出的原因是运算过程中最高位产生了进位或借位 A: 参加运算的操作数超出了机器的表示范围B: C: 运算的结果的阶码超出了机器的表示范围寄存器的位数太少,不得不舍弃最低有效位 D: 。 7、无论如何划分计算机的功能部件,控制器部件中至少含有 IP A: PC、 IR B: PC、、IP C: IR D: AR、IP 8、某存储器容量为32K×16位,则 A: 地址线为16根,数据线为32根 根16根,数据线为32地址线为B: C: 地址线为15根,数据线为16根 D: 地址线为15根,数据线为32根 9、在统一编址方式下,存储单元和I/O设备是靠指令中的来区分的。

计算机体系结构实验报告二

实验二结构相关 一、实验目得: 通过本实验,加深对结构相关得理解,了解结构相关对CPU性能得影响。 二、实验内容: 1、用WinDLX模拟器运行程序structure_d、s 。 2、通过模拟,找出存在结构相关得指令对以及导致结构相关得部件。 3、记录由结构相关引起得暂停时钟周期数,计算暂停时钟周期数占总执行 周期数得百分比。 4、论述结构相关对CPU性能得影响,讨论解决结构相关得方法。 三、实验程序structure_d、s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; < A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit < this is a ment !! A: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: 、double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 四、实验过程 打开软件,load structure_d、s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(Rstall 数据相关Stall 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面得数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关得部件:译码部件。

自考计算机系统结构考前复习资料

自考计算机系统结构考前复习资料

第一章计算机系统结构的基本概念 从处理数据的角度看,并行级别有位串字串,位并字串,位片串字并,全并行。位串字串和位并字串基本上构成了SIMD。位片串字并的例子有:相联处理机STARAN,MPP。全并行的例子有:阵列处理机ILLIAC IV。 从加工信息的角度看,并行级别有存储器操作并行,处理器操作步骤并行,处理器操作并行,指令、任务、作业并行。 存储器操作并行是指能够在一个存储周期内并行读出多个CPU字的,采用单体多字、多体单字或多体多字的交叉访问主存系统,进而采用按内容访问方式,位片串字并或全并行方式,在一个主存周期内实现对存储器中大量字的高速并行操作。例子有并行存储器系统,以相联存储器为核心构成的相联处理机。 处理器操作步骤并行是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。例子有流水线处理机。 处理器操作并行是指一个指令部件同时控制

多个处理单元,实现一条指令对多个数据的操作。擅长对向量、数组进行处理。例子有阵列处理机。 指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。例子有多处理机,计算机网络,分布处理系统。 并行性的开发途径有时间重叠(Time Interleaving),资源重复(Resource Replication),资源共享(Resource Sharing)。 时间重叠是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。例子有流水线处理机。 资源重复是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。例子有阵列处理机,相联处理机。 资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率,从而提高系统性能。例子有多处理机,计算机网络,分布处理系统。 SISD:一个指令部件控制一个操作部件,实现一

计算机系统结构模拟题

《计算机系统结构》模拟题 一.判断是非题,对的打√,错的打× 1.系列机是指由一个厂家生产的具有相同组成,但具有不同系统结构和实现的一系列不同型号的机器。 ( × ) 2.Cray 1向量处理机中,由于每个向量寄存器的长度为64,当实际需要处理的向量长度大于64时,它就不能够处理了。 ( × ) 3.按照Flynn 分类法,Illiac IV 阵列处理机是MIMD 计算机。 ( × ) 4.多级混洗交换网络是阻塞网络。 ( √ ) 二.填空题 1.多机系统的互连网络的通信模式可分为4种,其中,一对一的通信模式称为____单播_____模式,一对全体的通信模式为_____广播____模式,多对多的通信模式为____会议_____模式。 2.SIMD 计算机和流水线向量处理机都可以执行向量指令,前者采用___资源重复______并行性,后者采用___时间重叠______并行性。 3.系列机软件兼容必须做到___向后_____兼容,力争做到___向上_____兼容。 4.流水线消除瓶颈段的方法有____细分_____和____重复设置瓶颈段(可交换次序)_____2种方法。 5.设通道数据传送过程中,选择一次设备的时间为 s T ,传送一个字节的时间为D T ,则字 节多路通道最大流量等于____ D s T T 1 _____。 6.Illiac IV 8×8阵列中,网络直径为____7_____。 7.对堆栈型替换算法,增大分配给程序的___主存页面______,对第一级存储器的命中率就会单调____上升_____。 8.从网络的任何结点看,若网络拓扑结构都是相同的,则称这样的网络是___对称______网络。 三.单项选择题 1.在计算机系统层次结构中,从下层到上层,各层相对顺序正确的是( B )。 A.汇编语言机器级-操作系统机器级-高级语言机器级 B.微程序机器级-传统机器语言机器级-汇编语言机器级 C.传统机器语言机器级-高级语言机器级-汇编语言机器级 D.汇编语言机器级-应用语言机器级-高级语言机器级 2.Illiac IV 阵列处理机中,PE 之间所用的互连函数是( A )。

计算机系统结构总复习题

一、单项选择题 1、直接执行微指令的是( ) A.汇编程序B.编译程序 C.硬件D.微指令程序 2、对系统程序员不透明的应当是( )。 A.Cache存贮器B.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器 3、对机器语言程序员透明的是( )。 A.中断字B.主存地址寄存器 C.通用寄存器D.条件码 4、计算机系统结构不包括( )。 A.主存速度B.机器工作状态 C.信息保护D.数据 5、从计算机系统结构上讲,机器语言程序员所看到的机器属性是( )。A.计算机软件所要完成的功能B.计算机硬件的全部组成 C.编程要用到的硬件组织D.计算机各部件的硬件实现 6、计算机组成设计不考虑( )。 A.专用部件设置B.功能部件的集成度 C.控制机构的组成D.缓冲技术 7、以下说法中,不正确的是( )。 软硬件功能是等效的,提高硬件功能的比例会: A.提高解题速度B.提高硬件利用率 C.提高硬件成本D.减少所需要的存贮器用量 8、在系统结构设计中,提高软件功能实现的比例会( )。 A.提高解题速度B.减少需要的存贮容量 C.提高系统的灵活性D.提高系统的性能价格比 9、下列说法中不正确的是( )。 A.软件设计费用比软件重复生产费用高 B.硬件功能只需实现一次,而软件功能可能要多次重复实现 C.硬件的生产费用比软件的生产费用高 D.硬件的设计费用比软件的设计费用低 10、在计算机系统设计中,比较好的方法是( )。 A.从上向下设计B.从下向上设计 C.从两头向中间设计D.从中间开始向上、向下设计11、"从中间开始"设计的"中间"目前多数是在( )。 A.传统机器语言级与操作系统机器级之间 B.传统机器语言级与微程序机器级之间 C.微程序机器级与汇编语言机器级之间 D.操作系统机器级与汇编语言机器级之间 12、系列机软件应做到( )。 A.向前兼容,并向上兼容 B.向后兼容,力争向上兼容

计算机系统结构模拟题

《计算机系统结构》模拟题(补)一.单项选择题 1. SIMD是指()。 A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2. 磁盘外部设备适合于连接到()。 A.字节多路通道B.数组多路通道或选择通道 C.选择通道或字节多路通道D.数组多路通道或字节多路通道 3. 下列()存储设备不需要编址。 A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 4.多处理机的各自独立型操作系统( )。 A.要求管理程序不必是可再入的 B.适合于紧耦合多处理机 C.工作负荷较平衡 D.有较高的可靠性 5.输入输出系统硬件的功能对( )是透明的。 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 6. 实现汇编语言源程序变换成机器语言目标程序是由()。 A.编译程序解释B.编译程序翻译 C.汇编程序解释D.汇编程序翻译 7.全相联地址映象是指( )。 A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间是固定的,而组任何虚页可以装入任何实页位置 D.组间可任意装入,组是固定装入 8.( )属于MIMD系统结构。 A.各处理单元同时受同一个控制单元的管理 B.各处理单元同时接受同一个控制单元送来的指令 C.松耦合多处理机和多计算机 D.阵列处理机

9.设16个处理器编号分别为0,1,2,…,15用Cube3互联函数时,第10号处理机与第( ) 号处理机相联。 A.11 B.8 C.14 D.2 10.若输入流水线的指令既无局部性相关,也不存在全局性相关,则( )。 A.可获得高的吞吐率和效率 B.流水线的效率和吞吐率恶化 C.出现瓶颈 D.可靠性提高 11.流水线的技术指标不包括( )。 A.响应比 B.吞吐率 C.加速比 D.效率 12.指令优化编码方法,就编码的效率来讲,方法最好是()。 A. 固定长度编码 B. 扩展编码法 C. Huffman编码法 D. 以上编码都不是 13.RISC 计算机的指令系统集类型是 ( ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器 - 存储器型 14.相联存储器的访问方式是( )。 A.先进先出顺序访问B.按地址访问 C.无地址访问D.按容访问 15.存储器读写速率越高,每位的成本也越高,存储容量也小。解决这一问题的主要方法是采用( )。 A.多级存储体系结构B.并行存储器 C. Cache D.缓冲技术 16.计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是()。 A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级语言机器级---汇编语言机器级 D. 汇编语言机器级---应用语言机器级---高级语言机器级 17.对系统程序员不透明的是()。 A.Cache 存储器 B.系列几各档不同的数据通路宽度 C.指令缓冲寄存器 D.虚拟存储器 18.在计算机系统设计中,比较好的方法是()。

北邮计算机系统结构实验报告-实验一到五-WINDLX模拟器

北京邮电大学 实验报告 课程名称计算机系统结构 计算机学院03班 王陈(11)

目录 实验一WINDLX模拟器安装及使用......................................... 错误!未定义书签。 ·实验准备................................................................................ 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验内容及要求.................................................................... 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验二指令流水线相关性分析 ............................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验三DLX处理器程序设计 .................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 A.向量加法代码及性能分析 ................................................... 错误!未定义书签。 B.双精度浮点加法求和代码及结果分析 .............................. 错误!未定义书签。 ·实验总结............................................................................. 错误!未定义书签。实验四代码优化 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 ·实验总结+实习体会........................................................... 错误!未定义书签。实验五循环展开 ....................................................................... 错误!未定义书签。 ·实验目的............................................................................. 错误!未定义书签。 ·实验环境................................................................................ 错误!未定义书签。 ·实验原理................................................................................ 错误!未定义书签。 ·实验步骤................................................................................ 错误!未定义书签。 ·实验过程............................................................................. 错误!未定义书签。 矩阵乘程序代码清单及注释说明........................................... 错误!未定义书签。 相关性分析结果........................................................................... 错误!未定义书签。 增加浮点运算部件对性能的影响........................................... 错误!未定义书签。 增加forward部件对性能的影响 ............................................ 错误!未定义书签。 转移指令在转移成功和转移不成功时候的流水线开销 .. 错误!未定义书签。 ·实验总结+实习体会+课程建议......................................... 错误!未定义书签。

自考计算机系统结构考前复习资料

第一章计算机系统结构的基本概念 从处理数据的角度看,并行级别有位串字串,位并字串,位片串字并,全并行。位串字串和位并字串基本上构成了SIMD。位片串字并的例子有:相联处理机STARAN,MPP。全并行的例子有:阵列处理机ILLIAC IV。 从加工信息的角度看,并行级别有存储器操作并行,处理器操作步骤并行,处理器操作并行,指令、任务、作业并行。 存储器操作并行是指可以在一个存储周期内并行读出多个CPU字的,采用单体多字、多体单字或多体多字的交叉访问主存系统,进而采用按内容访问方式,位片串字并或全并行方式,在一个主存周期内实现对存储器中大量字的高速并行操作。例子有并行存储器系统,以相联存储器为核心构成的相联处理机。 处理器操作步骤并行是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。例子有流水线处理机。 处理器操作并行是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。擅长对向量、数组进行处理。例子有阵列处理机。 指令、任务、作业并行是指多个独立的处理机分别执行各自的指令、任务、作业。例子有多处理机,计算机网络,分布处理系统。 并行性的开发途径有时间重叠(Time Interleaving),资源重复(Resource Replication),资源共享(Resource Sharing)。 时间重叠是指在并行性概念中引入时间因素,让多个处理过程在时间上错开,轮流重复地执行使用同一套设备的各个部分,加快硬件周转来赢得速度。例子有流水线处理机。 资源重复是指一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。例子有阵列处理机,相联处理机。 资源共享是指用软件方法让多个用户按一定时间顺序轮流使用同一套资源以提高资源的利用率,从而提高系统性能。例子有多处理机,计算机网络,分布处理系统。 SISD:一个指令部件控制一个操作部件,实现一条指令对一个数据的操作。例子有传统的单处理机 SIMD:一个指令部件同时控制多个处理单元,实现一条指令对多个数据的操作。例子有阵列处理机,相联处理机。 MIMD:多个独立的处理机分别执行各自的指令、任务、作业,实现指令、任务、作业并行的多机系统,是多个SISD的集合,也称多倍SISD系统(MSISD)。例子有多处理机,计算机网络,分布处理系统。 exercises: 1.有一台经解释实现的计算机,可以按功能划分成4级,每一级为了执行一条指令,需要下一级的N条指令来解释。如果执行第1级的一条指令要Kns时间,那么执行第2、第3和第4级的一条指令各需要用多少时间? 解答:执行第2、第3和第4级的一条指令各需要KNns、KN^2ns、KN^3ns的时间。 1.有一个计算机系统可按功能分成4级,每级的指令互不相同,每一级的指令都比其下一级的指令在效能上强M倍,即第i级的一条指令能完成第i-1级的M条指令的计算量。现若需第i级的N条指令解释第i+1级的一条指令,而有一段第1级的程序需要运行Ks,问在第2、3和4级上一段等效程序各需要运行多长时间? 答:第2级上等效程序需运行:(N/M)*Ks。第3级上等效程序需运行:(N/M)*(N/M)*Ks。第4级上等效程序需运行:(N/M)*(N/M)*(N/M)*Ks。 note: 由题意可知:第i级的一条指令能完成第i-1级的M条指令的计算量。而现在第i 级有N条指令解释第i+1级的一条指令,那么,我们就可以用N/M来表示N/M 表示第i+1级

计算机系统结构作业答案第三章(张晨曦)

3.1 -3.3为术语解释等解答题。 3.4 设一条指令的执行过程分为取指令,分析指令和执行指令3个阶段,每个阶段所需时间分别为ΔT, ΔT, 2ΔT,分别求出下列各种情况下,连续执行N条指令所需的时间。 (1) 顺序执行方式 (2) 只有“取指令”与“执行指令”重叠 (3) “取指令”,“分析指令”与“执行指令”重叠 解: (1) 4NΔT (2) (3N+1) ΔT (3) 2(N+1) ΔT 3.6 解决流水线瓶颈问题有哪两种常用方法? 解: (1) 细分瓶颈段 将瓶颈段细分为若干个子瓶颈段 (2) 重复设置瓶颈段 重复设置瓶颈段,使之并行工作,以此错开处理任务 3.9 列举下面循环中的所有相关,包括输出相关,反相关,真数据相关。 for(i = 2; i < 100; i=i+1) { a[i] = b[i] + a[i]; -----(1) c[i+1] = a[i] + d[i]; -----(2) a[i-1] = 2*b[i]; -----(3) b[i+1] = 2*b[i]; -----(4) } 解: 输出相关:第k次循环时(1)与第k+1轮时(3) 反相关:第k次循环时(1)和(2)与第k-1轮时(3) 真数据相关:每次循环(1)与(2),第k次循环(4)与k+1次循环(1),(3),(4) 3.12 有一指令流水线如下所示 50ns 50ns 100ns 200ns (1)求连续如入10条指令的情况下,该流水线的实际吞吐率和效率 (2)该流水线的“瓶颈”在哪一段?请采用两种不同的措施消除此“瓶颈”。对于你所给出 的两种新的流水线连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)(m表示流水线级数,n 表示任务数)

计算机系统结构考试题库及答案

计算机系统结构试题及答案 一、选择题(50分,每题2分,正确答案可能不只一个,可单选 或复选) 1.(CPU周期、机器周期)是内存读取一条指令字的最短时间。 2.(多线程、多核)技术体现了计算机并行处理中的空间并行。 3.(冯?诺伊曼、存储程序)体系结构的计算机把程序及其操作数 据一同存储在存储器里。 4.(计算机体系结构)是机器语言程序员所看到的传统机器级所具 有的属性,其实质是确定计算机系统中软硬件的界面。 5.(控制器)的基本任务是按照程序所排的指令序列,从存储器取 出指令操作码到控制器中,对指令操作码译码分析,执行指令操作。 6.(流水线)技术体现了计算机并行处理中的时间并行。 7.(数据流)是执行周期中从内存流向运算器的信息流。 8.(指令周期)是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机,使用(晶体管)作为电子器件。 10.1960年代中期开始出现的第三代计算机,使用(小规模集成电路、 中规模集成电路)作为电子器件。 11.1970年代开始出现的第四代计算机,使用(大规模集成电路、超 大规模集成电路)作为电子器件。 12.Cache存储器在产生替换时,可以采用以下替换算法:(LFU算法、 LRU算法、随机替换)。

13.Cache的功能由(硬件)实现,因而对程序员是透明的。 14.Cache是介于CPU和(主存、内存)之间的小容量存储器,能高 速地向CPU提供指令和数据,从而加快程序的执行速度。 15.Cache由高速的(SRAM)组成。 16.CPU的基本功能包括(程序控制、操作控制、时间控制、数据加 工)。 17.CPU的控制方式通常分为:(同步控制方式、异步控制方式、联合 控制方式)反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是:(在功能部件内部采用同步控 制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下,尽可能多地采用异步控制方式)。 19.CPU的同步控制方式有时又称为(固定时序控制方式、无应答控 制方式)。 20.CPU的异步控制方式有时又称为(可变时序控制方式、应答控制 方式)。 21.EPROM是指(光擦可编程只读存储器)。 22.MOS半导体存储器中,(DRAM)可大幅度提高集成度,但由于(刷 新)操作,外围电路复杂,速度慢。 23.MOS半导体存储器中,(SRAM)的外围电路简单,速度(快),但 其使用的器件多,集成度不高。 24.RISC的几个要素是(一个有限的简单的指令集、CPU配备大量的 通用寄存器、强调对指令流水线的优化)。

计算机系统结构实验报告

计算机系统结构实验报告 一.流水线中的相关 实验目的: 1. 熟练掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点; 2. 加深对计算机流水线基本概念的理解; 3. 进一步了解DLX基本流水线各段的功能以及基本操作; 4. 加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响; 5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停。 实验平台: WinDLX模拟器 实验内容和步骤: 1.用WinDLX模拟器执行下列三个程序: 求阶乘程序fact.s 求最大公倍数程序gcm.s 求素数程序prim.s 分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察 CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。 2. 用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相 关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的 百分比;论述资源相关对CPU性能的影响,讨论解决资源相关的方法。 3. 在不采用定向技术的情况下(去掉Configuration菜单中Enable Forwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟周期数以及程序执行的 总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比。 在采用定向技术的情况下(勾选Enable Forwarding),用WinDLX再次运行程序data_d.s。重复上述3中的工作,并计算采用定向技术后性能提高的倍数。 1. 求阶乘程序 用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准 输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。 实验结果: 在载入fact.s和input.s之后,不设置任何断点运行。 a.不采用重新定向技术,我们得到的结果

计算机体系结构自考

全国 2004年 7月高等教育自学考试 计算机系统结构试卷 课程代码:02325 一、单项选择题( 在每小题的四个备选答案中,选出一个正确答案,并将正确答案的 序号填在题干的括号内。每小题2分,共20 分) 1.软件和固件的功能在逻辑上是 ( )的。 A.固件优于软件 B.不等价 C.等价 D.软件优于固件 2.( )编写者看到的逻辑结构和功能能力就是计算机的外部特性。 A.操作系统 B.汇编语言程序 C.Windows NT D.微程序 3.RISC 计算机的指令系统集类型是 ( )。 A. 堆栈型 B.累加器型 C.寄存器—寄存器型 D.寄存器-存储器型 4.主存储器的 ( )要求属于外特性。 A. 容量大小 B.速度 C.页面组织 D.带宽 5.在采用延迟转移技术时,在以下几种调度方法中,效果最好的是哪一种方法 ?( ) A.将转移指令前的那条指令调度到延迟槽中 B.将转移目标处的那条指令调度到延迟槽中 C.将转移不发生时该执行的那条指令调度到延迟槽中 D.在延迟槽中填入 NOP 空操作指令 6.设 8个处理器编号分别为 0,1,2?,7用 Cube2互联函数时,第 5号处理机与第 ( 处理机相联。 A.1 B.3 C.4 D.6 7.大型计算机和小型计算机的主要区别在于 ( )。 A.大型机运行速度比小型机快得多 B.大型机能够控制大量的外设 C.大型机具有图型终端和图形处理能力 D.大型机的外存经管能力超过小型机 8.在以下总线规范中,哪一种总线具有与设备和主机无关的高级命令系统 ?( ) A.IDE B.AT C.SCSI D.PCI )号)。 1 / 5

系统结构期末考试试题及答案

得分 评分人 填空题: (20分,每题2 分) 单选题:(10分,每题1分) A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置 《计算机系统结构》期末考试试卷(A ) 得分 注:1、共100分,考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令,是属于( A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对 (B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) C. 组之间固定,组内任何虚页可装入任何实页位置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关,则( B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、 计算机使用的语言是(B ) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、 指令执行结果出现异常引起的中断是( C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是(A ) A.直接 B .组相联 C .段相联 D .全相联 9、 组相联映象、LRU 替换的Cache 存储器,不影响 Cache 命中率的是(B ) A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、 流水处理机对全局性相关的处理不 包括(C ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

计算机体系结构实验报告二

实验二结构相关 一、实验目的: 通过本实验,加深对结构相关的理解,了解结构相关对CPU性能的影响。 二、实验内容: 1. 用WinDLX模拟器运行程序structure_d.s 。 2. 通过模拟,找出存在结构相关的指令对以及导致结构相关的部件。 3. 记录由结构相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行 周期数的百分比。 4. 论述结构相关对CPU性能的影响,讨论解决结构相关的方法。 三、实验程序structure_d.s LHI R2, (A>>16)&0xFFFF 数据相关 ADDUI R2, R2, A&0xFFFF LHI R3, (B>>16)&0xFFFF ADDUI R3, R3, B&0xFFFF ADDU R4, R0, R3 loop: LD F0, 0(R2) LD F4, 0(R3) ADDD F0, F0, F4 ;浮点运算,两个周期,结构相关 ADDD F2, F0, F2 ; <- A stall is found (an example of how to answer your questions) ADDI R2, R2, #8 ADDI R3, R3, #8 SUB R5, R4, R2 BNEZ R5, loop ;条件跳转 TRAP #0 ;; Exit <- this is a comment !! A: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 B: .double 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

四、实验过程 打开软件,load structure_d.s文件,进行单步运行。经过分析,此程序一 次循环中共有五次结构相关。(R-stall 数据相关Stall- 结构相关) 1)第一个结构相关:addd f2,,f0,f2 由于前面的数据相关,导致上一条指令addd f0,f0,f4暂停在ID阶段,所以下一条指令addd f2,,f0,f2发生结构相关,导致相关的部件:译码部件。 2)第二个结构相关:ADDI R2, R2, #8,与第一个结构相关类似。由于数据相关, 上一条指令暂停在ID阶段,所以导致下一条指令发生结构相关。

相关文档
相关文档 最新文档