文档库 最新最全的文档下载
当前位置:文档库 › 计算机体系结构的研究重点与发展方向分析

计算机体系结构的研究重点与发展方向分析

计算机体系结构的研究重点与发展方向分析
计算机体系结构的研究重点与发展方向分析

计算机体系结构的研究重点与发展方向分析

【摘要】:本文首先简要说明了现代计算机的两种主要体系结构CISC 体系和RISC 体系,指出了基于冯·诺伊曼体系结构的现代计算机体系存在的问题及研究重点,并展望了未来计算机体系的发展方向。

【关键词】:体系结构;CIST 体系;RISC 体系

一、引言

计算机体系结构主要指计算机的系统化设计和构造,不同的计算机体系结构适用于不同的需求或应用。现代计算机的两种主要体系结构是CISC 体系和RISC 体系。其中RISC是近20 年的研究主流。而随着计算机应用的普及,RISC 结构也出现了许多与以多媒体处理和个人移动计算机为主要内容的应用趋势的不协调。为了消除这些不协调,未来计算机体系结构将会向什么方向发展呢?本文将对这些问题进行阐述和说明。

二、两种主要的计算机体系结构说明

当今的计算机体系结构,从传统意义指令界面上来看基本划分成两大类:一类是CISC 体系结构,如INTEL 的X86芯片,另一类是RISC 体系结构,如SPARC、MIPS、POWERPC、等。不管是CISC 体系结构还是RISC 体系结构,人们在计算机体系结构的设计上均追求两方面的目标:

1.面向应用(软件)描述方面

设计的计算机体系在面向应用(软件)描述方面使得自己的指令语义层次比较高,这点CISC 较为明显,因为它有许多指令可以直接支持高级语言的语义。而RISC 则比较隐蔽,它是靠精简指令的优化编译(即通过若干条精简指令有机组合)来支持高级语言的语义。2.面向应用处理方面

设计的计算机体系在面向应用处理方面,使得自己的指令处理速度明显提高,进而加速应用处理的速度。这点RISC表现的比较明显,因为它的指令硬件译码直接实现和采用流水线技术等大大提高了它的处理速度,而在CISC 中,当初增加硬件的资源支持复杂的高层次的语义的指令,本身就意味着提高应用的处理速度。

在过去的20 年里,RISC 技术不断发展,逐渐取代C1SC成为工作站和服务器的主流技术。RISC 计算机以超标量、流水线、乱序执行、预取指令/数据、分支预测和指令取消等硬件技术和相应的基于编译器的优化技术为核心,利用指令级并行,在高端工作站和服务器领域占据了绝对的统治地位。

三、当前计算机体系结构存在的问题

60 多年来,冯·诺伊曼体系结构为世界众多的科学家精心地构造,从而创造了今天的计算机世界。冯·诺伊曼的伟大发明,其核心有三点:(1)二进制;(2)存储模型;(3)一个时刻只有一个操作的串行机制。

虽然在计算机界,众多的国家专家在研究多值理论,但至今几乎没有突破二进制的体系。人们利用了很多存储管理的软件技术和方法,力图将一维的存储模型改为二维的,但仍然没

有逃出冯氏存储模型和寄存器存储的结构,使得在串行机制上进行新的突破将十分困难。主要表现在:

1.操作瓶颈制约

因为冯·诺伊曼体系结构本质包括串行性、顺序性的控制机理。对数据相关和资源的控制和仲裁均是人为决定。因此构成了时间和空间的极大开销,造成冯氏数据流的拥塞,即为大家熟知的冯·诺伊曼瓶颈问题。

2.算法的制约

冯氏体系的很大贡献在于将所有应用问题建立在四则运算和逻辑运算的组合算法,并以寄存器为基本模型的存储体系上,但它在基本操作控制上仍是一种串行机制,不具备构造一个并行算法的基础。在串行的模型上去建立并行算法,必定会带来本质的困难和效率的损失。3.存储模型的制约

存储模型在冯·诺伊曼体系结构当中是一种被动式的访问机制,不能真正体现人类在并行操作行为中经常反映的无破坏性操作和平等交互赋值运行的需求,因此冯·诺伊曼的存储模型结构仅能在运行时以空间为代价进行复制或以时间为代价进行选择来替代这种制约。当前,计算机求解一般过程如图 1 所示,而以上三大制约的存在,严重阻碍了计算机的处理速度及信息处理能力。

图1 计算机问题求解过程图

由图 1 可见:计算机在求解时,经过时间往往多于求解时间几个数量级,如果以上三大制约瓶颈消除了,我们就可用更简捷的方式求解同样规模的问题,也就是在较短时间或较少空间内求解,最大发挥计算机的潜力。然而,现有计算机体系结构,无论是CISC 体系还是RISC 体系,它们本质上都属于冯·诺伊曼体系结构范畴,只是在指令界面的特征上有所区别而已,难以消除以上制约,因此它们的固有缺陷再所难免。

四、计算机体系结构的研究重点

1.对并行体系结构的研究

众所周知,在计算机领域中,并行是实现计算能力突破的根本手段。由于与并行体系结构相对的是当前使用的串行结构,串行结构上的效率提升始终不是无限制的,而在嵌入式领域中,专用的并行结构在当前的技术条件下提升性能和功耗效率已经达到10-1000 倍。所以,现在不少商业通用处理器在生产上已经倾向于转向多处理器体系结构,或者CMP,或者SMT,或者二者兼而有之,而不是仅仅只试图提高单一处理器的IPC,这是一个很大的转变。

然而,并行应用程序的开发是一个缓慢而且费心的过程。只有那些有巨大的计算需求或者有严格的预算和功耗限制的人才会去开发。虽然目前很多关于并行编译器和软件开发工具的研究会对设计可用的并行系统有益,但是只有为并行软件设计出更好的并行系统,才是关键所在。一些早期的研究为新的并行体系结构作了尝试。原始的数据流结构由于只关注并行而忽略局部性和可预测性而最终导致失败,但它确实又提供了一个真实的并行结构例子。后来人们又在数据流的思想上进行了局部性方面的研究,但这方面的工作进行的还远远不够。

像数据流、缓存及前瞻技术的各种组合都值得深入研究。

2.对功耗敏感的体系结构进行研究

假如计算机性能和容量能够以过去的速度继续增长,对于功耗敏感的体系结构的研究是十分重要的。对于功耗敏感的体系结构,静态和动态功耗方面的考虑已成为处理器设计过程中最大的限制。尽管计算机工作者对于“动态可调整结构”的研究进行了很多的工作,但他们取得的性能收益正逐渐递减,并且它的复杂性使其难以应用到系统的大部分部件中去。由于它是以指数级形式上升的,设计先进体系结构和嵌入式应用要时刻考虑功耗问题,这是很重要的。并且功耗问题和可靠性问题之间的关系非常密切,一定要一同考虑。

3.设计能够高效开发显示并行的结构

新结构性能的提升主要来源于开发更多的并行,因为流水线深度和时钟速率有局限性。显示并行的方法能够用于提高那些易提取并行性代码的性能。这方面存在很多的挑战,例如:确定片上该集成何种机制能够提高这部分代码的可扩

展性:确定CMP 中PE 的最佳粒度:要扩大那些能够有效地运行在并行结构上的代码类型;找到有效的方法来消除引脚接口的瓶颈。目前引脚接口的瓶颈已经成为影响性能的一大因素,因为引脚数增长的速度要远远小于片上可集成的晶体管数目增长的速度。

4.开发隐式并行的大指令窗口的体系结构

开发单线索代码中的隐式并行方面的研究也十分重要。目前的体系结构可开发的隐式并行与代码中存在的隐式并行相差有1-2 个数量级。这方面的研究之所以重要是因为:第一,绝大多数代码无法显示并行化。

第二,体系结构时钟速率方面的限制也强迫我们必须转向开发更多的并行。

这些研究领域不能被分割开,在最好的情况下,不是将各种研究机制复杂地组合在一起,而是应该研究出一种从根本上,简洁的底层机制一次性解决上述问题。

五、计算机体系结构的发展方向

近十几年来,计算机技术得到迅猛发展和普及,使得从事各种技术工作的人员对计算机的了解普遍加深。但由于技术层次的多面性和应用的差异性,特别是发展的迅猛和不均匀所带来的迷惑性,使人们不易看清某个方面的具体发展现状。计算机体系结构是设计计算机应用系统的一个重要参考因素,是一个近来较受关注的话题。根据目前计算机体系结构的发展状况来看,未来一段时间,计算机体系结构将向以下几个方向发展:

1.VLIW 体系

VLIW 指的是一种指令集设计思想与技术,它利用编译器把若干个简单的、无相互依赖的操作压缩到同一个很长的指令字中。当超长指令字被从Cache 或主存取进处理器时,可以容易地分割出各个操作,并一次性分别分派到多个独立的执行单元中并行执行。

2.单芯片多处理器体系

单芯片多处理器是随着VLSI 工艺水平的提高自然会想到的一个方向。在0.25mm 工艺下,单片可以集成20 个21064(32kCache);在2010 年将实现的0.07mm 工艺下,单片可以集成60 个21064 水平的微处理器。不远的将来,现今的SMP 系统可以完全集成在一个芯片内,其性能提高显然是诱人的。

3.多线程体系

多线程技术结合了指令级现场交换和顺序调度技术,是数据流模型和冯·诺伊曼控制流模型的有机结合。简单地说,线程是一组静态排序的指令序列,其中,当第一条指令开始执行,后续指令即开始执行而不中断。线程作为执行调度的基本单位,多个线程可以并发(并行)执行,以达到互相隐藏延迟操作和提高并行度的效果。

六、结束语

从目前计算机体系发展来看,CISC 体系与RISC 体系的界限日益模糊,它们代表着两种思想而不是技术。冯·诺伊曼体系结构构成了现代计算机实现的基础,而其局限性已经成为现代计算机发展的障碍。可以预见 VILW 体系、多线程体系等必将成为计算机发展的重要方向。

【参考文献】

[1] 任琦,吉梅.计算机体系结构的未来.软件导报,2005.

[2] 沈绪榜,冯国臣等.计算机体系结构的分类模型.计算机学,2004.

[3] 郑纬民,汤志忠编. 计算机系统结构. 北京:清华大学出版社,1998.

计算机体系结构试题及答案版本

计算机体系结构试题及答案 1、计算机高性能发展受益于:(1) 电路技术的发展;(2) 计算机体系结构技术的发展。 2、层次结构:计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。第六级:应用语言虚拟机-> 第五级:高级语言虚拟机-> 第四级:汇编语言虚拟机-> 第三级:操作系统虚拟机->第二级:机器语言(传统机器级) -> 第一级:微程序机器级。 3、计算机体系结构:程序员所看到的计算机的属性,即概括性结构与功能特性。 4、透明性:在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的概念称为透明性。 5、Amdahl 提出的体系结构是指机器语言级程序员所看见的计算机属性。 6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定,也就是指令集的设计,该界面之上由软件的功能实现,界面之下由硬件和固件的功能来实现。 7、计算机组织是计算机系统的逻辑实现;计算机实现是计算机系统的物理实现。

8、计算机体系结构、计算机组织、计算机实现的区别和联系? 答:一种体系结构可以有多种组成,一种组成可以有多种物理实现,体系结构包括对组织与实现的研究。 9、系列机:是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。 10、软件兼容:即同一个软件可以不加修改地运行于系统结构相同的 各机器,而且它们所获得的结果一样,差别只在于运行时间的不同。 11、兼容机:不同厂家生产的、具有相同体系结构的计算机。 12、向后兼容是软件兼容的根本特征,也是系列机的根本特征。 13、当今计算机领域市场可划分为:服务器、桌面系统、嵌入式计算三大领域。 14、摩尔定律:集成电路密度大约每两年翻一番。 15、定量分析技术基础(1)性能的评测:(a)响应时间:从事件开始到结束之间的时间;计算机完成某一任务所花费的全部时间。(b)流量:单位时间内所完成的工作量。(c )假定两台计算机x 、y;x 比y 快意思为:对于给定任务,x 的响应时间比y少。x的性能是y的几倍是指:响应时间x / 响应时间y = n ,响应时间与性能成反比。

计算机体系结构解

计算机体系结构解

————————————————————————————————作者:————————————————————————————————日期:

第一章计算机组成原理 本部分要求掌握计算机方面的基础知识,包括计算机的发展、计算的系统组成、基本组成和工作原理、计算机的数制数据表示以及运算校验、指令系统以及计算机系统的安全等基础性的知识。内容多而且复杂,尤其是有关计算机硬件方面的内容,很细而且灵活性不高,知识量相当大,掌握这部分一定要多下功夫,学会取舍、把握重点、抓住要害。 1.1 考试大纲及历年考题知识点 1.1.1 大纲要求 考试要求: 1 掌握数据表示、算术和逻辑运算; 2 掌握计算机体系结构以及各主要部件的性能和基本工作原理考试范围 1 计算机科学基础 1.1 数制及其转换二进制、十进制和十六进制等常用制数制及其相互转换 1.2 数据的表示 ?数的表示(原码、反码、补码、移码表示,整数和实数的机内表示,精度和溢出)?非数值表示(字符和汉字表示、声音表示、图像表示) ?校验方法和校验码(奇偶校验码、海明校验码、循环冗余校验码) 1.3 算术运算和逻辑运算 ?计算机中的二进制数运算方法 ?逻辑代数的基本运算和逻辑表达式的化简 2.计算机系统知识 2.1 计算机系统的组成、体系结构分类及特性 ?CPU 和存储器的组成、性能和基本工作原理 ?常用I/O 设备、通信设备的性能,以及基本工作原理 ?I/O 接口的功能、类型和特性 ?I/O 控制方式(中断系统、DMA、I/O 处理机方式) ?CISC/RISC,流水线操作,多处理机,并行处理 2.2 存储系统 ?主存-Cache 存储系统的工作原理 ?虚拟存储器基本工作原理,多级存储体系的性能价格 ?RAID 类型和特性 2.3 安全性、可靠性与系统性能评测基础知识 ?诊断与容错 ?系统可靠性分析评价 ?计算机系统性能评测方式 1.2 计算机科学基础 1.2.1 数制及其转换 1、R 进制转换成十进制的方法按权展开法:先写成多项式,然后计算十进制结果. 举例: (1101.01)2=1×2^3+1×2^2+0×2^1+1×2^0+ 0×2^-1+1×2^-2 =8+4+1+0.25=13.25 (237)8=2×8^2+3×8^1+7×8^0 =128+24+7=159 (10D)16=1×16^2+13×16^0=256+13=269

计算机体系结构期末复习

计算机体系结构期末复习资料 1.并行性:是指在同一时刻或者是同一时间间隔内完成两种或两种以上性质相同或不同的工作。 2.CPI:每条指令执行时所花费的平均时钟周期。 3.体系结构:即计算机的属性,即概念性结构与功能特性。 4.Amdahl定理:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。 5.信息存储的整数边界:信息在主存中存放的起始地址必须是该信息(字节数)的整数倍。 6.指令系统的正交性:指在指令中各个不同含义的字段,在编码时应互不相关,相互独立。 7.流水线技术:是指将一个重复的时序过程,分解成为若干子过程,而每个过程都可有效在其专用功能段上与其他子过程同时执行。 8.定向技术:在某条指令产生一个结果之前,其他指令并不直接需要该计算结果,如果能将该计算结果从其他产生的地方直接送到其他指令需要它的地方,那么就可以避免暂停的技术就叫定向技术。 9.相关:衡量两个随机变量之间相关程度的指标。 10.向量流水处理机:是指处理机具有向量数据表示并通过向量指令对向量的各元素进行处理。、

11.定向:将计算结果从其产生的地方直接送到其他指令需要它的地方,或所有需要它的功能单元,避免暂停。 12.指令集的并行:当指令之间不存在相关时,它们在流水线中是可以重叠起来并行执行。 13.记分牌技术:流出和读操作数。在没有结构冲突时,尽可能早地执行没有数据冲突的指令,实现每个时钟周期执行一条指令。如果某条指令被暂停,而后面的指令与流水线中正在执行或被暂停的指令都不相关,是这些指令可以跨越它,继续流出和执行下去。 14.Tomasulo算法:寄存器换名是通过保留站和流出逻辑来共同完成,当指令流出时,如果其操作数还没有计算出来,则该指令中相应的寄存器换名将产生这个操作数的保留站的标识。因此,指令流出到保留站后,其操作数寄存器或者换成了数据本身,或换成了保留站的标识,和寄存器无关。后面指令对该寄存器的写入操作就不会产生WAR冲突。 15.替换算法:由于主存中的块比Cache中的块多,所以当要从主存中调一个块到Cache中时,会出现该块所映象到的一组(或一个)Cache块已全部被占用的情况。这时,需要被迫腾出其中的某一块,以接纳新调入的块。

计算机系统结构重点题解自考复习资料

第 1 章计算机系统结构的基本概念 1.1 解释下列术语 层次结构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每 一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级, 汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 然后再在这低翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序, 一级机器上运行,实现程序的功能。 解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效 程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复, 直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透 明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻 辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl 定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高, 受限于该部件的执行时间占总执行时间的百分比。 而是相对地簇聚。包程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的, 括时间局部性和空间局部性。 CPI:每条指令执行的平均时钟周期数。 测试程序套件:由各种不同的真实应用程序构成的一组测试程序,用来测试计算机在各个方面的 处理性能。

计算机系统结构发展历程及未来展望

计算机系统结构发展历程及未来展望 一、计算机体系结构 什么是体系结构 经典的关于“计算机体系结构(computer Architecture)”的定义是1964年C.M.Amdahl在介绍IBM360系统时提出的,其具体描述为“计算机体系结构是程序员所看到的计算机的属性,即概念性结构与功能特性” 。 按照计算机系统的多级层次结构,不同级程序员所看到的计算机具有不同的属性。一般来说,低级机器的属性对于高层机器程序员基本是透明的,通常所说的计算机体系结构主要指机器语言级机器的系统结构。计算机体系结构就是适当地组织在一起的一系列系统元素的集合,这些系统元素互相配合、相互协作,通过对信息的处理而完成预先定义的目标。通常包含的系统元素有:计算机软件、计算机硬件、人员、数据库、文档和过程。其中,软件是程序、数据库和相关文档的集合,用于实现所需要的逻辑方法、过程或控制;硬件是提供计算能力的电子设备和提供外部世界功能的电子机械设备(例如传感器、马达、水泵等);人员是硬件和软件的用户和操作者;数据库是通过软件访问的大型的、有组织的信息集合;文档是描述系统使用方法的手册、表格、图形及其他描述性信息;过程是一系列步骤,它们定义了每个系统元素的特定使用方法或系统驻留的过程性语境。 体系结构原理 计算机体系结构解决的是计算机系统在总体上、功能上需要解决的问题,它和计算机组成、计算机实现是不同的概念。一种体系结构可能有多种组成,一种组成也可能有多种物理实现。 计算机系统结构的逻辑实现,包括机器内部数据流和控制流的组成以及逻辑设计等。其目标是合理地把各种部件、设备组成计算机,以实现特定的系统结构,同时满足所希望达到的性能价格比。一般而言,计算机组成研究的范围包括:确定数据通路的宽度、确定各种操作对功能部件的共享程度、确定专用的功能部件、确定功能部件的并行度、设计缓冲和排队策略、设计控制机构和确定采用何种可靠技术等。计算机组成的物理实现。包括处理机、主存等部件的物理结构,器件的集成度和速度,器件、模块、插件、底板的划分与连接,专用器件的设计,信号传输技术,电源、冷却及装配等技术以及相关的制造工艺和技术。 主要研究内容 1·机内数据表示:硬件能直接辨识和操作的数据类型和格式 2·寻址方式:最小可寻址单位、寻址方式的种类、地址运算 3·寄存器组织:操作寄存器、变址寄存器、控制寄存器及专用寄存器的定义、数量和使用规则 4·指令系统:机器指令的操作类型、格式、指令间排序和控制机构 5·存储系统:最小编址单位、编址方式、主存容量、最大可编址空间 6·中断机构:中断类型、中断级别,以及中断响应方式等

计算机系统结构有详细答案

(仅供参考,不作为考试标准), 选择题分,每题分)2(30计算机系统结构设计者所关心的是________所看到的的计算机结构。 A)硬件设计人员B)逻辑设计人员 D)高级语言程序员C)机器语言或汇编语言程序员 。意________,应当注提系在计算机统设计时,为了高系统性能度的令执行速快A)加经常性使用指大的指令特B)要别精心设计少量功能强数的占减少在数量上很小比例的指令条C)要度D)要加快少量指令的速 。的问题统中因________而导致系主重叠寄存器技术要用于解决在RISC 流水线影A)JMP指令响保护令B)CALL指的现场问存储器不便来只C)有LOAD和STORE指令带的访度速器访问D)存储 ________ 效率高计为使流水算机运行要A)各过程段时间不同B)连续处理的任务类型应该不同 D)连续处理的任务数尽可能少C)连续处理的任务类型应该相同 栈型替是的________。换算法堆不属于B)近期最少A)近期最使用法久未用法 D)页面失效频率法出进C)先先法 象联组,相映的优点。是________象联全与相映相比B)块冲突概率低C)命中率高D)主存利用率小录A)目表高 是方好关相指除中叠次一重消令最的法________。B)设相关专用令指改准A)不修通路 令指条下析分后推C) 令指条下行执后推D) 流的用采,时关据数到,中作水操遇相________。有法办解决器译编化优A)用办的排新重令指过通,测检序法据数B)向定重技术 C)延迟转移技术 D)加快和提前形成条件码 经多级网络串联来实现全排列网络,只能用________。 A)多级立方体网络B)多级PM2I网络 D)上述多级混洗交换网络任何网络C) 序传送的________。是以虫蚀寻径流水方式在各寻径器是顺B)包A)消息C)片节D)字 ________ 处理机超标量作指条令部件个B) 只有一操期A)在一个时钟周内分时发射多多钟C)在一个时周期内同时发射条指令件有只一个取指部D)

系统结构期末考试试题及答案

得分 评分人 填空题: (20分,每题2 分) 单选题:(10分,每题1分) A.任何虚页都可装入主存中任何实页的位置 B. 一个虚页只装进固定的主存实页位置 《计算机系统结构》期末考试试卷(A ) 得分 注:1、共100分,考试时间120分钟。 2、此试卷适用于计算机科学与技术本科专业。 1、."启动I/O"指令是主要的输入输出指令,是属于( A. 目态指令 B.管态指令 C.目态、管态都能用的指令 D.编译程序只能用的指令 2、 输入输出系统硬件的功能对 (B )是透明的 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 3、 全相联地址映象是指(A ) C. 组之间固定,组内任何虚页可装入任何实页位置 D.组间可任意装入,组内是固定装入 4、( C ) 属于MIMD 系统结构 A.各处理单元同时受一个控制单元的管理 B.各处理单元同时受同个控制单元送来的指令 C.松耦合多处理机和多计算机系统 D. 阵列处理机 5、多处理机上两个程序段之间若有先写后读的数据相关,则( B ) A.可以并行执行 B.不可能并行 C.任何情况均可交换串行 D.必须并行执行 6、 计算机使用的语言是(B ) A.专属软件范畴,与计算机体系结构无关 B.分属于计算机系统各个层次 C.属于用以建立一个用户的应用环境 D. 属于符号化的机器指令 7、 指令执行结果出现异常引起的中断是( C ) A.输入/输出中断 B.机器校验中断 C.程序性中断 D.外部中断 &块冲突概率最高的 Cache 地址映象方式是(A ) A.直接 B .组相联 C .段相联 D .全相联 9、 组相联映象、LRU 替换的Cache 存储器,不影响 Cache 命中率的是(B ) A.增大块的大小 B .增大主存容量 C .增大组的大小 D .增加Cache 中的块数 10、 流水处理机对全局性相关的处理不 包括(C ) A.猜测法 B.提前形成条件码 C.加快短循环程序的执行 D.设置相关专用通路

(完整word版)计算机系统结构复习资料

1. 多级层次结构 从计算机语言的角度,把计算机系统按功能划分成多级层次结构。 2. 透明性: 在计算机技术中,对本来存在的事物或属性,但从某种角度看又好象不存在的概念称为透明性。 3. 对于通用寄存器型机器,这些属性主要是指:(选择题) (1) 数据表示 (硬件能直接辩认和处理的数据类型) (2) 寻址规则 (包括最小寻址单元、寻址方式及其表示) (3) 寄存器定义 (包括各种寄存器的定义、数量和使用方式) (4) 指令集 (包括机器指令的操作类型和格式、指令间的排序和控制机构等) (5) 中断系统 (中断的类型和中断响应硬件的功能等) (6) 机器工作状态的定义和切换 (如管态和目态等) (7) 存储系统 (主存容量、程序员可用的最大存储容量等) (8) 信息保护 (包括信息保护方式和硬件对信息保护的支持) (9) I/O 结构(包括I/O 连接方式、处理机/存储器与I/O 设备间数据传送的方式和格式以及I/O 操作的状态等) 4. 计算机组成 计算机系统的逻辑实现。 5. 计算机实现 计算机系统的物理实现。 (两者的区别 第5页) 6. 系列机 在一个厂家内生产的具有相同的体系结构,但具有不同组成和实现的一系列 不同型号的机器。 7. 冯氏分类法 用系统的最大并行度对计算机进行分类。 最大并行度:计算机系统在单位时间内能够处理 8. Flynn 分类法 按照指令流和数据流的多倍性进行分类。 9. 4个定量原理:(有理解,有简答) 第6级 第5级 第4级 第3级 第2级 第1级

以经常性事件为重点=大概率事件优先规则 10.CPU性能公式: CPU时间= 执行程序所需的时钟周期数×时钟周期时间= IC ×CPI ×时钟周期时间 其中,时钟周期时间是系统时钟频率的倒数。 每条指令执行的平均时钟周期数CPI CPI = 执行程序所需的时钟周期数/IC IC:所执行的指令条数 11.程序的局部性原理(构成存储层次的理论依据) 包括程序的时间局部性,程序的空间局部性 12.冯·诺依曼结构的主要特点 以运算器为中心。 在存储器中,指令和数据同等对待。 存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。 指令的执行是顺序的。 指令由操作码和地址码组成。 指令和数据均以二进制编码表示,采用二进制运算。 13.实现可移植性的常用方法 采用系列机,模拟与仿真,统一高级语言。 14.软件兼容方式: 向前(后)兼容,向上(下)兼容四种。 向后兼容一定要保证,他是系列机的根本特征(填空) 15.模拟:用软件的方法在一台现有的机器(称为宿主机)上实现另一台机器(称为虚拟机) 的指令集。 16.仿真:用一台现有机器(宿主机)上的微程序去解释实现另一台机器(目标机)的指令 集。 17.并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。 同时性和并发性(填空) 18.从执行程序的角度来看,并行性等级从低到高可分为: 指令内部并行 指令级并行 线程级并行 任务级或过程级并行 作业或程序级并行 19.提高并行性的技术途径: 时间重叠,资源重复,资源共享 20.耦合度分为:(了解区别) 紧密耦合系统(直接耦合系统):在这种系统中,计算机之间的物理连接的频带较高,一般是通过总线或高速开关互连,可以共享主存。 松散耦合系统(间接耦合系统):一般是通过通道或通信线路实现计算机之间的互连,可以共享外存设备(磁盘、磁带等)。机器之间的相互作用是在文件或数据集一级上进行的。 21.CISC指令集结构存在的问题: 各种指令的使用频度相差悬殊 指令集庞大,指令条数很多,许多指令的功能又很复杂, 许多指令由于操作繁杂,其CPI值比较大,执行速度慢。

计算机体系结构论文

计算机体系结构论文 论文题目:计算机系统结构中多处理机技术姓名:XXX 班级:XXX 学号:XXXX

摘要:多处理机是指能同时执行多个进程的计算机系统.多处理机通过共享的主存或输入/输出子系统或高速通信网络进行通信。利用多台处理机进行多任务处理,协同求解一个大而复杂的问题来提高速度,或者依靠冗余的处理机及其重组能力来提高系统的可靠性、适应性和可用行。该文介绍了微处理器的发展、多处理机的总线以及处理机系统中通信和存储技术的发展和两种特殊的多处理机系统结构,以及现今几种典型的并行计算机体系结构及处理机分配与调度策略。而本篇论文主要根据所阅读的文章进行扩展延伸,主要介绍了多处理机技术,它的总线以及分配调度方面。 关键字:多处理机;体系结构;总线;调度 引言: 微电子技术和封装技术的进步,使得高性能的VLSI微处理器得以大批量生产,性能价格比不断合理,这为并行多处理机的发展奠定了重要的物质基础。计算机系统性能增长的根本因素有两个:一个是微电子技术,另一个是计算机体系结构技术。五十年代以来,人们先后采用了先行控制技术、流水线技术、增加功能部件甚至多机技术、存储寻址和管理能力的扩充、功能分布的强化、各种互联网络的拓扑结构以及支持多道、多任务的软件技术等_系列并行处理技术,提高计算机处理速度,增强系统性能。多处理机体系结构是计算机体系结构发展中的一个重要内容,已成为并行计算机发展中人们最关注的结构。 多处理机的介绍: 多处理机是指能同时执行多个进程的计算机系统。 由于超大规模集成电路(VLSI)技术迅速发展的结果,多处理技术能够充分地发挥高性能的32位微处理机的有效性,用大量低价格的部件配置高性能的计算机结构系统.以典型的

计算机体系结构知识点

目录 第一章计算机系统结构基本概念 (2) (一) 概念 (2) (二) 定量分析技术 (3) (三) 计算机系统结构发展 (4) (四) 计算机的并行性 (5) 第二章计算机指令集结构 (7) 一. 指令集结构的分类 (7) 二. 寻址方式 (7) 三. 指令集结构的功能设计 (8) 四. 指令格式的设计 (10) 五. MIPS指令集结构 (10) 第三章流水线技术 (14) 一. 流水线的基本概念 (14) 二. 流水线的性能指标 (14) 三. 流水线的相关与冲突 (16) 四. 流水线的实现 (18) 第四章指令集并行 (18) 付志强

第一章计算机系统结构基本概念 (一)概念 什么是计算机系统结构:程序员所看到的计算机属性,即概念性结构与功能特性. 透明性:在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的概念成为透明性. 常见计算机系统结构分类法 冯氏分类法(冯泽云):按最大并行度对计算机进行分类. Flynn分类法:按指令流和数据流多倍性进行分类 ①单指令流单数据流 ②单指令流多数据流 ③多指令流单数据流(不存在) ④多指令流多数据流 付志强

(二)定量分析技术 Amdahl定律:加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比. 加速比=系统性能 改进后 系统性能 改进前 = 总执行时间 改进前 总执行时间 改进后 加速比依赖于以下两个因素 ①可改进比例 ②部件加速比 CPU性能公式 CPU时间 CPU时间=执行程序所需时间的时钟周期数x时钟周期时间(系统频率倒数) CPI(Cycles Per Instruction) CPI =执行程序所需时钟周期数/所执行指令条数 ∴CPU时间= IC x CPI x 时钟周期时间 可知CPU性能取决于一下三个方面 ①时钟周期时间:取决于硬件实现技术和计算机组成 付志强

计算机体系结构参考1

第一题选择题 1.SIMD是指(B) A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2.下列那种存储设备不需要编址?D A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 3.按照计算机系统层次结构,算术运算、逻辑运算和移位等指令应属于(A)级机器语言。 A、传统机器语言机器 B、操作系统机器 C、汇编语言机器 D、高级语言机器 4.早期的计算机系统只有定点数据表示,因此硬件结构可以很简单。但是这样的系统有明显的缺点,下面哪一个不是它的缺点:B A.数据表示范围小 B.单个需要的计算时钟周期多 C.编程困难 D.存储单元的利用率很低 7.下面哪个页面替换算法实际上是不能够实现的?D A)随机页面替换算法 B)先进先出替换算法 C)最久没有使用算法 D)最优替换算法

9.指令优化编码方法,就编码的效率来讲,那种方法最好?C A. 固定长度编码 B. 扩展编码法 C. huffman编码法 D. 以上编码都不是 10.在早期冯·诺依曼计算机特征中,机器以(C)为中心。 A、存储器 B、输入输出设备 C、运算器 D、控制器 1.RISC 计算机的指令系统集类型是( C ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器- 存储器型 2、相联存储器的访问方式是( D )。 A.先进先出顺序访问 B.按地址访问 C.无地址访问 D.按内容访问 3、假设—条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每—段分别只有—个部件可供使用,并且执行时间分别为Δt、2Δt和3Δt,连续执行n条指令所需要花费的最短时间约为( C )。 (假设“取指令”、“分析”和“执行”可重叠,并假设n足够大) A.6 nΔt B.2 nΔt C.3 nΔt D.nΔt 6、下列计算机不属于RISC计算机的是(C )。 A.SUN:Ultra SPARC

计算机系统结构期末考试题目

第一章: 1.计算机系统结构的定义 答:由程序设计者看到的一个计算机系统的属性,即概念性结构和功能特性。 2.透明性概念 答:在计算机技术中,一种本来是存在的事物或属性,但从某种角度看似乎不存在,称为透明性现象。 3.兼容性向后兼容 兼容性:同一个软件可以不加修改地运行于系统结构相同的各档机器,可获得相同的结果,差别只在于不同的运行时间。 向后兼容:按某个时期投入市场的某种型号机器编制的程序,不加修改就能运行于在它之后投入市场的机器。 4.Amdahl定律 答:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 5.CPI 答:每条指令的平均时钟周期数。 6.MIPS 答:每秒百万条指令数!MIPS=时钟频率/(CPI*10^6) 7.MFLOPS 答:每秒百万次浮点操作次数。MFLOPS=程序中的浮点操作次数/(执行时间*10^6) 8.命中率的概念 答: 9.Flynn分类法是按指令流和数据流的多倍性特征进行计算机系统结构的划分 答:①单指令流单数据流SISD ②单指令流多数据流SIMD ③多指令流单数据流MISD(实际不存在)④多指令流多数据流MIMD 10.计算机系统设计的定量原理(四个) 答:①加快经常性事件的速度②Amdahl定律③CPU性能公式④访问的局部性原理11.CPI和加速比的计算 答:CPI=CPU时钟周期数/IC CPU时间=CPU时钟周期数/频率 CPU时间=CPU时钟周期*时钟周期长 加速比=(采用改进措施后的性能)/(没有采用改进措施前的性能) =(没有采用改进措施前执行某任务的时间)/(采用改进措施后执行某任务的时间) 12.软硬件实现的特点 硬件实现:速度快、成本高;灵活性差、占用内存少 软件实现:速度低、复制费用低;灵活性好、占用内存多 13.系统评价的标准 ①运算速度②存储器系统③其他性能④成本标准

计算机体系结构复习

1. 计算机系统的多级层次结构: 第6级 第5级 第4级 第3级 第2级 第1级 2. 系统结构的概念: 计算机系统结构指的是计算机系统的软、 硬件的界面, 即机器语言程 序员或编译程序设计者所能看到的传统机器级所具有的属性。 3. 在计算机技术中, 对本来存在的事物或属性, 但从某种角度看又好象不存在的概念称为 透明性。 4. 对于通用寄存器型机器,这些属性主要是指: (选择题) 1) 指令系统(包括机器指令的操作类型和格式、指令间的排序和控制机构等) 2) 数据表示 (硬件能直接辩认和处理的数据类型) 3) 寻址规则 (包括最小寻址单元、寻址方式及其表示) 4) 寄存器定义 (包括各种寄存器的定义、数量和使用方式) 5) 中断系统 (中断的类型和中断响应硬件的功能等) 6) 机器工作状态的定义和切换 (如管态和目态等) 7) 存储系统 (主存容量、程序员可用的最大存储容量等) 8) 信息保护 (包括信息保护方式和硬件对信息保护的支持) 9) I/O 结构(包括 I/O 连接方式、处理机 /存储器与 I/O 设备间数据传送的方式和 格式 以及 I/O 操作的状态等) 5. 计算机组成指的是计算机系统结构的逻辑实现, 包含物理机器级中的数据流和控制流的 组成以及逻辑设计。 6. 计算机实现指的是计算机组成的物理实现。 7. 数据表示是指计算机硬件能够直接识别、指令集可以直接调用的数据类型。 8. 数据类型、数据结构、数据表示之间的关系 名词解释 填空 选择 简答 计算 L1:微程序机器

9.系列机指由同一厂商生产的具有相同体系结构、但具有不同组成和实现的一系列不同型 号的机器。 10.常见的计算机系统结构分类法有两种:Flynn 分类法和冯氏分类法。冯氏分类法是用系 统的最大并行度对计算机进行分类;Flynn 分类法是指按照指令流和数据流的多倍性进行分类。 11.定量分析技术(简答题): 1)以经常性事件为重点:在计算机系统设计中,经常需要在多种不同的方法之间进行折中,这时应按照对经常发生的情况采用优化方法的原则进行选择。 2)Amdahl 定律:加速某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比。 3)CPU性能公式:执行一个程序所需的CPU 时间=执行程序所需的时钟周期数*时钟周期时间 4)程序的局部性原理:指程序执行时所访问的存储器地址分布不是随机的,而是相对簇聚的。分为时间局部性和空间局部性。 12.冯诺依曼结构的特点:以运算器为中心;在存储器中,指令和数据同等对待;存储器是 按地址访问、按顺序线性编址的一维结构,每个存储单元的位数是固定的;指令是按顺序执行的;指令由操作码和地址码组成;指令和数据均以二进制编码表示,采用二进制运算。 13.实现可移植性的常用方法有三种:采用系列机、模拟与仿真、统一高级语言。 14.系列机在兼容方面,向后兼容一定要保证,尽量保证向上兼容 15.模拟是指用软件的方法在一台现有的计算机上实现另一台计算机的指令集。(软件方法) 16.仿真是指用一台现有计算机上的微程序去解释实现另一台计算机的指令集。(硬件方法) 17.并行性包括同时性和并发性。 18.从执行程序的角度来看,并行性等级从低到高可分为:(简答) 1)指令内部并行:单条指令中各微操作之间的并行 2)指令级并行:并行执行两条或两条以上的指令 3)线程级并行:并行执行两个或两个以上的线程,通常是以一个进程内派生的多个线程为调度单位。 4)任务级或过程级并行:并行执行两个或两个以上的过程或任务,以子程序或进程为调度单位。 5)作业或程序级并行:并行执行两个或两个以上的作业或程序。 19.提高并行性的技术路径(12 字):时间重叠、资源重复、资源共享 20.能够对紧密耦合系统和松散耦合系统进行区分:紧密耦合系统共享主存,松散耦合系统共 享外设 21.CISC 指令集结构存在的问题: 1)各种指令的使用频度相差悬殊

完整版计算机体系结构课后习题原版答案_张晨曦著

第1章计算机系统结构的基本概念 (1) 第2章指令集结构的分类 (10) 第3章流水线技术 (15) 第4章指令级并行 (37) 第5章存储层次 (55) 第6章输入输出系统 (70) 第7章互连网络 (41) 第8章多处理机 (45) 第9章机群 (45) 第1章计算机系统结构的基本概念 1.1 解释下列术语 层次机构:按照计算机语言从低级到高级的次序,把计算机系统按功能划分成多级层次结构,每一层以一种不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。 虚拟机:用软件实现的机器。 翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。

解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。 计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。 在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。 计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。 计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。 系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。 Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。 程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。

2020.4《计算机体系结构》期末试卷A含答案

《计算机体系结构》期末考试A卷 (总分:100分,时间:100分钟) 姓名:周元华 专业:计算机科学与技术 学号: 18260070164016 学习中心:上海弘成 一、填空题(每空1分,共14分) 1.高速缓冲存储器的地址映象方式有三种,它们分别是:全向量方式,直接相联方式,组相连方式。 2.虚拟存储器的三种管理方式是段式管理,页式管理和 段页式管理。 3.从主存的角度来看,“Cache—主存”层次的目的是为了提高速度,而“主存—辅存”层次的目的是为了扩大容量 4.根据指令间的对同一寄存器读和写操作的先后次序关系,数据相关冲突可分为读与写(RAM)、写与读(WAR)和写与写(WAW)三种类型。 5.当代计算机体系结构的概念包括指令集结构、计算机组成和计算机实现三个方面的内容 二、名词解释(每题2分,共16分) 计算机体系结构: 计算机体系结构是指根据属性和功能不同而划分的计算机理论组成部分及计算机基本工作原理、理论的总称。其中计算机理论组成部分并不单与某一个实际硬件相挂钩,如存储部分就包括寄存器、内存、硬盘等。 兼容机: 兼容机,就是由不同公司厂家生产的具有相同系统结构的计算机。简单点说,就是非厂家原装,而改由个体装配而成的机器,其中的元件可以是同一厂家出品,但更多的是整合各家之长的 计算机。 写直达法: 写直达法一般指全写法。全写法(write-through):又称写直达法、写穿法,透写法,Cache使 用方式之一。 高速缓冲存储器: 高速缓冲存储器(Cache)其原始意义是指存取速度比一般随机存取记忆体(RAM)来得快 的一种RAM,一般而言它不像系统主记忆体那样使用DRAM技术,而使用昂贵但较快速的SRAM 技术,也有快取记忆体的名称。 高速缓冲存储器是存在于主存与CPU之间的一级存储器,由静态存储芯片(SRAM)组成, 容量比较小但速度比主存高得多,接近于CPU的速度。在计算机存储系统的层次结构中,是介 于中央处理器和主存储器之间的高速小容量存储器。它和主存储器一起构成一级的存储器。高速 缓冲存储器和主存储器之间信息的调度和传送是由硬件自动进行的。 高速缓冲存储器最重要的技术指标是它的命中率。 延迟转移技术: 在转移指令之后插入一条或几条有效的指令。当程序执行时,要等这些插入的指令执行完成 之后,才执行转移指令,因此,转移指令好像被延迟执行了,这种技术称为延迟转移技术。 线性流水线: 线性流水线就是由一整套工艺串联而成的生产线。 流水线又称为装配线,一种工业上的生产方式,指每一个生产单位只专注处理某一个片段的工 作,以提高工作效率及产量;按照流水线的输送方式大体可以分为:皮带流水装配线、板链线、 倍速链、插件线、网带线、悬挂线及滚筒流水线这七类流水线。 输送线的传输方式有同步传输的/(强制式),也可以是非同步传输/(柔性式),根据配置的 选择,可以实现装配和输送的要求。输送线在企业的批量生产中不可或缺。 流水线的吞吐率: 流水线的吞吐率是单位时间内流水线处理的任务数。 并行性: 并行性是指计算机系统具有可以同时进行运算或操作的特性,在同一时间完成两种或两种以 上工作。它包括同时性与并发性两种含义。同时性指两个或两个以上事件在同一时刻发生。并发 性指两个或两个以上事件在同一时间间隔发生。 三、简答题(每题5分,共30分) 1.如有一个经解释实现的计算机,可以按功能划分成4级。每一 级为了执行一条指令需要下一级的N条指令解释。若执行第一 级的一条指令需K(ns)时间,那么执行第2、3、4级的一条指 令各需要用多少时间(ns)? 答:第1级:1条1级指令 K ns 第2级:1条2级指令N条1级指令 1*N*K ns = NK ns 第3级:1条3级指令N条2级指令 1*N*NK ns =N2K ns 第4级:1条4级指令N条3级指令 1*N*NNK ns =N3K ns 2.根据Amdahl定律,系统加速比由哪两个因素决定? 答:系统加速比依赖于两个因素: (1)可改进比例:可改进部分在原系统计算时间中所占的比例 (2)部件加速比:可改进部分改进以后的性能提高 3.简述组相联映象规则。 答:(1)主存与缓存分成相同大小的数据块。(2)主存和Cache 按同样大小划分成组。(3)主存容量 是缓存容量的整数倍,将主存空间按缓冲区的大小分成区,主存中每一区的组数与缓存的组数相同 4.引起Cache与主存内容不一致的原因是什么?为了保持Cache 的一致性,在单计算机系统中一般采取哪些措施? 答:不一致的原因:(1)由于CPU写Cache,没有立即写主存 (2)由于I/O处理机或I/O设备写主存 采取措施: (1)全写法,亦称写直达法(WT法-Write through) 方法:在对Cache进行写操作的同时,也对主存该内容进行写入 (2)写回法(WB法-Write back) 方法:在CPU执行写操作时,只写入Cache,不写入主存。 5.按照同一时间内各段之间的连接方式来分,流水线可分为哪两 类? 答:(1)静态流水线:在同一时间内,流水线的各段只能按同一种功能的连接方式工作。 (2)动态流水线:在同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。 6.Flynn分类法是根据什么对计算机进行分类的?将计算机分 成哪几类? 答:Flynn分类法,根据计算机中指令和数据的并行状况把计算机分成: (1)单指令流单数据流(SISD.; (2)单指令流多数据流(SIMD.; (3)多指令流单数据流(MISD.; (4)多指令流多数据流(MIMD.。 四、问答与计算题(第1题10分,第2、3题每题15分共40分) 1.一个有快表和慢表的页式虚拟存储器,最多有64个用户,每 个用户最多要用1024个页面,每页4K字节,主存容量8M字节。 (1)写出多用户虚地址的格式,并标出各字段的长度。 (2)写出主存地址的格式,并标出各字段的长度。

计算机体系结构试题汇总

计算机系统结构 姓名:学号: 一、简答题(每小题10分,共20分) 1.简述使用物理地址进行DMA存在的问题,及其解决办法。 2.从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机做一比较(列表)。 二、(60分)现有如下表达式: Y=a ×X 其中:X和Y是两个有64个元素的32位的整数的向量,a为32位的整数。假设在存储器中,X和Y的起始地址分别为1000和5000,a的起始地址为6000。 1.请写出实现该表达式的MIPS代码。 2.假设指令的平均执行时钟周期数为5,计算机的主频为500 MHz,请计算上述MIPS 代码(非流水化实现)的执行时间。 3.将上述MIPS代码在MIPS流水线上(有正常的定向路径、分支指令在译码段被解析出来)执行,请以最快执行方式调度该MIPS指令序列。注意:可以改变操作数,但不能改变操作码和指令条数。画出调度前和调度后的MIPS代码序列执行的流水线时空图,计算调度前和调度后的MIPS代码序列执行所需的时钟周期数,以及调度前后的MIPS流水线执行的加速比。 4.根据3的结果说明流水线相关对CPU性能的影响。 三、(20分)请分析I/O对于性能的影响有多大?假设: 1.I/O操作按照页面方式进行,每页大小为16 KB,Cache块大小为64 B;且对应新页的地址不在Cache中;而CPU不访问新调入页面中的任何数据。 2.Cache中95%被替换的块将再次被读取,并引起一次失效;Cache使用写回方法,平均50%的块被修改过;I/O系统缓冲能够存储一个完整的Cache块。 3.访问或失效在所有Cache块中均匀分布;在CPU和I/O之间,没有其他访问Cache 的干扰;无I/O时,每1百万个时钟周期中,有15,000次失效;失效开销是30个时钟周期。如果替换块被修改过,则再加上30个周期用于写回主存。计算机平均每1百万个周期处理一页。

计算机体系结构期末试卷及答案

课程测试试题( A 卷) ----------------------以下为教师填写-------------------- I、命题院(部):信息科学与工程学院 II、课程名称:计算机体系结构 III、测试学期:2014-2015学年度第2学期 IV、测试对象:信息学院计算机、网络专业 2012 级班 V、问卷页数(A4): 3 页 VI、答卷页数(A4): 4 页 VII、考试方式:闭卷(开卷、闭卷或课程小论文,请填写清楚) VIII、问卷内容: 一、填空题(共30分,20空,每空分) 1、现代计算机系统是由()和()组成的十分复杂的系统。 2、计算机系统应能支持软件可移植,实现可移植性的常用方法有3种,即(),(), 统一高级语言。 3、可以将当前大多数通用寄存器型指令集结构进一步细分为3种类型,即()、() 和存储器-存储器型指令集结构。 4、MIPS指令DADDIU R14,R5,#6属于()类型的指令格式;MIPS指令 SD R4,300(R5)属于()类型的指令格式。 5、描述流水线的工作,常采用时空图的方法。在时空图中,横坐标表示(),纵坐 标代表()。 6、在MIPS指令实现的简单数据通路中,在WB周期中,有两大类指令执行操作:() 和()指令。 7、存储器的层次结构中,“Cache-主存”层次是为了弥补主存()的不足,“主 存-辅存”层次是为了弥补主存()的不足。 8、Cache实现的映像规则有全相联映像、()和()三种。 9、反映存储外设可靠性能的参数有可靠性、()和()。 10、根据系统中处理器个数的多少,可把现有的MIMD计算机分为两类,每一类代表 了一种存储器的结构和互连策略。第一类机器称为()结构,第二类机器具有()。 二、判断题(每小题1分,共10分) 1、从计算机语言的角度,系统结构把计算机系统按功能划分成多级层次结构,其中, 第2级是操作系统虚拟机,第3级是汇编语言虚拟机。() 2、计算机系统中提高并行性的3种途径中,资源重复是在并行性概念中引入时间因 素,加快硬件周转而赢得时间。() 3、指令集结构中采用多种寻址方式可能会增加实现的复杂度和使用这些寻址方式的 指令的CPI。() 4、指令条数多,通常超过200条,是设计RISC的原则之一。() 5、根据流水线中各功能段之间是否有反馈回路,可把流水线分为线性流水线和非线 性流水线。() 6、在多级存储体系中,“cache——主存”层次的存储管理实现主要由软件件实现。

(完整版)计算机系统结构复习题(附答案)范文

计算机系统结构复习题和重点(附答案) 一、单项选择题 1.实现汇编语言源程序变换成机器语言目标程序是由() A.编译程序解释B.编译程序翻译 C.汇编程序解释D.汇编程序翻译 2.系列机软件必须保证() A.向前兼容,并向上兼容B.向前兼容,并向下兼容 C.向后兼容,力争向上兼容D.向后兼容,力争向下兼容 3.浮点数尾数基值r m=8,尾数数值部分长6位,可表示规格化正尾数的个数是()A.56个B.63个 C.64个D.84个 4.在IBM370系统中,支持操作系统实现多进程共用公用区管理最有效的指令是()A.“执行”指令B.“程序调用”指令 C.“比较与交换”指令D.“测试与置定”指令 5.关于非专用总线三种控制方式中,下列叙述错误 ..的是() A.集中式定时查询,所有部件共用同一条“总线忙”线 B.集中式定时查询,所有部件都用同一条“总线请求”线 C.集中式独立请求,所有部件都用同一条“总线请求”线 D.集中式串行链接,所有部件都用同一条“总线请求”线 6.磁盘外部设备适合于连接到() A.字节多路通道B.数组多路通道或选择通道 C.选择通道或字节多路通道D.数组多路通道或字节多路通道 7.在Cache存储器中常用的地址映象方式是() A.全相联映象B.页表法映象 C.组相联映象D.段页表映象 8.在指令级高度并行的超级处理机中,下列叙述正确的是() A.超标量处理机利用资源重复,要求高速时钟机制 B.超流水线处理机利用资源重复,要求高速时钟机制 C.超标量处理着重开发时间并行性,要求高速时钟机制 D.超流水线处理机着重开发时间并行性,要求高速时钟机制 9.间接二进制n方体网络是一种() A.多级立方体网络B.多级全排列网络

相关文档
相关文档 最新文档