文档库 最新最全的文档下载
当前位置:文档库 › 高级计算机系统结构综述

高级计算机系统结构综述

高级计算机系统结构综述
高级计算机系统结构综述

目录

1.概述 (3)

1.1 计算机系统结构的发展 (3)

1.3 计算机系统的层次结构 (3)

2.计算机指令集结构 (4)

2.1 指令结构的分类 (4)

2.2 指令集结构的功能设计 (5)

3.流水线技术 (6)

3.1 流水线的基本概念 (6)

3.2流水线的相关与冲突 (8)

3.3 向量处理机 (9)

4.指令并行 (10)

4.1 指令的静态调度与动态调度 (10)

4.2 动态分支预测技术 (10)

5.存储器的层次结构 (11)

5.1 存储器的结构 (11)

5.2 Cache的基本知识 (12)

5.3 主存与虚拟存储器 (13)

6.输入/输出系统 (13)

6.1 总线 (13)

6.2 通道处理机 (14)

7.计算机系统结构的发展趋势 (14)

7.1高性能计算机体系结构 (14)

7.2 高性能计算的发展方向 (15)

参考文献 (17)

高级计算机系统结构综述

摘要:计算机体系结构是一门连接硬件与软件的学科,在不断的深入研究过程中,一直在追求计算机的功能、性能、功率以及花费的高度协调,以期达到各方面的最佳状态,在花费、能量、可用性的抑制下,实现计算机的多功能、高性能、低功率、少花费的新时代。本篇综述主要讲述计算机指令集结构设计,流水线技术,指令级并行,存储器层次结构,输入/输出系统以及计算机系统结构的发展趋势。

关键字:高级计算机系统结构,流水线技术,指令级并行,存储器层次结构,输入/输出系统

Overview of advanced computer architecture Abstract:The computer architecture is a subject which connects hardware and software. In the process of continuous in-depth study, it has been pursuing the function, performance, power and cost of the computer, in order to achieve the best state in every aspect,and realize the new era of multi-function, high performance, low power and low cost.This paper mainly focuses on the computer instruction set architecture, pipeline technology, instruction level parallelism, memory hierarchy, input / output system and the development trend of computer architecture.

Key words:advanced computer architecture,pipeline technology,instruction level parallelism,memory hierarchy,input / output system.

1.概述

1.1 计算机系统结构的发展

世界上第一台电子数字计算机是1946年在美国宾夕法尼亚大学制成的,这是科学史上一次划时代的创新,它奠定了电子计算机的发展基础。提高计算机速度始终是发展计算机性能的一个突出问题,器件的发展对推动计算机的发展起了重大作用。然而机器速度提高的速率越来越慢,这一事实促使人们对计算机系统结构做更多的研究工作更多潜力。VLSI技术的发展,带来了集成度高、体积小、功耗低、可靠性高、价格便宜的器件,使得计算机系统可以通过采用更加复杂的系统结构来创造出性能更高、工作可靠、价格合理的高性能计算机。

20世纪60年代初期,随着晶体管和磁芯存储器的出现,处理单元和存储器实现小型化,并行计算机开始出现。到了20世纪60年代末期,单一处理器中可以集成多个功能单元,产生了流水线技术。在70年代初,与向量计算机同时出现了并行处理机,这类计算机同向量计算机的应用领域很多是相同的,但专业性更强。

20世纪80年代开始,微处理器技术高速发展。此时,微处理器随着机器的字长从4位、8位、16位一直增加到32位、64位,其性能也随之显著提高。另外,80年代在单处理机中提高指令执行的并行度方面也有新发展。简化指令系统计算机(RISC)简化了指令系统使能充分发挥流水线的作用,超长指令字(VLIW)计算机和超级标量机的目标更提高了一步。从20世纪90年代末开始,以前发展的主要几种体系逐步走向融合,同时随着新技术的出现又为新的架构带来了新的革命。2006 年,处理器开始从单核转向多核处理器发展,多核处理器已不再局限于高端服务器,开始向 PC机普及,多核处理器使 PC 机变成并行式计算机。多核技术在高性能计算中也已获得了广泛应用。

1.3 计算机系统的层次结构

计算机是一个十分复杂的硬、软件结合而成的整体。它通常是多层次结构的,每一级各对应一类机器,各有自己的机器语言。在这里,“机器”的定义是能存储、执行程序的算法和数据结构的集合体。各级机器的算法和数据结构的实现方法不同:M0由硬件实现,M1由微程序(固件)实现,M2~M5由软

件实现。由软件实现的机器称为虚拟机器,以区别由硬件或固件实现的实际机器。各级的程序被翻译成比它低一级的语言的程序,或由低一级的程序解释。 如下图所示:

应用语言程序经应用程序包 翻译成高级语言程序

高级语言程序经编译程序翻 译成汇编语言

汇编语言程序经汇编程序翻 译成机器语言程序

一般机器语言程序解释作业 控制语句等

用微指令程序解释机器指

微指令由硬件直接执行

图1.1 计算机系统的层次结构图

2.计算机指令集结构

2.1 指令结构的分类

根据CPU 中用来存储操作数的存储单元的类型,可将指令集结构分为 堆栈型指令集结构、累加器型指令集结构和通用寄存器型指令集结构。

1.堆栈型指令集结构:堆栈型是一种表示计算的简单模型,指令短小,不能随机访问堆栈,从而很难生成有效代码。同时,由于堆栈是瓶颈,所以很难被高效地实现。

微程序机器M0

具有L0机器语言(微指令系统) 应用语言机器M5

具有L5机器语言(应用语言) 高级语言机器M4

具有L4机器语言(高级语言) 汇编语言机器M3 具有L3机器语言(汇编语言) 操作系统机器M2 具有L2机器语言(作业控制语言等) 传统机器M1 具有L1机器语言(微机器令系统)

2.累加器型指令集结构:累加器型减少了机器的内部状态,由于累加器是唯一的暂存器,指令短小,这种机器的存储器通信开销最大。

3.通用寄存器型指令集结构:寄存器型易于生成高效的目标代码,所有操作数均需命名,且要显式表示,因而指令比较长。

现代大多数机器均采用通用寄存器型指令集结构,因为寄存器和CPU内部其他存储单元一样,要比存储器快。其次是对编译器而言,可以更加容易、有效地分配和使用寄存器。

根据通用寄存器型指令集结构,又可进一步分为以下三种类型:

寄存器-寄存器型(RR)其优点是简单,指令字长固定,是一种简单的代码生成模型,各种指令的执行时钟周期数相近。缺点与指令中含存储器操作数的指令集结构相比指令条数多,因而其目标代码量较大。

寄存器-存储器型(RM)其优点是可以直接对存储器操作数进行访问,而不必先用load指令进行加载。容易对指令进行编码,且其目标代码量较小。缺点是指令中的操作数类型不同。在一条指令中同时对一个寄存器操作数和存储器操作数进行编码,将限制指令所能够表示的寄存器个数。指令的执行时钟周期数因操作数的来源(寄存器或存储器)不同而差别比较大。

存储器-存储器型(MM)其优点是一种最紧密的编码方式,无需“浪费”寄存器保存变量。缺点是指令字长多种多样。每条指令的执行时钟周期数也大不一样,对存储器的频繁访问将导致存储器访问瓶颈问题。这种类型的指令集结构现在已不用了。

2.2 指令集结构的功能设计

在设计指令集结构时,有两种截然不同的设计策略,产生了两类不同的计算机系统:

CISC即复杂指令集计算机。它是增强指令功能,把越来越多的功能交由硬件来实行,并且指令的数量也是越来越多。CISC通过只执行在程序中经常使用的指令来简化处理器的结构,而特殊操作则以子程序的方式实现,它们的特殊使用通过处理器额外的执行时间来弥补。

RISC即精简指令集计算机。它是尽可能的把指令集简化,不仅指令的条数少,而且指令的功能也比较简单。RISC包含许多应用程序中很少使用的特定指

令,执行数字存在内存而非暂存器的运算。相比之下,比较复杂的指令集较容易使工作更完善,内存及快取的效率较高,以及较为简单的程式码。

3.流水线技术

3.1 流水线的基本概念

流水线技术是将一个重复的时序过程分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其他子过程同时执行。流水线中的每个子过程及其功能部件称为流水线的级或段,段与段相互连接形成流水线。流水线的段数称为流水线的深度。

流水线技术具有以下特点

(1)流水过程由多个相联系的子过程组成,每个过程称为流水线的“级”或“段”。

(2)每个子过程由专用的功能段实现。

(3)各个功能段所需时间应尽量相等。流水线需要有“通过时间”,在此之后流水过程才进入稳定工作状态,每一个时钟周期流出一个结果。

(4)流水技术适合于大量重复的时序过程,只有在输入端能连续地提供任务,流水线的效率才能充分发挥。

从不同的角度和观点,可以把流水线分成多种不同的种类。如下图所示:

图2.1 流水线分类图 单功能流水线:只能完成一种固定功能的流水线

多功能流水线:流水线的各段可以进行不同的连接,从而使流水线在不同的时间,或者在同一时间完成不同的功能。

静态流水线:在同一时间内,流水线的各段只能按同一种功能的连接方式工作。

动态流水线:在同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。

部件级流水线(运算操作流水线):把处理机的算术逻辑部件分段,以便流水级别

向量流水处理机

流水

线

流水线完成功能分类 同一时间各段连 接方式 数据表示

流水线中是否有反馈路线 任务流入流出顺序是否相同 单功能流水线 多功能流水线 处理机级流水线 动态流水线 标量流水处理机 部件级流水线 静态流水线 顺序流水线 非线性流水线 乱序流水线

线性流水线

为各种数据类型进行流水操作。

处理机级流水线(指令流水线):把解释指令的过程按照流水方式处理。

处理机间流水线(宏流水线):由两个以上的处理机串行地对同一数据流进行处理,每个处理机完成一项任务。

标量流水处理机:处理机不具有向量数据表示,仅对标量数据进行流水处理。

向量流水处理机:处理机具有向量数据表示,并通过向量指令对向量的各元素进行处理。

线性流水线:流水线的各段串行连接,没有反馈回路。

非线性流水线:流水线中除有串行连接的通路外,还有反馈回路。

顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。每一个任务在流水线的各段中是一个跟着一个顺序流动的。

乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成(从输出端流出)。

3.2流水线的相关与冲突

相关是指两条指令之间存在某种依赖关系。如果两条指令相关,则他们就有可能不能在流水线中重叠执行或者只能部分重叠执行,

1.结构相关:当指令在重叠执行过程中,硬件资源满足不了指令重叠执行的要求,发生资源冲突时将产生“结构相关”;

2.数据相关:当一条指令需要用到前面指令的执行结果,而这些指令均在流水线中重叠执行时,就可能引起“数据相关”;

3. 控制相关:当流水线遇到分支指令和其他会改变PC值的指令时就会发

生“控制相关”。

流水线冲突是指对于具体的流水线来说,由于相关的存在,使得指令流中的下一条指令不能在指定的时钟周期执行。流水线冲突有三种类型:

1.结构冲突:因硬件资源满足不了指令重叠执行的要求而发生的冲突。解决方法:流水化功能单元;资源重复;暂停流水线。

2.数据冲突:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲突。

3.控制冲突:流水线遇到分支指令和其他会改变PC值的指令所引起的冲突。

(可省)解决数据冲突有四中方法

1.定向技术:在某条指令产生一个结果之前,其他指令并不真正需要该计算结果,如果将该计结果从其产生的地方直接送到其他指令需要它的地方,就可以避免暂停;

2.暂停技术:设置一个“流水线互锁”的功能部件,一旦流水线互锁检测到数据相关,流水线暂停执行发生数据相关指令后续的所有指令,直到该数据相关解决为止。;

3.采用编译器调度。当流水线中出现冲突时,编译器通过重新排列代码的顺序来消除流水线中的暂停,这种技术称为流水线调度

4.重新组织代码顺序。

流水线设计者有时会允许结构冲突的存在,原因:一是为了减少硬件开销,二是为了减少功能单元的延迟。

3.3 向量处理机

在流水线处理机中,设置向量数据表示和相应的向量指令,称为向量处理机。不具有向量数据表示和相应的向量指令的流水线处理机,称为标量处理机。向量处理方式有以下三种方式:

1.水平处理方式:向量计算是按行的方式从左到右横向地进行,组成循环程序进行处理,不适合向量处理机的并行处理。

2.垂直处理方式:适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入、输出端直接与存储器相联,构成MM型(存储器-存储器)的运算流水线。

3.分组处理方式:把向量分成若干组,组内按纵向方式处理,一次处理各组,每组向量运算的源/目向量都在向量寄存器中,流水线的运算部件输入、输出端与向量寄存器相联,构成RR型(寄存器—寄存器)运算流水线。

提高向量处理机性能有多种方法,许多新型向量处理机系统则采用了多处理机系统结构:

1.设置多个功能部件,使它们并行工作。

2.采用链接技术,加快一串向量指令的执行。

3.采用循环开采技术,加快循环处理。

4.采用多处理机系统,进一步提高性能。

4.指令并行

4.1 指令的静态调度与动态调度

当指令之间不存在相关时,它们可以在流水线中重叠起来并行执行。这种指令序列中存在的潜在并行性称为指令级并行。

静态调度方法:依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化。静态调度通过把相关的指令拉开距离来减少可能产生的停顿。

动态调度方法:在程序的执行过程中,依靠专门硬件对代码进行调度,减少数据相关导致的停顿。

Tomasulo算法是一种比较典型的动态调度算法,其算法的核心思想是记录和检测指令相关,操作数一旦就绪就立即执行,把发生RAW冲突的可能性减少到最小,通过寄存器换名来消除WAR冲突和WAW冲突。

Tomasulo算法的基本思想是:只要操作数有效,就将其取到保留站,避免指令流出时才到寄存器中取数据,这就使得即将执行的指令从相应的保留站中取得操作数,而不是从寄存器中。指令的执行结果也是直接送到等待数据的其他保留站中去。因而,对于连续的寄存器写,只有最后一个才真正更新寄存器中的内容。一条指令流出时,存放操作数的寄存器名被换成为对应于该寄存器保留站的名称(编号)。指令流出逻辑和保留站相结合实现寄存器换名,从而完全消除了数据写后写和先读后写相关这类名相关。

4.2 动态分支预测技术

在程序运行时,根据分支指令过去的表现来预测其将来的行为。如果分支行为发生了变化,预测结果也跟着改变。预测分支是否成功和尽快找到分支目标地址(或指令),从而避免因控制相关而造成流水线停顿是动态分支预测技术的目的。如何记录分支的历史信息以及如何根据这些信息来预测分支的去向(甚至取到指令)是其要解决的两个关键问题。采用分支历史表 BHT,采用分支目标缓冲器BTB以及基于硬件的前瞻执行是三种动态分支预测技术,最常

用到的是基于硬件的前瞻执行。

前瞻执行的基本思想:对分支指令的结果进行猜测,并假设这个猜测总是对的,然后按这个猜测结果继续取、流出和执行后续的指令。只是执行指令的结果不是写回到寄存器或存储器,而是放到一个称为ROB 的缓冲器中。等到相应的指令得到“确认”(即确实是应该执行的)后,才将结果写入寄存器或存储器。

对Tomasulo 算法加以扩充,就可以支持前瞻执行了。 允许指令乱序执行,但必须顺序确认。前瞻执行通过ROB 实现了指令的顺序完成,能够实现精确异常,且很容易地推广到整数寄存器和整数功能单元上,但所需的硬件太复杂。

5.存储器的层次结构

5.1 存储器的结构

对于通用计算机而言,存储层次至少应具有三级:最高层为CPU 寄存器,中间为主存,最底层为辅存。在较高档的计算机中还可根据具体的功能分工细划如下图,存储层次中越往上,存储介质的访问速度越慢,价格也越高,相对的存储容量也越小。

CPU 寄存器

主存

辅存

图5.1 计算机系统存储层次图 单级存储器的主要矛盾是速度越快,每位价格就越高。容量越大,每位价格就越低。容量越大,速度越慢。因此采取多级存储层次方法来解决此类矛盾。

“Cache -主存”层次:在CPU 和主存之间增加一级速度快、但容量较小而每位价格较贵的高速缓冲存储器。借助于辅助软硬件,它与主存构成一个有机的整体,以弥补主存速度的不足。 寄存器

高速缓存 主存 磁盘缓存 磁盘 可移动存储介质

辅助硬件

CPU Cache 主存

图5.2 “Cache-主存”层次

“主存-辅存”层次:在主存外面增加一个容量更大、每位价格更便宜、但速度更慢的存储器。它们依靠辅助软硬件的作用,构成一个整体。以弥补主存容量的不足。

辅助软硬

CPU 主存辅存

图5.3 “主存-辅存”层次

5.2 Cache的基本知识

其地址映象规则有如下三种:

1. 全相联映象:主存中的任一块可以被放置到Cache中的任意一个位置,空间利用率最高,冲突概率最低,实现最复杂。Cache空间的利用率较高,块冲突概率较低,因而Cache的失效率也低。

2. 直接映象:主存中的每一块只能被放置到Cache中唯一的一个位置。Cache空间的利用率较低,块冲突概率较高,因而Cache的失效率也高。

3. 组相联映象:主存中的每一块可以被放置到Cache中唯一的一个组中的任何一个位置,组相联是直接映像和全相联的一种折中。

查找算法是为了解决当CPU访问Cache时,确定Cache中是否有要访问的块,以及确定其位置。

替换算法是为了解决当新调入一块,而Cache又已被占满,应该替换那一块。有随机法,先进先出法以及最近最少使用法LRU。

5.3 主存与虚拟存储器

延迟和带宽是贮存的主要性能指标。可以有以下三种存储器组织技术来提高主存性能:

增加存储器的宽度。这样也就增加CPU和存储器之间的连接通路的宽度,CPU和Cache之间就有了一个多路选择器,扩充主存的最小增量增加了相应的倍数,而且写入有可能变得复杂。

采用简单的多体交叉存储器。在存储系统中采用多个DRAM,并利用它们潜在的并行性。

独立存储体。设置多个存储控制器,使多个体能独立操作,以便能同时进行多个独立的访存。

虚拟存储器是“主存-辅存”层次进一步发展的结果,可以分为页式和段式的存储器管理方式具有多次性,对换性,虚拟性的特点。

6.输入/输出系统

6.1 总线

输入/输出系统简称I/O系统,I/O系统是用于实现数据输入、输出及数据存储的系统。它包括I/O设备以及I/O设备与处理机的连接。

在计算机系统中,各子系统之间可以通过总线相互连接。因为它是由不同的外设分时共享的,形成了信息交换的瓶颈,从而限制了系统中总的I/O吞吐量。

总线按用途分类可分为

1.CPU存储器总线。CPU存储器总线比较短,通常具有较高的速度,并且要和存储器系统的速度匹配来优化带宽。

2.I/O总线。I/O总线要连接许多不同类型、不同带宽的设备,因而比较长,并且应遵循总线标准。

按设备定时方式分类,总线可分为

同步总线。所有设备通过统一的总线系统时钟进行同步。优点是成本低,速度快,因为它不需要设备之间互相确定时序的逻辑。缺点是总线操作必须以相同的速度运行。

异步总线。设备之间没有统一的系统时钟,设备自己内部定时。设备之间

的信息传送用总线发送器和接收器控制。容易适应更广泛的设备类型,扩充总线时不用担心时钟时序和时钟同步问题。但在传输时,异步总线需要额外的同步开销。

CPU与外部设备进行输入/输出的方式在计算机的发展过程中经历了不同的方式。在早期的计算机系统中,是采用程序I/O方式;当在系统中引入中断机制后,I/O方式便发展为中断驱动方式;此后,随着DMA控制器的出现,又使I/O方式在传输单位上发生了变化,即从以字节为单位的传输扩大到以数据块为单位进行传输,从而大大地改善了块设备的I/O性能;而通道的引入,又使对I/O操作的组织和数据的传送都能独立地进行而无需CPU的干预。

6.2 通道处理机

通道处理机(简称通道)专门负责整个计算机系统的输入/输出工作,只能执行有限的一组输入/输出指令。其对外设的控制通过输入/输出接口和设备控制器进行控制。根据信息传送方式的不同通道分为三种类型:字节多路通道:一种简单的共享通道,主要为多台低速或中速的外围设备服务。传送过程:通道每连接一个外围设备,只传送一个字节,然后又与另一台设备连接,并传送一个字节。

数组多路通道:适于为高速设备服务。传送过程:每连接一台高速设备,一般传送一个数据块,传送完成后,又与另一台高速设备连接,再传送一个数据块。

选择通道:为多台高速外围设备服务。传送过程:在选择通道中,通道每连接一个外围设备,就把这个设备的n个字节全部传送完成,然后再与另一台设备相连接。

通道完成一次数据传输的工作过程:

在用户程序中使用访管指令进入管理程序,由CPU通过管理程序组织一个通道程序,并启动通道。通道处理机执行CPU为它组织的通道程序,完成指定的数据I/O工作。通道程序结束后向CPU发中断请求。CPU响应这个中断请求后,第二次进入操作系统,调用管理程序对I/O中断请求进行处理。

7.计算机系统结构的发展趋势

7.1高性能计算机体系结构

高性能计算(high performance computer,HPC)是计算机集群系统,它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算能力来处理大型计算问题。高性能计算方法的基本原理就是将问题分为若干部分,而相连的每台计算机均可同时参与问题的解决,从而显著缩短了解决整个问题的计算时间。解决大型计算问题需要功能强大的计算机系统,随着高性能计算的出现,使这一类应用从昂贵的大型外部计算机系统演变为采用商用服务器产品和软件的高性能计算机集群体。因此,高性能计算系统已经成为解决大型问题计算机系统的发展方向。

高性能计算机具有以下技术:

对称多处理(symmetrical multiprocessing,SMP)技术是相对非对称多处理技术而言的、应用十分广泛的并行技术。

非一致访问分布共享存储技术(non uniformmemory access,NUMA)中,每个处理器与本地存储器和高速缓存相连,多个处理器通过处理器、存储器互联网络相连。

集群(Cluster)是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理。

网格技术有可能成为实现Petaflops的另一条途径。

7.2 高性能计算的发展方向

混合体系统结构已成为HPC发展趋势

建在东京技术研究所的TSUBAME采用的就是混合体系,除了使用1036个AMD双核Opteron外,360块加速卡为系统贡献了24%的性能,仅增加了1%的功耗。而IBM将在2008年完成的名为RoadRuner的1600万亿次HPC中,总共采用了16000个Opteron和Cell两种架构的处理器。多核微处理器和面向领域的混合体系结构已经成为HPC发展的趋势。

集群将成为超级计算系统的主流

集群架构的超级计算系统,特别是以采用普通商用芯片和内联技术组成的系统,迅速成为目前高性能计算架构的主流。它大受欢迎的主要原因在于其经济有效性和公开性。它一般采用廉价的不同IA服务器为运算节点,小规模的系统一般采用以太网进行内联,规模大一点和性能要求较高的多采用

InfiniBand、QsNET或Myrinet作为内联网络,外加免费的、公开的、通用的操纵系统(Linux)和并行编程接口(MPI),使超级计算机的造价告别了天文数字。

集群标准化深入泛高性能计算时代

2005年,国内服务器厂商把泛高性能计算时代下集群技术总结为10 大标准,为Linux集群技术及应用推广打下了非常好的基础。继此之后,集群在远程/异地操作控制、一体化监控、集群负载均衡、智能机柜、异构支持、集群简易管理、集群高速并行吞吐、集群安全、行业应用等方面的技术标准慢慢浮出水面,并被高性能计算行业所接受。标准化是行业应用成熟化得标志,预计集群标准技术会有更进一步的发展和普及。

虚拟计算机技术在集群应用中的深层次发展

基于应用级集群虚拟计算机技术不仅将带来更高的集群部件利用率,同时也会带来支持应用动态迁移、故障自动隔离、系统自动重构的高可靠集群应用环境,以及更为简洁、统一的Linux集群管理模式。伴随Microsoft的Virtual Server、VMware的VMare Workstation和Xensource的Xen,以及Intel的Vanderpool、AMD的Pacifica等部件级及系统级虚拟技术的兴起,预计未来几年虚拟技术在集群系统应用中将会有更深一步的发展。

集群可信计算环境构造技术浮出水面

基于商业计算及信息化应用对集群架构的普及推动,预计基于内外网隔离、统一身份认证、访问控制、分布式入侵检测、流量分析、应用层及传输层加密传输协议、主动防护等技术催生全新的集群应用可信计算机环境构造技术框架,从而使计算机获得从物理层到应用层全方位的、多层次的、立体的集群应用安全环境,位高性能计算机的商业应用打下良好的基础。

综上所述,超级计算机正在完成一个从科研工具和试验产品到产业应用的转变,具有广阔的发展空间。但高性能计算机的发展一直面临着挑战,其巨大的计算潜力与性能始终没有被充分应用起来。效率一直是高性能计算机最为突出的关键性问题之一,高性能计算机实际效率的高可用性将成为下一阶段的研究方向。

参考文献

[1] 戴志涛,张天乐,谭建成.计算机组成与系统结构.科学出版社,2011.

[2] 孙强南,孙昱东.计算机系统结构.科学出版社,1992.

[3] 刘超.计算机系统结构.中国水利水电出版社,2005.

[4] 吴艳霞.计算机体系结构.北京:清华大学出版社,2010.

[5] 苏广川,张笈.高级计算机结构技术及其应用.北京理工大学出版社.

[6] 张春元,罗莉等.计算机系统结构.国防科技大学出版社,2002.

[7] 汤晓丹,梁红兵,哲凤屏,汤子瀛.计算机操作系统,2007.

计算机系统结构模拟试题(5)

计算机组成原理模拟试题(2) 一、填空题:04分,每题02分 1、X=-0.1001 [X]原=_____________ [X]补=_____________[-X]补=_____________ Y=0.0101 [Y]原=_____________ [Y]补=_____________ [-Y]补=_____________ [X+Y]补=_____________ 2、对西文输出的字符设备,在计算机的内存储器中存储的是字符数据的每个字符的_____________码,输出(包括显示或打印)的则是每个字符的_____________,设备中的字符发生器的主要功能是解决从字符的_____________码和字符的_____________间的对应关系。 二、单选题:20分,每题02分 3、32 x 32点阵汉字的机内编码需要。 A: 16个字节 B: 32个字节 C: 32×2个字节 D: 32×4个字节 4、某机字长32位,采用原码定点整数表示,符号位为1位,数值位为31位,则可表示的最大正整数为,最小负整数为。 A: B: C: D: 5、在定点二进制运算器中,减法运算一般通过来实现。 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 6、在浮点数运算中产生溢出的原因是。 A: 运算过程中最高位产生了进位或借位 B: 参加运算的操作数超出了机器的表示范围 C: 运算的结果的阶码超出了机器的表示范围 D: 寄存器的位数太少,不得不舍弃最低有效位 7、无论如何划分计算机的功能部件,控制器部件中至少含有。 A: PC、IP B: PC、IR C: IR、IP D: AR、IP 8、某存储器容量为32K×16位,则 A: 地址线为16根,数据线为32根 B: 地址线为32根,数据线为16根

计算机体系结构第五章练习题参考解答

第 五 章 5.34 在一个采用组相联映象方式的Cache 存储系统中,主存由B 0~B 7共8块组成,Cache 有2组,每组2块,每块大小为16B 。在一个程序执行过程中,访存的主存块地址流为:B 6,B 2,B 4,B 1,B 4,B 6,B 3,B 0,B 4,B 5,B 7,B 3。 (1)写出主存地址的格式,并标出各字段的长度。 (2)写出Cache 地址的格式,并标出各字段的长度。 (3)指出主存与Cache 之间各个块的映象关系。 (4)若Cache 的4个块号为C 0、C 1、C 2和C 3,列出程序执行过程中的Cache 块地址流。 (5)若采用FIFO 替换算法,计算Cache 的块命中率。 (6)若采用LRU 替换算法,计算Cache 的块命中率。 (7)若改为全相联映象方式,再做(5)和(6)。 (8)若在程序执行过程中,每从主存装入一块到Cache ,平均要对这个块访问16次,计算在这种情况下的Cache 命中率。 解:(1)(2)采用组相联映象时,主存和Cache 地址的格式分别为: 主存按Cache 的大小分区,现主存有8个块,Cache 有2×2=4个块,则主存分为8/4=2 个区,区号E 的长度为1位。又每区有2个组,则组号G 、g 的长度都为1位。而每组有2个块,则块号B 、b 的长度又都为1位。每块大小为16个存储字,故块内地址W 、w 的长度都为4位。 (3)根据组相联映象的规则,主存块0~7与Cache 块0~3之间的映象关系为:主存块0、1、4、5与Cache 块0、1之间全相联,主存块2、3、6、7与Cache 块2、3之间全相联。 (4)根据组相联映象的规则,该主存块地址流相应的一种Cache 块地址流如下表所示(组内替换算法为FIFO )。 时间: 1 2 3 4 5 6 7 8 9 10 11 12 主存块地址流: B 6 B 2 B 4 B 1 B 4 B 6 B 3 B 0 B 4 B 5 B 7 B 3 Cache 块地址流: C 2 C 3 C 0 C 1 C 0 C 2 C 2 C 0 C 0 C 0 C 3 C 2 (5)组内替换算法采用FIFO 时,Cache 块0~3的使用过程如下表所示。 时间: 1 2 3 4 5 6 7 8 9 10 11 12 主存块地址流: B 6 B 2 B 4 B 1 B 4 B 6 B 3 B 0 B 4 B 5 B 7 B 3 Cache 块0 Cache 块1 Cache 块2 Cache 块3 命中 命中 命中 可见命中三次,Cache 块命中率为H i = 3/12 = 0.25。 (6)组内替换算法采用LRU 时,Cache 块0~3的使用过程如下表所示。

北邮研究生 高级计算机系统结构

计算机系统结构的发展历程 课程:高级计算机系统结构 姓名: 学号: 班级:

2015年12月 一、计算机系统结构 随着当今社会和科技的飞速发展,自四十年代计算机问世以来,计算机科学更是发展迅速,应用领域不断扩展计算机的普及和广泛应用,现代社会正朝着高度信息化,自动化方向发展。计算机逐渐成为社会必不可少的支柱力量。 计算机系统是按人的要求接收和存储信息,自动进行数据处理和计算,并输出结果信息的机器系统。计算机是脑力的延伸和扩充,是近代科学的重大成就之一。计算机系统由硬件系统和软件系统组成。前者是借助电、磁、光、机械等原理构成的各种物理部件的有机组合,是系统赖以工作的实体。后者是各种程序和文件,用于指挥全系统按指定的要求进行工作。 而计算机系统结构是计算机的的机器语言程序员或编译程序编写者所看到的外特性。所谓外特性,就是计算机的概念性结构和功能特性,主要研究计算机系统的基本工作原理,以及在硬件、软件界面划分的权衡策略,建立完整的、系统的计算机软硬件整体概念。其也称为计算机体系结构,它是由计算机结构外特性,内特性,微外特性组成的。经典的计算机系统结构的定义是指计算机系统多级层次结构中机器语言机器级的结构,它是软件和硬件/固件的主要交界面,是由机器语言程序、汇编语言源程序和高级语言源程序翻译生成的机器语言目标程序能在机器上正确运行所应具有的界面结构和功能。 以最常见的冯诺依曼计算机为例,计算机系统结构包含了以下几个方面: 1.指令集架构(Instruction set architecture;简称ISA):被视为一种机器语言, 包含了许多相关的指令集(存储器定址、处理器控制,寄存器控制等等……)。 2.微体系结构/微架构(Microarchitecture)或称计算机组织(Computer

计算机系统结构试题及答案(二)

计算机系统结构试题及答案 一、单项选择题(本大题共20小题,每小题2分,共20分) 1.以下正确的是()。 A)机箱是计算机的外特性,属系统结构的研究范围 B)集成电路芯片的设计是计算机组成原理的研究范围 C)加法器的设计是计算机实现的研究内容 D)计算机性能评价是计算机系统结构的研究范围 2.在流水线相关处理中,采用()会产生“写-写”相关和“先读后写”相关。 A)猜测法B)顺序流动 C)异步流动 D)相关专用通路3.非线性流水线是指() A)存在分叉连接的流水线B)存在反向连接的流水线 C)一个任务使用多个功能段的流水线D)动态连接的流水线4.网络直径与网络的()有关 A)度B)链路总数 C)结点间通信经过的最多链路数D)通信延迟 5.下列关于存储器的描述,哪个是正确的() A)多体交叉存储器主要解决扩充容量问题 B)Cache的功能全由硬件完成 C)Cache与主存统一编址,即主存空间的某一部分属于Cache D)“主存—外存”的存储层次是为了弥补主存速度的不足 6.在单指令流多数据流计算机中各处理单元必须()。 A)以同步方式在同一时间内执行不同的指令 B)以同步方式在同一时间内执行相同的指令 C)以异步方式在同一时间内执行相同的指令 D)以异步方式在同一时间内执行不同的指令 7.虚拟存储器地址变换是指()。 A)多用户虚地址与实地址如何一一对应 B)程序的逻辑地址变换成主存实地址 C)程序执行时将虚地址变换成对应的实存地址 D)指令的符号地址变换成二进制地址

8.反映网络在理想通信模式下通信带宽的特性是() A)度B)直径C)带宽总和D)等分带宽 9.依据Michael J.Flynn提出的按指令流和数据流的多倍性对计算机系统分类,Illiac IV计算机属于()A)SISD B)SIMD C)MISD D)MIMD 10.全相联地址映象是指()。 A)任何主存页都可装入Cache中任何页的位置 B) 一个虚页只装进固定的主存实页位置 C ) 组之间是固定的,而组内任何主存页可以装入任何Cache页位置 D) 组间可任意装入,组内是固定装入 二、名词解释题(本大题共5小题,每小题4分,共20分)解释每小题所给名词的含义,若解释正确则给分,若 解释错误则无分,若解释不准确或不全面,则酌情扣分。 1.目录表 2.阻塞网络 3. 写直达法 4. 乱序流动 5. 向量链接技术 三、简答题(本大题共4小题,共25分) 1.(5分)存储程序计算机(冯氏机)在系统结构上的主要特点是什么? 2.(5分)在cache容量一定的情况下,增加cache中的块大小能否达到提高cache命中率的效果?为什么? 3.(5分)解释数据相关(局部相关)与控制相关(全局相关)。 4.(10分)有哪几种向量处理方式?它们对向量处理机的结构要求有何不同? 四、综合题(本大题共4小题,共35分) 1. (5分)某计算机系统采用浮点运算部件后使浮点运算速度提高到原来的20倍,而系统运行一程序 的整体性能提高到原来的10倍,试计算该程序中浮点操作所占的比例。

计算机系统结构模拟试题5

计算机组成原理模拟试题(2)一、填空题:04分,每题02分 =_____________ [X]补=_____________补-X][1、 X=-0.1001 [X]原 =_____________ =_____________ =_____________ [-Y]补Y]原=_____________ []补 Y=0.0101 [Y ]补=_____________ [X+Y对西文输出的字符设备,在计算机的内存储器中存储的是 字符数据的每个字符的、 2,设备中的字符_____________(包括显示或打印)的则是每个字 符的码,输出_____________间的对应关_____________发生器的主要功能是解决从字符的 _____________码和字符的系。分二、单选题:20分,每题02 。3、 32 x 32点阵汉 字的机内编码需要 A: 16个字节 B: 32个字节 2个字节 C: 32×个字节 D: 32×4位,则可表示位,数值位为314、某机字长32位,采 用原码定点整数表示,符号位为1 。,最小负整数为的最大正整数为 A: B: C: D: 来实现。 5、在定点二进制运算器中,减法运算一般通过 A: 原码运算的二进制减法器 B: 补码运算的二进制减法器 C: 补码运算的十进制加法器 D: 补码运算的二进制加法器 。 6、在浮点数运算中产生溢出的原因是运算过程中最高位产生了进位或借位 A: 参加运算的操作数超出了机器的表示范围B: C: 运算的结果的阶码超出了机器的表示范围寄存器的位数太少,不得不舍弃最低有效位 D: 。 7、无论如何划分计算机的功能部件,控制器部件中至少含有 IP A: PC、 IR B: PC、、IP C: IR D: AR、IP 8、某存储器容量为32K×16位,则 A: 地址线为16根,数据线为32根 根16根,数据线为32地址线为B: C: 地址线为15根,数据线为16根 D: 地址线为15根,数据线为32根 9、在统一编址方式下,存储单元和I/O设备是靠指令中的来区分的。

计算机系统结构简答题复习

计算机系统结构简答题复习(1) 1、如果外设要求的通道实际流量十分接近或等于通道具有的最大流量时, 则可能发生局部的数据丢失问题,我们怎样解决(三种方法)? 答: 1. 增大通道最大流量。 2. 动态改变设备优先级。 3. 增加一定数量的缓存器,尤其是优先级比较低的设备 2、解决软件移植最好的办法有哪些? 1.采用系列机 2.采用模拟与仿真 3.采用统一的高级语言 3、证明在浮点数的字长和表数范围一定时,尾数基值rm取2或4具有最高 的表数精度 4、假设一条指令的执行过程分为"取指令"、"分析"和"执行"三段,每一段 的时间分别为△t、2△t和3△t。在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。 (1)顺序执行方式。 (2) "取指令"、"分析"和"执行"重叠。 计算机系统结构简答题复习(2) 5、RISC处理机的关键技术有哪四种? 1. 延时转移技术 2. 指令取消技术 3. 重叠寄存器窗口技术 4. 指令流调整技术 6、多处理机有那些基本特点?发展这种系统的主要目的有哪些?多处理机 着重解决那些技术问题? 1. 结构灵活 2. 程序并行 3. 并行任务派生 4. 进程同步 5. 多处理机工作时,要根据任务的多少来调用资源,因此,所需要的资源变化复杂 目的是:利用多台处理机并发执行一个作业,使得执行速度比单处理机块着重解决的问题 着重解决的技术问题:

1. 硬件结构上多处理机,主存,I/O子系统之间应有高带宽,低价格,灵活无规则互联,尽可能不发生信息传送冲突 2. 从并行语言并行算法编译等,最大限度的开发程序并行性 3. 大的任务如何分成多个子任务 4. 从操作系统上解决并行任务分配,调度和资源分配;任务或进程间的同步,死锁竞争等问题的解决 7、向量的处理方式有哪三种?各有何特点? 1. 横向处理方式。向量计算是按行的方式从左至右横向地进行。 2. 纵向处理方式。向量计算是按列的方式自上而下纵向地进行。 3. 纵横处理方式。横向处理和纵向处理相结合的方式。 8、向量处理机实现链接的条件是什么? 1.没有向量寄存器冲突和运算部件冲突。 2. 只有第一个结果送入向量寄存器的那一个周期可以链接。 3. 先行的两条指令产生运算结果的时间必须相等。 4.两条向量指令的向量长度必须相等。 9、提高向量处理机性能的常用技术有那些? 1.链接技术 2.向量循环或分段开采技术 3. 向量递归技术 4.稀疏矩阵的处理技术 10、列出互连网络中四种寻径方式?并指出它们各自优缺点? 1.线路交换。在传递一个信息前需要频繁的建立从源结点到目地结点的物理通路,开销将会很大。 2.存储转发寻址。包缓冲区大,不利于VLSI的实现;时延大,与结点的距离成正比 3.虚拟直通。没有必要等到整个消息全部缓冲后再做路由选择,只要接收到用作寻址的消息头部即可判断,通信时延与结点数无关;同样不利于VLSI 的实现。 4.虫蚀寻址。每个结点的缓冲区小,易于VLSI实现;较低的网络时延。 计算机系统结构简答题复习(3) 11、采用并行处理机的SIMD 计算机主要特点是什么?▲ 1.速度快,而且潜力大 2.模块性好,生产和维护方便 3.可靠性高,容易实现容错和重构 4.效率低。与流水线处理机,向量处理机等比较。依靠是资源重复,而 不是时间重叠,所以其效率要低一些。 5.潜力大。主要依靠增加PE个数,与流水线处理机主要依靠缩短时钟 相比,其提高速度的潜力要大得多。

计算机系统结构模拟题

《计算机系统结构》模拟题 一.判断是非题,对的打√,错的打× 1.系列机是指由一个厂家生产的具有相同组成,但具有不同系统结构和实现的一系列不同型号的机器。 ( × ) 2.Cray 1向量处理机中,由于每个向量寄存器的长度为64,当实际需要处理的向量长度大于64时,它就不能够处理了。 ( × ) 3.按照Flynn 分类法,Illiac IV 阵列处理机是MIMD 计算机。 ( × ) 4.多级混洗交换网络是阻塞网络。 ( √ ) 二.填空题 1.多机系统的互连网络的通信模式可分为4种,其中,一对一的通信模式称为____单播_____模式,一对全体的通信模式为_____广播____模式,多对多的通信模式为____会议_____模式。 2.SIMD 计算机和流水线向量处理机都可以执行向量指令,前者采用___资源重复______并行性,后者采用___时间重叠______并行性。 3.系列机软件兼容必须做到___向后_____兼容,力争做到___向上_____兼容。 4.流水线消除瓶颈段的方法有____细分_____和____重复设置瓶颈段(可交换次序)_____2种方法。 5.设通道数据传送过程中,选择一次设备的时间为 s T ,传送一个字节的时间为D T ,则字 节多路通道最大流量等于____ D s T T 1 _____。 6.Illiac IV 8×8阵列中,网络直径为____7_____。 7.对堆栈型替换算法,增大分配给程序的___主存页面______,对第一级存储器的命中率就会单调____上升_____。 8.从网络的任何结点看,若网络拓扑结构都是相同的,则称这样的网络是___对称______网络。 三.单项选择题 1.在计算机系统层次结构中,从下层到上层,各层相对顺序正确的是( B )。 A.汇编语言机器级-操作系统机器级-高级语言机器级 B.微程序机器级-传统机器语言机器级-汇编语言机器级 C.传统机器语言机器级-高级语言机器级-汇编语言机器级 D.汇编语言机器级-应用语言机器级-高级语言机器级 2.Illiac IV 阵列处理机中,PE 之间所用的互连函数是( A )。

计算机系统结构_第五章练习 答案

第五章练习 1、描述计算机系统流水线的性能指标有哪些?其定义和定量表达式是什么? 指标主要有吞吐率、加速比、效率。 (1)吞吐率:在单位时间内流水线所完成的任务数量或输出的结果数量。 基本公式:TP=n/Tk,其中,n是任务数,Tk是处理完成n个任务所用的时间。 各个功能段执行时间均相等,输入连续n个任务的一条k段线性流水线的实际吞吐率为:TP=n/[(k+n-1) ?t] (2)加速比:完成一批任务,不使用流水线所用的时间与使用流水线所用的时间之比。 基本公式:S=T0/Tk,其中,T0为不使用流水线所用的时间,Tk为使用流水 线的执行时间。 各个功能段执行时间均相等的一条K段流水线完成n个连续任务时的实际加速比为:s=k*n*?t/[(k+n-1) ?t]=k*n/( k+n-1). (3)效率:指流水线的设备利用率。 在时空图上,流水线的效率定义为n个任务占用的时空区与k个功能段总的时空区之比。即:E=T0/(k*Tk) 各个功能段执行时间均相等,输入连续n个任务的一条k段线性流水线的效率为:E=n/(k+n-1) 2、假设某个流水线由4个功能部件组成,每个功能部件的执行时间都为?t。当 连续输入10个数据后,停顿5?t,又连续输入10个数据,如此重复。 画出时空图,计算流水线的实际吞吐率,加速比和效率。 总时间:Tk=[(4+10-1)+2] *?t*n =15n*?t 实际吞吐率:TP=N/Tk=10n/(15n*?t)=2/(3?t) 不使用流水线所用的时间为T0=4*N*?t =40n*?t 加速比:S=T0/Tk=2.67 效率:E=T0/(k*Tk)=0.67

计算机系统结构发展历程及未来展望

计算机系统结构发展历程及未来展望 一、计算机体系结构 什么是体系结构 经典的关于“计算机体系结构(computer A 按照计算机系统的多级层次结构,不同级程序员所看到的计算机具有不同的属性。一般来说,低级机器的属性对于高层机器程序员基本是透明的,通常所说的计算机体 系结构主要指机器语言级机器的系统结构。计算机体系结构就是适当地组织在一起的 一系列系统元素的集合,这些系统元素互相配合、相互协作,通过对信息的处理而完 成预先定义的目标。通常包含的系统元素有:计算机软件、计算机硬件、人员、数据库、文档和过程。其中,软件是程序、数据库和相关文档的集合,用于实现所需要的 逻辑方法、过程或控制;硬件是提供计算能力的电子设备和提供外部世界功能的电子 机械设备(例如传感器、马达、水泵等);人员是硬件和软件的用户和操作者;数据库 是通过软件访问的大型的、有组织的信息集合;文档是描述系统使用方法的手册、表格、图形及其他描述性信息;过程是一系列步骤,它们定义了每个系统元素的特定使 用方法或系统驻留的过程性语境。 体系结构原理 计算机体系结构解决的是计算机系统在总体上、功能上需要解决的问题,它和计 算机组成、计算机实现是不同的概念。一种体系结构可能有多种组成,一种组成也可 能有多种物理实现。 计算机系统结构的逻辑实现,包括机器内部数据流和控制流的组成以及逻辑设计等。其目标是合理地把各种部件、设备组成计算机,以实现特定的系统结构,同时满足所 希望达到的性能价格比。一般而言,计算机组成研究的范围包括:确定数据通路的宽度、确定各种操作对功能部件的共享程度、确定专用的功能部件、确定功能部件的并 行度、设计缓冲和排队策略、设计控制机构和确定采用何种可靠技术等。计算机组成 的物理实现。包括处理机、主存等部件的物理结构,器件的集成度和速度,器件、模块、插件、底板的划分与连接,专用器件的设计,信号传输技术,电源、冷却及装配 等技术以及相关的制造工艺和技术。 主要研究内容 1·机内数据表示:硬件能直接辨识和操作的数据类型和格式 2·寻址方式:最小可寻址单位、寻址方式的种类、地址运算 3·寄存器组织:操作寄存器、变址寄存器、及专用寄存器的定义、数量和使用规则 4·:指令的操作类型、格式、指令间排序和控制机构 5·:最小编址单位、编址方式、容量、最大可编址空间 6·中断机构:中断类型、中断级别,以及中断响应方式等

计算机体系结构试题库—简答题

计算机体系结构试题库 简答题(100题) 1.简述CISC结构计算机的缺点。 答: ●在CISC结构的指令系统中,各种指令的使用频率相差悬殊。据统计,有20%的指 令使用频率最大,占运行时间的80%。也就是说,有80%的指令在20%的运行时 间内才会用到。 ●CISC结构指令系统的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制 时间和成本,而且还容易造成设计错误。 ●CISC结构指令系统的复杂性给VLSI设计增加了很大负担,不利于单片集成。 ●CISC结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。 ●在CISC结构的指令系统中,由于各条指令的功能不均衡性,不利于采用先进的计 算机体系结构技术(如流水技术)来提高系统的性能。 2.RISC结构计算机的设计原则。 答: A.选取使用频率最高的指令,并补充一些最有用的指令; B.每条指令的功能应尽可能简单,并在一个机器周期内完成; C.所有指令长度均相同; D.只有load和store操作指令才访问存储器,其它指令操作均在寄存器之间进行; E.以简单有效的方式支持高级语言。 3.影响现代微处理器主频提升的主要原因由哪些? 答:线延迟、功耗。 4.指令集格式设计时,有哪三种设计方法? 答:固定长度编码、可变长编和混合编码)三种设计方法。

5.简述存储程序计算机(冯·诺依曼结构)的特点。 答: (1)机器以运算器为中心。 (2)采用存储程序原理。 (3)存储器是按地址访问的、线性编址的空间。 (4)控制流由指令流产生。 (5)指令由操作码和地址码组成。 (6)数据以二进制编码表示,采用二进制运算。 6.在进行计算机系统设计时,一个设计者应该考虑哪些因素对设计的影响? 答: 在进行计算机系统设计时,设计者应该考虑到如下三个方面因素的影响: ●技术的发展趋势; ●计算机使用的发展趋势; ●计算机价格的发展趋势。 7.简述程序翻译技术的特点。 答: 翻译技术是先把N+1级程序全部变换成N级程序后,再去执行新产生的N级程序,在执行过程中N+1级程序不再被访问。 8.简述程序解释技术的特点。 答: 解释技术是每当一条N+1级指令被译码后,就直接去执行一串等效的N级指令,然后再去取下一条N+1级的指令,依此重复进行。 9.经典体系结构的定义是什么? 计算机体系结构是机器级程序员所看到的计算机的属性,即概念性结构与功能特性。10.“线延迟墙”指的是什么?

计算机系统结构总复习题

一、单项选择题 1、直接执行微指令的是( ) A.汇编程序B.编译程序 C.硬件D.微指令程序 2、对系统程序员不透明的应当是( )。 A.Cache存贮器B.系列机各档不同的数据通路宽度C.指令缓冲寄存器D.虚拟存贮器 3、对机器语言程序员透明的是( )。 A.中断字B.主存地址寄存器 C.通用寄存器D.条件码 4、计算机系统结构不包括( )。 A.主存速度B.机器工作状态 C.信息保护D.数据 5、从计算机系统结构上讲,机器语言程序员所看到的机器属性是( )。A.计算机软件所要完成的功能B.计算机硬件的全部组成 C.编程要用到的硬件组织D.计算机各部件的硬件实现 6、计算机组成设计不考虑( )。 A.专用部件设置B.功能部件的集成度 C.控制机构的组成D.缓冲技术 7、以下说法中,不正确的是( )。 软硬件功能是等效的,提高硬件功能的比例会: A.提高解题速度B.提高硬件利用率 C.提高硬件成本D.减少所需要的存贮器用量 8、在系统结构设计中,提高软件功能实现的比例会( )。 A.提高解题速度B.减少需要的存贮容量 C.提高系统的灵活性D.提高系统的性能价格比 9、下列说法中不正确的是( )。 A.软件设计费用比软件重复生产费用高 B.硬件功能只需实现一次,而软件功能可能要多次重复实现 C.硬件的生产费用比软件的生产费用高 D.硬件的设计费用比软件的设计费用低 10、在计算机系统设计中,比较好的方法是( )。 A.从上向下设计B.从下向上设计 C.从两头向中间设计D.从中间开始向上、向下设计11、"从中间开始"设计的"中间"目前多数是在( )。 A.传统机器语言级与操作系统机器级之间 B.传统机器语言级与微程序机器级之间 C.微程序机器级与汇编语言机器级之间 D.操作系统机器级与汇编语言机器级之间 12、系列机软件应做到( )。 A.向前兼容,并向上兼容 B.向后兼容,力争向上兼容

计算机系统结构作业答案第三章(张晨曦)

3.1 -3.3为术语解释等解答题。 3.4 设一条指令的执行过程分为取指令,分析指令和执行指令3个阶段,每个阶段所需时间分别为ΔT, ΔT, 2ΔT,分别求出下列各种情况下,连续执行N条指令所需的时间。 (1) 顺序执行方式 (2) 只有“取指令”与“执行指令”重叠 (3) “取指令”,“分析指令”与“执行指令”重叠 解: (1) 4NΔT (2) (3N+1) ΔT (3) 2(N+1) ΔT 3.6 解决流水线瓶颈问题有哪两种常用方法? 解: (1) 细分瓶颈段 将瓶颈段细分为若干个子瓶颈段 (2) 重复设置瓶颈段 重复设置瓶颈段,使之并行工作,以此错开处理任务 3.9 列举下面循环中的所有相关,包括输出相关,反相关,真数据相关。 for(i = 2; i < 100; i=i+1) { a[i] = b[i] + a[i]; -----(1) c[i+1] = a[i] + d[i]; -----(2) a[i-1] = 2*b[i]; -----(3) b[i+1] = 2*b[i]; -----(4) } 解: 输出相关:第k次循环时(1)与第k+1轮时(3) 反相关:第k次循环时(1)和(2)与第k-1轮时(3) 真数据相关:每次循环(1)与(2),第k次循环(4)与k+1次循环(1),(3),(4) 3.12 有一指令流水线如下所示 50ns 50ns 100ns 200ns (1)求连续如入10条指令的情况下,该流水线的实际吞吐率和效率 (2)该流水线的“瓶颈”在哪一段?请采用两种不同的措施消除此“瓶颈”。对于你所给出 的两种新的流水线连续输入10条指令时,其实际吞吐率和效率各是多少? 解:(1)(m表示流水线级数,n 表示任务数)

计算机体系结构试题及答案版本

计算机体系结构试题及答案 1、计算机高性能发展受益于:(1) 电路技术的发展;(2) 计算机体系结构技术的发展。 2、层次结构:计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。第六级:应用语言虚拟机-> 第五级:高级语言虚拟机-> 第四级:汇编语言虚拟机-> 第三级:操作系统虚拟机->第二级:机器语言(传统机器级) -> 第一级:微程序机器级。 3、计算机体系结构:程序员所看到的计算机的属性,即概括性结构与功能特性。 4、透明性:在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的概念称为透明性。 5、Amdahl 提出的体系结构是指机器语言级程序员所看见的计算机属性。 6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定,也就是指令集的设计,该界面之上由软件的功能实现,界面之下由硬件和固件的功能来实现。 7、计算机组织是计算机系统的逻辑实现;计算机实现是计算机系统的物理实现。

8、计算机体系结构、计算机组织、计算机实现的区别和联系? 答:一种体系结构可以有多种组成,一种组成可以有多种物理实现,体系结构包括对组织与实现的研究。 9、系列机:是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。 10、软件兼容:即同一个软件可以不加修改地运行于系统结构相同的 各机器,而且它们所获得的结果一样,差别只在于运行时间的不同。 11、兼容机:不同厂家生产的、具有相同体系结构的计算机。 12、向后兼容是软件兼容的根本特征,也是系列机的根本特征。 13、当今计算机领域市场可划分为:服务器、桌面系统、嵌入式计算三大领域。 14、摩尔定律:集成电路密度大约每两年翻一番。 15、定量分析技术基础(1)性能的评测:(a)响应时间:从事件开始到结束之间的时间;计算机完成某一任务所花费的全部时间。(b)流量:单位时间内所完成的工作量。(c )假定两台计算机x 、y;x 比y 快意思为:对于给定任务,x 的响应时间比y少。x的性能是y的几倍是指:响应时间x / 响应时间y = n ,响应时间与性能成反比。

计算机系统结构简答题范文

第1 章系统结构的基本概念 1、为什么将计算机系统看成是多级机器构成的层次结构?P2 2、从机器(汇编)语言程序员的角度来看,以下哪些是不透明的?为什么? 条件码寄存器、磁盘外设、先行进位链、中断寄存器、移位器、I/O端口寄存器 3、就目前通用机来说,计算机系统结构的属性主要包括哪些(03.7)?P3 4、设计指令系统时,以乘法运算为例,简述系统结构设计、计算机组成设计、计算机实现 各应考虑的问题(09.4)。P4 5、简述在设计主存系统时,计算机系统结构、计算机组成、计算机实现各需要考虑的问题 (08.7)。P4 6、简述计算机系统结构、组成和实现三者的相互关系(03.4)。 7、计算机系统结构用软件实现和硬件实现各自的优缺点?P7 8、简述软硬件功能分配的基本原则(06.7)。P8 9、简述计算机系统“由中间开始”设计的基本思想(05.4)其“中间”指的是什么地方?这样 设计的优点是什么(05.7) (07.7)? 10、试述由上往下、由下往上设计思路和存在的问题?P9 11、什么是软件的可移植性(03.7)?为什么要进行软件移植?P10 12、简述采用统一高级语言方法、适用场合、存在问题和应采取的策略。 13、简述统一高级语言的出发点、难点和发展前景(04.4)。 14、采用系列机方法、适用场合、好处、存在问题和应采取的策略P11 15、采用模拟与仿真方法、适用场合、好处、存在问题和应采取的策略。 16、模拟与仿真的主要区别和适合场合是什么(02.4)? 17、软件移植的途径,各受什么限制(08.4)?P14 18、器件的发展对逻辑设计方法的影响(06.4)。P17 19、什么是计算机系统的并行性、开发并行性的目的和两重含义(02.7)?P19 20、从执行程序角度出发,简述并行处理数据的四个等级,给出简单解释,各举一例P19 21、从处理数据的并行上,简述并行处理数据的四个等级,给出简单解释,各举一例P19 22、简要解释提高计算机系统并行性的三个技术途径(07.4),简要解释并举例说明。P20 23、简述计算机系统Flynn分类法的分类角度及类别,并说明各类别的特征(04.7) (09.7)。第2 章数据表示、寻址方式与指令系统 1、数据结构和机器的数据表示之间的关系?引入数据表示的基本原则?P27 2、简述标志符数据表示的主要优点(02.4)。P29 3、标识符数据表示与描述符数据表示有什么不同? 4、使用标志符数据表示会带来什么问题?对此应如何认识。 5、数据描述符和向量数据表示对向量数据结构所提供的支持有什么不同?P30 6、堆栈型机器与通用寄存器型机器的主要区别?堆栈型机器对程序调用的哪些操作提供支持?P32 7、以浮点数数据表示说明数的可表示精度、运算中的精度损失,尾数基值取小对哪个有利

计算机系统结构模拟题

《计算机系统结构》模拟题(补)一.单项选择题 1. SIMD是指()。 A、单指令流单数据流 B、单指令流多数据流 C、多指令流单数据流 D、多指令流多数据流 2. 磁盘外部设备适合于连接到()。 A.字节多路通道B.数组多路通道或选择通道 C.选择通道或字节多路通道D.数组多路通道或字节多路通道 3. 下列()存储设备不需要编址。 A. 通用寄存器 B. 主存储器 C. 输入输出设备 D. 堆栈 4.多处理机的各自独立型操作系统( )。 A.要求管理程序不必是可再入的 B.适合于紧耦合多处理机 C.工作负荷较平衡 D.有较高的可靠性 5.输入输出系统硬件的功能对( )是透明的。 A.操作系统程序员 B.应用程序员 C.系统结构设计人员 D.机器语言程序设计员 6. 实现汇编语言源程序变换成机器语言目标程序是由()。 A.编译程序解释B.编译程序翻译 C.汇编程序解释D.汇编程序翻译 7.全相联地址映象是指( )。 A.任何虚页都可装入主存中任何实页的位置 B.一个虚页只装进固定的主存实页位置 C.组之间是固定的,而组任何虚页可以装入任何实页位置 D.组间可任意装入,组是固定装入 8.( )属于MIMD系统结构。 A.各处理单元同时受同一个控制单元的管理 B.各处理单元同时接受同一个控制单元送来的指令 C.松耦合多处理机和多计算机 D.阵列处理机

9.设16个处理器编号分别为0,1,2,…,15用Cube3互联函数时,第10号处理机与第( ) 号处理机相联。 A.11 B.8 C.14 D.2 10.若输入流水线的指令既无局部性相关,也不存在全局性相关,则( )。 A.可获得高的吞吐率和效率 B.流水线的效率和吞吐率恶化 C.出现瓶颈 D.可靠性提高 11.流水线的技术指标不包括( )。 A.响应比 B.吞吐率 C.加速比 D.效率 12.指令优化编码方法,就编码的效率来讲,方法最好是()。 A. 固定长度编码 B. 扩展编码法 C. Huffman编码法 D. 以上编码都不是 13.RISC 计算机的指令系统集类型是 ( ) 。 A. 堆栈型 B. 累加器型 C. 寄存器—寄存器型 D. 寄存器 - 存储器型 14.相联存储器的访问方式是( )。 A.先进先出顺序访问B.按地址访问 C.无地址访问D.按容访问 15.存储器读写速率越高,每位的成本也越高,存储容量也小。解决这一问题的主要方法是采用( )。 A.多级存储体系结构B.并行存储器 C. Cache D.缓冲技术 16.计算机系统多级层次中,从下层到上层,各级相对顺序正确的应当是()。 A.汇编语言机器级---操作系统机器级---高级语言机器级 B.微程序机器级---传统机器语言机器级---汇编语言机器级 C.传统机器语言机器级---高级语言机器级---汇编语言机器级 D. 汇编语言机器级---应用语言机器级---高级语言机器级 17.对系统程序员不透明的是()。 A.Cache 存储器 B.系列几各档不同的数据通路宽度 C.指令缓冲寄存器 D.虚拟存储器 18.在计算机系统设计中,比较好的方法是()。

计算机系统结构 第一章自考练习题答案教学内容

第一章计算机系统结构的基本概念 历年真题精选 1. 下列对系统程序员不透明的是()。 A. 乘法器 B. 先行进位链 C. 指令缓冲器 D. 条件码寄存器2.“从中间开始”设计的“中间”目前多数是在( D )。 A. 微程序机器级与汇编语言机器级之间 B. 操作系统机器级与汇编语言机器级之间 C. 传统机器语言机器级与微程序机器级之间 D. 传统机器语言机器级与操作系统机器级之间 3. 开发计算机系统结构并行性的主要技术途径有时间重叠、(资源重复)和(资源 共享)。 4. 计算机系统弗林分类法,把计算机系统分成单指令流单数据流(SISD)、单指令流多数 据流(SIMD)、(多指令流单数据流(MISD))和(多指令流多数据流(MIMD))四大类。 5. 设计指令系统时,以乘法运算为例,简述系统结构设计、计算机组成设计、计算机实现 各应考虑的问题。(P4) 6. 实现软件移植的途径有哪些?各受什么限制?(P14) 同步强化练习 一.单项选择题。 1. 实现汇编语言源程序变换成机器语言目标程序是由( C )。 A. 编译程序翻译 B. 编译程序解释 C. 汇编程序翻译 D. 汇编程序解释

2. 系列机软件应做到( B ) A. 向前兼容,并向下兼容 B. 向后兼容,力争向上兼容 C. 向前兼容,并向上兼容 D. 向后兼容,力争向下兼容 3. 在计算机系统多级层次结构中,机器级由低到高,相对顺序正确的应当是( B )。 A. 传统机器语言、汇编语言、操作系统 B. 微程序、传统机器语言、高级语言 C. 高级语言、汇编语言、传统机器语言 D. 传统机器语言、应用语言、高级语言 4. 可以直接执行微指令的是( C )。 A. 编译程序 B. 微程序 C. 硬件 D. 汇编程序 5. 计算机系统结构不包括( A )。 A. 主存速度 B. 数据表示 C. 机器工作状态 D. 信息保护 6. 对计算机系统结构透明的是()。 A. 是否使用通道型I/0处理机 B. 虚拟存储器 C. 字符行运算指令 D. VLSI技术 7. 在主存设计上,属计算机系统结构考虑的应是( C )。 A. 频宽的确定 B. 多体交叉还是单体 C. 容量和编址单位 D. 用MOS还是TTL 8. 计算机组成设计不考虑( B )。 A. 缓冲技术 B. 功能部件的集成度 C. 专用部件设置 D. 控制机构的组成 9. 下列说法中不正确的是( D ) A. 硬件的生产费用比软件的生产费用高 B.软件设计费用比软件重复生产费用高 C. 硬件功能只需实现一次而软件功能可能要多次重复实现 D. 硬件实际费用比软件设计费用低

吉林大学计算机系统结构题库第三章

第三章流水线技术 知识点汇总 先行控制、流水线、单功能流水线、多功能流水线、静态流水线、动态流水线、部件级流水线、处理机级流水线、处理机间流水线、线性流水线、非线性流水线、顺序流水线、乱序流水线、时空图、流水线性能评价(吞吐率、加速比、效率)、解决流水线瓶颈问题方法、相关(数据相关、名相关、控制相关)、换名技术、流水线冲突(结构冲突、数据冲突、控制冲突)、流水线互锁机制、定向技术、指令调度、预测分支失败、预测分支成功、延迟分支(从前调度、从失败处调度、从成功处调度)、流水寄存器、3种向量处理方式(横向、纵向、纵横)、链接技术。 简答题 1.流水技术有哪些特点?(答出4个即可)(知识点:流水线) 答:1.将处理过程分解为若干子过程,由专门的功能部件来实现,2各段的时间尽可能相等,3各部件间都有一个缓冲寄存器,4适用于大量重复的时序过程,5需要通过时间和排空时间。 2.什么是静态流水线?什么是动态流水线?(知识点:静态流水线、动态流水线) 答:同一时间段内,多功能流水线中的各段只能按同一种功能的连接方式工作;同一时间段内,多功能流水线中的各段可以按照不同的方式连接同时执行多种功能。 3.什么是单功能流水线?什么是多功能流水线?(知识点:单功能流水线、多功能流水线) 答:只能完成一种固定功能的流水线。流水线的各段可以进行不同的连接,以实现不同的功能。 4.什么是线性流水线?什么是非线性流水线?(知识点:线性流水线、非线性流水线) 答:流水线的各段串行连接,没有反馈回路。流水线中除了有串行的连接外,还有反馈回路。 5.列举3种相关。(知识点:相关) 答:数据相关,名相关,控制相关。 6.流水线中有哪三种冲突?各是什么原因造成的?(知识点:流水线冲突) 答:结构冲突,硬件资源满足不了指令重叠执行的要求;数据冲突,指令在流水线中重叠执行时需要用到前面指令的执行结果;控制冲突,流水线遇到分支指令和其他会改变PC值的指令。 7.选择至少2种解决流水线结构冲突的方法简述。(知识点:结构冲突) 答:流水线停顿一个时钟周期,推迟后面的指令操作。设置相互独立的指令存储器和数据存储器。 8.选择至少2种解决流水线数据冲突的方法简述。(知识点:数据冲突) 答:定向技术,将计算结果从其产生的地方直接送到其他指令需要的地方。通过编译时让编译器重新组织指令顺序来消除冲突。

计算机系统结构考试题库及答案

计算机系统结构试题及答案 一、选择题(50分,每题2分,正确答案可能不只一个,可单选 或复选) 1.(CPU周期、机器周期)是内存读取一条指令字的最短时间。 2.(多线程、多核)技术体现了计算机并行处理中的空间并行。 3.(冯?诺伊曼、存储程序)体系结构的计算机把程序及其操作数 据一同存储在存储器里。 4.(计算机体系结构)是机器语言程序员所看到的传统机器级所具 有的属性,其实质是确定计算机系统中软硬件的界面。 5.(控制器)的基本任务是按照程序所排的指令序列,从存储器取 出指令操作码到控制器中,对指令操作码译码分析,执行指令操作。 6.(流水线)技术体现了计算机并行处理中的时间并行。 7.(数据流)是执行周期中从内存流向运算器的信息流。 8.(指令周期)是取出并执行一条指令的时间。 9.1958年开始出现的第二代计算机,使用(晶体管)作为电子器件。 10.1960年代中期开始出现的第三代计算机,使用(小规模集成电路、 中规模集成电路)作为电子器件。 11.1970年代开始出现的第四代计算机,使用(大规模集成电路、超 大规模集成电路)作为电子器件。 12.Cache存储器在产生替换时,可以采用以下替换算法:(LFU算法、 LRU算法、随机替换)。

13.Cache的功能由(硬件)实现,因而对程序员是透明的。 14.Cache是介于CPU和(主存、内存)之间的小容量存储器,能高 速地向CPU提供指令和数据,从而加快程序的执行速度。 15.Cache由高速的(SRAM)组成。 16.CPU的基本功能包括(程序控制、操作控制、时间控制、数据加 工)。 17.CPU的控制方式通常分为:(同步控制方式、异步控制方式、联合 控制方式)反映了时序信号的定时方式。 18.CPU的联合控制方式的设计思想是:(在功能部件内部采用同步控 制方式、在功能部件之间采用异步控制方式、在硬件实现允许的情况下,尽可能多地采用异步控制方式)。 19.CPU的同步控制方式有时又称为(固定时序控制方式、无应答控 制方式)。 20.CPU的异步控制方式有时又称为(可变时序控制方式、应答控制 方式)。 21.EPROM是指(光擦可编程只读存储器)。 22.MOS半导体存储器中,(DRAM)可大幅度提高集成度,但由于(刷 新)操作,外围电路复杂,速度慢。 23.MOS半导体存储器中,(SRAM)的外围电路简单,速度(快),但 其使用的器件多,集成度不高。 24.RISC的几个要素是(一个有限的简单的指令集、CPU配备大量的 通用寄存器、强调对指令流水线的优化)。

相关文档
相关文档 最新文档