计算机系统结构概要归纳.doc

资源描述

《计算机系统结构概要归纳.doc》由会员分享，可在线阅读，更多相关《计算机系统结构概要归纳.doc（7页珍藏版）》请在三一文库上搜索。

1、计算机系统结构概要归纳LH计算机系统结构复习第一章计算机系统结构基本概念1.1计算机系统结构计算机系统层次结构计算机系统结构主要研究软件、硬件功能分配和对软件硬件界面的确定，即哪些功能由软件完成、哪些功能由硬件完成。软件与硬件实现的特点：硬件实现：速度快、成本高；灵活性差、占用内存少。软件实现：速度低、复制费用低；灵活性好、占用内存多。计算机组成的任务是在计算机系统结构确定分配给硬件子系统的功能及其概念结构之后，研究各组成部分的内部构造和相互联系，以实现机器指令级的各种功能和特性。系统结构是计算机系统的软硬件界面；计算机组成是计算机系统结构的逻辑实现；计算机实现是计算机组成的物理实现。

2、计算机系统结构的分类：Flynn分类法：指令流：机器执行的指令序列。数据流：由指令调用的数据序列，包括输入数据和中间结果。多倍性：在系统最受限制的元件上同时处于同一执行阶段的指令或数据的最大可能个数。按照数据流和指令流的组织方式分为：SISD、SIMD、MISD、MIMD。冯氏分类法：用最大并行度分类，最大并行度：计算机系统在单位时间内能够处理的最大的二进制位数。分为：1、字串位串WSBS；2、字并位串WPBS；3、字串位并WSBP；4、字并位并WPBP。 Handler分类法：根据并行度和流水线分类，把计算机的硬件结构分成三个层次：1、程序控制部件（PCU）的个数k；2、算术逻辑部件（A

3、LU）或处理部件PE的个数d；3、每个算术逻辑部件包含基本逻辑线路（ELC）的套数w。1.2计算机系统设计技术计算机系统设计的定量原理：、加快经常性时间的处理速度；、Amdahl定律：系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。加速比=（采用改进措施后的性能）/（没有采用改进措施性能）=（没有采用改进措施前执行某任务的时间）/（采用改进措施后某任务执行时间）。可知加速比与两个因素有关：一是计算机执行某任务的总时间中可被改进部分的时间所占百分比Fe；另一个是改进部分采用改进措施后比没有采用改进措施前性能提高倍数Se。可得改进后整

4、个任务的执行时间为：Tn=T0(1-Fe+Fe/Se) 改进后系统加速比：Sn=T0/Tn=1/(1-Fe)+Fe/Se。 CPU性能公式：CPU时间=CPU时钟周期数/频率=CPU时钟周期数*时钟周期长。每条指令的平均时钟周期数：CPI=CPU时钟周期数/IC IC是指令的条数。CPU时间=（IC*CPI）/ 频率。 CPI=计算机系统设计者任务：1、确定用户对计算机系统的性能、价格和性能的要求（具体性能要求有：应用领域、软件兼容层次、操作系统需求、标准（浮点数标准、总线标准、网络标准、程序设计语言标准）。2、软硬件的平衡。3、设计出符合今后发展方向的系统结构。计算机系统结构设计主要方法：

5、由上往下、由下往上、由中间开始设计的方法三种。1.3系统结构评价标准性能：时间是衡量性能的标准，同样工作量，时间越少性能越好。响应时间是完成一个任务的全部时间；CPU时间是CPU的计算时间（不包括I/O等待时间，分为用户CPU时间和系统CPU时间，CPU性能是指用户CPU时间）。MIPS每秒百万条指令数：MIPS=指令条数/（执行时间*106）=时钟频率/(CPI*106)程序执行时间Te=指令条数/(MIPS*106)MIPS缺陷：1、MIPS依赖于指令集，不能正确比较指令集不同的机器性能。2、在同一机器上，MIPS因程序不同而变化，有时是很大的。3、MIPS可能与性能相反。MFLOPS每秒

6、百万次浮点操作次数=程序中浮点操作次数/(执行时间*106) MFLOPS取决于机器和程序两方面，只能用来衡量机器浮点操作性能，不能体现机器整体性能，MFLOPS是基于操作而非指令的，所以可以比较不同的机器，MFLOPS依赖于操作类型（加减乘除等），单个程序的MFLOPS值不能反映机器性能。用基准测试程序来测试评价机器的性能，按评价准确性递减顺序：1、实际的应用程序方法；2、核心程序方法；3、玩具基准测试程序；4、综合基准测试程序。性能比较：时间表示：平均执行时间是各执行时间算术平均值Am= Ti是第i个程序执行时间。速度（MFLOPS）表示：平均时间是调和平均：Hm=n/。加权算术平均值：A

7、m= Wi是程序的比例权因子。加权调和平均、几何平均公式见P18。1.4计算机系统结构发展冯诺依曼结构特征：1、存储器是字长固定的、顺序线性编址的一维结构。2、存储器提供可按地址访问的一级地址空间，每个地址是唯一定义的。3、由指令形式的低级机器语言驱动。4、指令的执行是顺序的，即一般按照指令在存储器中存放的顺序执行，程序分支由转移指令实现。5、机器以运算器为中心，输入输出设备与存储器之间的数据传送都途径运算器。运算器、存储器、输入输出设备的操作以及他们之间的联系都由控制器集中控制。系列机：同一厂家生产的有相同系统结构，但具有不同组成和实现的一系列不同型号机器（性能和价格都不一样）。兼容机：不

8、同厂家生产的具有相同系统结构的机器。在一种机器的系统结构上实现另一种机器的系统结构，一般采用模拟和仿真方法。模拟方法是指用软件方法在一台现有主机A（宿主机）上实现另一台计算机B（虚拟机）的指令系统。用微程序直接解释另一种指令系统的方法称为仿真。宿主机A本身由微程序控制，B机称为目标机。不管采用哪种方式，都需要模拟/仿真存储系统、I/O系统、控制台的操作等。模拟方法中模拟程序放在主存中，仿真方法仿真微程序放在控存中，因此仿真的运行速度快于模拟，通常两种混合使用，对于使用频率高的指令，尽可能用仿真方法提高运行速度，对于使用频率低且难于用仿真实现的指令则用模拟方法来实现。第2章指令系统2.1 数

9、据表示数据的类型：文件、图、表、树、阵列、队列、链表、栈、向量、串、实数、整数、字符等。数据表示研究的是计算机硬件能够直接识别、可以被指令系统直接调用的那些数据类型。数据结构研究的是面向系统软件、面向应用领域所需要处理的各种数据类型，研究这些数据类型的逻辑结构和物理结构之间的关系，并给出相应的算法。确定哪些数据类型用数据表示来实现的原则：1、缩短程序的运行时间；2、减少CPU与主存储器之间的通信量；3、这种数据表示的通用性和利用率。在设计计算机系统时，对于数据类型，系统结构设计者要做的是：确定哪些数据类型全部用硬件实现，即数据表示；哪些数据类型用软件实现，即数据结构。浮点数表示方式要研究的核

10、心内容是数据字长与这种数据表示方式的表数范围、表数精度、表数效率之间的关系。浮点数在数据存储单元中的存放方式mf：尾数的符号位ef:阶码的符号位e：阶码的值m：尾数的值令N是浮点数集F内任一给定实数，而M是F中最接近N，且被用来代替N的浮点数，则绝对误差为=|M-N| 相对表数误差=|（M-N）/N|。规格化浮点数的表数精度是最高的，浮点数的表数效率主要与尾数的基值有关。浮点数的舍入处理：原因：1、数制转换超出范围。2、两数进行某种运算时结果超出范围。舍入方法：a.恒舍法：将超过有效字长p之外的g位代码全部舍掉。 b.恒置法：又称r/2法（r是尾数的基值），把规格化尾数有效字长P位的最低一位

11、置为r/2，而不管超过p之外的g位代码是什么。 c.下舍上入法：以规格化尾数有效字长p位之外的g位代码的中间值为界，小于中间值的则舍，大于则入（如十进制的四舍五入、二进制的0舍1入、16进制7舍8入）。 d.R*舍入法：是一种完全没有积累误差的舍入方法，而且精度也极高，但是实现起来很复杂。 e.查表法。采用标志符数据表示方法优点：1、简化了指令系统；2、由硬件自动实现一致性检查和数据类型的转换；3、简化程序设计；4、简化编译器；5、支持数据库系统；6、方便软件调试。采用标志符数据表示方法缺点：1、数据和指令的长度可能不一致；2、指令的执行速度降低；3、硬件复杂度增加。在表示多维、或结构比较复杂

12、的数据时要使用数据描述符。数据描述符与标志符主要区别：标志符通常只作用于一个数据，而数据描述符要作用于一组数据。采用数据描述符的优缺点与采用标志符优缺点相同。2.2寻址技术目前常用的编址单位有字编址、字节编址（最普遍）、位编址。动态存储器DRAM是一种破坏性读出的存储器，每当读出数据后，存储单元被清0，为了下次还能够从这个存储单元中读出原来的数据，必须把刚刚读出的那个数据重新写入这个存储单元，这一过程称为重写。向一个DRAM存储器中写入一个数据的过程也必须包括读出和重写两次访问操作。并行存储器的编址技术：1、地址码高位交叉编址方式能用来扩大存储器容量；2、地址码低位交叉编址能提高存储器速度。主

13、存寻址方式主要包括直接寻址、间接寻址、变址寻址方式等三种类型。程序的定位：把指令和数据中的逻辑地址（相对地址）转换成主存储器的物理地址（绝对地址）。定位方式有直接定位（程序装入主存储器中之前就转换）、静态定位（程序装入主存储器过程中就进行地址转换）、动态定位（执行到相应指令或数据才进行地址转换）。2.3指令格式的优化设计操作码OPC地址码A地址码通常包括三部分内容：1、操作数地址；2、地址的附加信息（偏移量、块长度、跳距）；3、寻址方式。操作码表示方法：固定长度操作码、Huffman编码法（H=- Pi是第i中操作码在程序中出现概率）、扩展编码法。有三种类型的指令系统： CISC、RISC

14、、VLIW。2.4 指令系统的功能设计通用计算机必须有五类基本指令（1、数据传送类指令；2、运算类指令；3、程序控制指令；4、输入输出指令；5、处理控制和调试指令）。指令系统性能：完整性、规整性（包括对称型和均匀性）、高效率、兼容性。卡内基梅隆大学对RISC的论述：1、大多数指令在单周期内完成；2、采用LOAD/STORE结构；3、硬布线控制逻辑；4、减少指令和寻址方式的种类；5、固定的指令格式；6、注重译码的优化。RISC关键技术：1、延时转移技术；2、指令取消技术；3、重叠寄存器窗口技术。4、指令流调整技术；5、硬件为主固件为辅。第3章存储系统3.1 存储系统原理现代计算机系统都是以存

15、储器为中心，冯诺依曼计算机以运算器为中心。一个存储器性能常用速度T、容量S、价格C三个主要指标衡量。Cache存储系统是为了提高存储器速度，而虚拟存储器系统是为了增加存储器的存储容量。Cache一般用SRAM实现，存储周期几十毫微秒，主存用DRAM实现，存储周期几百毫微秒。存储器种类：主存储器、Cache、通用寄存器、缓冲存储器、磁盘存储器、磁带存储器、光盘存储器等。材料工艺：ECL、TTL、MOS、磁表面、激光，SRAM、DRAM访问方式：随机访问、直接译码、先进先出、相联访问、块传送、文件组。访问效率e=.H是访问命中率，T2/T1是存储器速度之比。所以要提高效率，可以提高命中率或使构成存

16、储系统的两个存储器速度之比不要太大。实践证明，采用预取技术可以大幅提高命中率H，具体做法是：不命中时，在数据从主存储器中取出送往CPU的同时，把主存储器相邻几个单元中的数据（称为一个数据块）都取出来送入Cache中，根据程序员的局部性原理，CPU以后再对Cache存储系统访问时，命中率就会提高。第5章标量处理机只有标量数据表示和标量指令系统的处理机称为标量处理机。设计处理机的任务之一是缩短解释指令的时间，也就是提高处理机指令执行的速度。通常提高指令执行速度途径有：1、提高处理机的工作主频；2、采用更好的算法和设计更好的功能部件；3、多条指令并行执行，称为指令级并行技术。5.1 先行控制技术先

17、行控制技术关键是缓冲技术和预处理技术。取指令分析执行一条指令的执行过程多条指令要在处理机中执行时，有多种执行方式：1、顺序执行方式；2、一次重叠执行方式；3、二次重叠执行方式。取指令k分析k执行k取指令k+1分析k+1执行k+1 一次重叠执行方式：如果两个过程的时间均相等，则执行n条指令所用的时间为：T(12n）t 取指令k分析k执行k取指令k+1分析k+1执行k+1 二次重叠执行方式：如果执行三个过程的时间相等，则执行n条指令所用的时间为T(2n）t 所谓相关是指在一段程序的相近指令之间有某种关系，这种关系可能影响指令的重叠执行。有数据相关和控制相关。在执行本条指令的过程中，如果用到的指令

18、、操作数、变址偏移量等正好是前面指令的执行结果，则必须等待前面的指令执行完成，并把结果写到主存或通用寄存器中之后，本条指令才能开始执行，这种相关称为数据相关。控制相关是指由条件分支指令、转子程序指令、中断等引起的相关。数据相关种类：指令相关、主存操作数相关、通用寄存器相关、变址相关。解决数据相关方法有两种：一种是推后分析法，在遇到数据相关时，推后本条指令的分析，直至所需要的数据写入到相关的存储单元中。另一种方法是设置专用路径，即不必等待所需要的数据写入到相关存储单元中，而是经专门设置的数据通路读取所需要的数据。5.2 流水线处理机可以从两个方面来开发处理机内部的并行性，一个是空间并行性，即在一

19、个处理机内设置多个独立的操作部件，并让这些操作部件并行工作，这种处理剂称为多操作部件处理机和超标量处理机。流水线方式是把一个重复的过程分解为若干个子过程，每个子过程可以与其他子过程同时进行。流水线的特点：1、在流水线中处理的任务必须是连续任务，只有连续不断的提供任务才能充分发挥流水线的效率。2、把一个任务（一条指令或一个操作1）分解成几个有联系的子任务，每隔子任务由一个专门的功能部件来实现。3、在流水线的每一个功能部件后面都要有一个缓冲寄存器，或称为锁存器、闸门寄存器等，用于保存本段的执行结果。4、流水线的各段的时间应尽量相等，否则将引起“堵塞”、“断流”等。5、流水线需要有“装入时间”和“排

20、空时间”。流水线的性能分析：衡量流水线性能的主要指标有吞吐量、加速比、效率。吞吐量TP是指在单位时间内流水线所完成的任务数量或输出的结果数量TP=n/Tk n为任务数，Tk是处理完成n个任务所用的时间。各段执行时间相等，输入连续任务情况下，完成n个任务需要的总的时间为：Tk=(k+n-1)t 其中t为时钟周期，k为流水线段数。加速比：完成一批任务，不使用流水线所用的时间与使用流水线所用的时间之比为流水线的加速比。如果不使用流水线，即顺序执行所用的时间为T0，使用流水线的执行时间为Tk,则流水线的极速比为：S=T0/Tk。各个功能段执行时间均相等的一条k段流水线完成n个连续任务时的实际加速比为S=kn/(k+n-1).流水线的效率是指流水线的设备利用率，包含有时间和空间两个方面因素。一条k段流水线的效率可以表示为E=（n个任务占用的时空区）/（k个流水段的总的时空区）=T0/(kTk).T0是顺序执行n个任务所用的时间。第 7 页共 7 页

展开阅读全文