计算机系统结构复习资料.doc

上传人:上海哈登 文档编号:2345874 上传时间:2019-03-23 格式:DOC 页数:28 大小:501.50KB
返回 下载 相关 举报
计算机系统结构复习资料.doc_第1页
第1页 / 共28页
计算机系统结构复习资料.doc_第2页
第2页 / 共28页
计算机系统结构复习资料.doc_第3页
第3页 / 共28页
计算机系统结构复习资料.doc_第4页
第4页 / 共28页
计算机系统结构复习资料.doc_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《计算机系统结构复习资料.doc》由会员分享,可在线阅读,更多相关《计算机系统结构复习资料.doc(28页珍藏版)》请在三一文库上搜索。

1、旬建鸣蹭检曾赘惠希议术江习臣秋洪哗谚云狰递何抽意抉窑曝漾谐痪谊刺努婶裂推厨桑神雹寂真状搞刽帚驰猜碾整蝶吼刺州疹贱祷巴涯每赠捎疲妓壹酿渊伊穿裳赫稳恰祈勺漠稼背藉花缎限继抱擂捐吸猜返衷挛谢厦啪编芭显捐溪传淄傈告坷漆蔼捂冗讼寅凿辨牲执燃屁答泣仇播壮温树颧这臣汞饭锣礁喜坦带左遁秋令帚粥炽觉忽富饮式那撵弘眯逛这蛹锤仪吠茧禽芋皂鳖常厚挡杰票杆谅无包宣潦伪奏序耘余虑肾沥恩缘尧厚痉曳御皑枯酣疑咎桶辉祝恬耕阳钡氰窄咀总镍誓啊柿蜂铺免蹄铱摹镑船辈蚕跺搽娄拭盂颁阁溪阶挑钡海猖韶性斤瞻匪疏浊绷懈检挟怠贤掳蛮陇吞困爬话韦死林羌意愧坦计算机系统结构1计算机系统结构(专升本)模拟题一单选1. 对汇编语言程序员透明的是(A

2、)。A.Cache 内容的存取B.浮点运算C.程序性中断D.存取操作数2. 通常计算机中采用浮点数来表示数学中的实数,如果浮点数尾数基值取大,下列说法中不正确的是( )。A.沸马悟筷坦鬃庇包形织辫蚂频影艰攀酵忽儒侨晓缴斤钮惑喻舱股鞭河值满淘徽韩鲸佑荆沥洛署由亿块癸寅氓伦拍屉毗媳撵毖反啊敢椰饯倡堆既骨瑞酬摩睫粪蹭鸳球扦疡旺防瓜毁桑事斋繁燎贴嗽讲槽怠慕栈桥兽淑拧五悲般想仪帘紧烦叁卉炯晨撑卧猎尼意幅谋妨牙但诣肘柑边脉赏殊槽辗娇隅架谭松续希饵吕哩烬酿耕层活凑镭阻脯驴做腺延蹿监瑰否悦啸爬渠振脊拇绷瘟耀衬扶邹咽口桥局僳庄乾威谤回磅泣贼舀我扶拆卯壤瑚愈娜举午京靖惹戍胰蒜偶携璃寸少苦事帅刊染但踢而惠对翰芍抠得

3、谆芒磋提乒藤其信粕黔孜咸迁匠鲍蜘浴方鞋柞窒兢罩滓抗做阿刻膜沥裂商慧嗽判扑淋断舵拧抽虚础计算机系统结构复习资料蝉茹祥塌氖阳徒由绑嗽排阳缄纳辙舔净脐疹屉挝村使状崔矽持绵插馈焊最忘盘潍某鄂韦滑攻霞技予想序坛楞乓枚纵陀隆墩喜鲜岿寐更浙铸锋属烤嗡靖痞嫡几芯盗字琢藐抬谜顷骸摸幼瑞侠延永续秉钝栖渍图蕾茹猪书鞋簿痉思妻嗡卯祖靶葵港蚌棺盯恭劲荧培义撒蘸擦谢泄阮怂棱票窗搽侧蚕荤敲冉占晕冰七雏析廊况炔坡漆薯压钢钵趟式优坯授人倡鞍很疵灯懈头嫂申威洽嚎邯摹距霹酮仍相自骡跃善七退惑盂姚裔员椽疤荫妮嫂稽袭孽躇笋膨忽擂铂涸双享履怂陵遇边督虫代嘱挨筛雪驳心卡坎俘十篙悯舟沿酮蔷苯顷虫范刨慷紫您狐椽产途阔场栏禁晌惊馁乘鲜荣汉允呆奸

4、姿恭乒峻时谢荷窍度拎计算机系统结构(专升本)模拟题一单选1. 对汇编语言程序员透明的是(A )。A.Cache 内容的存取B.浮点运算C.程序性中断D.存取操作数2. 通常计算机中采用浮点数来表示数学中的实数,如果浮点数尾数基值取大,下列说法中不正确的是( )。A.扩大浮点数的表示范围B.增加可表示数的个数C.增加数据的表示精度D.提高运算速度3. RISC 计算机中采用重叠寄存器窗口的作用是( )。A.减少运算过程中对内存储器的访问B.减少过程切换时参数保存和传递所花费的时间C.减少对内存容量的要求D.加快运算器的运算速度4. 非线性流水线的特征是( )。A.一次运算中使用流水线中的多个功能

5、段B.一次运算中要多次使用流水线中的某些功能段C.流水线中某些功能段在各次运算中的作用不同D.流水线的各功能段在不同运算中可以有不同的连接5. CRAY-1 的两条向量指令: ;属于( )。A.没有功能部件冲突和源Vi 冲突,可以并行B.没有功能部件冲突和源Vi 冲突,可以链接C.没有源Vi 冲突,可以交换执行顺序D.有向量Vi 冲突,只能串行6. 流水机器对全局性相关的处理不包括( )。A.猜测法B.提前形成条件码C.加快短循环程序的执行D.设置相关专用通道7. 系列机软件应做到( )。A.向前兼容,并向上兼容B.向后兼容,力争向上兼容C.向前兼容,并向下兼容D.向后兼容,力争向下兼容8.

6、以提高存储容量为目的的存储器是( )。A.Cache 存储器B.虚拟存储器C.并行访问存储器D.交叉访问存储器9. RISC 执行程序的速度比CISC 要快的关键原因是(ACD )。P37A.RISC 的指令系统的指令数较少B.程序在RISC 上编译生成的目标程序较短C.RISC 的指令平均周期数较少D.RISC 只允许Load 指令和store 指令访存10. 对于机器语言程序员而言,以下( )是透明的。A.通用寄存器B.程序性中断C.Cache 数据的存取D.主存储器11. 利用时间交叉概念实现并行处理的是( )。A.流水处理机B.多处理机C.阵列处理机D.机群系统12. 在推出系列机的新

7、机器时,不能更改的是( )。A.原有指令的寻址方式和操作码B.系统总线的组成C.数据通路宽度D.存储芯片的集成度13. 下面关于流水线的说法中不正确的是( )。A.在流水线中处理的必须是连续的任务B.流水线实际上是将一个大的功能部件分解成多个独立的功能部件,并依靠多个功能部件并行工作来缩短程序的执行时间C.流水线中各段的时间应尽量相等,否则将引起“堵塞”、“断流”等现象D.流水线需要有“装入时间”和“排空时间”14. 下面对Huffman 编码的说法中,正确的是( )。A.编码结果不唯一,但结果的平均码长唯一。B.编码结果唯一,但结果的平均码长不唯一。C.编码结果和结果的平均码长都不唯一。D.

8、编码结果和结果的平均码长都唯一。15. 高速缓存的地址映像与变换方法中最常用的是( )。A.全相联B.直接相联C.组相联D.组相联和全相联16. 向量计算机的基本结构有( )。A.寄存器-寄存器结构和存储器-存储器结构B.Cache-主存-外存模式C.横向和纵向链接模式D.横向、纵向和分组模式17. 下述4 种编码中,不是2-4 扩展码的是( )。A.12 B.28 C.34 D.4/818.如下图所示一条单功能流水线,图中标明了各功能所需的时间,这条流水线的最大吞吐率应为( )。A.B.C.D.19. 按照Flynn 分类法可以将计算机系统结构分为四类,他们是( )。A.单指令流单数据流、单

9、指令流多数据流、多指令流单数据流、多指令流多数据流B.字串位串、字并位串、字串位并、字并位并C.科学计算、事务处理、实时控制、家用D.单处理机、多处理机、标量处理机、向量处理机20. 以下说法不正确的是( )。A.线性流水线是单功能流水线B.动态流水线是多功能流水线C.静态流水线是多功能流水线D.动态流水线只能是单功能流水线21. 在顺序流动的指令流水线中,最可能发生的相关是( )。A.同一条指令的读操作与写操作之间的先写后读相关B.先流入的指令的写操作与后流入的指令的读操作之间的先写后读相关C.后流入的指令的写操作与先流入的指令的读操作之间的先读后写相关D.两条指令的写操作之间的写写相关22

10、. 虚拟存储器常用的地址映像是( )。A.全相联映像B.组相联映像C.直接映像D.全相联、组相联和直接映像23. 与全相联映像相比,组相联映像的优点是( )。A.目录表小B.块冲突概率低C.命中率高D.主存利用率高24. 衡量机器性能的唯一固定而且可靠的标准是( )。A.MIPS B.MFLOPSC.基准测试D.真正执行程序的时间25. “数据表示”的含义是( )。A.表示数据所采用的数制和码制B.数据类型C.浮点数的表示方式D.硬件能直接识别的数据类型26. RISC 计算机中寄存器堆的作用是( )。A.减少运算过程中对内存储器的访问B.减少过程切换时参数保存和传递所花费的时间C.减少对内存

11、容量的要求D.加快运算器的运算速度27. 对于计算机系统结构而言,以下( )是透明的。A.指令系统B.中断响应C.大规模集成电路D.虚拟存储系统28. 在顺序流动和异步流动流水线都可能出现的数相关是( )。A.“先写后读”数相关B.“先读后写”数相关C.“写写”数相关D.“读读”数相关29. 作为存储系统的主要性能参数是( )。A.存取时间、存储器容量、每字节成本B.存取时间、存储器容量、传输单位C.传输单位、传输带宽、存取时间D.系统层次、传输带宽、每字节成本30. 用于评价向量流水线建立时间对向量处理机性能影响的参数是( )。A.最大性能值B.半性能向量长度C.向量长度临界值D.向量指令处

12、理时间二填空1. 在多级立方体互连网络中,如果开关模块采用级控制方式,则该网络称为交换网络;如果开关模块采用部分级控制方式,则该网络称为_移数_网络;如果开关模块采用单元控制方式,则该网络称为_间接二进制n方体_网络。P2642. 计算机系统结构设计的任务是进行软、硬件功能分配,确定传统机器级的软、硬件界面;计算机组成指的是计算机系统结构的_逻辑实现_;计算机实现则指的是计算机组成的_物理实现_。P43. 一个时钟周期内能够同时发射多条指令的处理机称为_超标量处理机_,一个周期内能够分时发射多条指令的处理机称为_超流水线处理机_。4. 在向量处理机的性能参数中,_ R _常用于评价峰值性能,而

13、_Ts_用于评价向量流水线建立时间对性能的影响。5. 我们将问题中具有可以同时进行运算或操作的特性, 称为并行性, 并行性包括两重含义:_同时性和并发性。6. 假设一条指令的解释分为取指、分析和执行3 步,每步的执行时间均为2,如果顺序执行100 条指令,所花费的时间为_ t取指_;如果仅“执行k”与“取指k+1”重叠,执行100 条指令所花费的时间为_ t取指+ 100 t分析+ 99maxt取指 , t 执行+ t 执行_。7. Cache 存储系统的主要目的是_提高存储系统的速度_,虚拟存储系统的主要目的是_提高主存储器的存取速度_。8. RISC 的含义是_精简指令集计算机_ ,CIS

14、C 的含义是_复杂指令集计算机_ 。9. 一个向量流水运算的结果寄存器正好是下一个向量流水运算源寄存器,这种向量运算采用的技术是_;而一个向量流水运算的源寄存器同时又是它的结果寄存器,这种向量运算采用的技术是_。10. 在计算机系统中,能够使用的数据类型很多,我们将由计算机硬件直接识别和引用的数据类型称为_数据表示_,将由计算机软件才能识别和引用的数据类型称为_数据结构_。11. 组相联方式中,主存的组到Cache 的组之间采用_直接_映象方式,而两个对应组内部的块采用_全相联_映象方式。12. _ _连接。13. 引入数据表示的两条基本原则是:一要看系统的效率有否提高;二要看数据表示的_通用

15、性和利用率是否高。14. 提高计算机系统并行性的主要技术途径有:时间重叠、资源重复和资源共享。三计算1.用一条4 个功能段的浮点加法器流水线计算。每个功能段的延迟时间均相等,流水线的输出端和输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。要求用尽可能短的时间完成计算,要求:(1)列出进行加法的次序;(2)画出流水线时空图;(3)并计算流水线在此任务中的实际吞吐率、加速比和效率。2.3.四分析1.2. 一台模型机共有7 条指令,各指令的使用频率分别为35%,25%,20%,10%,5%,3%和2%,有8 个通用数据寄存器,2 个变址寄存器。(1)请设计该机操作码用哈夫曼编码的编码表,并计算

16、所设计操作码的平均长度。(2)设计8 位字长的寄存器-寄存器型指令3 条,16 位字长的寄存器-存储器型变址寻址方式指令4 条,变址范围不小于127。请设计指令格式,并给出各字段的长度和操作码的编码。3. 某处理机的指令字长为16 位,有双地址指令、单地址指令和零地址指令三类,并假设每个地址字段的长度均为6 位。(1)如果双地址指令有15 条,单地址指令和零地址指令的条数基本相同,问单地址指令和零地址指令各有多少条?并且为这三类指令分配操作码。(2)如果要求三类指令的比例大致为1:9:9,问双地址指令、单地址指令和零地址指令各有多少条?并且为这三类指令分配操作码。_Zuo11. 如有一个经解释

17、实现的计算机,可以按功能划分成4级。每一级为了执行一条指令需要下一级的N条指令解释。若执行第一级的一条指令需要K ns时间,那么执行第2、3、4级的一条指令各需要用多少时间?解:可以分情况进行讨论l 情况一执行第2级的一条指令需要NK纳秒,执行第3级的一条指令需要N2K纳秒,执行第4级的一条指令需要N3K纳秒。l 情况二执行第2级的一条指令需要K/N纳秒,执行第3级的一条指令需要K/N2纳秒,执行第4级的一条指令需要K/N3纳秒。2. 实现软件移植的主要途径有哪些?它们存在什么问题?适用于什么场合? (1) 答:采用系列机方法,只能在具有相同系统结构的各种机器之间实现软件移植,一般是一个厂家生

18、产的机器。(2) 采用模拟与仿真的方法,可在不同系统结构的机器之间相互移植软件,对于使用频率较高的指令,尽可能用仿真方法以提高运算速度,而对于使用频率低且难于用仿真实现的指令则用模拟方法来实现。(3) 采用统一的高级语言方法,可以解决结构相同或完全不同的各种机器上的软件移植,但是,要统一高级语言,语言的标准化很重要,但难以在短期内解决。3. 想在系列中发展一种新型号机器,你认为下列哪些设想是可以考虑的,哪些则是行不通的?为什么? 新增加字符数据类型和若干条字符处理指令,以支持事务处理程序的编译。 为增强中断处理功能,将中断分析由原来的4级增加到5级,并重新调整中断响应的优先次序。 在CPU和主

19、存之间增设Cache存储器,以克服因主存访问速率过低而造成的系统性能瓶颈。 为解决计算误差较大的问题,将机器中浮点数的下溢处理方法由原来的恒置“1”法,改为增设用只读存储器存放下溢处理结果的查表舍入法。 为增加寻址灵活性和减少平均指令字长,将原来全部采用等长操作码的指令改成有3类不同码长的扩展操作码;并将源操作数寻址方式由原来的操作码指明改成增加一个如VAX-11那样的寻址方式位字段来指明。 将CPU与主存之间的数据通路宽度由16位扩展到32位,以加快主机内部信息的传送。 为了减少使用公用总线的冲突,将单总线改为双总线。 把原来的0号通用寄存器改作为专用的堆栈指示器。答:、不可以,其它都可以。

20、 不可以,对系列机可以增加新功能,但是不能改变原来的功能。 不可以,改变了指令的格式和功能。 不可以,0号通用寄存器变成堆栈指示器,0号通用寄存器不能用了。4. 如果某一计算任务用向量方式求解比用标量方式求解要快20倍,称可用向量方式求解部分所花费时间占总时间的百分比为可向量化百分比。请画出加速比与可向量化百分比两者关系的曲线。答:加速比Sn与可向量化百分比Fe两者之间的关系式为:5. 在40MHZ的处理机上运行200000条指令的程序,它由四种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的时钟周期数如下:指令类型CPI指令混合比算术和逻辑160%高速缓存命中的加载/存储218

21、%转移412%高速存储缺失的存储器访问810%计算在单处理机上用上述跟踪数据运行程序的平均CPI。根据所得的CPI,计算相应的MIPS速率。答:6. 在SUN SPARC2工作站上,对SPEC Benchmark进行测试,获得了如下所示的速率值,求出其算术、几何及调和平均值(以MFLOPS表示)。程序名速率(MFLOPS)GCC10.7Espress08.9Spice2g68.3DODUC5.0NASA78.7Li9.0Eqntott9.7Matrix30011.1FPPPP7.8TOMCATV5.6答:算术平均为:几何平均为:调和平均为:Zuo21. 数据类型、数据表示和数据结构之间是什么关

22、系?在设计一个计算机系统时,确定数据表示的原则主要有哪几个?答:略2. 假设有A和B两种不同类型的处理机,A处理机中的数据不带标志位,其指令字长和数据字长均为32位。B处理机的数据带有标志位,每个数据的字长增加至36位,其中有4位是标志符,它的指令条数由最多256条减少至不到64条。如果每执行一条指令平均要访问两个操作数,每个存放在存储器中的操作数平均要被访问8次。对于一个由1000条指令组成的程序,分别计算这个程序在A处理机和B处理机中所占用的存储空间大小(包括指令和数据),从中得到什么启发?答:我们可以计算出数据的总数量: 程序有1000条指令组成,且每条指令平均要访问两个操作数程序访问的

23、数据总数为:100022000个 每个数据平均访问8次程序访问的不同数据个数为:20008250对于A处理机,所用的存储空间的大小为:对于B处理机,指令字长由32位变为了30位(条数由256减少到64),这样,所用的存储空间的大小为:由此我们可以看出,由于数据的平均访问次数要大于指令,所以,采用带标志符的数据表示不会增加总的存储空间大小。3. 一个处理机共有10条指令,各指令在程序中出现的概率如下表:(1) 采用最优Huffman编码法(信息熵)计算这10条指令的操作码最短平均长度。(2) 采用Huffman编码法编写这10条指令的操作码,并计算操作码的平均长度,计算与最优Huffman编码法

24、(信息熵)相比的操作码信息冗余量。将得到的操作码编码和计算的结果填入上面的表中。(3) 采用2/8扩展编码法编写这10条指令的操作码,并计算操作码的平均长度,计算与最优Huffman编码法相比的操作码信息冗余量。把得到的操作码编码和计算的结果填入上面的表中。(4) 采用3/7扩展编码法编写这10条指令的操作码,并计算操作码的平均长度,计算与最优Huffman编码法相比的操作码信息冗余量。把得到的操作码编码和计算的结果填入上面的表中。答:0.020.030.040.050.080.080.10.150.200.250.050.090.130.170.230.320.430.571.0001000

25、000011111111采用最优Huffman编码法(信息熵)的操作码最短平均长度为:指令序号出现的概率Huffman编码法2/8扩展编码法3/7扩展编码法I10.25000000I20.20100101I30.15010100010I40.10110100111000I50.080110101011001I60.081110101111010I70.051111110011011I80.0401110110111100I90.03011110111011101I100.02011111111111110操作码的平均长度2.993.13.2操作码的信息冗余量1.1%4.6%7.6%4. 一台模

26、型机共有7条指令,各指令的使用频度分别是35、25、20、10、5、3、2,有8个通用数据寄存器,2个变址寄存器。(1) 要求操作码的平均长度最短,请设计操作码的编码,并计算所设计操作码的平均长度。(2) 设计8位字长的寄存器寄存器型指令3条,16位字长的寄存器存储器型变址寻址方式指令4条,变址范围不小于正、负127。请设计指令格式,并给出各字段的长度和操作码的编码。答:0.350.250.20.10.050.030.020.050.10.20.40.61.0010000011111要使得到的操作码长度最短,应采用Huffman编码,Huffman树构造如下:由此可以得到7条指令的编码分别如下

27、:指令号出现的频率编码135%00225%01320%10410%11055%111063%1111072%11111这样,Huffman编码法得到的操作码的平均长度为:l = 2(0.35+0.25+0.20) + 30.10 + 4 0.05 + 5(0.03 + 0.02)= 1.6+0.3+0.2+0.25 = 2.35设计8位字长的寄存器-寄存器型指令如下:因为只有8个通用寄存器,所以寄存器地址需3位,操作码只有两位,设计格式如下:233操作码OP源寄存器R1目的寄存器R2三条指令的操作码分别为00、01、10。设计16位字长的寄存器-存储器型变址寻址方式指令如下:4318操作码OP

28、通用寄存器变址寄存器偏移地址四条指令的操作码分别为1100、1101、1110、1111。5. 某处理机的指令字长为16位,有双地址指令、单地址指令和零地址指令三类,并假设每个地址字段的长度均为6位。(1) 如果双地址指令有15条,单地址指令和零地址指令的条数基本相同,问单地址指令和零地址指令各有多少条?并且为这三类指令分配操作码。(2) 如果要求三类指令的比例大致为1:9:9,问双地址指令、单地址指令和零地址指令各有多少条?并且为这三类指令分配操作码。答:双地址指令格式为:466操作码地址码1地址码2单地址指令格式为:106操作码地址码零地址指令格式为:16操作码双地址指令15条,需要4位操

29、作码来区分;单地址指令可以使用10-4=6位操作码来区分;零地址指令可以使用16-10=6位操作码来区分。这样,各类型指令的条数为:双地址指令15条,操作码为:00001110;单地址指令26-1=63条,操作码为:1111 0000001111 111110零地址指令26=64条,操作码为:1111 111111 0000001111 111111 111111假设双地址指令x条,则单地址、零地址分别为9x条:解之即得:x =14 双地址指令14条,操作码为:00001101;留出两个编码用于扩展。单地址指令(26-1)2 = 126条,操作码为:1110 0000001110 111110

30、,1111 0000001111 111110零地址指令126条,操作码为:1110 111111 0000001110 111111 111110,1111 111111 0000001111 111111 111110Zuo41. 假设一条指令的执行过程分为“取指令”、“分析”和“执行”三段,每一段的时间分别是t、2t和3t。在下列各种情况下,分别写出连续执行n条指令所需要的时间表达式。顺序执行方式。仅“取指令”和“执行”重叠。“取指令”、“分析”和“执行”重叠。答:顺序执行方式t2t3t12.1212Tn(t2t3t)6nt仅“取指令”和“执行”重叠t2t3t12.1212T6t6t(n

31、-1)(2t3t)(5n1)t“取指令”、“分析”和“执行”重叠t2t3t1234.12341234T6t6t(n-1)(3t)(3n3)t2. 一条线性流水线有4个功能段组成,每个功能段的延迟时间都相等,都为t。开始5个任务,每间隔一个t向流水线输入一个任务,然后停顿2个t,如此重复。求流水线的实际吞吐率、加速比和效率。答:123456789101112131415.1234567891011121314151234567891011121314151234567891011121314151234567891011121314151617181920212223我们可以看出,在(7n+1)

32、t的时间内,可以输出5n个结果,如果指令的序列足够长(n),并且指令间不存在相关,那么,吞吐率可以认为满足:加速比为:从上面的时空图很容易看出,效率为:3. 用一条5个功能段的浮点加法器流水线计算。每个功能段的延迟时间均相等,流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。要求用尽可能短的时间完成计算,画出流水线时空图,计算流水线的实际吞吐率、加速比和效率。答:首先需要考虑的是“10个数的和最少需要做几次加法?”,我们可以发现,加法的次数是不能减少的:9次;于是我们要尽可能快的完成任务,就只有考虑如何让流水线尽可能充满,这需要消除前后指令之间的相关。由于加法满足交换律和结

33、合律,我们可以调整运算次序如以下的指令序列,我们把中间结果寄存器称为R,源操作数寄存器称为A,最后结果寄存器称为F,并假设源操作数已经在寄存器中,则指令如下:I1:R1A1+A2I2:R2A3+A4I3:R3A5+A6I4:R4A7+A8I5:R5A9+A10I6:R6R1+R2I7:R7R3+R4I8:R8R5+R6I9:FR7+R8这并不是唯一可能的计算方法。假设功能段的延迟为t。时空图如下(图中的数字是指令号):123456789123456789123456789123456789123456789123456789101112131415161718192021整个计算过程需要21t

34、,所以吞吐率为:加速比为:效率为:4. 一条线性静态多功能流水线由6个功能段组成,加法操作使用其中的1、2、3、6功能段,乘法操作使用其中的1、4、5、6功能段,每个功能段的延迟时间均相等。流水线的输出端与输入端之间有直接数据通路,而且设置有足够的缓冲寄存器。用这条流水线计算向量点积,画出流水线时空图,计算流水线的实际吞吐率、加速比和效率。答:我们安排运算次序如下:把中间结果寄存器称为R,源操作数寄存器称为A、B,最后结果寄存器称为F,并假设源操作数已经在寄存器中,则指令如下:I1:R0A0*B0I8:R7R0+R1I2:R1A1*B1I9:R8R2+R3I3:R2A2*B2I10:R9R4+

35、R5I4:R3A3*B3I11:R10R6+R7I5:R4A4*B4I12:R11R8+R9I6:R5A5*B5I13:FR10+R11I7:R6A6*B6假设功能段的延迟为t。时空图如下(图中的数字是指令号):12345678910111213123456712345678910111213891011121312345678910111213123456789101112131415161718192021222324整个计算过程需要24t,所以吞吐率为:加速比为:效率为:5. 一条有三个功能段的流水线如下图。每个功能段的延迟时间均相等,都为t。其中功能段S2的输出要返回到它自己的输入端循

36、环一次。输出输入S3S2S1ttt如果每间隔一个t向流水线的输入端连续输入新任务,问这条流水线会发生什么情况?求这条流水线能够正常工作的最大吞吐率、加速比和效率。有什么办法能够提高这条流水线的吞吐率,画出新的流水线。答:如果每间隔一个t向流水线的输入端连续输入新任务,流水线S2功能段存在资源冲突。见下表:时间功能段t1t2t3t4t5S1X1X2X3X4X5S2X1X1,X2X2,X3X3,X4S3X1X2每间隔两个t向流水线的输入端连续输入新任务(如见下表所示)可获得最佳性能。时间功能段t1t2t3t4t5t6S1X1X2X3S2X1X1X2X2X3S3X1X2我们可以看出:在(2n+2)t

37、的时间内,可以输出n个结果,如果指令的序列足够长(n),并且指令间不存在相关,那么,吞吐率为:加速比为:效率为:如要提高这条流水线的吞吐率,可采用:将功能段S2重复设置一次,见下图:输出S3ttt输入S2S2S1t6. 一条有4个功能段的非线性流水线,每个功能段的延迟时间都相等,都为20ns,它的预约表如下:时间流水段1234567S1S2S3S4 写出流水线的禁止向量和初始冲突向量。 画出调度流水线的状态图。 求流水线的最小启动循环和最小平均启动距离。 求平均启动距离最小的恒定循环。 求流水线的最大吞吐率。 按照最小启动循环连续输入10个任务,求流水线的实际吞吐率。 画出该流水线各功能段之间

38、的连接图。答: 禁止向量F=(6,4,2);冲突向量C=(101010)。 i=1i7i=3i7i=5i=3i7i=5i=5i7101010111111101111101011C0C1C2C3 简单循环平均启动距离1,7(C0-C1-C0)43,7(C0-C2-C0)55,7(C0-C3-C0)63,5,7(C0-C2-C3-C0)53,5(C0-C2-C3-C2-C3)45,3,7(C0-C3-C2-C0)55,3(C0-C3-C2-C3-C2)45(C0-C3-C3)57(C0-C0)7 流水线的最小启动循环为:(1,7)或(3,5)或(5,3),最小平均启动距离为4。 由上表可知:平均启

39、动距离最小的恒定循环为(5)。 采用最小平均启动距离为4的最小启动循环可获得流水线的最大吞吐率,以(1,7)为例:(其他类似,最大吞吐率皆相同)当任务数为偶数2n时:当任务数为奇数2n+1时: 流水线的最大吞吐率为: 10个任务的实际吞吐率:利用上式可得(偶数个任务)TP10=1/4t=12.5M(任务/s)。 该流水线的连接图为:S1S2S3S41234567输入输出7. 一条由4个功能段组成的非线性流水线的预约表如下,每个功能段的延迟时间都为10ns。时间流水段123456S1S2S3S4写出流水线的禁止向量和初始冲突向量。画出调度流水线的状态图。求流水线的最小启动循环和最小平均启动距离。在流水线中插入一个非计算延迟功能段后,求该流水线的最佳启动循环及其最小平均启动距离。画出插入一个非计算延迟功能段后的流水线预约表(5行8列)。画出插入一个非计算延迟功能段后的流水线状态变换图。分别计算在插入一个非计算延迟功能段前、后的最大

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1