资源预览内容
第1页 / 共7页
第2页 / 共7页
第3页 / 共7页
第4页 / 共7页
第5页 / 共7页
第6页 / 共7页
第7页 / 共7页
亲,该文档总共7页全部预览完了,如果喜欢就下载吧!
资源描述
第三讲计算机组成与体系结构高速缓冲存储器:地址映像方式流水线:效率、吞吐率和加速比并行计算:并行处理机的基本功能,网络互联的几种方式高速缓冲存储器(cache)多级存储器体系:寄存器、高速缓冲存储器、主存储器、磁盘存储器、光盘存储器、磁带存储器。存储器中数据常用的存取方式:顺序存取、直接存取、随机存取、相联存取。顺序存取:按特定的线性顺序进行,使用一个共享的读写装置,存取时间可变;磁带存储器。直接存取:每个数据块都拥有惟一的地址标识,使用一个共享的读写装置,存取时间可变;磁盘存储器。随机存取:每个可寻址单元都具有惟一的地址和读写装置,读写时间是个常数;主存储器。相联存取:一种随机存取方式,选择某一单元取决于其内容而不是地址,读写时间是个常数;高速缓冲存储器。存储器系统的性能主要由存取时间、存储器带宽、存储器周期和数据传输率等来衡量。Cache的功能:提高CPU数据输入输出的速率,突破“冯.诺依曼瓶颈”,即突破CPU与存储系统间数据传送带宽的限制。在计算机的存储体系中,cache是访问速度最快的层次。使用cache改善系统性能的依据是程序的局部性原理,包括时间局部性和空间局部性。如果CPU需要访问的内容大多能在cache中找到(称为访问命中,hit),则可以大大提高系统性能。Cache的命中率计算:t3=h*t1+(1-h)*t2以h代表对cache的访问命中率,t1表示cache的周期,t2表示主存储器周期,t3表示使用“cache+主存储器”的系统的平均周期,(1-h)为失效率(未命中率)。Cache的淘汰算法:当cache已存满数据后,必须用新数据替换cache中的某些旧数据的算法;先进先出算法,近期最少使用算法,随机淘汰法。先进先出算法(FIFO):当需要替换时,总是淘汰最先调入cache的页面内容;比较容易实现,系统开销少,不一定合理。近期最少使用算法(LRU):当需要替换时,将在最近一段时间内使用最少的页面内容替换掉;实现较复杂,系统开销较大,使cache的命中率提高,应用较多。Cache的读写过程:读操作:当CPU发出访存请求时,存储器地址先被送到cache,按所用的映像方式读取cache地址,从cache页中读取内容,并将相应的cache标记与主存中的主存页标记进行比较,如果两者相同,则访问cache命中,将从cache中读取数据送往CPU;如果两者不符或没有找到相应的cache标记,则未命中,从主存中读取数据送CPU,并根据淘汰算法更新cache中的内容。写操作:写直达(写通)、写回、标记法。写直达:当要写cache时,数据将同时写回主存储器。写回:CPU修改cache中的某一行后,相应的数据并不立即写入主存储器单元,而是当该行被从cache中淘汰时,才把数据写回主存储器。标记法:对cache中的每个数据设置一个有效位,当数据进入cache后有效位置1,当CPU对数据修改时,数据只需写入主存储器并同时将该有效位清0。Cache的地址映像方法:直接映像、相联映像、组相联映像。地址映像是将主存与cache的存储空间划分为若干个大小相同的页(或块),地址间的对应关系。直接映像:以随机存取存储器作为cache。直接映像方式的主存地址:主存地址主存页号高位地址标识符主存组号(主存标记)Cache页号页内地址Cache地址主存分组,每组有为数为cache页数的页,组内各页与cache中各页固定映射,以cache页数为模进行重复映射。在cache中为每页设置了一个cache标记,其位数与主存组号的位数相同,标记cache页中的当前内容来自主存的哪个组。通过cache页号找到对应的cache页,并比较主存地址中主存组号与对应cache页中的cache标记,标记相同则命中。直接映像方式是多对一的映射关系。优点是比较容易实现,缺点是不够灵活,cache的存储空间可能得不到充分利用。相联映像:以相联存储器作为cache。相联映像方式的主存地址:主存地址地址部分-主存页标记(主存页号)数据部分-页内地址主存的每一页可以映射到cache的任一页,以页为单位自由映射,无固定对应关系。在cache中每页的cache标记的位数与主存页号的位数相同。通过比较主存地址中主存页号与cache各页的标记,标记相同则命中。相联映像方式是多对多的映射关系。逐页比较速度比较慢,同时与cache各页比较则成本较高;硬件电路较复杂;只适用于小容量cache。组相联映像:兼顾了相联和直接映像方式的优点。主存和cache都分组,主存组内的页数与cache的分组数相同。组相联映像方式的主存地址:主存地址高位地址标识符-主存页标记1Cache组号组内页号-主存页标记2页内地址Cache地址主存中的各页与cache的组号有固定的映射关系,可自由地映射到cache组中的任何一页。在cache中每页的cache标记的位数是主存高位地址标识符的位数和cache组内页号的位数之和。通过cache组号和组内页号找到对应的cache页,并比较主存页标记和cache中该页的标记,标记相同则命中。如果cache组中页数只有一页,则就是直接映像方式;如果cache只作为一组,则就是相联映像方式。在cache容量相等的条件下,组相联映像比直接映像有更高的命中率。流水线技术把一件任务分解为若干顺利执行的子任务,不同的子任务由不同的执行机构负责执行,这些机构可以并行工作,实现多个任务的重叠执行,以提高工作效率。流水线有两种:指令流水线和运算操作流水线。指令流水线:计算机中一条指令的执行需要若干步,采用流水线技术来实现指令的执行,以提高CPU性能。流水线技术对性能的提高程度取决于其执行顺序中最慢的一步。运算操作流水线:计算机在执行各种运算操作时可以应用流水线技术来提高运算速度。静态流水线:在某一时间内,各段只能按一种功能连接流水线,只有在流水线全部流空后,才能切换成为按另一种功能连接流水线;按功能来划分。流水线的关键在于重叠执行,流水线应满负荷工作即各个阶段都要同时并行工作。在实际情况中,流水线会阻塞,使其性能下降。阻塞原因有:转移指令的影响、共享资源访问冲突、中断系统。转移指令的影响:流水线执行一条转移指令时,不能确定下一条指令的地址,必须把取指段和指令地址计算段互锁,使流水线处于等待状态,不能满负荷工作,性能下降。解决办法:采用猜测法,猜测可能调转的语句,猜测正确流水线正常运行,否则清空当前流水线内容。或者通过编译系统的支持,优化指令的执行顺序,使流水线闲置的时间尽可能地少。共享资源访问冲突:当多条指令以流水线方式重叠执行时,可能会引起对共享的寄存器/存储器资源访问次序的变化,从而导致冲突,又称数据相关。为避免冲突,需要把相互关联的指令进行阻塞处理,使流水线效率下降。一般来说指令流水线级数越多,越容易导致数据相关,堵塞流水线。解决办法:通过编译系统的设置,在相互关联的指令间插入其他指令,使其进入流水线的时间拉开,避免冲突。中断系统:当有中断发生时,与条件转移指令类似,流水线也不得不停止,载入中断处理程序,对流水线的影响不可避免。流水线响应中断有两种方式:当中断发生时,立即停止现有的流水线,称为精确断点法,立即响应中断,缩短了中断响应时间,增加了CPU的硬件复杂度。当中断发生时,在流水线内的指令继续执行,停止流水线的入口,当流水线内指令执行完后,在执行中断处理指令,中断响应时间较长,称为不精确断点法,实现控制简单。在流水线中,指令相关、主存操作数相关、通用寄存器组的操作数相关及变址寄存器变址值相关为局部性相关。对局部性相关进行处理时,先写后读相关、先读后写相关和写-写相关都是控制机构能处理的局部性相关的内容。处理方法:设置相关专用通道。转移指令引起的相关称为全局性相关。处理方法:猜测法、加快和提前形成条件码、加快短循环程序的执行、转移指令迟延执行等。流水线的吞吐率:单位时间内流水线所完成的任务数量或输出的结果数量。TP=n/Tk,n为任务数,Tk是处理完成n个任务所用的时间。设各段执行时间均相等的k段流水线,各段执行时间都为时钟周期t,流水线处于理想状况即输入的任务是连续的,则Tk=(k+n-1)*t当任务数n趋于无穷大时,得到流水线的最大吞吐率TPmax=1/t,是时钟周期的倒数。TP=n/(k+n-1)t=n/(k+n-1)*TPmax流水线的加速比:完成同样一批任务,不使用流水线所用的时间(T0)与使用流水线所用的时间(Tk)之比。S=T0/Tk设流水线各段执行时间都为t,则S=nk/(n+k-1),Smax=k,流水线的最大加速比等于流水线的段数;如果流水线各段执行时间不相等,其中是完成第一个任务的时间,取流水线最慢的时钟周期,即流水线的平均时间。流水线的效率:流水线的设备利用率,在时空图上,n个任务占用的时空区与k个流水段总的时空区之比。E=n个任务占用的时空区/k个流水段总的时空区=T0/kTk。如果流水线的各段执行时间均相等t,且输入的n个任务是连续的,则一条k段流水线的效率为E=n/(n+k-1),最大效率为Emax=1。效率与吞吐率的关系:E=TP*t效率与加速比的关系:E=S/k,效率是流水线的实际加速比与最大加速比的比值。如果流水线各段执行时间不相等,。在计算一条实际流水线的效率时,往往需要考虑流水线各段所使用的设备量不相等或者价格不相等的情况,可以根据各段设备量或者价格所占比重分别赋以不同的权值。如果系统中同时存在多条流水线(多度),需要转换为单条流水线计算。磁盘调度:磁盘结构、存取过程、磁盘调度算法磁盘结构与参数:道密度TPI(道/英寸或毫米):沿磁盘半径方向,单位长度内磁道的数目。磁盘的最外层为0道。位密度(位/毫米):沿磁道方向,单位长度内存储二进制信息的位数。每个磁道存储的位数都是相同的,磁盘的位密度从外向内增加。磁盘的数据以块的形式进行存放和传输,这些块称为扇区(sector)。每个磁道的扇区数不等,一般包括10-100个扇区。柱面:若干个磁盘组成的磁盘组,所有盘面上相同位置的磁道组。总磁道数:Cn=m*TPI*(de-di)/2;m:磁盘盘面数;TPI:道密度;de:最外圈直径;di:最内圈直径。非格式化容量:Cn=w*3.14*d*m*n;w:位密度;d:最内圈直径;m:磁盘盘面数;n:每面磁道数。格式化容量:Cn=m*n*s*b;m:磁盘盘面数;n:每面磁道数;s:每道扇区数;b:每个扇区存储的字节数。磁盘数据存取过程:根据磁盘存放数据的规则,在向磁盘记录一个文件时,应将文件尽可能记录在同一柱面上,当一个柱面记录不下时,再记录到相邻的柱面上。为存取磁道上的一个记录,必须有三个参数:柱面号、磁头号(盘面号)、扇区号;磁盘机进行查找(将磁头定位到指定柱面,并选择指定的磁头)、搜索(指定的磁头寻找指定的扇区)、读、写、控制。平均存取之间(毫秒)=平均寻道时间+(平均定位时间+转动延迟)=查找时间+等待时间查找时间:磁头移动到目标磁道所需的时间;由磁盘机的性能决定。等待时间:等待读写的扇区旋转到磁头下方所用的时间;一般用磁道旋转一周所用时间的一半作为平均等待时间。磁盘的数据传输速率:磁头找到地址后,单位时间写入或读出的字节数。R=TB/T;TB:一个磁道上记录的字节数;T:磁盘每转一圈所需的时间。TB=s*b;s:每道扇区数;b:每个扇区存储的字节数。T=60/rpm;rpm:每分钟的转数。R=s*b*rpm/60;未给出
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号