资源预览内容
第1页 / 共59页
第2页 / 共59页
第3页 / 共59页
第4页 / 共59页
第5页 / 共59页
第6页 / 共59页
第7页 / 共59页
第8页 / 共59页
第9页 / 共59页
第10页 / 共59页
亲,该文档总共59页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
4.2指令的动态调度,静态调度:在出现数据相关时,为了消除或 者减少流水线空转,编译器确定并分离出程 序中存在相关的指令,然后进行指令调度, 并对代码进行优化。动态调度:通过硬件重新安排指令的执行顺序, 来调整相关指令实际执行时的关系,减少处理 器空转。 以硬件复杂性的显著增加为代价。,第四章 指令级并行,4.2.1 动态调度的原理,到目前为止我们所使用流水线的最大的局限性: 指令必须顺序流出看下面一段代码: DIVD F0 , F2 , F4; S1 ADDD F10 , F0 , F8; S2:S2对S1数据相关, S2被阻塞 SUBD F12 , F8 ,F14;S3:S3与S1、S2都没 有相关,但也被阻塞,4.2 指令的动态调度,为了允许乱序执行,我们将基本流水线的译码阶段 再分为两个阶段: (1)流出(Issue,IS):指令译码,检查是否存 在结构阻塞。 (2)读操作数(Read Operands,RO):当没有数 据相关引发的阻塞时就读操作数。指令乱序结束带来的最大问题: 异常处理比较复杂 (精确异常处理、不精确异常处理),4.2 指令的动态调度,4.2.2 动态调度算法之一:记分牌,例:数据先读后写(WAR)相关引起的阻塞 代码序列: DIVDF0 , F2 , F4 ADDDF10 , F0 , F8 SUBDF8 , F8 , F14 指令乱序执行时就会出现先读后写相关。,记分牌技术的目标: 在资源充足时,尽可能早地执行没有数据阻 塞的指令,达到每个时钟周期执行一条指令。,4.2 指令的动态调度,要发挥指令乱序执行的好处,必须有多条指令 同时处于执行阶段,这就要求有多个功能部件 或功能部件流水化或者两者兼有。 假设:处理器采用多个功能部件。 CDC 6600具有16个功能部件: 4个浮点部件, 5个存储器访问部件 7个整数操作部件 在DLX中,假设有2个乘法器、1个加法器、1 个除法部件和1个整数部件。,4.2 指令的动态调度,1.采用记分牌技术的DLX处理器的基本结构。,图4.1 具有记分牌的DLX处理器基本结构,记分牌电路负责记录资源的使用,并负责相关检测,控制指令的流出和执行。,2.每条指令在流水线中的执行过程分为四段: (1) 流出(Issue,记为IS) 如果本指令所需的功能部件有空闲,并 且其它正在执行的指令使用的目的寄存器与 本指令的不同,记分牌就向功能部件流出本 指令,并修改记分牌内部的数据记录。 解决了指令间存在的结构相关或写后写相关。,4.2 指令的动态调度,(2) 读操作数(Read Operand,记为RO)。 记分牌需要监测源操作数寄存器中数据的 有效性,如果前面已流出的还在运行的指令不 对本指令的源操作数寄存器进行写操作,或者 一个正在工作的功能部件已经完成了对这个寄 存器的写操作,那么此操作数有效。当操作数 有效后,记分牌将启动本指令的功能部件读操 作数并开始执行。 解决了数据的先写后读(RAW)相关。 通过以上步骤,记分牌动态解决了结构相 和数据相关引发的阻塞,指令可能乱序流出。,4.2 指令的动态调度,(3) 执行(Execution,记为EX)。(4) 写结果(Write Result,记为WR)。 记分牌知道指令执行完毕后,如果目标 寄存器空闲,就将结果写入到目标寄存器中, 然后释放本指令使用的所有资源。 检测先读后写(WAR)相关 在出现以下的情况时,就不允许指令写结果:,前面的某条指令(按顺序流出)还没有读取操作数; 其中某个源操作数寄存器与本指令的目的寄存器相同。,4.2 指令的动态调度,存在一个问题:就是功能部件到寄存器文件的数据总线宽度是有限的,当流水线中进入读操作数段(RO)和写结果段(WB)的功能部件总数超过可用总线的数目,这会导致结构阻塞。,3. 记分牌需要纪录的信息分为三部分: (1) 指令状态表 记录正在执行的各条指令已经进入记 分牌DLX流水线四段中的哪一段。,4.2 指令的动态调度,(2) 功能部件状态表 纪录各个功能部件的状态。每个功能部件 在状态表中都由以下九个域来纪录: Busy: 指示功能部件是否在工作 Op: 功能部件当前执行的操作 Fi: 目的寄存器编号 Fj,fk:源寄存器编号 Qj,Qk:向Rj,Rk中写结果的功能部件 Rj,Rk:表示Fj,Fk是否就绪, 是否已经被使用,4.2 指令的动态调度,(3) 结果寄存器状态表 每个寄存器在表中有一个域,用于纪录写 入本寄存器的功能部件(编号)。如果当前正 在运行的功能部件没有需要写入本寄存器的, 则相应域置为空。4. DLX记分牌所要维护的数据结构 给出下列代码运行过程中记分牌保存的信息.,4.2 指令的动态调度,LD F6 , 34(R2)LD F2 , 45(R3)MULTDF0 , F2 , F4SUBDF8 , F6 , F2DIVDF10 , F0 , F6ADDDF6 , F8 , F2,4.2 指令的动态调度,指 令,指令状态表 IS RO EX WR,LD F6 , 34(R2) LD F2 , 45(R3) MULTDF0 , F2 , F4 SUBDF8 , F6 , F2 DIVDF10 , F0 , F6 ADDDF6 , F8 , F2,图4.2 DLX记分牌信息组成和记录的信息,4.2 指令的动态调度,部件名称,功能部件状态表 Busy Op Fi Fj Fk Qj Qk Rj Rk,整数 yes LD F2 R3 no乘法1 yes MULTD F0 F2 F4 整数 no yes乘法2 no加法 yes SUBD F8 F6 F2 整数 yes no除法 yes DIVD F10 F0 F6 乘法1 no yes,例4.3 假设浮点流水线中执行的延迟如下: 加法需2个时钟周期 乘法需10个时钟周期 除法需40个时钟周期 代码段和记分牌信息的起始点状态如图4.2。分别给出MULTD和DIVD准备写结果之前的记分牌状态。 解: 在分析记分牌状态之前,首先需要分析指令之间存在的相关性,因为相关性会影响指令进入记分牌DLX流水线的相应段。,4.2 指令的动态调度,(1) 第二个LD指令到MULD和SUBD、MULTD到DIVD 之间以及SUBD到ADDD之间存在着先写后读相关;(2) DIVD和ADDD之间存在着先读后写相关;(3) ADDD和SUBD指令关于浮点加法部件还存在着结 构相关。 图4.3和图4.4分别给出了MULTD指令和DIVD 指令将要写结果时记分牌的状态。,4.2 指令的动态调度,指 令,指令状态表 IS RO EX WR,LD F6 , 34(R2) LD F2 , 45(R3) MULTDF0 , F2 , F4 SUBDF8 , F6 , F2 DIVDF10 , F0 , F6 ADDDF6 , F8 , F2 ,图4.3 程序段执行到MULTD将要写结果时记分牌的状态,4.2 指令的动态调度,部件名称,功能部件状态表 Busy Op Fi Fj Fk Qj Qk Rj Rk,整数 no 乘法1 yes MULTD F0 F2 F4 no no乘法2 no加法 yes ADDD F6 F8 F2 no no除法 yes DIVD F10 F0 F6 乘法1 no yes,指 令,指令状态表 IS RO EX WR,LD F6 , 34(R2) LD F2 , 45(R3) MULTD F0 , F2 , F4 SUBD F8 , F6 , F2 DIVD F10 , F0 , F6 ADDD F6 , F8 , F2 ,图4.4 程序段执行到DIVD将要写结果时记分牌的状态,4.2 指令的动态调度,部件名称,功能部件状态表 Busy Op Fi Fj Fk Qj Qk Rj Rk,整数 no 乘法1 no乘法2 no加法 no除法 yes DIVD F10 F0 F6 no no,5.分析记分牌是如何控制指令执行的。 操作在记分牌流水线中前进时,记分牌必须 记录与操作有关的信息,如寄存器号等。 约定: Fj(FU)S1 :将寄存器S1的名字送入Fj(FU) FU : 指令使用的功能部件 D : 目的寄存器的名字 S1和S2: 源操作数寄存器的名字, Op: 进行的操作 Fj(FU): 功能部件FU的Fj域 result(D):结果寄存器状态表中对应于寄存器D的内容,为产生寄存器D中结果的功能部件名。,
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号