系统结构chpt5下载_PPT模板_50

is_530219

暂无简介

系统结构chpt5null计算机系统结构计算机系统结构第一章基本概念第二章指令系统第三章存储系统第四章输入输出系统第五章标量处理机第六章向量处理机第七章互连网络第八章并行处理机第九章多处理机第五章　标量处理机第五章　标量处理机5.1 指令的重叠执行方式 5.2 流水线技术 5.3 超标量处理机 5.4 超流水线处理机 5.5 超标量超流水线处理机null 只有标量数据表示和标量指令系统的处理机称为标量处理机提高指令执行速度的主要途径： (1) 提高处理机的工作主频 (2) 采用更好的...

null计算机系统结构计算机系统结构第一章基本概念第二章指令系统第三章存储系统第四章输入输出系统第五章标量处理机第六章向量处理机第七章互连网络第八章并行处理机第九章多处理机第五章　标量处理机第五章　标量处理机5.1 指令的重叠执行方式 5.2 流水线技术 5.3 超标量处理机 5.4 超流水线处理机 5.5 超标量超流水线处理机null 只有标量数据表示和标量指令系统的处理机称为标量处理机提高指令执行速度的主要途径： (1) 提高处理机的工作主频 (2) 采用更好的算法和设计更好的功能部件 (3) 采用指令级并行技术三种指令级并行处理机： (1) 流水线处理机和超流水线(Super-pipelining)处理机 (2) 超标量(Superscalar)处理机 (3) 超长指令字(VLIW: Very Long Instruction Word) 处理机null取指令k

分析

定性数据统计分析pdf 销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析

k执行k取指令k+1分析k+1执行k+15.1 指令的重叠执行方式1、顺序执行方式执行n条指令所用的时间为：如果每段时间都为t，则执行n条指令所用的时间为： T=3ntnull主要优点：控制简单，节省设备。主要缺点：执行指令的速度慢，功能部件的利用率很低。2、一次重叠执行方式一种最简单的流水线方式如果两个过程的时间相等，则执行n条指令的时间为：T=(1+2n)tnull取指分析执行取指分析执行取指分析执行主要优点：指令的执行时间缩短功能部件的利用率明显提高主要缺点：需要增加一些硬件控制过程稍复杂null如果三过程的时间相等，执行n条指令的时间为：T=(2+n)t 理想情况下同时有三条指令在执行处理机的结构要作比较大的改变，必须采用先行控制方式取指k+2分析k+2执行k+2取指k+1分析k+1执行k+1取指k分析k执行k3、二次重叠执行方式先行控制方式的原理先行控制方式的原理1.采用二次重叠执行方式必须解决两个问题： (1)有独立的取指令部件、指令分析部件和指令执行部件把一个集中的指令控制器，分解成三个独立的控制器：存储控制器、指令控制器、运算控制器 (2)要解决访问主存储器的冲突问题取指令、分析指令、执行指令都可能要访问存储器null2.解决访存冲突的

方法

快递客服问题件处理详细方法山木方法pdf 计算方法pdf 华与华方法下载八字理论方法下载

： (1)采用低位交叉存取方式：这种方法不能根本解决冲突问题。指令、读操作数、写结果。 (2)两个独立的存储器：独立的指令存储器和数据存储器。如果再规定，执行指令所需要的操作数和执行结果只写到通用寄存器，则取指令、分析指令和执行指令就可以同时进行。在许多高性能处理机中，有独立的指令Cache和数据Cache。这种结构被称为哈佛结构。null(3)采用先行控制技术采用先行控制技术的关键是缓冲技术和预处理技术。缓冲技术通常用在工作速度不固定的两个功能部件之间。设置缓冲栈的目的是用来以平滑功能部件之间的工作速度。在采用了缓冲技术和预处理技术之后，运算器能够专心于数据的运算，从而大幅度提高程序的执行速度。第五章　标量处理机第五章　标量处理机5.1 先行控制技术 5.2 流水线技术 5.3 超标量处理机 5.4 超流水线处理机 5.5 超标量超流水线处理机null空间并行性：设置多个独立的操作部件多操作部件处理机超标量处理机时间并行性：采用流水线技术。不增加或只增加少量硬件就能使运算速度提高几倍流水线处理机超流水线处理机5.2 流水线技术null5.2.1 流水线工作原理 5.2.2 流水线的分类 5.2.3 线性流水线的性能分析 5.2.4 非线性流水线的调度技术5.2 流水线技术null5.2.1 流水线工作原理1、简单流水线流水线的每一个阶段称为流水步、流水步骤、流水段、流水线阶段、流水功能段、功能段、流水级、流水节拍等。在每一个流水段的末尾或开头必须设置一个寄存器，称为流水寄存器、流水锁存器、流水闸门寄存器等。会增加指令的执行时间。分析器分析k+1流水锁存器执行部件执行k流水锁存器输入输出t1t2为了简化，在一般流水线中不画出流水锁存器。null取指形成操作数地址译码取操作数执行保存结果2、一种指令流水线一般4至12个流水段，等于及大于8个流水段的称为超流水线处理机null分析k分析k+1分析k+2分析k+3执行k执行k+1执行k+2执行k+3时间空间0t1t2t3t4t53、流水线的时空图一条简单流水线的时空图：nullED1时间空间0t1t2t3t4t5ED2ED3ED4ED5EA1EA2EA3EA4EA5MA1MA2MA3MA4MA5NL1NL2NL3NL4NL5t6t7t8NL：规格化MA：尾数加EA：对阶ED：求阶差一个浮点加法器流水线的时空图(由求阶差、对阶、尾数加和规格化4个流水段组成)：null4、流水线的主要特点只有连续提供同类任务才能充分发挥流水线的效率：对于指令流水线：要尽量减少因条件分支造成的“断流” 对于操作部件：主要通过编译技术，尽量提供连续的同类操作在流水线的每一个流水线段中都要设置一个流水锁存器时间开销：流水线的执行时间加长是流水线中需要增加的主要硬件之一null各流水段的时间应尽量相等流水线处理机的基本时钟周期等于时间最长的流水段的时间长度流水线需要有“装入时间”和“排空时间”null1、线性流水线与非线性流水线流水线的各个流水段之间是否有反馈信号线性流水线(Linear Pipelining) 每个流水段都流过一次，且仅流过一次非线性流水线(Nonlinear Pipelining) 在流水线的某些流水段之间有反馈回路或前馈回路线性流水线能够用流水线连接图唯一表示非线性流水线必须用流水线连接图流水线预约表等共同表示5.2.2 流水线的分类nullS1输入S2S3输出前馈回路反馈回路一种简单的非线性流水线null2、按照流水线的级别来分处理机级流水线, 又称为指令流水线 (Instruction Pipelining) 例如：在采用先行控制器的处理机中，各功能部件之间的流水线先行指令缓冲栈输入先行控制方式中的指令流水线先行指令分析器先行读数栈先行操作栈取指译码取操作数指令执行部件后行写数栈输出执行写结果null求阶差输入输出t1对阶尾数加规格化t2t3t4P1输入任务1MM…P2任务2MP3任务3输出部件级流水线（操作流水线），如浮点加法器流水线处理机之间的流水线称为宏流水线 (Macro Pipelining)每个处理机对同一个数据流的不同部分分别进行处理null3、单功能流水线与多功能流水线单功能流水线：只能完成一种固定功能的流水线 Cray-1计算机中有12条；YH-1计算机有18条； Pentium有一条5段的定点和一条8段的浮点流水线； PentiumⅢ有三条指令流水线，其中两条定点指令流水线，一条浮点指令流水线多功能流水线：流水线的各段通过不同连接实现不同功能Texas公司的ASC计算机中的8段流水线，能够实现：定点加减法、定点乘法、浮点加法、浮点乘法、逻辑运算、移位操作、数据转换、向量运算等。nullnull4、静态流水线与动态流水线静态流水线：同一段时间内，多功能流水线中的各个功能段只能按照一种固定的方式连接，实现一种固定的功能。只有连续出现同一种运算时，流水线的效率才能得到充分的发挥。动态流水线：在同一段时间内，多功能流水线中的各段可以按照不同的方式连接，同时执行多种功能。null1时间空间023…n123…n123…n123…n123…n123…n1234…123…12……1输入求阶差对阶尾数加规格化尾数乘累加输出静态流水线时空图浮点加法定点乘法null1时间空间023…n123…n123…n123…n123…n123…n输入求阶差对阶尾数加规格化尾数乘累加输出动态流水线时空图………………123546123541234123…………浮点加法定点乘法nullS1就绪回答S2就绪回答S3就绪回答输出就绪回答输入5、流水线的其他分类方法按照数据表示方式：标量流水线和向量流水线按照控制方式：同步流水线和异步流水线顺序流水线与乱序流水线：乱序流水线又称为无序流水线、错序流水线或异步流水线等null5.2.3 线性流水线的性能分析衡量流水线性能的主要指标有：吞吐率、加速比和效率。1、吞吐率（Though Put）求流水线吞吐率的最基本公式：TP = n / Tkn为任务数, Tk为完成n个任务所用时间各段执行时间相等，输入连续任务情况下完成n个连续任务需要的总时间为：Tk= (k+n-1) tk为流水线的段数， t为时钟周期null1时间空间S123……n-1nS2S3S4123……n-1n123……n-1n123……n-1nkt(n-1) tnt(k-1)tTnull吞吐率：最大吞吐率为：各段执行时间不相等、输入连续任务情况下：吞吐率为：最大吞吐率为：null流水线各段执行时间不相等的解决办法S1输入t1=tS2t2=3tS3t3=tS4t4=t输出1时间空间S1S2S3S4ti(n-1)t2Tk23…n123…n123…n123…nnullS1输入输出tS2-1tS2-2tS2-3tS3tS4tS2(3t)S1输入输出t1=tS2-1S2-1S2-1S3S4t3=tt4=tt2=3t二是将 “瓶颈”流水段重复设置：一是将“瓶颈”流水段细分(如果可分的话)：null1时间空间23nS1流水段重复设置的流水线S2-1456…14…-2-1n-225…n-136…n123n456…-2-1123n456…-2-1S2-2S2-3S3S4null2、加速比（Speedup）计算流水线加速比的基本公式： S = 顺序执行时间T0 / 流水线执行时间Tk各段执行时间相等，输入连续任务情况下加速比为：最大加速比为：各段执行时间不等，输入连续任务情况下实际加速比为：null任务个数加速比10246811248163264128null3、效率（Efficiency）计算流水线效率的一般公式：各流水段执行时间相等，输入n个连续任务流水线的效率为：流水线的最高效率为null各流水段执行时间不等，输入n个连续任务流水线的效率为：null流水线各段的设备量或各段的价格不相等时：流水线的效率为：即：其中，ai < k，且null流水线的吞吐率、加速比与效率的关系：因为因此：E=TP·Dt，S=k·Enull5、流水线性能分析举例对于单功能线性流水线，输入连续任务的情况，通过上面给出的公式很容易计算出流水线的吞吐率、加速比和效率。用一条4段浮点加法器流水线求8个浮点数的和Z＝A＋B＋C＋D＋E＋F＋G＋Hnull1时间空间23求阶差4567123456712345671234567对阶尾数加规格化加数ACEGA+BE+FBDFHC+DG+HA+B+C+DE+F+G+H结果A+BC+DE+FG+HA+B+C+DE+F+G+HZ = [(A+B) + (C+D)] + [(E+F) + (G+H)]null7个浮点加法共用了15个时钟周期。流水线的吞吐率为：流水线的加速比为：流水线的效率为：第五章　标量处理机第五章　标量处理机5.1 先行控制技术 5.2 流水线技术 5.3 超标量处理机 5.4 超流水线处理机 5.5 超标量超流水线处理机null5.3 超标量处理机 5.3.1 基本结构 5.3.2 单发射与多发射null超标量处理机： Intel公司的i860, i960, Pentium处理机Motolora公司的MC88110 IBM公司的Power 6000 SUN公司的SuperSPARC等。超流水线处理机： SGI公司的MIPS R4000, R5000, R10000等。超标量超流水线处理机： DEC公司的Alpha等。nullk段流水线基准标量处理机m度超标量n度超流水线(m,n)度超标量超流水机器类型机器流水线周期同时发射指令条数指令发射等待时间指令级并行度ILP1个时钟周期1条1个时钟周期11m1m1/n11/nn1/nm1/nmn超标量、超流水、超标量超流水处理机的主要性能null5.3.1 基本结构一般流水线处理机：一条指令流水线，一个多功能操作部件，每个时钟周期平均执行指令的条数小于1。多操作部件处理机：一条指令流水线，多个独立的操作部件，操作部件可以采用流水线，也可以不流水。多操作部件处理机的指令级并行度小于1。null超标量处理机典型结构：多条指令流水线先进的超标量处理机有：定点处理部件CPU，浮点处理部件FPU,图形加速部件GPU 大量的通用寄存器，两个一级高速Cache 超标量处理机的指令级并行度大于1nullMotorola公司的MC88110： 10个操作部件两个寄存器堆：整数部件通用寄存器堆，32个32位寄存器；浮点部件扩展寄存器堆，32个80位寄存器。每个寄存器堆有8个端口，分别与8条内部总线相连接，有一个缓冲深度为4的先行读数栈和一个缓冲深度为3的后行写数栈。两个独立的高速Cache中，各为8KB，采用两路组相联方式，转移目标指令Cache，在有两路分支时，存放其中一路分支上的指令null整数部件整数部件位操作浮点加乘法部件除法部件图形部件图形部件内部总线读数存数部件通用寄存器堆扩展寄存器堆目标指令指令分配转移部件数据Cache (8KB)指令Cache (8KB)系统总线32位地址总线32位数据总线超标量处理机MC88110的结构null5.3.2 单发射与多发射单发射处理机：每个周期只取一条指令、只译码一条指令，只执行一条指令，只写回一个运算结果取指部件和译码部件各设置一套可以只设置一个多功能操作部件，也可以设置多个独立的操作部件操作部件中可以采用流水线结构，也可以不采用流水线结构设计目标是每个时钟周期平均执行一条指令，ILP的期望值1nullIF时钟周期指令I1I2I3IDEXWRIFIDEXWRIFIDEXWR123456单发射处理机的指令流水线时空图nullIFIDFA1FA2FA3MD1MD2MD3ALLS浮点加法部件乘除法部件定点ALU部件取数存数部件WR来自指令Cache通用寄存器后行写数栈null多发射处理机：每个周期同时取多条指令、同时译码多条指令，同时执行多条指令，同时写回多个运算结果需要多个取指令部件，多个指令译码部件和多个写结果部件设置多个指令执行部件，复杂的指令执行部件一般采用流水线结构设计目标是每个时钟周期平均执行多条指令，ILP的期望值大于1nullIF时钟周期指令I1I2I3IDEXWR123456多发射处理机的指令流水线时空图I4I5I6IFIDEXWRI7I8I9IFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRnullIFIDFA1FA2FA3MD1MD2MD3ALLS浮点加法部件乘除法部件定点ALU部件取数存数部件WRIFIDWRnull超标量处理机：一个时钟周期内能够同时发射多条指令的处理机称为超标量处理机必须有两条或两条以上能够同时工作的指令流水线先行指令窗口：能够从指令Cache中预取多条指令能够对窗口内的指令进行数据相关性分析和功能部件冲突的检测窗口的大小：一般为2至8条指令采用目前的指令调度技术，每个周期发射2至4条指令比较合理null例如： Intel公司的i860、i960、Pentium处理机，Motolora公司的MC88110处理机，IBM公司的Power 6000处理机等每个周期都发射两条指令 TI公司生产的SuperSPARC处理机以及Intel的Pentium III处理机等每个周期发射三条指令操作部件的个数多于每个周期发射的指令条数。4个至16个操作部件超标量处理机的指令级并行度：1＜ILP＜m；m为每个周期发射的指令条数。nullIFIDFA1FA2FA3MD1MD2MD3ALLS浮点加法部件乘除法部件定点ALU部件取数存数部件WRIFIDWRIFID先行指令窗口null超标量处理机的性能在理想情况下，N条没有资源冲突、没有数据相关和控制相关的指令在单流水线普通标量处理机中执行的时间是：在超标量处理机中执行的时间是：超标量处理机相对于普通处理机的加速比是：第五章　标量处理机第五章　标量处理机5.1 先行控制技术 5.2 流水线技术 5.3 超标量处理机 5.4 超流水线处理机 5.5 超标量超流水线处理机null5.4 超流水线处理机两种定义：一个周期内能够分时发射多条指令的处理机称为超流水线处理机指令流水线有8个或更多功能段的流水线处理机称为超流水线处理机提高处理机性能的不同方法：超标量处理机是通过增加硬件资源为代价来换取处理机性能的超流水线处理机则通过各硬件部件充分重叠工作来提高处理机性能null两种不同并行性：超标量处理机采用的是空间并行性超流水线处理机采用的是时间并行性null5.4.1 指令执行时序每隔1/n个时钟周期发射一条指令，流水线周期为1/n个时钟周期在超标量处理机中，流水线的有些功能段还可以进一步细分例如：ID功能段可以再细分为译码、读第一操作数和读第二操作数三个流水段。也有些功能段不能再细分，如WR功能段一般不再细分。因此有超流水线的另外一种定义：有8个或8个以上流水段的处理机称为超流水线处理机nullIF时钟周期指令I1I2I3IDEXWR123456每个时钟周期分时发送3条指令的超流水线I4I5I6IFIDEXWRI7I8I9IFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRnull5.4.2 典型处理机结构 MIPS R4000处理机每个时钟周期包含两个流水段，是一种很标准的超流水线处理机结构。指令流水线有8个流水段有两个Cache，指令Cache和数据Cache的容量各8KB，每个时钟周期可以访问Cache两次，因此在一个时钟周期内可以从指令Cache中读出两条指令，从数据Cache中读出或写入两个数据。主要运算部件有整数部件和浮点部件nullnull指令 CacheMIPS R4000处理机的流水线操作IF：取第一条指令 IS：取第二条指令 RF：读寄存器堆，指令译码 EX：执行指令 DF：取第一个数据 DS：取第二个数据 TC：数据

标志

禁止坐卧标志下载饮用水保护区标志下载桥隧标志图下载上坡路安全标志下载地理标志专用标志下载

校验；WB：写回结果指令译码读寄存器堆ALU数据 Cache标志检验寄存器堆IFISRFEXDFDSWBTCnullIF流水线周期当前CPU周期ISRFEXDFDSTCWBIFISRFEXDFDSTCWBIFISRFEXDFDSTCWBIFISRFEXDFDSTCWBIFISRFEXDFDSTCWBIFISRFEXDFDSTCWBIFISRFEXDFDSTCWBIFISRFEXDFDSTCWB主时钟周期MIPS R4000正常指令流水线工作时序null如果在LOAD指令之后的两条指令中，任何一条指令要在它的EX流水级使用这个数据，则指令流水线要暂停一个时钟周期采用顺序发射方式null暂停IFISRFEXDFDSTCWBMIPS R4000正常指令流水线工作时序ISRFEXDFDSTCWBRFEXDFDSTCWBEXDFDSTCWBEXDFDSTCWBDFDSTCWBIFISRFI1I2I3I4I5I6运行运行Load指令使用Load数据null5.4.3 超流水线处理机性能指令级并行度为(1,n)的超流水线处理机，执行N条指令所的时间为超流水线处理机相对于单流水线普通标量处理机的加速比为null即：超流水线处理机的加速比的最大值为：S(1,n)MAX = n第五章　标量处理机第五章　标量处理机5.1 先行控制技术 5.2 流水线技术 5.3 超标量处理机 5.4 超流水线处理机 5.5 超标量超流水线处理机null5.5 超标量超流水线处理机把超标量与超流水线技术结合在一起，就成为超标量超流水线处理机 5.5.1 指令执行时序 5.5.2 典型处理机结构 5.5.3 超标量超流水线处理机性能 5.5.4 三种指令级并行性处理机性能比较null5.5.1 指令执行时序超标量超流水线处理机在一个时钟周期内分时发射指令n次，每次同时发射指令m条，每个时钟周期总共发射指令m  n条。nullIF时钟周期指令I1I2I3IDEXWR12345I4I5I6I7I8I9IFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRIFIDEXWRI10I11I12每时钟周期发射3次,每次3条指令null5.5.2 典型处理机结构 DEC公司的Alpha处理机采用超标量超流水线结构。主要由四个功能部件和两个Cache组成：整数部件EBOX、浮点部件FBOX、地址部件ABOX和中央控制部件IBOX。中央控制部件IBOX可以同时从指令Cache中读入两条指令，同时对读入的两条指令进行译码，并且对这两条指令作资源冲突检测，进行数据相关性和控制相关性分析。如果资源和相null 关性允许，IBOX就把两条指令同时发射给EBOX、ABOX和FBOX三个指令执行部件中的两个。指令流水线采用顺序发射乱序完成的控制方式。在指令Cache中有一个转移历史表，实现条件转移的动态预测。在EBOX内还有多条专用数据通路，可以把运算结果直接送到执行部件。 Alpha 21064处理机共有三条指令流水线整数操作流水线和访问存储器流水线分为7个流水段，其中，取指令和分null 析指令为4个流水段，运算2个流水段，写结果1个流水段。浮点操作流水线分为10个流水段，其中，浮点执行部件FBOX的延迟时间为6个流水段。所有指令执行部件EBOX、IBOX、ABOX和FBOX中都设置由专用数据通路。nullnull 析指令为4个流水段，运算2个流水段，写结果1个流水段。浮点操作流水线分为10个流水段，其中，浮点执行部件FBOX的延迟时间为6个流水段。所有指令执行部件EBOX、IBOX、ABOX和FBOX中都设置由专用数据通路。 Alpha 21064处理机的三条指令流水线的平均段数为8段，每个时钟周期发射两条指令。因此，Alpha 21064处理机是超标量超流水线处理机。nullSWAPIF 取值 SWAP 交换双发射指令、转移预测 I0 指令译码 I1 访问通用寄存器堆，发射校验 A1 计算周期1，IBOX计算新的PC值 A2 计算周期2，查指令快表 WR 写整数寄存器堆，指令Cache命中检测17个流水段的整数操作流水线IFI0I1A0A1WR234560nullSWAPIF 取值 SWAP 交换双发射指令、转移预测 I0 指令译码 I1 访问通用寄存器堆，发射校验 AC ABOX计算有效数据地址 TB 查数据快表 HM 写读数缓冲栈，数据Cache命中/ 不命中检测17个流水段的访问存储器流水线IFI0I1ACTBHM234560nullSWAPIF 取值 SWAP 交换双发射指令、转移预测 I0 指令译码 I1 访问通用寄存器堆，发射校验 F1-F5 浮点计算流水线 FWR 写回浮点寄存器堆110个流水段的浮点操作流水线IFI0I1F1F2FWR234560F3F4F5789null5.5.3 超标量超流水线处理机性能指令级并行度为(m,n)的超标量超流水线处理机，连续执行N条指令所需要的时间为：超标量超流水线处理机相对于单流水线标量处理机的加速比为：null 在理想情况下，超标量超流水线处理机加速比的最大值为： S(m, n)MAX＝m nnull5.5.4 三种指令级并行处理机性能比较超标量处理机、超流水线处理机和超标量超流水线处理机相对于单流水线普通标量处理机的性能曲线。0.00.51.01.52.02.512345678相对性能超标量超流水线超标量超流水线指令级并行度null 从三种指令级并行处理机的性能曲线中，可以得出如下结论： 1、三种处理机的性能关系超标量处理机的相对性能最高，其次是超标量超流水线处理机，超流水线处理机的相对性能最低，主要原因如下： (1) 超标量处理机在每个时钟周期的一开始就同时发射多条指令，而超流水线处理机则要把一个时钟周期平均分成多个流水线周期，每个流水线周期发射一条指令；因此，超流水线处理机的启动延迟比超标量处理机大。null (2)条件转移造成的损失，超流水线处理机要比超标量处理机大。 (3)在指令执行过程中的每一个功能段，超标量处理机都重复设置有多个相同的指令执行部件，而超流水线处理机只是把同一个指令执行部件分解为多个流水级；因此，超标量处理机指令执行部件的冲突要比超流水线处理机小。 2、实际指令级并行度与理论指令级并行度的关系当横坐标给出的理论指令级并行度比较低时，处理机的实际指令级并行度null 的提高比较快。当理论指令级并行度进一步增加时，处理机实际指令级并行度提高的速度越来越慢。在实际设计超标量、超流水线、超标量超流水线处理机的指令级并行度时要适当，否则，有可能造成花费了大量的硬件，但实际上处理机所能达到的指令级并行度并不高。目前，一般认为，m 和 n 都不要超过4。null3、最大指令级并行度一个特定程序由于受到本身的数据相关和控制相关的限制，它的指令级并行度的最大值是有限的，是有个确定的值。这个最大值主要由程序自身的语义来决定，与这个程序运行在那一种处理机上无关。对于某一个特定的程序，图中的三条曲线最终都要收拢到同一个点上。当然，对于各个不同程序，这个收拢点的位置也是不同的。null本章重点 1、指令的重叠执行方式及时空图表示方法 2、线性流水线的性能分析及计算 3、超标量处理机的指令执行时序及性能 4、超流水线处理机的指令执行时序及性能 5、超标量超流水线处理机的指令执行时序及性能 null练习题： 5.3 5.7 5.8 5.9 5.18

本文档为【系统结构chpt5】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。

系统结构chpt5

热门搜索

历史搜索