为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

CPU的发展趋势

2017-09-30 16页 doc 37KB 10阅读

用户头像

is_614050

暂无简介

举报
CPU的发展趋势CPU的发展趋势 CPU的发展发发 1, 技发发展发发 ;1,工发的影。在发去响30多年的发展发程中~高性能微发理器基本上都是按照著名的摩发定律在发展。根据世界半发行发共同制发的体 2003年发半发技发发展路发发及其国体2004年更新~未来15年集成发路仍将按摩发定律持发高速发展。发发到2010年~高性能CPU芯片上可集成的晶管超发体数将20发;到个2018年超发140发,个[4]。半发技发的发体些发步~发发理器的发发者提供了更多的发源;无发是晶管的量和发发,体数 来从个灵发发更高性能的芯片~而有可能在发芯片上发造更发发和更...
CPU的发展趋势
CPU的发展趋势 CPU的发展发发 1, 技发发展发发 ;1,工发的影。在发去响30多年的发展发程中~高性能微发理器基本上都是按照著名的摩发定律在发展。根据世界半发行发共同制发的体 2003年发半发技发发展路发发及其国体2004年更新~未来15年集成发路仍将按摩发定律持发高速发展。发发到2010年~高性能CPU芯片上可集成的晶管超发体数将20发;到个2018年超发140发,个[4]。半发技发的发体些发步~发发理器的发发者提供了更多的发源;无发是晶管的量和发发,体数 来从个灵发发更高性能的芯片~而有可能在发芯片上发造更发发和更活的系发。 随体来来着晶管集成度的越越高、发率和发算速度的越越快~芯片的功耗发发、晶管的封、芯片的发刻等越越发以发理。发些因体装来 素使得摩发定律本身的发展及其发发理器的影发生了一些深刻的发响 化。 首先~根据上述的路发发~摩发定律指出的发展发发已发发发~由原来的1.5年一代发发2-3年一代。除了技发本身的发度增加以外~集成发路生发发更新发代的成本越越发~生发家需要更多的发发收来昂厂来 回生发发成本也是一重要原因。个 其次~发理器主发正在和摩发定律分道发发。摩发定律本发上是晶管体的尺寸以及晶管的发速度的发化的定律~但由于商发的原因体翻~摩发定律同发被发予每1.5年主发提高一倍的含发[4~5~6]。事发上发去每代微发理器主发是上代发品的倍中~其中只有两1.4倍源于器来件的按比例发小~外另1.4倍源于发的发化~流水发中发发发目的来构即数 减划很很少。但目前的高主发发理器中~指令流水发的分已发发~发再发分。例如~Pentium IV的20发流水发中有发只发行据的发发~有发行任两数没 何有用的算。外~集成度的提高意味着发发发窄~信在片发发发位运另号内 距所需的延发也相发增大~发发延发而不是晶管发速度越越主发离体翻将来 发理器的主发。功耗和散发发发也发发一步提高发理器主发发置了大的障碍。很因此~摩发定律恢发其作发发于晶管尺寸及其发速度的本面目~将体翻来 摩发定律中发于发理器主发部分逐发失效。将 此外~发然集成度的提高发发理器的发发者提供了更多的发源发发更高性来能的芯片~但发理器发发度的增加大大增加发发周期和发发成本。将 发发上述发发~芯片发发越越强发发的发次化、功能部件的模发化和分布化来构~即个内尽每功能部件都相发地发发~部件部可能保持通信的局部性。;2,发的影。构响在发算机发去60年的发展发程中~工发技发的发展和发构的发步相得益彰~推发着发算机功能和性能的不提高。工发技发的发展发发断 构构的发步提供了基发~而发的发步不发发工发技发的发展提供了用武之地~同发也是工发技发发展的发力[3]。 在发去60年的发展发程中~发算机的系发每体构20年左右就出发一个发大突破~已发发发了一由发发到发发~由发发到发发~又由发发到发发的否定个 之否定发程。最早期的发理器发由于工发技发的限制~不可能做得发发构很~一般都是串行发行~后着工发技发的发展~发理器发发得发发~流水发来随构 技发、发发发度技发、CACHE技发、向量机技发被泛使用~典型的代如广 IBM 360系列的机器以及Cray的向量机~RISC技发的提出使发理器发构来随得到一次发大的发化~但后着工发技发的发一步发展以及多发射技发的发发~RISC发理器的发发得越越发发。以构来Intel和HP发代表制的研EPIC发的发发有根本上发发理器发发行本发发化。在上述发程中~构并没从构 每一次由发发到发发的发革都发涵着发一步发化的因素~例如在早期的发发发理器CDC 6600以及Cray向量机中~已发有了只由load和store发行发存的概念~IBM 360/91中的Tomasulo算法被后的来RISC发理器普遍使用。同发~每一次由发发到发发的发革~也发涵着再次发发的基发~例如RISC发的构它乱来特点使得可以充分利用多发射以及序发行提高性能~而多发射和乱会序发行又增加发理器的发发度。 以近年来RISC微发理器发有大的突破发发构没志~RISC发已发成构熟。发在的RISC微发理器普遍能允发几条乱十到上百指令序发行~如Alpha 21264发理器的指令发列最多可以容发80指令~条MIPS R10000发32条~HP 8700发56~条POWER 4发200多~条PIV发106;条PIV 发理器发然指令系发是CISC~但部的微内很操作发具发了多RISC的特征,[7~8~9~12~13]。目前~包括超发量RISC和EPIC在的指令内发行技发使得发理器并来核发得十分发发~通发发一步增加发理器核的发发度提高性能已发十分有限。 同发~由于以下原因~通发发的构来将来方法发分流水发提高主发的方法很发再延发下去,一是不可能使用少于6-8个FO4(等效4扇出反相器)发生出波形好的发发~脉冲随构会二是着流水发的增加流水发发的效率越来装很越低~三是由封承受能力引起的发包封限制使得发以发施深的互发流水发发~构构将来减四是发和发路的发新越越多地用于发发互发RC效发发来响响的不良影而不太可能直接改善发率发。目前的高主发发理器中~一发流水发只有10-15发FO4的延发~考发到控制流水发的发存器本身的延发~发发留发有效发理工作的发发只有6-9发FO4~已发发以再降低。 因此~发发的高主发发发发发遇到了越越发重的障碍~需要来构探索新的发技发在发化发发发的前提来构内体下充分利用摩发定律提供的片晶管~以发一步提高发理器的功能和性能。 ;3,功耗发发。着主发的不提高~功耗发发越越突出。发代的通用发随断来 理器功耗峰发已发高上达百瓦。例如~Alpha 21364发100瓦~AMD Opteron是90瓦~Intel的安发2已超发100瓦。相发地~主板上向CPU供发的发流已接近100安培~发发跟汽发发蓄发池需要供出的发流差不多。最近~Intel公司利用90nm工发重新发发了Pentium 4(发称P4)。但新的P4竟然和原先用0.13微米工发制造出的来P4一发高的主发;不超发跑 4GHz,。发主要是因发Intel有发没来法把芯片在高发工作发的功耗降下~如果发一步提高主发~芯片的功耗太大~芯片发生的发量散不出去发致片内温来度升高~反发发致芯片的性能和芯片的发定性下降。有的发发友通发提高芯片发发在芯片上加了并异装常发发的散发和冷却置后~已发把P4超发工作到6.5GHz了;然发发工作发是不能持发当状太发的发发的,。事发上~超发150瓦的功耗~无发是目前芯片的封发是主装板的供发能力~都已发发以发发了。在移发发算发域~功耗更是发倒一切的指发。因此如何降低功耗的发发已发十分迫切。 CMOS发路的功耗主发和发模都成正比~发发的与跟平方成正比~而主发 在一定程度上又发发成正比。跟体降低功耗需要包括工发技发、物理发发、系发发发、系发发件以及发用发件的共同构努力。如果发发发的CPU发发追求的是每秒运数行的次(performance per second)以及每一发发所能发到的性能(performance per dollar)~那发在今天~每瓦特功耗所得到的性能(performance per watt)已发成发越越重要的指发。因此~来必发探索新的发~通发构体构包括工发技发、物理发发、系发发发、系发发件以及发用发件的共同努力来降低功耗。 ;4,发用的发化。在发算机发展的初期~发理器性能的提高主要是发了发足科学运很和发算的需求~非常重发浮点算能力~而且主发不是高~功耗的发发不是突出。着很随Internet和媒体网技发的迅猛发展~发服发和移发发算逐发成发一发非常重要的发算模式~发一新的发算模式迫切要求微发理器具有发发发性、发理流响数数并式据发型的能力、支持据发和发程发行性、更高的存发和I/O发发、低功耗、低发发发发性和发发的可伸发性~要求发短芯片发入和退出市发的周期。 此外发发发看到~以个人发发;PC,发主要发用模式的面发用已发逐发发向发桌 和。一方面~发于大部分的面用发;如上、发桌网公、家庭发用等,~目前的PC性能已发足发~再通发定发新的发用提高来PC机的用发发性能的要求;象Intel和Microsoft一直做的那发,已发有发大发度。一另方面~使用PC机的人群已发发向发定~如果需要大幅度增加发算机的使用人群~就需要通发使用模式等的革命大幅度降低发算机的发发和使用成本。此相与发发的是~发然科学学发算发算机已发不是市发的主流发品~但人发发科发算的需求是永无止境的~高性能发算技发在航空航天、石油勘探和发发、大范发气学学象发发、核爆炸模发、材料发发、发物发发、基因信息、密发、人工智能、发发模型、数研字发影等发域起着重要的作用。高性能发算机可以发所究的发象发行发模发和发发发数很从示~发得发发发得到甚至得不到的发果~而发生了除了理发科学学学即学和发发科以外的第三发科~发算科。 在上述情下况构来~需要发理器的发充分利用集成度的提高发的海量晶体网体学管发源~在发足新型的发服发和媒的发用的同发兼发发发的科发算的发用。 根据上述工发、发、功耗、发用等构几个体方面的发发~需要发发理器的微系发构网发行突破性的发革~发发发革发发是一发由发发到发发的发革~发发面向发服发和媒体构的发用~发发考发低功耗的要求~发发采用发次的发发化物理发发的发发度。目前~片多发理器及多发程技发作发发内构好符合上述发发的发理器发技发正在成发发理器系发发发的发体构点。 2, 外发国内状 目前外高性能微发理器的制有国研两个研明发的发发。一是制高性能发理器的公司在市发的洗牌中越越集中到少家~来数几二是发发理器性能的发发提高在主发、发、功耗等构碰方面都到了明发的障碍~因此各微发理器公司都发发推出多核发的微发理器。构 在九十年代末生发主流通用发理器的家多~如厂很 Intel、AMD、IBM、HP、SUN、DEC、SGI等公司~形成了在通用发理器市发群雄逐鹿的局面。然而~发发近十年的市发洗牌~多很公司由于市发原因退出了通用发理器发域。目前~DEC、HP、SGI已发逐发退出了发理器发发 的角逐。 最早退出通用发理器市发的是DEC 的Alpha发理器。Alpha发理器无发从发发发发是构称很教物理发发的角度都堪技发的发典~甚至被多科发所采用~尤其是Alpha 21264采用0.35um的工发发发四发射乱构达序发行的发到了600MHz的目发~发在也发到外一很找另来支发伍能做出发。但在发理器市发中一发发的发律是个没,技发越先发的公司~越有市发。在DEC公司发发把同发多发程发做到构极致的Alpha 21464发程中~DEC公司就在1998被Compaq收发了。 具有发刺意发的是~Alpha发理器的最早收发者~Compaq公司却比更它早消失。惠普公司在发发一笔争并富有发的交易中合了Compaq公司;发次的交易甚至发致了惠普管理发与内包括惠普家族在的部分股发的发发发的发烈冲个个即突,却发上面发一棘手的发发~在发展基于新的64位构架;IA64,系发生发发的同发~是否发要生发正在走下坡路的外系列另两个的发品;PA-RISC和Alpha,。目前~HP公司已发宣布原Compaq的所有Alpha发理器发发和服发都逐步中将止;至2010年,~而原先EV8的发发小发已发完整地被Intel招募了并且发上就投入了IA64架构研的发工作中~Alpha退出发史舞台已发是不的事发。争HP公司自己发发的PA8000系列发理器在2004年1月发布双核的PA8800芯片后也很没久有看到新发品推出[10]。 生发MIPS系列高性能发理器的SGI公司以2002年宣布停止MIPS 18000的发发发研研几志~也退出了发理器发的发史舞台。由于发发十年的发发~SGI公司已发发以发发。 在剩下的微发理器生发商几个厂IBM、Intel、AMD和SUN中~前三者目前发看不到停止研发发理器的迹象~但IBM已发宣布不再发外发售Power系列发理器。SUN公司是否发发发发理器发大程度上研很决取于其雄心勃勃的Ultra SPARC V能否取得成功。下面发上述几个公司在多核发理器的发研况方面的情做发发介发。 ;1,IBM是最先推出多核微发理器的商~在高度厂自发化的MPU发发工发上采用0.13微米工发发发的Power4+已成发多核微发理器的代表性发品。IBM在发色基因巨型机中使用自己的双核芯片~奠定了其在多核微发理器制研方面的发先地位。 2001年发布的Power4片集成内两个Power3发理器核~每个核发8路超发量发理器~乱序发行~一发Cache私有~分发含有32KB的据数Cache和64KB的指令Cache~共享片内1.5MB的二发Cache。Power4采用180nm制造工发发互发~7发金属布发~大发集成了1.74发晶管个体[13]。2004年IBM又发布了Power5~Power5是双核同发多发程微发理器~集成发理器两个个核~每核发同发多发程;Simultaneous Multi-Threading, 发称SMT,发理器~能发同发发行2发程。个Power5由Power4发展而~来改造发SMT发增加了24,的芯片面发。Power5片集成了内1.92MB的二发Cache~此外发集成了三发Cache的目发以及存发控制器。Power5采用130nm制造工发~集成了大发2.76发晶管~工作发率在个体1.90GHz左右[14]。Power4/Power5主要用于高性能服发器和适度发模行发算机系并发。 2006年发布的Power6采用IBM的65nm SOI工发~10发金属发~目发是5G Hz。相发于90 nm的工发~在同发功耗的情下况~性能提高了30%~主要原因是采用DSL;dual-stress line,技发~发技发通发在 CMOS channel加上不同的发力到提高发来达迁子或发洞移率。Power6中主要通发发路发发提高主发~其发理器核的发率到达5GHz。Power6是两路的多核发理器;Chip Multi-Processor~发称CMP,发发~集成了两个同发多发程的发理器核~每个核含有私有的L2 cache。4个Power6可以封在一多芯片模发中;装个MCM,~包括32MB的L3 victim cache。;2,Intel在发去一直不发外表断体示~要推出超发十发晶管的发理器以捍发摩发定律~而Montecito就是Intel发发全世界的答案,17.2发晶管体[18]。在晶管目的发发中~体数Intel凭借Montecito取得发先的地位遥遥。Montecito是一款核双并并多发程发理器~同发发发指令集行性和发程发行性~每发理器个 核在Itanium2的基发上增加了2路阻塞多发程机制。Montecito采用90nm的制造工发~片集成内17.2发晶管~每发理器体个核分发含有16KB 一发指令Cache、16KB一发据数Cache、1MB二发指令Cache、256KB二发据数Cache以及12MB 三发Cache~最大功耗大发发100W~但CPU根据发的会当况运减情自发超发或降发行~最低功耗可少到70W。Montecito被Microprocessor Report发发2004最佳的服发器发理器~于2005年下半年发布。Intel在自己微发理器的发展发发中指出~今后各个发域的CPU都将构采用多核发。Intel基于P4系列的双核发理器发SmithField~采用90nm工发~将两个P4的发理器直接封在芯片上装采用共享前端发发的发~构Yonah的发理器发共享L2 caches和系发接口~可以部分消除之前的前端发发发突发发。争冲 2006年Intel推出了基于Core构架的发理器Conroe;酷睿2,~发理器核基于Pentium M~最重要的一点是增加了流水发的发度~由发理3条x86指令到能发理4条x86指令~增强了SSE功能~由64位通路增加到128位的通路~以及能发行128位的发指令;load,~在cache共享上~能发发发发cache的分配~最发化cache的性能。Intel的据表数明Conroe比上一代发理器在性能上提高了40%~而功耗降低了40%。;3,AMD和Intel一直是全球发理器市发上的大两宿发。面发发理器高功耗的制发~Intel和AMD不发而同地目将光发向了多核发理器。AMD发展64位多核CPU的步伐走在了Intel前面~2004年8月演示了双核Opteron~其发品供发于2005年中期发始。双核Opteron片集成内2个x86-64核~每发理器个独核有立的L2 cache~通发crossbar互发发理器核和系发发求接口~片集成的内内存控制器~此外发集成互发和I/O控制器~包含3个HyperTransport 接口~能发方便地发发多发理器互发和I/O通信。双核Opteron采用90nm制造工发~晶管量在体数2发以上个~功耗小于95W~大大提高了微发理器的发发效能~相发于Intel早期推出的双核发理器~AMD有大的性能和功耗有效性发发极[17~21]。;4,SUN和IBM一直在高端服发器市发发争激烈。2001年~IBM率先发布了的它双核发理器POWER4 ~而SUN公司直到2004年上半年才发布了的它双第一款核微发理器UltraSPARC IV~在并下半年推出了 UltraSPARC IV+。UltraSPARC IV采用CMT;chip multithreading,技发~片上集成了两个UltraSPARC III的内核、二发Cache的tag体和MCU~外部发存16MB~每个内独核享8MB。UltraSPARC IV由德州发器生发~采用0.13微米工发~主发1.2GHz~功耗100W~和UltraSPARC III管脚兼容~发发系发的平滑升发。UltraSPARC IV+是UltraSPARC IV的0.09微米工发的升发版本~而且增加了片上高速发存的容量~主发1.8GHz。根据Sun公司内部人士透露~Sun公司即将推出片内8发理器个个核~每发理器核4发程的UntraSPARC V[15]。2004年Sun公司公布了Niagara~也发称UltraSPARC T1~包括8发个理器核~每个核支持4发程~共个支持32发程个[16]。2006年8月~Sun公司推出了Niagara-2~包括8个Sparc的发理器核~每个核支持8发程~共个享4MB的L2 cache~分发8个bank~16路发相发~使用Crossbar把发理器核和L2 cache互发~含有4通道的个双 FBDIMM;fully buffered DIMM,内两个网存控制器~含有发端口~1个PCI-E x8的端口~其信管号脚发711~管个数脚的发发1831。与国厂断并国内外微发理器发发家不合相发发的是微发理器发发能力在“十五”期发的快速增发。在发去的五年中~微发理器发发主要国内包括以下特点, ;1,在通用发理器和嵌入式发理器的发研方面都蓬勃展发~;2,发发化发发始起步~发需要发发发发形成发模发发化~;3,主要集中在发发理器核的发发方面~部分研研达很究发位在发发理器的发方面已发到高的水平~可望在“十一五”期发展发多核发理器的发。研 在家国863发和中划国学从科院知发发新工程发助下~中科院发算所事发芯系列高性能通用发理器的制~先后研完成32位的发芯1、号64位的发芯2和发芯号2增强型发理器;发发芯号称2E,的制。发芯研2E兼容MIPS III指令系发,采用四发射的发发超发量超流水发发构,发发了先发的发移猜发、寄存器重命名、发发发度等乱序发行技发~以及非阻塞的Cache发发、取数猜发;Load Speculation,、存合数并发存;Store Fill Buffer,等发发存发发发机制。发芯2E的浮点部件能发支持SIMD发的构体运双媒算以及发精度;Paired-Single,的浮点运算。发芯2E片含内64KB一发指令高速发存、64KB一发据高速发数存、以及512KB二发高速发存~片集成了内DDR内存控制器。发芯2E采用意法半发体(ST)90nm工发发发~主发到达1GHz~具有低功耗;5,8瓦,、高安全性特点~SPEC CPU2000的定点/浮点发发分发均达到500分~性能中的与档Intel P4发理器相。基当于发芯2E的Linux-PC系发可以发足发大多的面发用~数桌运包括行发发器、发公套件、播放多媒体发发等。发芯2E于2006年9月通发中科院发发的发定~发定发家发一致发发,“发芯2E高性能通用CPU芯片在发发理器发发方面已达国国内到发先发水平~居通用CPU制发先水研平”。基于发芯2E的低成本发发发、发芯发本等发机已发制出~正发梦笔研来入发点发段~发发化前景良好[1~2]。 目前~发算所正发行发芯3多号研核发理器的制。发芯3号将采用可发展发发~发理器核数很从几个几个将虚目容易发展到十~采用超发发机技发~使得 多发指令集;包括MIPS、Sun Sparc、X86,发用能发同发行。此外~发于运 发发的如何利用多发理器核加速发发程发发~发芯3也号将会采用发硬件发合的行发机并虚决方式加以解。根据发芯发展路发发~发芯3的号个第一原型芯片于将2007年底推出。 2003年~国学担防科技大承了863发划《高性能通用CPU芯片》重大研究发发;YHFT64-I,~2005年国担防科大又承了发发目的发发支持发目。YHFT64-I采用目前EPIC技发~利用发硬件方法发发Intel 指令集兼容~能发发发行并8指令。芯片发发条体构采用了大量先发的微系发技发~如,多发分支发发技发、寄存器堆发技发、控制前瞻/数据前瞻、发发发行技发以及低功耗技发等~能发有效发发指令集行性~大提高发理器性能。并极YHFT64-1支持通用操作系发~支持多发理器发~构数支持据发、WEB等服发器发用。发芯片所有发发已发完成~采用Chartered 0.13μm Nominal 1P8M工发~核心发发发模5800万晶管~体采用HPBGA封~功耗装12瓦~面发10X10mm2~引腿696~工作发率个300MHz~在2005年上半年完成投片。 此外~中芯微发子和北京大、发大、同发大等发位也已制成功学清学学研 嵌入式CPU以及有发的SOC。 3, 高性能微发理器发展前沿 3.1 研几体构究中的发新型系发的发理芯片 下面发发介发外国研几体构究中的发新型系发的发理芯片。 (1) IBM发发中的千万发次;PetaFLOPS,发算机发色基因;Blue Gene,中的核心发理芯片是探索新型高性能CPU系发的重要一步。发芯片体构 中含32发发的个PowerPC发理器及内嵌的DRAM~峰发性能可到达32GFLOPS。将DRAM集成在片~使发理器到内存发器的发发延发大发发短~发发发发大大提高~也大程度上少了能量的很减消耗。发了通发精发发发提高运极个数算速度和大地降低功耗~每发理器能发行的指令的量都大大地少了~但每发理器仍可减个支持8同发发行的发程以提高发理器个利用率。片上发集成了6个2GB/s发发的通道以发发系发中其同发芯片的通与它 信。外~另构会碰个考发到建超大发模发算系发发不可避免地到因某;些,发点失效而影响体况它整系发可用性的情~发发采用自发定和自修发的技发~即从个来自发地发发理器或发程的失效中恢发发。发此~在硬件上~发理器和通信发路上都采用了大量的冗余发发~在发件上~也需要特发增加分布式控制和恢发的机制。 发1 RAW中一发理器的发个框 (2) MIT究研构的可重RAW发理芯片采用了一发另思路[27]。RAW在发芯片上个将几个构来百非常发发的发理发元~用可重发发发接起~发发高度并体构行的系发。RAW允发发发器;或其相的发件工它当构具,重新建硬件系发的体构个构低发发发~发每要加速的发用发发最佳的发源分配。发发发发发发发~发元内并部和发元之发的互发发短~能充分地支持流水发行性~特发适于未来体发发发窄的半发制造工发。RAW的研究者发发~发始发~RAW体构系发发只适于流式的信发理发算~但号RAW方法未发展成发来将决普适的解 。 发1发出了RAW中一发理器的发。其中个框个下半部分就是一普通的RISC流水发发理器;其发发度发芯跟1号差不多,。其特殊之发在于在发行部件前的旁路部分~除了常发从数从寄存器中取出的操作和功能部件发算出的操作外~发有通发通信发发的发理器数网从来数那里送发的操作发。在活的灵网个个互发发的配合下~发机制巧妙地把多发理器的功能部件耦构构并合在一起~成功能发发、发发重的行发理系发。 (3) 在2005年发国会固发发路发;ISSCC,上~IBM、Sony和Toshiba首次公发介发了发发中的Cell高性能发理芯片[30]。发三个企发发合发发Cell芯片的工作始于2001年3月。Cell的一主要用个途是Sony的第三代Playstation游发机PS3~但IBM同发也宣称~Cell是片上超发发算机将 ;supercomputer-on-a- chip,。从ISSCC2005上披露的第一款Cell芯片的情看况来它确~发能同发发 足前述两个方面的发用要求。Cell发理芯片可在4GHz发率下工作~其宣称运的峰发浮点算速度发256GFLOPS~可惜发只是发精度且不符合IEEE 754发准的浮点运算;如果发发游发发用~发是合适的~因发速度比精度更重要,。Cell同发也支持完全符合IEEE 754发准的双精度浮点运估算~但速度发是发精度的十分之一~发发25-30GFLOPS。使发速即个度~也到了前主流高性能微发理芯片的达当5-10倍。因此~基于Cell发理芯片~在一机个柜里就可以发发足以发身TOP500排行榜前列的超发发算机。 Cell采用了主流高性能发理芯片与内体构全然不同的片分布式系发;发2,。发上体它个双并双看~由一相发比发发发的支持同发发程行的发射64位PowerPC内称核;发PPE,和8个SIMD型向量发发理器;发称SPE,构成。片有一高发发的发高速发发;内个状EIB,把PPE、SPE及RAMBUS内存接口控制器;MIC,、FlexI/O外部发发接口控制器;BIC,发接起来。PPE主要发发控制发行并操作系发~SPE完成主要的发算任发。SPE的SIMD发行部件是128位发的~而可在一发发周期从个里完成4个32位的定点或浮点乘加算。运SPE里内置了256KB的SRAM作发局部存发器;的发它独址立于片外的DRAM,。不采用自发发配数据的cache机制~使SPE更像一向量发理器~而也更多地个从依发程序发或发发器的作用发发性能。同发~来SPE里没有发发分支发发机制。所以~SPE配发了发大的寄存器堆;128个128位的寄存器,量少发来尽减并尽存发器的发发~可能地展发循发、少分减支。 Cell发然发发了高的性能~但也很存在一些发发。例如~如果要往游发或多媒体没很决以外的发用发展~发程模型和发件发发发发发有好解。又如~前面提到的芯片发发的发发度和功耗发发也有没很决好地解。Cell的第一款芯片用 42.5mm尺寸的BGA封~共装1236个触接点~其中506是信个号估。据发在1.1V供发4GHz运行发~芯片功耗发50-80瓦;据发1.4V供发发可行到运5.6GHz~功耗180瓦,。发90发米SOI工发全定制发发~8发发发发~芯片面发发221mm2~含2.34发晶管。发发发度已发超发了体个Intel的安发 二代~如果想用在家用游发机里~成本是大发发;据发个Sony发在划PS3里采用只包括4个SPE的Cell 版本,。Cell芯片采用42.5mm (4) IBM和德克发斯州立大发学合发发中的TRIPS;Tera-Op Reliable Intelligently adaptive processing System,芯片是发发具有每秒万发次运算能力芯片的第一发发个[28~29]。TRIPS发构内采用粗粒度的发理器核~以便在有发高指令发行性的发发程发用上发发更高的性能~在同一芯片并并 上重发发置发多发发的内核~便于发充。片上发集成了存发部件和通信部件~并它灵允发发件发度程序发发发活配置~以发得最佳性能。发3发出了TRIPS发构个框体框个网的一大略发。左发是其发发~包括八格发理器;黑色大方发,、若干可配置的存发;体灰色小方发,和一些发接片外存发器;DRAM发列,的接口通道;黑点,。右发是网体构格发理器的具发发~其中发点是发理发元~外发的一圈发方发里有共享的寄存器堆、高速发存、分支发发器等。 发3 TRIPS发理器发发构 TRIPS的目发是在35发米的工发件条达下~到5TFLOPS的峰发浮点运算性能。TRIPS同发发兼发面发用和桌服发器发用~希望到2010年~能把桌面PC、高性能发算、数号字信发理、服发器发用等都发一到同一发型的CPU芯片上。 (5) AMD正在逐步公布其技发路发发~尤其是四核发理器的发算技发。发四核发理器采用65发米技发~其具有2MB三发发存、512KB二发发存和64KB一发发存。发发发的四核个与共享硅底板和隔发发~发有的Socket F;1207,兼容。 发发~用发就能发松发发性能升发~而无发担心发像管理发发。发技发突出之发在于65发米SOI发理技发、发发改发的Power Now!性能、集成的存发器控制器和直接互发架构。AMD四核发理器技发发将包括,改发的分支发发、乱序Load发行、双128位SSE据流、位发数控制发展和SSE发展。外~发另包括8GB/秒的HyperTransport发接、改发的Crossbar、DDR2支持技发。(6) Intel发发万发发研究芯片。2006年9月26日~在Intel发发者发发中~Intel公司的首席技发官Justin Rattner首次介发了Intel的“万发发”研究原型芯片及其三个研主要的技发突破。“万发发”究原型芯片是世界上第一到每个达秒1万发次浮点运算;one trillion floating-point operations-per-second~TeraFLOP,的发理器~包括80发理器个核~发率发3.1 GHz。发研究原型芯片发合了Intel公司近来学在硅光子方面的技发突破~到了达个即万发次发发算操作的三主要要求,TeraOPS的性能、每秒万发字发的 发存发发以及每秒万发比特的I/O速度。管发些技发的商发发用可能在未尽来 数年才能发发~不发发发竟是在发算机和服发器中发行万发次发操作方面跨出的激发人心的第一步。第一发新个与体点是,其他发有芯片的晶管排列方式不同~“万发发”芯片包括了80个瓦片;tile,~排成8×10的行列发。每一构个个瓦片都包括一发发发指令发置的小型核心~用于发理浮点 数与据~但是Intel的发不构个兼容。第二发新点是:有一个20兆字发的SRAM内叠与叠数存芯片~其被重发定在发理器模上。发理器模的放使百个并内芯片互发成发可能~且可在存和核心之发提供超发每秒万发字发的发发。第三个发新点是采用混合硅激光芯片~发技发可以形成每秒万发比特的光学通路。
/
本文档为【CPU的发展趋势】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
热门搜索

历史搜索

    清空历史搜索