![chp5-4_流水線1_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/7/e7f02a9c-45ee-4a94-be62-08480930bc9e/e7f02a9c-45ee-4a94-be62-08480930bc9e1.gif)
![chp5-4_流水線1_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/7/e7f02a9c-45ee-4a94-be62-08480930bc9e/e7f02a9c-45ee-4a94-be62-08480930bc9e2.gif)
![chp5-4_流水線1_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/7/e7f02a9c-45ee-4a94-be62-08480930bc9e/e7f02a9c-45ee-4a94-be62-08480930bc9e3.gif)
![chp5-4_流水線1_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/7/e7f02a9c-45ee-4a94-be62-08480930bc9e/e7f02a9c-45ee-4a94-be62-08480930bc9e4.gif)
![chp5-4_流水線1_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/7/e7f02a9c-45ee-4a94-be62-08480930bc9e/e7f02a9c-45ee-4a94-be62-08480930bc9e5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、1第五章 中央處理器返回2第五章 中央處理器5.1CPU功能和組成5.2指令周期5.3時序產(chǎn)生器5.4微程序控制器及其設(shè)計5.5硬布線控制器及其設(shè)計5.6傳統(tǒng)CPU5.7流水CPU5.8RISC的CPU5.9多媒體CPU35.6 傳統(tǒng)傳統(tǒng)CPU5.6.1Intel 80885.6.2 IBM37045.6.1Intel 8088lIntel 8088l1979年l16位55.6.2 IBM370lIBM370 CPUl1972年l32位lALU的三個功能部件l寄存器結(jié)構(gòu)lCPU控制狀態(tài)l管態(tài)l目態(tài)65.7 流水流水CPUlEnslow統(tǒng)計過:l19651975間,反映器件性能級延遲大約為原來的
2、1/10,而反映計算機系統(tǒng)性能之一的平均指令時間為1%。l結(jié)論:同一時期計算機系統(tǒng)性能比器件性能提高的速度快得多l(xiāng)促使計算機性能提高的因素除了器件性能得提高外還有哪些呢?75.7 流水流水CPU5.7.1并行處理技術(shù)5.7.2流水CPU的結(jié)構(gòu)5.7.3流水線中的主要問題5.7.4 Pentium CPU85.7.1并行處理技術(shù)并行處理技術(shù)l并行性(Parrelism)概念l問題中具有可以同時進行運算或操作的特性l例:在相同時延的條件下,用n位運算器進行n位并行運算速度幾乎是一位運算器進行n位串行運算的n倍(狹義)l(廣義)含義l只要在同一時刻(同時性)或在同一時間間隔內(nèi)(并發(fā)性)完成兩種或兩種
3、以上性質(zhì)相同或不同的工作,他們在時間上相互重疊,都體現(xiàn)了并行性95.7.1并行處理技術(shù)并行處理技術(shù)l三種形式l時間并行(重疊):讓多個處理過程在時間上相互錯開,輪流使用同一套硬件設(shè)備的各個部件,以加快硬件周轉(zhuǎn)而贏得速度,實現(xiàn)方式就是采用流水處理部件l空間并行(資源重復(fù)):以數(shù)量取勝l它能真正的體現(xiàn)同時性lLSI和VLSI為其提供了技術(shù)保證l時間+空間并行l(wèi)Pentium中采用了超標(biāo)量流水線技術(shù)105.7.2流水流水CPU的結(jié)構(gòu)的結(jié)構(gòu)l流水計算機的系統(tǒng)組成存儲器體系:主存采用多體交叉存儲器;Cache流水方式CPU:指令部件、指令隊列、執(zhí)行部件指令流水線指令隊列:FIFO執(zhí)行部件:可以有多個采用
4、流水線方式構(gòu)成的算術(shù)邏輯部件構(gòu)成,可以將定點運算部件和浮點運算部件分開。115.7.2流水流水CPU的結(jié)構(gòu)的結(jié)構(gòu)l流水線CPU時空圖lIF(Instruction Fetch取指) lID(Instruction Decode指令譯碼)lEX(Execution執(zhí)行) lWB(Write Back寫回)125.7.2流水流水CPU的結(jié)構(gòu)的結(jié)構(gòu)流水CPU非流水CPU135.7.2流水流水CPU的結(jié)構(gòu)的結(jié)構(gòu)145.7.2流水流水CPU的結(jié)構(gòu)的結(jié)構(gòu)具有兩條以上的指令流水線上圖中流水線滿載時,每一個時鐘周期可以執(zhí)行2條指令采用時間和空間并行技術(shù)155.7.2流水流水CPU的結(jié)構(gòu)的結(jié)構(gòu)l流水線(Pipe
5、lining)的分類l按級別分為l指令流水線l算術(shù)流水線l處理機流水線(宏流水線)165.7.3流水線中的主要問題流水線中的主要問題l瓶頸問題(流水線中有速度慢的段)l再分成幾個段l用資源重復(fù)的方法也可以解決l資源相關(guān):多條指令進入流水線后在同一時鐘周期內(nèi)爭用同一功能部件。l解決辦法:后邊指令拖一拍再推進;增設(shè)一個功能部件175.7.3流水線中的主要問題流水線中的主要問題 數(shù)據(jù)相關(guān)例:兩條指令發(fā)生數(shù)據(jù)相關(guān)沖突RAW(Read After Write)ADD R1,R2,R3R2+R3-R1SUB R4,R1,R5R1-R5-R4AND R6,R1,R7R1R7-R6185.7.3流水線中的主要
6、問題流水線中的主要問題l數(shù)據(jù)相關(guān)lRAW(Read After Write)后面指令用到前面指令所寫的數(shù)據(jù)lWAW(Write After Write)兩條指令寫同一個單元在簡單流水線中沒有此類相關(guān),因為不會亂序執(zhí)行l(wèi)WAR(Write After Read)后面指令覆蓋前面指令所讀的單元在簡單流水線中沒有此類相關(guān)l解決辦法:可以推后后繼指令對相關(guān)單元的讀操作設(shè)置相關(guān)的直接通路(Forwarding)19【例4】流水線中有三類數(shù)據(jù)相關(guān)沖突:寫后讀(RAW)相關(guān);讀后寫(WAR)相關(guān);寫后寫(WAW)相關(guān)。判斷以下三組指令各存在哪種類型的數(shù)據(jù)相關(guān)。(1)I1 ADD R1,R2,R3 ;(R2)
7、+(R3)-R1 I2 SUB R4,R1,R5 ;(R1)-(R5)-R4(2)I3 STO M(x),R3 ;(R3)-M(x),M(x)是存儲器單元 I4 ADD R3,R4,R5 ;(R4)+(R5)-R3(3)I5 MUL R3,R1,R2 ;(R1)(R2)-R3 I6 ADD R3,R4,R5 ;(R4)+(R5)-R3解:l第(1)組指令中,I1指令運算結(jié)果應(yīng)先寫入R1,然后在I2指令中讀出R1內(nèi)容。由于I2指令進入流水線,變成I2指令在I1指令寫入R1前就讀出R1內(nèi)容,發(fā)生RAW相關(guān)。l第(2)組指令中,I3指令應(yīng)先讀出R3內(nèi)容并存入存儲單元M(x),然后在I4指令中將運算結(jié)
8、果寫入R3。但由于I4指令進入流水線,變成I4指令在I3指令讀出R3內(nèi)容前就寫入R3,發(fā)生WAR相關(guān)。l第(3)組指令中,如果I6指令的加法運算完成時間早于I5指令的乘法運算時間,變成指令I(lǐng)6在指令I(lǐng)5寫入R3前就寫入R3,導(dǎo)致R3的內(nèi)容錯誤,發(fā)生WAW相關(guān)。205.7.3流水線中的主要問題流水線中的主要問題l控制相關(guān)l引起原因:轉(zhuǎn)移指令l解決辦法:延遲轉(zhuǎn)移法,轉(zhuǎn)移預(yù)測法215.7.3流水線中的主要問題流水線中的主要問題225.7.4 Pentium CPUlPentium CPU (第一代)l1989年初0.8um工藝,310萬晶體管l有60M和66MHz外頻兩種版本l5V電壓,功耗20Wl
9、超標(biāo)量流水線結(jié)構(gòu)l486有一條流水線lPentium有U和V兩條指令流水線U流水線可以執(zhí)行所有的整數(shù)和浮點指令V流水線可以執(zhí)行簡單的整數(shù)和FXCH浮點指令l雙重分離式Cache,減少了等待和搬移數(shù)據(jù)時間l32位CPU,外部數(shù)據(jù)總線寬度為64位,外部地址總線寬度為36位235.7.4 Pentium CPUl非固定長度指令格式,9種尋址方式,191條指令,兼具有RISC和CISC特性,不過我們還是將其看成CISClSL電源管理技術(shù)l提供了更加靈活的存儲器尋址結(jié)構(gòu),可以支持傳統(tǒng)的4k大小的頁面,也可以支持4M大小的頁面l動態(tài)轉(zhuǎn)移預(yù)測技術(shù)lPentium結(jié)構(gòu)圖lMESI(Modified Exclu
10、sion Share Invalid)lBTB(Branch Target Buffer)lTLB(Translation Lookaside Buffer)24255.8 RISC CPUl特點l(采用流水線技術(shù))l簡單而統(tǒng)一格式的指令譯碼;l大部分指令可以單周期執(zhí)行l(wèi)只有LOAD/STORE可以訪問存儲器l簡單的尋址方式l采用延遲轉(zhuǎn)移技術(shù)l采用LOAD延遲技術(shù)l三地址指令格式l較多的寄存器l對稱的指令格式l其他。(見書)265.8 RISC CPUl實例 MC88110lCPU結(jié)構(gòu)框圖(見下圖)l12個執(zhí)行功能部件l3個Cache(指令,數(shù)據(jù)和目標(biāo)指令)l兩個寄存器堆(通用寄存器堆、擴展寄
11、存器堆)l六條80位寬的內(nèi)部總線27MC88110 CPU結(jié)構(gòu)框圖結(jié)構(gòu)框圖28MC88110的指令流水線的指令流水線l超標(biāo)量流水線CPUlF&D:取指和譯碼段需要一個時鐘周期,lEX:執(zhí)行段,大都只需要一個時鐘周期,lWB:寫回段,只需要時鐘周期的一半l采用了直接通路(Forwarding)技術(shù)F&DEXWB29l指令動態(tài)調(diào)度策略l按序發(fā)射l取兩條指令,配對發(fā)送,一個周期可以有兩條指令執(zhí)行完畢l如下圖:30l第一條指令由于資源相關(guān)或數(shù)據(jù)相關(guān),則這兩條指令都不發(fā)射l若第一條指令能發(fā)射,第二條不能發(fā)射,只發(fā)射第1條指令到EX段,第二條指令等待并新取一條指令與之配對等待發(fā)射315.8 RISC CP
12、Ul幾個問題:l怎樣判斷能否發(fā)射呢?l可以采用計分牌的方法l如何保證按序完成?lFIFO指令隊列l(wèi)如何對待控制相關(guān)(轉(zhuǎn)移指令)?l采用延遲轉(zhuǎn)移法和目標(biāo)指令cache法325.8 RISC CPUl計分牌:l計分牌是一個位向量、每一位對應(yīng)寄存器堆中的一個寄存器。l指令發(fā)射時,目的寄存器在計分牌中相應(yīng)位為1;寫回后清0l判斷指令可否發(fā)射的條件是:l該指令的所有目的寄存器、源寄存器在向量位中對應(yīng)的位都為0l否則,等待這些位清除335.8 RISC CPUlFIFO隊列l(wèi)FIFO隊列稱為歷史緩沖器,每當(dāng)一條指令發(fā)射后,副本傳入FIFO隊列隊尾l只有當(dāng)前面的指令執(zhí)行完畢,才到達隊首,l執(zhí)行完畢后,離開隊
13、列345.8 RISC CPUl延遲轉(zhuǎn)移法l可選l如果采用延遲轉(zhuǎn)移選項,則轉(zhuǎn)移指令后的轉(zhuǎn)移延遲時間內(nèi)指令被發(fā)射l否則,指令照常發(fā)送l指令Cache(TIC)法l是一個32位的全相聯(lián)Cache,用來保存轉(zhuǎn)移路徑的前兩條指令355.8 RISC CPUl例5 超標(biāo)量流水線結(jié)構(gòu)如下365.8 RISC CPUI1LDA R1,AI2ADDR2,R1I3ADDR3,R4I4MULR4,R5I5LDAR6,BI6MULR6,R7l畫出按序完成各段推進情況圖l畫出按序完成流水線時空圖RAWWARWAW375.8 RISC CPUI6385.8 RISC CPU395.9 多媒體多媒體 CPUl多媒體概念l
14、指利用計算機來綜合、集成地處理文字、圖形、圖象、聲音、視頻、動畫等媒體,從而形成的一種全新的信息傳播和處理的計算機技術(shù)。主要特征:l信息表示的數(shù)字化l處理的集成性l系統(tǒng)的交互性405.9 多媒體多媒體 CPUl主要技術(shù)問題l壓縮和解壓縮技術(shù)l靜態(tài)640*480的256色圖象約占640*480*1B=307200B300K640*480的24Bit彩色圖象約占640*480B*3=921600B=900Kl動態(tài)每秒鐘30楨(播放256色)則每秒鐘處理300K*30=9M,而ISA總線的傳輸率只有5MBPSl結(jié)論:多媒體信息量大,給信息處理和傳輸帶來了困難415.9 多媒體多媒體 CPUl解決方法
15、:壓縮技術(shù)JPEG(Joint Photographic Experts GroupMPEG(Moving Picture group)軟件技術(shù)多媒體OS多媒體處理軟件硬件技術(shù)MMX(多媒體擴展技術(shù))動態(tài)執(zhí)行技術(shù)425.9 多媒體多媒體 CPUlMMX(多媒體擴展技術(shù))lMMX是Intel為增強處理器的多媒體能力而提出的解決方案,它是57個多媒體指令集合。這些指令是為高效地處理視頻、聲音和圖形數(shù)據(jù)而專門設(shè)計的lIntel使用SIMD(單指令流,多數(shù)據(jù)流)過程來實現(xiàn)這些多媒體指令。435.9 多媒體多媒體 CPUl多媒體和通信應(yīng)用中經(jīng)常使用重復(fù)運行的循環(huán),這些循環(huán)只占程序代碼的10%或更少,卻要
16、占用多達90%的執(zhí)行時間。lSIMD允許一條指令在多個數(shù)據(jù)上進行相同的操作。由于循環(huán)是打亂CPU內(nèi)部流水線,降低CPU執(zhí)行效率的一個重要因素,lMMX指令,減少了循環(huán),能大大提高原來存在大量計算性循環(huán)的視頻、聲音和圖象等多媒體應(yīng)用的性能。445.9 多媒體多媒體 CPUlMMX指令處理的數(shù)據(jù)類型稱作分組數(shù)據(jù)(packet data),每個分組數(shù)據(jù)總是64位的。l8個字節(jié)l4個16位字l2個32位雙字l一個64位數(shù)據(jù)455.9 多媒體多媒體 CPUlMMX一次可以計算64位數(shù)據(jù),而Intel處理器上的通用寄存器是32位的,因此它借用浮點運算器80位的寄存器來存放數(shù)據(jù)。l雖然借用了浮運算器的寄存器
17、,但數(shù)據(jù)的處理或運算并不是在浮點運算器中進行,而是在專門的整數(shù)處理單元中進行。l8個80位的浮點數(shù)據(jù)寄存器,在進行浮點運算的時候ST0ST7l在進行MMX運算的時候,MM0MM1l從總體上說,MMX指令屬于整數(shù)指令。(但是這個整數(shù)指令可以處理圖像、圖形、音頻、通訊、信號處理等其他功能)465.9 多媒體多媒體 CPUlMMX指令的先進性體現(xiàn)在以下五個方lSIMD結(jié)構(gòu) l飽和運算方式 l積和運算方式l比較指令l轉(zhuǎn)換指令475.9 多媒體多媒體 CPUlSIMD結(jié)構(gòu):l利用CPU64的帶寬,一次可以并行處理8個8位數(shù)據(jù),或4個16位數(shù)據(jù)等l飽和運算:l在運算結(jié)果最大值,按最大值計算l運算結(jié)果byt
18、e,dword-word525.9 多媒體多媒體 CPUl下面以PACKSSDW來說明:l將64位有符號源操作、和64位有符號目的操作數(shù),緊縮成64位有符號數(shù)。l帶有飽和操作,如果超出范圍,則為FFFFHl轉(zhuǎn)換指令廣泛用于矩陣的行列轉(zhuǎn)換 535.9 多媒體多媒體 CPUl解緊縮指令lPUNPCKHBW,WD,DQl交錯放置兩數(shù)的高位lbyte-word,word-dword,dword-qwordlPUNPCKLBW,WD,DQl交錯放置兩數(shù)的低位lbyte-word,word-dword,dword-qword 545.9 多媒體多媒體 CPUl由于使用了浮點數(shù)寄存器,Intel的Penti
19、um MMX在切換執(zhí)行浮點指令和MMX指令之間有一個狀態(tài)轉(zhuǎn)換過程,該過程大約要50個時鐘周期。因此如果大量混用MMX指令和浮點指令,會降低CPU的執(zhí)行效率。555.9 多媒體多媒體 CPUl動態(tài)執(zhí)行技術(shù)l通過預(yù)測程序流來調(diào)整指令的執(zhí)行,分析程序的數(shù)據(jù)流來選擇指令執(zhí)行的最佳順序l涉及數(shù)據(jù)相關(guān)性、指令調(diào)度法、轉(zhuǎn)移預(yù)測法、指令的發(fā)射順序和完成順序等流水技術(shù)l適合MMX指令的加速執(zhí)行 l實現(xiàn)的關(guān)鍵技術(shù):l取消“取指”、“執(zhí)行”的時間順序,采用指令緩沖池l允許執(zhí)行單元在一個較大的范圍內(nèi)調(diào)遣和執(zhí)行可以譯碼過的指令返回56核心結(jié)構(gòu)示意圖看下圖核心結(jié)構(gòu)示意圖看下圖返回57l取指/譯碼單元:l從指令cache取
20、指,l3個并行譯碼IDl調(diào)遣/執(zhí)行單元:l從數(shù)據(jù)cache接受數(shù)據(jù)流,依數(shù)據(jù)和資源的相關(guān)性規(guī)劃微操作的執(zhí)行,并暫存推測執(zhí)行的結(jié)果。l回收單元:l找出那些已被執(zhí)行完的微操作,并按原始順序?qū)λ鼈冎匦屡判颍丛樞蛑饌€回收。5.9 多媒體多媒體 CPU返回58第五章小結(jié)第五章小結(jié)lCPU是計算機的中央處理部件,具有指令控制、操作控制、時間控制、數(shù)據(jù)加工等基本功能。早期的CPU由運算器和控制器兩大部分組成。隨著高密度集成電路技術(shù)的發(fā)展,當(dāng)今的CPU芯片變成運算器、cache和控制器三大部分,其中還包括浮點運算器、存儲管理部件等。lCPU中至少要有如下六類寄存器:指令寄存器、程序計數(shù)器、地址寄存器、數(shù)據(jù)
21、緩沖寄存器、通用寄存器、狀態(tài)條件寄存器。CPU從存儲器取出一條指令并執(zhí)行這條指令的時間和稱為指令周期。CISC中,由于各種指令的操作功能不同,各種指令的指令周期是不盡相同的。劃分指令周期,是設(shè)計操作控制器的重要依據(jù)。返回59第五章小結(jié)第五章小結(jié)lRISC中,由于流水執(zhí)行,大部分指令在一個機器周期完成。時序信號產(chǎn)生器提供CPU周期(也稱機器周期)所需的時序信號。操作控制器利用這些時序信號進行定時,有條不紊地取出一條指令并執(zhí)行這條指令。l微程序設(shè)計技術(shù)是利用軟件方法設(shè)計操作控制器的一門技術(shù),具有規(guī)整性、靈活性、可維護性等一系列優(yōu)點,因而在計算機設(shè)計中得到了廣泛應(yīng)用。但是隨著ULSI技術(shù)的發(fā)展和對機器速度的要求,硬連線邏輯設(shè)計思想又得到了重視
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版全球供應(yīng)鏈管理國際貨運代理合同
- 二零二五年度影視特效制作與宣傳片拍攝合同范本
- 2025年度湖南得大消防工程環(huán)保驗收及評估合同
- 2025年度會展場地搭建與物料租賃服務(wù)合同范本
- 2025年度國企商品房采購及配套設(shè)施合同范本
- 二零二五合資經(jīng)營協(xié)議書范本:農(nóng)產(chǎn)品深加工技術(shù)合作開發(fā)合同
- 2025年度太空探索合股投資合同協(xié)議書
- 二零二五年度個人個人間農(nóng)作物種植合作合同3篇
- 2025年度廠房出售附帶土地使用權(quán)合同書4篇
- 個人家教輔導(dǎo)2024年度合同2篇
- 2024年北京東城社區(qū)工作者招聘筆試真題
- 一年級數(shù)學(xué)個位數(shù)加減法口算練習(xí)題大全(連加法-連減法-連加減法直接打印版)
- 五年級上冊數(shù)學(xué)試題試卷(8篇)
- 五年級上冊小數(shù)遞等式計算200道及答案
- 冀教版五年級下冊數(shù)學(xué)全冊教學(xué)課件
- T-SDASTC 006-2023 眩暈病中西醫(yī)結(jié)合基層診療指南
- 安全個人承諾書范文個人承諾書范文
- 遠(yuǎn)視儲備培訓(xùn)課件
- 嶺南膏方規(guī)范
- 【可行性報告】2023年虛擬演播室制作設(shè)備相關(guān)行業(yè)可行性分析報告
- 世界老年人跌倒的預(yù)防和管理指南解讀及跌倒應(yīng)急處理-
評論
0/150
提交評論