1.高級計算機系統(tǒng)結(jié)構(gòu)_概述

上傳人：d*** IP屬地：江西上傳時間：2022-05-26 格式：PPT 頁數(shù)：57 大小：1.05MB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩52頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、高級計算機系統(tǒng)結(jié)構(gòu)雷航雷航Tel: 61831144 前言課程歷史課程歷史:現(xiàn)代微機系統(tǒng)現(xiàn)代微機系統(tǒng)現(xiàn)代微機結(jié)構(gòu)現(xiàn)代微機結(jié)構(gòu)高級計算機體系結(jié)構(gòu)高級計算機體系結(jié)構(gòu)以以Intel80286、80386為主為主Intel 86系列處理器、系列處理器、以及其它高端處理器、以及其它高端處理器、RISC技術(shù)、技術(shù)、64位處位處理器、總線技術(shù)等理器、總線技術(shù)等以現(xiàn)代微機結(jié)構(gòu)以現(xiàn)代微機結(jié)構(gòu)內(nèi)容為基礎(chǔ)內(nèi)容為基礎(chǔ), 進一步結(jié)進一步結(jié)合計算機硬件技術(shù)發(fā)合計算機硬件技術(shù)發(fā)展?fàn)顩r進行討論展?fàn)顩r進行討論1、本課程的前續(xù)課程 (1) 微型計算機原理及應(yīng)用微型計算機原理及應(yīng)用主要內(nèi)容主要內(nèi)容: CPU及微型計算機的組成及

2、微型計算機的組成尋址方式、指令系統(tǒng)以及匯編語言程序設(shè)計尋址方式、指令系統(tǒng)以及匯編語言程序設(shè)計信息存儲原理、存儲器組織、存儲空間分配以及信息存儲原理、存儲器組織、存儲空間分配以及如何與如何與CPU接口接口微機接口微機接口: 查詢、中斷、查詢、中斷、DMA三種主要接口方式三種主要接口方式典型接口芯片典型接口芯片: Intel8255/8253/8259/8237/8251等等微機應(yīng)用微機應(yīng)用: 如串行如串行/并行通信、并行通信、A/D和和D/A轉(zhuǎn)換等轉(zhuǎn)換等(2) 計算機組成原理計算機組成原理主要內(nèi)容主要內(nèi)容: 運算器的構(gòu)成運算器的構(gòu)成(從全加器、進位鏈到加法器、從全加器、進位鏈到加法

3、器、乘法器等乘法器等, 以及原碼、補碼的各種運算方法以及原碼、補碼的各種運算方法) 控制器的構(gòu)成控制器的構(gòu)成: 組合邏輯設(shè)計方法、微程序設(shè)組合邏輯設(shè)計方法、微程序設(shè)計方法計方法存儲器存儲器: 存儲信息的原理、存儲器的組織、存存儲信息的原理、存儲器的組織、存儲空間的分配等儲空間的分配等計算機接口計算機接口: 查詢、中斷、查詢、中斷、DMA等等外部設(shè)備外部設(shè)備: 如如CRT、磁盤、磁帶機、打印機磁盤、磁帶機、打印機等等學(xué)習(xí)以上兩門課程的目的學(xué)習(xí)以上兩門課程的目的: 掌握計算機和微型計算機的基本工作原理以掌握計算機和微型計算機的基本工作原理以及一些基本的應(yīng)用。及一些基本的應(yīng)用。計算機原理偏

4、重于內(nèi)部特性和原理計算機原理偏重于內(nèi)部特性和原理微機原理則偏重于外部特性和原理微機原理則偏重于外部特性和原理(3) 操作系統(tǒng)操作系統(tǒng) 掌握一些基本概念掌握一些基本概念, 如多任務(wù)機制、分段、如多任務(wù)機制、分段、分頁等存儲管理。分頁等存儲管理。2、本課程的主要內(nèi)容和目的主要內(nèi)容主要內(nèi)容 (1) 現(xiàn)代計算機硬件體系結(jié)構(gòu)現(xiàn)代計算機硬件體系結(jié)構(gòu), 著重介紹著重介紹: 引入的關(guān)鍵技術(shù)引入的關(guān)鍵技術(shù), 如流水線、虛存機制、保如流水線、虛存機制、保護模式、超標(biāo)量結(jié)構(gòu)、指令重調(diào)度、超線護模式、超標(biāo)量結(jié)構(gòu)、指令重調(diào)度、超線程、多核技術(shù)、向量計算等程、多核技術(shù)、向量計算等, 并以并以Intel系列系列微處理器

5、為典型代表進行介紹。微處理器為典型代表進行介紹。(2) RISC處理器設(shè)計方法以及與處理器設(shè)計方法以及與CISC的比較的比較(3) 64位處理器位處理器(4) 總線技術(shù)總線技術(shù)(5) 計算機的一般性能評價方法等計算機的一般性能評價方法等處理器體系結(jié)構(gòu)處理器體系結(jié)構(gòu)學(xué)習(xí)目的學(xué)習(xí)目的掌握現(xiàn)代計算機硬件技術(shù)的特征、發(fā)展?fàn)顩r、掌握現(xiàn)代計算機硬件技術(shù)的特征、發(fā)展?fàn)顩r、不斷引入的新技術(shù)和發(fā)展方向不斷引入的新技術(shù)和發(fā)展方向,了解新技術(shù)如何了解新技術(shù)如何提高處理器以及計算機系統(tǒng)的性能，提高處理器以及計算機系統(tǒng)的性能，為進行計為進行計算機系統(tǒng)分析和研究、以及為其它專業(yè)課程的算機系統(tǒng)分析和研究、以及為其它專業(yè)

6、課程的學(xué)習(xí)進行打下基礎(chǔ)學(xué)習(xí)進行打下基礎(chǔ)。同時同時, 也從一個更高的層也從一個更高的層面上學(xué)習(xí)計算機硬件技術(shù)面上學(xué)習(xí)計算機硬件技術(shù)。課程特點課程特點將系統(tǒng)結(jié)構(gòu)、技術(shù)發(fā)展、典型處理器相結(jié)合將系統(tǒng)結(jié)構(gòu)、技術(shù)發(fā)展、典型處理器相結(jié)合; 內(nèi)容豐富內(nèi)容豐富, 概念多概念多, 但難度不大。但難度不大。第一章概述一、計算機的發(fā)展過程一、計算機的發(fā)展過程 (一一) 計算機的發(fā)展時期歸納計算機的發(fā)展時期歸納 (二二) 計算機性能指標(biāo)計算機性能指標(biāo) 網(wǎng)絡(luò)系統(tǒng)網(wǎng)絡(luò)系統(tǒng)70年代前年代前 70年代年代 80年代年代 90年年以后以后大中型機大中型機小型機小型機微型機微型機 (1) 字長字長首款微處理器首款微處理器 40

7、04Itanium4位位8位位16位位32位位64位位第第1臺臺64位微處理器位微處理器: DEC的的Alpha21064 64位計算機系統(tǒng)位計算機系統(tǒng) 內(nèi)部總線和寄存器為內(nèi)部總線和寄存器為64位位外部總線外部總線64位位配置配置64位操作系統(tǒng)位操作系統(tǒng) 64位數(shù)據(jù)一次性處理位數(shù)據(jù)一次性處理(2) 速度速度速度是衡量計算機處理能力的一個綜合指標(biāo)。速度是衡量計算機處理能力的一個綜合指標(biāo)。主頻、處理器的結(jié)構(gòu)、指令運行模式、主頻、處理器的結(jié)構(gòu)、指令運行模式、Cache的容量、內(nèi)存的大小和速度等諸多因素的容量、內(nèi)存的大小和速度等諸多因素, 最終最終都將表現(xiàn)在計算機的速度上。都將表現(xiàn)在計算機的速度上

8、。 64位處理器位處理器: 64位內(nèi)外部總線、位內(nèi)外部總線、64位寄存器位寄存器 (3) 容量容量內(nèi)存容量內(nèi)存容量: 外存容量外存容量高速緩存高速緩存(Cache) 容量容量: 不計入存儲容量不計入存儲容量主頻主頻決定主頻的因素決定主頻的因素? MIPS: 百萬條指令百萬條指令/每秒每秒基準(zhǔn)測試程序基準(zhǔn)測試程序, 比如比如SPEC(比如比如Intel 80386系統(tǒng)的理論內(nèi)存空間可達系統(tǒng)的理論內(nèi)存空間可達 232=4000M ) 。最大可達最大可達2n (n為地址線的條數(shù)為地址線的條數(shù)) 用什么來衡量速度用什么來衡量速度(三三) 微處理器主要生產(chǎn)廠商微處理器主要生產(chǎn)廠商 Intel公

9、司公司AMD公司公司IBM公司公司(如如Power PC系列和系列和Power系列系列)Apple公司公司(如如Power PC系列系列)Motorola公司公司(如如MC68系列系列) SUN公司公司(SPARC系列系列, 僅作設(shè)計僅作設(shè)計)MIPS公司公司(如如R系列系列RISC處理器處理器)HP公司公司(如如PA系列系列RISC處理器處理器) DEC公司公司(Alpha系列系列)等等(四四) 微處理器發(fā)展過程中引入的一些重要技術(shù)微處理器發(fā)展過程中引入的一些重要技術(shù) 1、虛存管理機制虛存管理機制提供提供分段管理分段管理和和分頁管理分頁管理等虛存管理機制等虛存管理機制, 為為操作系統(tǒng)提供了

10、支持操作系統(tǒng)提供了支持: 為存儲管理為存儲管理(虛存管理虛存管理)提供了一種有效手段提供了一種有效手段為多任務(wù)機制提供了一種重要的技術(shù)保證為多任務(wù)機制提供了一種重要的技術(shù)保證2、流水線技術(shù)流水線技術(shù) 地址流水線和地址流水線和指令流水線指令流水線3、分支預(yù)測技術(shù)分支預(yù)測技術(shù) 提高程序分支時的執(zhí)行效率提高程序分支時的執(zhí)行效率4、超級標(biāo)量結(jié)構(gòu)超級標(biāo)量結(jié)構(gòu) 實現(xiàn)了多條指令流水線的并行執(zhí)行實現(xiàn)了多條指令流水線的并行執(zhí)行5、大容量高速緩存大容量高速緩存極大緩解了極大緩解了CPU速度與內(nèi)存速度不匹配的矛盾速度與內(nèi)存速度不匹配的矛盾,為實現(xiàn)指令流水線起到了重要的作用為實現(xiàn)指令流水線起到了重要的作用6、RI

11、SC技術(shù)技術(shù) 處理器的一種設(shè)計方法處理器的一種設(shè)計方法, 提高了處理器的速度提高了處理器的速度, 使處理器的設(shè)計方法向前邁進了一大步使處理器的設(shè)計方法向前邁進了一大步7、SIMD技術(shù)技術(shù)(Single Instruction Multi-Data)單指令多數(shù)據(jù)流技術(shù)單指令多數(shù)據(jù)流技術(shù)9、顯示并行計算顯示并行計算(EPIC) 使處理器具有更高的指令并行能力使處理器具有更高的指令并行能力8、指令指令亂序執(zhí)行技術(shù)亂序執(zhí)行技術(shù) 指令的重調(diào)度指令的重調(diào)度(指令重新排序、指令動態(tài)調(diào)度指令重新排序、指令動態(tài)調(diào)度)能力能力, 使指令流水線具有更高的執(zhí)行效率使指令流水線具有更高的執(zhí)行效率11、多核技術(shù)多核技術(shù)

12、使處理器具有多處理器的處理能力使處理器具有多處理器的處理能力10、向量處理向量處理一種一種面向運算的并行處理器技術(shù)面向運算的并行處理器技術(shù)更好的硬件平臺更好的硬件平臺(五五) 微機迅速發(fā)展的主要原因和關(guān)鍵技術(shù)微機迅速發(fā)展的主要原因和關(guān)鍵技術(shù)集成技術(shù)的發(fā)展集成技術(shù)的發(fā)展微機性能的提高微機性能的提高功能更強功能更強的軟件的軟件微機進入新微機進入新的應(yīng)用領(lǐng)域的應(yīng)用領(lǐng)域?qū)ξC性能提對微機性能提出更高的要求出更高的要求 1、主要原因、主要原因: 2、關(guān)鍵技術(shù)、關(guān)鍵技術(shù):需求需求集成電路技術(shù)的發(fā)展集成電路技術(shù)的發(fā)展二、處理器二、處理器(硬件硬件)的熱點的熱點(近十幾年近十幾年) 1、PC處理器典型代表處

13、理器典型代表:Intel8086系列處理器系列處理器指令執(zhí)行方式指令執(zhí)行方式: 總線總線: 內(nèi)外部總線均為內(nèi)外部總線均為64位位體系結(jié)構(gòu)體系結(jié)構(gòu):指令流水線指令流水線超級標(biāo)量結(jié)構(gòu)超級標(biāo)量結(jié)構(gòu) Pentium基本型基本型: PentiumMMX(Multi-Media eXtended):稱為稱為 “ 多能多能 P e n t i u m ” , 在在Pentium基本型基礎(chǔ)上增加以下基本型基礎(chǔ)上增加以下功能功能: 新增加新增加57條多媒體信息處理指令條多媒體信息處理指令片內(nèi)片內(nèi)Cache容量從容量從16K增加到增加到32K SIMD技術(shù)技術(shù): 一條指令同時處理多個數(shù)據(jù)一條指令同時

14、處理多個數(shù)據(jù)傳統(tǒng)標(biāo)量處理傳統(tǒng)標(biāo)量處理SIMDXY X Y X3 X2 X1 X0 Y3 Y2 Y1 Y0 X3 Y3 X2 Y2 X1 Y1 X0 Y0 積和運算功能積和運算功能如單指令可完成計算如單指令可完成計算:Pentium基本型和基本型和Pentium MMX稱為稱為第一代奔騰處理器第一代奔騰處理器(P5架構(gòu)架構(gòu)) 飽和計算功能飽和計算功能將溢出后的結(jié)果作為最大值或最小值處理。將溢出后的結(jié)果作為最大值或最小值處理。X=a0b0a1b1a2b2a3b3a6b6a7b7當(dāng)發(fā)生上溢出時當(dāng)發(fā)生上溢出時: 溢出的結(jié)果轉(zhuǎn)化為最大值溢出的結(jié)果轉(zhuǎn)化為最大值當(dāng)發(fā)生下溢出時當(dāng)發(fā)生下溢出時: 溢出的結(jié)果轉(zhuǎn)化

15、為最小值溢出的結(jié)果轉(zhuǎn)化為最小值目的目的: 避免做溢出處理導(dǎo)致流媒體信息處理避免做溢出處理導(dǎo)致流媒體信息處理質(zhì)量下降和顏色出現(xiàn)倒置質(zhì)量下降和顏色出現(xiàn)倒置 14級流水線級流水線雙穴封裝技術(shù)雙穴封裝技術(shù): 指令亂序執(zhí)行指令亂序執(zhí)行: 寄存器重命名寄存器重命名(Register renaming): 分析并重排指令分析并重排指令, 優(yōu)化指令的優(yōu)化指令的順序執(zhí)行。也稱為指令流分析技術(shù)順序執(zhí)行。也稱為指令流分析技術(shù) 數(shù) 據(jù) 重新數(shù) 據(jù) 重新定位到一個內(nèi)部寄存器定位到一個內(nèi)部寄存器(速度與流水線的考慮速度與流水線的考慮) Pentium Pro: 高能高能Pentium 將二級將二級Cache(256

16、K)封裝在封裝在一個模塊中一個模塊中, 一級一級Cache和二級和二級Cache之間采之間采用用64位的獨立總線連接位的獨立總線連接在在Pentium基本型的基礎(chǔ)上的主要改進基本型的基礎(chǔ)上的主要改進: 將將CISC指令集內(nèi)部轉(zhuǎn)換為類指令集內(nèi)部轉(zhuǎn)換為類RISC指令集來指令集來執(zhí)行執(zhí)行, 以提高處理器速度以提高處理器速度 (Pentium II只支持只支持2個處理器個處理器) Pentium II: 在在Pentium Pro體系結(jié)構(gòu)中引入奔騰體系結(jié)構(gòu)中引入奔騰MMX功能功能 Pentium Pro與與Pentium MMX技術(shù)的結(jié)合技術(shù)的結(jié)合二級二級Cache從從256K增加到增加到512K

17、Pentium II Xeon(至強至強): 在在Pentium II基礎(chǔ)上的主要改進基礎(chǔ)上的主要改進: 二級二級Cache從從512K增加到增加到1M 可支持可支持4個或更多個處理器個或更多個處理器從從PentiumPro到到PentiumIII稱為稱為第二代奔騰處理器第二代奔騰處理器(P6架構(gòu)架構(gòu))原有原有Pentium處理器的處理器的SIMD只能處理整數(shù)只能處理整數(shù), 而而Pentium III的的SIMD, 既能處理整數(shù)既能處理整數(shù), 也能也能處理浮點數(shù)。處理浮點數(shù)。 Pentium III: 在在PentiumII基礎(chǔ)上的主要改進基礎(chǔ)上的主要改進: 新增加了新增加了70條指令條指令,

18、增強對多媒體信息、增強對多媒體信息、3維維圖形圖象信息、互連網(wǎng)操作的處理能力圖形圖象信息、互連網(wǎng)操作的處理能力增強的增強的SIMD技術(shù)技術(shù) Pentium 4: Pentium 4采用了新的內(nèi)部設(shè)計采用了新的內(nèi)部設(shè)計, 主要表現(xiàn)為主要表現(xiàn)為: 增加了增加了144條指令條指令, 進一步增強了對多媒體信進一步增強了對多媒體信息息/3維信息維信息/互連網(wǎng)操作的處理能力互連網(wǎng)操作的處理能力; 主頻達主頻達2G以上以上, 提高了指令執(zhí)行的吞吐率提高了指令執(zhí)行的吞吐率; 系統(tǒng)總線的速度從系統(tǒng)總線的速度從PentiumIII的的133M提高到提高到了了400M; 流水線的級數(shù)流水線的級數(shù)(流水線深度流

19、水線深度)從從PentiumIII的的14級提高到級提高到20級級; 超線程技術(shù)超線程技術(shù) (Hyper-Threading)Pentium4、Prescott、Pentium D的的體系結(jié)構(gòu)均稱為體系結(jié)構(gòu)均稱為NetBurst Pentium PrescottPrescott主要特征主要特征: 流水線的級數(shù)從流水線的級數(shù)從Pentium 4的的20級提高到級提高到30級級提高了分支預(yù)測機構(gòu)的預(yù)測效率提高了分支預(yù)測機構(gòu)的預(yù)測效率 Pentium D主要特征主要特征: 沿用沿用Prescott架構(gòu)架構(gòu), 采用雙核采用雙核結(jié)構(gòu)結(jié)構(gòu)(2個獨立的個獨立的Prescott核心核心) 不支持超線程不支持

20、超線程 CORE2 (酷睿酷睿2)CORE2的體系結(jié)構(gòu)稱為的體系結(jié)構(gòu)稱為Core微架構(gòu)微架構(gòu)通用于臺式機、服務(wù)器和筆記本電腦通用于臺式機、服務(wù)器和筆記本電腦雙核結(jié)構(gòu)雙核結(jié)構(gòu) 提高了每周期的執(zhí)行的指令數(shù)量提高了每周期的執(zhí)行的指令數(shù)量雙核共享雙核共享L2 Cache 更多的指令及數(shù)據(jù)預(yù)取更多的指令及數(shù)據(jù)預(yù)取器器更長位數(shù)更長位數(shù)SIMD (128位整數(shù)位整數(shù)及及128位浮點位浮點, 傳統(tǒng)傳統(tǒng)的處理器為的處理器為64位位) ) 降低了功耗降低了功耗整體性能比整體性能比Pentium D提高提高44。(2) 從集成技術(shù)的角度從集成技術(shù)的角度 CMOS(互補金屬氧化物半導(dǎo)體電路互補金屬氧化物半導(dǎo)體

21、電路)工藝工藝直接在半導(dǎo)體基片上制作各種晶體管電路直接在半導(dǎo)體基片上制作各種晶體管電路 SOI制作工藝制作工藝(Silicon On Insulator 硅晶絕緣體硅晶絕緣體) 減少了充電電流減少了充電電流, 降低了功耗降低了功耗減少了晶體管的靜電電容減少了晶體管的靜電電容, 縮短了充放電縮短了充放電時間時間, 提高了晶體管的切換速度提高了晶體管的切換速度SOI制作工藝與同期制作工藝與同期CMOS工藝相比工藝相比, 速度速度可提高可提高35%40%, 功耗可減少功耗可減少50%60%曾有資料認為曾有資料認為: SOI技術(shù)將使摩爾定律繼續(xù)起作用技術(shù)將使摩爾定律繼續(xù)起作用,有望使有望使CPU主頻

22、提高到主頻提高到T級。級。但是但是: : 近年來以及可預(yù)見的將來近年來以及可預(yù)見的將來, , 處理器的處理器的發(fā)展方向不是提高主頻發(fā)展方向不是提高主頻, , 而是多核處理器而是多核處理器銅芯片銅芯片采用銅導(dǎo)線來代替鋁用于集成電路中晶體管之間采用銅導(dǎo)線來代替鋁用于集成電路中晶體管之間的互聯(lián)線的互聯(lián)線, 在相同條件下減少在相同條件下減少40的功耗的功耗; 還可以將銅導(dǎo)線與還可以將銅導(dǎo)線與SOI技術(shù)相結(jié)合技術(shù)相結(jié)合(IBM率先采用率先采用了該方式了該方式)。 Low K互連層技術(shù)互連層技術(shù) 隨著電路板蝕刻精度越來越高隨著電路板蝕刻精度越來越高, 芯片上集成的電芯片上集成的電路越來越多路越來越多,

23、信號干擾也就越來越強。信號干擾也就越來越強。Low K材材料解決了芯片中的信號干擾料解決了芯片中的信號干擾, 并降低處理器的功并降低處理器的功耗，提高處理器的高頻穩(wěn)定性。耗，提高處理器的高頻穩(wěn)定性。應(yīng)變硅技術(shù)應(yīng)變硅技術(shù) 基本原理基本原理:加大硅原子的間距加大硅原子的間距, 以減小電子通行以減小電子通行所受到的阻力所受到的阻力, 相當(dāng)于減小了電阻。從而降低了相當(dāng)于減小了電阻。從而降低了耗發(fā)和熱量耗發(fā)和熱量, 運行速度則得以提升。運行速度則得以提升。在處理器的工藝上在處理器的工藝上, 芯片的功耗、封裝、等越來越芯片的功耗、封裝、等越來越難以處理難以處理, 使得摩爾定律本身的發(fā)展及其對處理器使得

24、摩爾定律本身的發(fā)展及其對處理器的影響發(fā)生了一些深刻的變化。的影響發(fā)生了一些深刻的變化。首先首先, 摩爾定律趨勢已經(jīng)變緩摩爾定律趨勢已經(jīng)變緩, 由原來的由原來的1.5年一代變年一代變?yōu)闉?-3年一代。除技術(shù)難度增加以外年一代。除技術(shù)難度增加以外, 集成電路生產(chǎn)集成電路生產(chǎn)線更新?lián)Q代的成本越來越昂貴。線更新?lián)Q代的成本越來越昂貴。其次其次, 處理器主頻正在與摩爾定律分道揚鑣。過去每處理器主頻正在與摩爾定律分道揚鑣。過去每代微處理器主頻是上代產(chǎn)品的兩倍中代微處理器主頻是上代產(chǎn)品的兩倍中, 只有只有1.4倍來倍來源于器件的按比例縮小源于器件的按比例縮小, 另外另外1.4倍來源于結(jié)構(gòu)優(yōu)化。倍來源于結(jié)構(gòu)優(yōu)化

25、。為此為此, 芯片設(shè)計越來越強調(diào)結(jié)構(gòu)的層次化、功能部芯片設(shè)計越來越強調(diào)結(jié)構(gòu)的層次化、功能部件的模塊化和分布化件的模塊化和分布化, 即每個功能部件都相對地簡即每個功能部件都相對地簡單單, 部件內(nèi)部盡可能保持通信的局部性。部件內(nèi)部盡可能保持通信的局部性。 (3) 從體系結(jié)構(gòu)的角度從體系結(jié)構(gòu)的角度處理器體系結(jié)構(gòu)處理器體系結(jié)構(gòu) 從標(biāo)量結(jié)構(gòu)演變到超級標(biāo)量結(jié)構(gòu)從標(biāo)量結(jié)構(gòu)演變到超級標(biāo)量結(jié)構(gòu) 數(shù)據(jù)流上從單數(shù)據(jù)流演變到多數(shù)據(jù)流數(shù)據(jù)流上從單數(shù)據(jù)流演變到多數(shù)據(jù)流處理器內(nèi)單一總線結(jié)構(gòu)演變?yōu)槎嗫偩€結(jié)構(gòu)處理器內(nèi)單一總線結(jié)構(gòu)演變?yōu)槎嗫偩€結(jié)構(gòu) 單指令發(fā)射到多指令發(fā)射單指令發(fā)射到多指令發(fā)射VLIW(Very Long I

26、nstruction Word), 即把多條即把多條指令連在一起指令連在一起, 增加了運算的速度。增加了運算的速度。短指令到短指令到超長指令字超長指令字VLIWVLIW的基本思想的基本思想:VLIW的基本思路的基本思路: 處理器在一個長指令字中賦予編譯程序控制所有處理器在一個長指令字中賦予編譯程序控制所有功能單元的能力功能單元的能力, 讓編譯程序精確調(diào)度在何處執(zhí)讓編譯程序精確調(diào)度在何處執(zhí)行每個操作、各寄存器讀寫和每個轉(zhuǎn)移操作。行每個操作、各寄存器讀寫和每個轉(zhuǎn)移操作。比如比如: 編譯器可以把編譯器可以把“R1+R2R3”和和“R4+R5R6”這兩條指令組合到一個指令字中這兩條指令組合到一個指令

27、字中(兩條指令無寄存器相關(guān)兩條指令無寄存器相關(guān))。指令并行性和數(shù)據(jù)移動完全由編譯來安排指令并行性和數(shù)據(jù)移動完全由編譯來安排, 處理處理器只需簡單執(zhí)行編譯程序所產(chǎn)生的結(jié)果器只需簡單執(zhí)行編譯程序所產(chǎn)生的結(jié)果, 因而簡因而簡化運行時資源的調(diào)度。化運行時資源的調(diào)度。如：比較如：比較Intel 80286與與Pentium的內(nèi)部結(jié)構(gòu)的內(nèi)部結(jié)構(gòu) Intel 80286 AU EU IDU BU 物理地址物理地址尋址請求尋址請求操作數(shù)操作數(shù)指令代碼指令代碼已譯碼指令已譯碼指令 8K指令指令Cache指令預(yù)指令預(yù)取部件取部件指令譯碼器指令譯碼器微指令微指令 ROM分支預(yù)分支預(yù)測部件測部件控制部件控制部

28、件U流水線流水線V流水線流水線U流水線地址生成邏輯流水線地址生成邏輯V流水線地址生成邏輯流水線地址生成邏輯雙端口數(shù)據(jù)雙端口數(shù)據(jù)Cache浮點處理浮點處理部件部件FPU總線接口部件總線接口部件32位內(nèi)部地址總線位內(nèi)部地址總線64位內(nèi)部數(shù)據(jù)總線位內(nèi)部數(shù)據(jù)總線Pentium基本型基本型微機系統(tǒng)微機系統(tǒng)硬件結(jié)構(gòu)的變化硬件結(jié)構(gòu)的變化從單一總線結(jié)構(gòu)從單一總線結(jié)構(gòu)主要表現(xiàn)為主要表現(xiàn)為PCI總線出現(xiàn)后總線出現(xiàn)后, 在一個系統(tǒng)中在一個系統(tǒng)中PCI總線、總線、ISA總線、總線、EISA總線并存。總線并存。多總線結(jié)構(gòu)多總線結(jié)構(gòu) SCSI接口接口圖形處理接口圖形處理接口以太網(wǎng)接口以太網(wǎng)接口芯片組芯片組ISA

29、總線總線低速低速I/O低速低速I/O微處理器微處理器芯片組芯片組存儲器存儲器PCI總線總線(4) 從指令計算的角度從指令計算的角度指令計算的執(zhí)行順序的演變指令計算的執(zhí)行順序的演變:串行計算方式串行計算方式: 指令流水線指令流水線:指令指令1 指令指令2指令指令3 指令指令4t指令指令1指令指令2指令指令3指令指令4 t EPIC模式模式EPIC體系結(jié)構(gòu)最基本的特點是從體系結(jié)構(gòu)最基本的特點是從VLIW繼承而繼承而來來: 支持由編譯器來決定指令執(zhí)行方案。支持由編譯器來決定指令執(zhí)行方案。在傳統(tǒng)體系結(jié)構(gòu)中在傳統(tǒng)體系結(jié)構(gòu)中, 分支指令可能會導(dǎo)致流水線分支指令可能會導(dǎo)致流水線的長延遲。所以條件分支往

30、往成為指令流水線的長延遲。所以條件分支往往成為指令流水線和和VLIW處理器性能發(fā)揮的瓶頸。處理器性能發(fā)揮的瓶頸。EPIC將分支指令拆分成三部分將分支指令拆分成三部分: 計算分支條件、計算分支條件、形成分支地址、從分支處和分支失敗處取指令形成分支地址、從分支處和分支失敗處取指令譯碼譯碼, 各個部件可以重疊執(zhí)行。各個部件可以重疊執(zhí)行。指令指令1指令指令2指令指令3指令指令4理論上講理論上講, 讓一組指令完全并行執(zhí)行讓一組指令完全并行執(zhí)行, 比如比如:t對分支指令對分支指令:?一組指令一組指令一組指令一組指令兩個分之方向的兩個分之方向的指令并行執(zhí)行！指令并行執(zhí)行！EPIC的的關(guān)鍵技術(shù)關(guān)鍵技術(shù): 大

31、量的寄存器支持大量的寄存器支持支持多個分支同時執(zhí)行時支持多個分支同時執(zhí)行時, 所需要的大量數(shù)據(jù)和所需要的大量數(shù)據(jù)和尋址信息。采用尋址信息。采用EPIC技術(shù)的處理器技術(shù)的處理器, 一般其寄存一般其寄存器數(shù)量都在器數(shù)量都在128個以上。個以上。高性能編譯器高性能編譯器通過通過“指令斷定指令斷定” 技術(shù)使多個分支同時執(zhí)行。技術(shù)使多個分支同時執(zhí)行。 “指令管道指令管道”技術(shù)來實現(xiàn)技術(shù)來實現(xiàn)(多個指令管道多個指令管道) EPIC(Explicity Parallel Instruction Computing) 顯式并行指令計算顯式并行指令計算: 核心思想是核心思想是“并行處理并行處理”實現(xiàn)方法實現(xiàn)

32、方法: 編譯器提前完成代碼排序編譯器提前完成代碼排序以滿足大流量指令和數(shù)據(jù)的要求。以滿足大流量指令和數(shù)據(jù)的要求。高速的指令和數(shù)據(jù)預(yù)裝技術(shù)高速的指令和數(shù)據(jù)預(yù)裝技術(shù) 高帶寬的數(shù)據(jù)通路高帶寬的數(shù)據(jù)通路:以保證大數(shù)據(jù)高速流動。以保證大數(shù)據(jù)高速流動。三、微機領(lǐng)域當(dāng)前的幾大熱點三、微機領(lǐng)域當(dāng)前的幾大熱點 1. 處理器處理器 (1) 64位處理器及全位處理器及全64位計算平臺位計算平臺基于基于EPIC計算模式的英特爾計算模式的英特爾IA-64結(jié)構(gòu)結(jié)構(gòu),以以Itanium處理器為代表處理器為代表比如比如:提供長模式提供長模式(Long-Mode-Active), 解決與解決與32位處理器的兼容性問題。

33、位處理器的兼容性問題。 AMD X86-64處理器處理器LMA=1:LMA=0: 純純x86系統(tǒng)系統(tǒng), 兼容兼容32位和位和16位位OS和應(yīng)用和應(yīng)用系統(tǒng)為系統(tǒng)為64位系統(tǒng)。并具有兩種子模式位系統(tǒng)。并具有兩種子模式: 64-bit模式模式和和兼容模式兼容模式。這兩種模式均。這兩種模式均需要使用需要使用64位操作系統(tǒng)。位操作系統(tǒng)。雙核雙核2.5 GHz 處理器處理器存儲空間擴展至存儲空間擴展至8GB 在進行在進行64位計算的同時位計算的同時, 兼容兼容32位應(yīng)用軟件位應(yīng)用軟件測試表明測試表明: 運行速度遠超出運行速度遠超出3.4 GHz奔騰奔騰4系統(tǒng)系統(tǒng) 64位位PowerPC G5 (Ap

34、ple, 用于個人電腦用于個人電腦 ) Power 4和和Power 5( (IBM, 用于服務(wù)器用于服務(wù)器) 如如: Power 4處理器的處理器的P690服務(wù)器服務(wù)器 Power 5處理器的處理器的open power 710服務(wù)器。服務(wù)器。 Power 6 主頻達到主頻達到5.4GHz 64位編程模式和位編程模式和64位位API 64位的編譯器位的編譯器支持大于支持大于4GB的物理存儲空間的物理存儲空間支持大于支持大于4GB規(guī)模的文件規(guī)模的文件支持多個物理設(shè)備文件支持多個物理設(shè)備文件(如多個磁盤系統(tǒng)如多個磁盤系統(tǒng)) 64位寬度以上的總線位寬度以上的總線 64位位Cache、高速圖形

35、板等高速圖形板等應(yīng)用層應(yīng)用層操作系統(tǒng)操作系統(tǒng)層層機器機器層層CPU芯片芯片層層 64位整數(shù)寄存器位整數(shù)寄存器 64位浮點寄存器位浮點寄存器 64位寬度以上的數(shù)據(jù)總線位寬度以上的數(shù)據(jù)總線以以64位計算模式為基礎(chǔ)位計算模式為基礎(chǔ), 加上相應(yīng)系統(tǒng)軟件支持加上相應(yīng)系統(tǒng)軟件支持 (2) 全全64位計算平臺位計算平臺(3) 多核處理器多核處理器對高速處理器的需求和主頻及功耗對高速處理器的需求和主頻及功耗的限制的限制, 多核技術(shù)和多核處理器的多核技術(shù)和多核處理器的發(fā)展成為必然趨勢。發(fā)展成為必然趨勢。也可以說也可以說, 多核處理器是傳統(tǒng)多處理器系統(tǒng)的進多核處理器是傳統(tǒng)多處理器系統(tǒng)的進一步發(fā)展一步發(fā)展, 也是集

36、成電路技術(shù)發(fā)展的結(jié)果。也是集成電路技術(shù)發(fā)展的結(jié)果。多核處理器多核處理器(CMPChip Multi-Processors ) 是將多個計算內(nèi)核集成在一個處理器芯是將多個計算內(nèi)核集成在一個處理器芯片中。片中。從結(jié)構(gòu)上從結(jié)構(gòu)上, 多核可以分為多核可以分為同構(gòu)多核同構(gòu)多核和和異構(gòu)多核異構(gòu)多核兩種兩種:同構(gòu)多核同構(gòu)多核異構(gòu)多核異構(gòu)多核計算內(nèi)核相同計算內(nèi)核相同, 地位對等的多核稱為地位對等的多核稱為“同構(gòu)多同構(gòu)多核核”。同構(gòu)。同構(gòu)CMP大多數(shù)由通用的處理器組成，大多數(shù)由通用的處理器組成，多個處理器執(zhí)行相同或者類似的任務(wù)。多個處理器執(zhí)行相同或者類似的任務(wù)。計算內(nèi)核不同計算內(nèi)核不同, 地位不對等的稱為地位

37、不對等的稱為“異構(gòu)多核異構(gòu)多核”, 異構(gòu)多核多采用異構(gòu)多核多采用“主處理核協(xié)處理核主處理核協(xié)處理核”的設(shè)計的設(shè)計如如: IBM公司的公司的CELL處理器處理器 AMD公司的公司的Fusion方案方案 “CPU+GPU”但是但是, 存在以下一些觀點存在以下一些觀點:多核處理器面臨的最大問題是多核處理器面臨的最大問題是可編程性可編程性。一旦核。一旦核心多過八個心多過八個, 就需要執(zhí)行程序能夠并行處理。盡管就需要執(zhí)行程序能夠并行處理。盡管在并行計算上在并行計算上, 人類已經(jīng)探索了超過人類已經(jīng)探索了超過40年年, 但編寫、但編寫、調(diào)試、優(yōu)化并行處理程序的能力還非常弱。調(diào)試、優(yōu)化并行處理程序的能力還非常

38、弱。出于技術(shù)的挑戰(zhàn)出于技術(shù)的挑戰(zhàn),多核處理器被強加給了產(chǎn)業(yè)多核處理器被強加給了產(chǎn)業(yè),而產(chǎn)而產(chǎn)業(yè)并沒有事先做好準(zhǔn)備?；蛟S十年以后業(yè)并沒有事先做好準(zhǔn)備?；蛟S十年以后,多核就到多核就到頭了。一味增加并行的處理單元可能頭了。一味增加并行的處理單元可能是行不通的。是行不通的。并行計算機的發(fā)展歷史表明，并行性超過一定程并行計算機的發(fā)展歷史表明，并行性超過一定程度以后，程序就很難寫。度以后，程序就很難寫。即使能夠不斷增加同類型的即使能夠不斷增加同類型的CPU內(nèi)核以加強并行內(nèi)核以加強并行處理能力處理能力, 但整個系統(tǒng)的處理性能仍然會受到軟件但整個系統(tǒng)的處理性能仍然會受到軟件中必須串行執(zhí)行的那部分的制約。中

39、必須串行執(zhí)行的那部分的制約。雖然英特爾已展示了雖然英特爾已展示了80核處理器原型核處理器原型, 但尷尬的是但尷尬的是,目前還沒有能夠利用這一處理器的操作系統(tǒng)。目前還沒有能夠利用這一處理器的操作系統(tǒng)。2. 存儲器存儲器問題問題: 揮發(fā)與非揮發(fā)存儲器與速度和容量的矛盾揮發(fā)與非揮發(fā)存儲器與速度和容量的矛盾發(fā)展的思路發(fā)展的思路: 將非揮發(fā)性、存取速度快、低成本、大容量將非揮發(fā)性、存取速度快、低成本、大容量、低功耗和可無限擦寫等目前所有揮發(fā)性與非揮低功耗和可無限擦寫等目前所有揮發(fā)性與非揮發(fā)性兩種存儲器的特性發(fā)性兩種存儲器的特性(優(yōu)點優(yōu)點)集于一身。集于一身。揮發(fā)性存儲器揮發(fā)性存儲器: 高速度、小

40、容量、易揮發(fā)。高速度、小容量、易揮發(fā)。非揮發(fā)性存儲器非揮發(fā)性存儲器: 低速度、大容量、不揮發(fā)。低速度、大容量、不揮發(fā)。幾種典型解決方案幾種典型解決方案 FeRAM存儲器存儲器( (鐵電存儲器鐵電存儲器) ) 以鐵電薄膜電容取代常規(guī)的存儲電荷的電容以鐵電薄膜電容取代常規(guī)的存儲電荷的電容, 利利用鐵電薄膜的極化反轉(zhuǎn)來實現(xiàn)數(shù)據(jù)存用鐵電薄膜的極化反轉(zhuǎn)來實現(xiàn)數(shù)據(jù)存/取。取。MRAM存儲器存儲器通過控制鐵磁體中的電子旋轉(zhuǎn)方向來實現(xiàn)讀通過控制鐵磁體中的電子旋轉(zhuǎn)方向來實現(xiàn)讀/ /寫寫電流的大小電流的大小, 使其具備二進制數(shù)據(jù)存儲能力。使其具備二進制數(shù)據(jù)存儲能力。比如比如Infineon 的的16Mbit M

41、RAM芯片速度比應(yīng)用芯片速度比應(yīng)用于于USB閃存、手持計算機和數(shù)碼相機中的非易失閃存、手持計算機和數(shù)碼相機中的非易失性閃存的速度快約性閃存的速度快約1000倍倍, 且可寫入次數(shù)比閃存且可寫入次數(shù)比閃存要高要高100萬倍。萬倍。 OUM存儲器存儲器由由Intel所提出。原理是利用所提出。原理是利用Ge、Sb、Te等化合物等化合物為材質(zhì)的薄膜來存儲信息為材質(zhì)的薄膜來存儲信息, 數(shù)據(jù)存儲利用不同溫度數(shù)據(jù)存儲利用不同溫度造成的相位變化來存儲數(shù)據(jù)。造成的相位變化來存儲數(shù)據(jù)。 Intel公司認為公司認為: OUM是最有前景的非易失性存儲是最有前景的非易失性存儲器替代者器替代者, 將超越了將超越了MRAM和

42、和FeRAM。PCM(基于硫系合金的電熱誘導(dǎo)相變轉(zhuǎn)換基于硫系合金的電熱誘導(dǎo)相變轉(zhuǎn)換)簡稱簡稱相變化存儲器相變化存儲器, ,是近年來的熱門研發(fā)主題。是近年來的熱門研發(fā)主題?；驹砘驹? 利用物質(zhì)利用物質(zhì)(特殊材料特殊材料)電阻電阻差異存取信息差異存取信息。據(jù)預(yù)測據(jù)預(yù)測, PCM未來市場潛力較未來市場潛力較FeRAM和和MRAM為大。為大。FeRAM和和MRAM有容量擴展方面的限制有容量擴展方面的限制, 而而PCM由于良好可擴展性，被認為是未來十年由于良好可擴展性，被認為是未來十年內(nèi)最好的主流內(nèi)最好的主流NVM技術(shù)之一。技術(shù)之一。由于容量和價格上的原因由于容量和價格上的原因, 上述存儲器還不

43、能代替上述存儲器還不能代替如如DRAM、SRAM等存儲器。等存儲器。3. 64位的操作系統(tǒng)位的操作系統(tǒng) 微軟微軟 Windows Server 2003?？杉嫒菘杉嫒軮ntel和和AMD的的64位處理器位處理器 Windows .NET Server64位操作系統(tǒng)描述位操作系統(tǒng)描述:“以以64位位CPU芯片為前提芯片為前提, 為充分發(fā)揮該為充分發(fā)揮該64位位CPU芯片的性能而實行芯片的性能而實行64位擴展的操作系位擴展的操作系統(tǒng)統(tǒng)”。 1996年年DEC公司公司: Digital UNIX 4.0 64位操作位操作系統(tǒng)系統(tǒng), 以及以及Open VMS 7.0 64 位操作系統(tǒng)。位操作系統(tǒng)。 S

44、UN公司公司: 64位的位的Solaris操作系統(tǒng)操作系統(tǒng) Windows7 64位位、Windows XP X64 4、正研究中的未來計算機、正研究中的未來計算機一般認為一般認為, 目前在半導(dǎo)體基片上光刻電子元件的方目前在半導(dǎo)體基片上光刻電子元件的方式會遭遇極限式會遭遇極限(工藝和熱量工藝和熱量)。 1970 1975 1980 1985 1990 1995 20001000000001000000010000001000001000010004004803868028680868080800880486pentiumPentium IIPentium IIIPentium 4摩爾定律摩爾定律從未來計算機的發(fā)展角度看從未來計算機的發(fā)展角度看, 科學(xué)界看好的未來計科學(xué)界看好的未來計算機目前有以下三類算機目前有以下三類:(1) 生物計算機生物計算機

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

1.高級計算機系統(tǒng)結(jié)構(gòu)_概述

文檔簡介

溫馨提示

最新文檔

評論

1.高級計算機系統(tǒng)結(jié)構(gòu)_概述

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔