




已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
高級計算機系統(tǒng)結(jié)構(gòu),雷航 ,前 言,課程歷史:,現(xiàn)代微機系統(tǒng),現(xiàn)代微機結(jié)構(gòu),高級計算機體系結(jié)構(gòu),1、本課程的前續(xù)課程 (1) 微型計算機原理及應(yīng)用 主要內(nèi)容: 微型計算機的基本組成 尋址方式、指令系統(tǒng)以及匯編語言程序設(shè)計 信息存儲原理、存儲器組織、存儲空間分配以及 如何與CPU接口 微機接口: 查詢、中斷、DMA三種主要接口方式 典型接口芯片: Intel8255/8253/8259/8237/8251等 微機應(yīng)用: 如串行/并行通信、A/D和D/A轉(zhuǎn)換等,(2) 計算機組成原理 主要內(nèi)容: 運算器的構(gòu)成(從全加器、進位鏈到加法器、乘法器等, 以及原碼、補碼的各種運算方法) 控制器的構(gòu)成: 組合邏輯設(shè)計方法、微程序設(shè)計方法 存儲器: 存儲信息的原理、存儲器的組織、存儲空間的分配等 計算機接口: 查詢、中斷、DMA等 外部設(shè)備: 如CRT、磁盤、磁帶機、打印機等,學習以上兩門課程的目的: 掌握計算機和微型計算機的基本工作原理以及一些基本的應(yīng)用。 計算機原理偏重于內(nèi)部特性和原理 微機原理則偏重于外部特性和原理,(3) 操作系統(tǒng) 掌握一些基本概念, 如多任務(wù)機制、分段、分頁等存儲管理。,2、本課程的主要內(nèi)容和目的 主要內(nèi)容 (1) 現(xiàn)代計算機硬件體系結(jié)構(gòu), 著重介紹:, 引入的關(guān)鍵技術(shù), 如流水線、虛存機制、保護模式、超標量結(jié)構(gòu)、指令重調(diào)度、超線程、多核技術(shù)、向量計算等, 并以Intel系列微處理器為典型代表進行介紹。,(2) RISC處理器設(shè)計方法以及與CISC的比較 (3) 64位處理器 (4) 總線技術(shù) (5) 計算機的一般性能評價方法等, 處理器體系結(jié)構(gòu),學習目的 掌握現(xiàn)代計算機硬件技術(shù)的特征、發(fā)展狀況、不斷引入的新技術(shù)和發(fā)展方向,了解新技術(shù)如何提高處理器以及計算機系統(tǒng)的性能,為進行計算機系統(tǒng)分析和研究、以及為其它專業(yè)課程的學習進行打下基礎(chǔ)。同時, 也從一個更高的層面上學習計算機硬件技術(shù)。,課程特點 (1) 內(nèi)容豐富, 概念多, 但難度不大; (2) 系統(tǒng)結(jié)構(gòu)與微處理器相結(jié)合,第一章 概述 一、計算機的發(fā)展過程 (一) 計算機的發(fā)展時期歸納,(二) 計算機性能指標,網(wǎng)絡(luò)系統(tǒng),70年代前 70年代 80年代 90年以后,大中型機,小型機,微型機,(1) 字長,第1臺64位微處理器:,DEC的Alpha21064, 64位計算機系統(tǒng), 內(nèi)部總線和寄存器為64位 外部總線64位 配置64位操作系統(tǒng) 64位數(shù)據(jù)一次性處理,(2) 速度,從每秒幾萬條指令到每秒達到上數(shù)千億條指令。,速度是衡量計算機處理能力的一個綜合指標。,主頻、處理器的結(jié)構(gòu)、指令運行模式、Cache的容量、內(nèi)存的大小和速度等諸多因素, 最終都將表現(xiàn)在計算機的速度上。, 64位處理器: 64位內(nèi)外部總線、64位寄存器,(3) 容量 內(nèi)存容量:, 外存容量, 高速緩存(Cache)容量:,不計入存儲容量, 主頻, 決定主頻的因素?, MIPS: 百萬條指令/每秒, 基準測試程序, 比如SPEC,(比如Intel80386系統(tǒng)的理論內(nèi)存空間可達 232=4000M ) 。, 用什么來衡量速度,(三) 微處理器發(fā)展過程中引入的一些重要技術(shù) 1、虛存管理機制 提供分段管理和分頁管理等的硬件支持, 為操作系統(tǒng)實現(xiàn)虛存管理、多任務(wù)機制提供了便利,2、流水線技術(shù) 地址流水線和指令流水線,3、分支預測技術(shù) 提高程序分支時的執(zhí)行效率,4、超級標量結(jié)構(gòu) 實現(xiàn)了單核多條指令流水線的并行執(zhí)行,5、大容量高速緩存 極大緩解了CPU速度與內(nèi)存速度不匹配的矛盾,為實現(xiàn)指令流水線起到了重要的作用,6、RISC技術(shù) 處理器的一種設(shè)計方法, 提高了處理器的速度, 使處理器的設(shè)計方法向前邁進了一大步,7、SIMD技術(shù)(Single Instruction Multi-Data) 單指令多數(shù)據(jù)流技術(shù),8、指令亂序執(zhí)行技術(shù) 指令的重調(diào)度(指令重新排序、指令動態(tài)調(diào)度)能力, 使指令流水線具有更高的執(zhí)行效率,9、顯示并行計算(EPIC) 使處理器具有更高的指令并行能力,11、多核技術(shù) 使處理器具有多處理器的處理能力,10、向量處理 一種面向運算的并行處理器技術(shù),二、處理器(硬件)的熱點(近十幾年) 1、PC處理器典型代表:,Intel8086系列處理器, 指令執(zhí)行方式:, 總線:,內(nèi)外部總線均為64位, 體系結(jié)構(gòu):,指令流水線,超級標量結(jié)構(gòu), Pentium基本型:,稱為“多能Pentium”, 在Pentium基本型基礎(chǔ)上增加以下功能:, 新增加57條多媒體信息處理指令 片內(nèi)Cache容量從16K增加到32K SIMD技術(shù): 一條指令同時處理多個數(shù)據(jù),傳統(tǒng)標量處理,SIMD,X,Y, 積和運算功能,如單指令可完成計算:,Pentium基本型和Pentium MMX稱為第一代奔騰處理器(P5架構(gòu)), 飽和計算功能,將溢出后的結(jié)果作為最大值或最小值處理。,X=a0b0a1b1a2b2a3b3a6b6a7b7,目的:,避免做溢出處理導致流媒體信息處理實時性能下降和顏色出現(xiàn)倒置, 14級流水線, 雙穴封裝技術(shù):, 指令亂序執(zhí)行:, 寄存器重命名(Register renaming):,分析并重排指令, 優(yōu)化指令的順序執(zhí)行。也稱為指令流分析技術(shù),數(shù)據(jù)重新定位到一個內(nèi)部寄存器(速度與流水線的考慮), Pentium Pro: 高能Pentium,將L2Cache(256K)封裝在一個模塊中, L1Cache和L2Cache之間采用64位的獨立總線連接,在Pentium基本型的基礎(chǔ)上的主要改進: 將CISC指令集轉(zhuǎn)換為類RISC指令集來執(zhí)行;,(Pentium II只支持2個處理器), Pentium II: 在Pentium Pro體系結(jié)構(gòu)中引入奔騰MMX功能 Pentium Pro與Pentium MMX技術(shù)的結(jié)合 二級Cache從256K增加到512K Pentium II Xeon(至強): 在Pentium II基礎(chǔ)上的主要改進: 二級Cache從512K增加到1M 可支持4個或更多個處理器,從PentiumPro到PentiumIII稱為第二代奔騰處理器(P6架構(gòu)),原有Pentium處理器的SIMD只能處理整數(shù), 而Pentium III的SIMD, 既能處理整數(shù), 也能處理浮點數(shù)。, Pentium III: 在PentiumII基礎(chǔ)上的主要改進: 新增加了70條指令, 增強對多媒體信息、3維圖形圖象信息、互連網(wǎng)操作的處理能力 增強的SIMD技術(shù), Pentium 4: Pentium 4采用了新的內(nèi)部設(shè)計, 主要表現(xiàn)為: 增加了144條指令, 進一步增強了對多媒體信 息/3維信息/互連網(wǎng)操作的處理能力; 主頻達2G以上, 提高了指令執(zhí)行的吞吐率; 系統(tǒng)總線的速度從PentiumIII的133M提高到了400M; 流水線的級數(shù)(流水線深度)從PentiumIII的14級提高到20級; 超線程技術(shù) (Hyper-Threading),Pentium4、Prescott、Pentium D的體系結(jié)構(gòu)均稱為NetBurst,主要特征: 流水線的級數(shù)從Pentium 4的20級提高到30級 提高了分支預測機構(gòu)的預測效率, Pentium D,主要特征: 沿用Prescott架構(gòu), 采用雙核結(jié)構(gòu)(2個獨立的Prescott核心) 不支持超線程, CORE2 (酷睿2),CORE2的體系結(jié)構(gòu)稱為Core微架構(gòu) 通用于臺式機、服務(wù)器和筆記本電腦, 雙核結(jié)構(gòu) 更長位數(shù)SIMD (128位整數(shù)及128位浮點, 傳統(tǒng)的處理器為64位) 降低了功耗 整體性能比Pentium D提高44。,(2) 從集成技術(shù)的角度, CMOS(互補金屬氧化物半導體電路)工藝,直接在半導體基片上制作各種晶體管電路, SOI制作工藝,(Silicon On Insulator), 減少了充電電流, 降低了功耗, 減少了晶體管的靜電電容, 縮短了充放電時間, 提高了晶體管的切換速度,SOI制作工藝與同期CMOS工藝相比, 速度可提高35%40%, 功耗可減少50%60%,曾有資料認為: SOI技術(shù)將使摩爾定律繼續(xù)起作用,有望使CPU主頻提高到T級。,但是: 近年來以及可預見的將來, 處理器的發(fā)展方向不是提高主頻, 而是多核處理器, 銅芯片 采用銅導線來代替鋁用于集成電路中晶體管之間的互聯(lián)線, 在相同條件下減少40的功耗; 還可以將銅導線與SOI技術(shù)相結(jié)合(IBM率先采用了該方式)。, Low K互連層技術(shù) Low K材料解決了芯片中的信號干擾, 并降低處理器的功耗,提高處理器的高頻穩(wěn)定性。, 應(yīng)變硅技術(shù) 基本原理: 加大硅原子的間距, 以減小電子通行所受到的阻力, 相當于減小了電阻。從而降低了功耗和熱量, 使運行速度得以提升。,目前, 在處理器的工藝上, 芯片的功耗、封裝等越來越難以處理, 使得摩爾定律本身的發(fā)展及其對處理器的影響發(fā)生了一些深刻的變化。,首先, 摩爾定律趨勢已經(jīng)變緩, 由原來的1.5年一代變?yōu)?-3年一代。除技術(shù)難度增加以外, 集成電路生產(chǎn)線更新?lián)Q代的成本越來越昂貴。,其次, 處理器主頻正在與摩爾定律分道揚鑣。過去每代微處理器主頻是上代產(chǎn)品的兩倍中, 只有1.4倍來源于器件的按比例縮小, 另外1.4倍來源于結(jié)構(gòu)優(yōu)化。,為此, 芯片設(shè)計越來越強調(diào)結(jié)構(gòu)的層次化、功能部件的模塊化和分布化, 即每個功能部件都相對地簡單, 部件內(nèi)部盡可能保持通信的局部性。,(3) 從體系結(jié)構(gòu)的角度, 處理器體系結(jié)構(gòu),從標量結(jié)構(gòu)演變到超級標量結(jié)構(gòu) 從單數(shù)據(jù)流演變到多數(shù)據(jù)流 處理器內(nèi)單一總線結(jié)構(gòu)演變?yōu)槎嗫偩€結(jié)構(gòu) 單指令發(fā)射到多指令發(fā)射,即把多條指令連在一起, 增加運算速度。,超長指令字VLIW(Very Long Instruction Word),比如: 編譯器把“R1+R2R3”和“R4+R5R6”這兩條指令組合到一個指令字中(兩條指令無寄存器相關(guān))。,如:比較Intel 80286與Pentium的內(nèi)部結(jié)構(gòu), Intel 80286,Pentium基本型, 微機系統(tǒng)硬件結(jié)構(gòu)的變化,從單一總線結(jié)構(gòu),主要表現(xiàn)為PCI總線出現(xiàn)后, 在一個系統(tǒng)中PCI總線、ISA總線、EISA總線并存。,多總線結(jié)構(gòu),(4) 從指令計算的角度 指令計算的執(zhí)行順序的演變:,串行計算方式:,指令流水線:,指令1, ,指令2,指令3,指令4,指令1,指令2,指令3,指令4, , EPIC模式,EPIC體系結(jié)構(gòu)最基本的特點是從VLIW繼承而來: 支持由編譯器來決定指令執(zhí)行方案。,在傳統(tǒng)的體系結(jié)構(gòu)中, 由于分支指令的存在, 執(zhí)行時可能會造成很長的延遲, 所以條件分支往往是限制VLIW處理器性能發(fā)揮的瓶頸。 EPIC將分支指令拆分成三部分: 計算分支條件 形成分支地址 從分支處和分支失敗處取指令譯碼 各個部件可以重疊執(zhí)行。,理論上講, 讓一組指令完全并行執(zhí)行, 比如:,對分支指令:,一組指令,一組指令,兩個分之方向的指令并行執(zhí)行!,EPIC的關(guān)鍵技術(shù):, 大量的寄存器支持,支持多個分支同時執(zhí)行時, 所需要的大量數(shù)據(jù)和尋址信息。采用EPIC技術(shù)的處理器, 一般其寄存器數(shù)量都在128個以上。, 高性能編譯器 通過“指令斷定” 技術(shù)(判定技術(shù))使多個分支同時執(zhí)行, 由 “指令管道”技術(shù)來實現(xiàn)(多個指令管道),EPIC(Explicity Parallel Instruction Computing) 顯式并行指令計算: 核心思想是“并行處理”,實現(xiàn)方法: 編譯器提前完成代碼排序,以滿足大流量指令和數(shù)據(jù)的要求。, 高速的指令和數(shù)據(jù)預裝技術(shù), 高帶寬的數(shù)據(jù)通路:,以保證大數(shù)據(jù)高速流動。,三、微機領(lǐng)域當前的幾大熱點 1. 處理器及系統(tǒng) (1) 64位處理器, 基于EPIC英特爾IA-64結(jié)構(gòu)(Itanium處理器), AMD X86-64處理器, 雙核2.5 GHz 處理器 存儲空間擴展至8GB 測試表明: 運行速度遠超出3.4 GHz奔騰4系統(tǒng), 64位PowerPC G5 (Apple, 用于個人電腦 ), Power 4和Power 5(IBM, 用于服務(wù)器) Power 6: 主頻達到5.4GHz,64位編程模式和64位API 64位的編譯器,支持大于4GB的物理存儲空間 支持大于4GB規(guī)模的文件 支持多個物理設(shè)備文件(如多個磁盤系統(tǒng)),64位寬度以上的總線 64位Cache、高速圖形板等,應(yīng)用層,操作系統(tǒng)層,機器層,CPU芯片層,64位整數(shù)寄存器 64位浮點寄存器 64位寬度以上的數(shù)據(jù)總線,以64位計算模式為基礎(chǔ), 加上相應(yīng)系統(tǒng)軟件支持,(2) 全64位計算平臺,(3) 多核處理器,也可以說, 多核處理器是傳統(tǒng)多處理器系統(tǒng)的進一步發(fā)展, 也是集成電路技術(shù)發(fā)展的結(jié)果。,多核處理器(CMP) 是將多個計算內(nèi)核集成在一個處理器芯片中。,多核可以分為同構(gòu)多核和異構(gòu)多核兩種:,同構(gòu)多核 ,計算內(nèi)核相同, 地位對等的稱為“同構(gòu)多核”。同構(gòu)CMP大多數(shù)由通用的處理器組成, 多個處理器執(zhí)行相同或者類似的任務(wù)。,異構(gòu)多核,計算內(nèi)核不同, 地位不對等的稱為“異構(gòu)多核”,異構(gòu)多核多采用“主處理核協(xié)處理核”的設(shè)計,如: IBM公司的CELL處理器 AMD公司的Fusion方案 “CPU+GPU”,但是, 存在以下一些觀點:,多核處理器面臨的最大問題是可編程性。一旦核心超過八個, 就需要執(zhí)行程序能夠并行處理。盡管在并行計算上, 人類已經(jīng)探索了超過40年, 但編寫、調(diào)試、優(yōu)化并行處理程序的能力還非常的弱。,出于技術(shù)的挑戰(zhàn),多核強加給了產(chǎn)業(yè),而產(chǎn)業(yè)界并沒準備好?;蛟S十年后,多核就到頭了。一味地增加并行處理核可能是行不通的。并行計算的發(fā)展歷史表明,并行性超過一定程度后,程序就很難寫。,即使能夠不斷增加同類型的CPU內(nèi)核以加強并行處理能力, 但整個系統(tǒng)的處理性能仍然會受到軟件中必須串行執(zhí)行的那部分的制約。,雖然英特爾已研發(fā)并展示了80核處理器原型, 但尷尬的是,目前還沒有能夠利用這一處理器的操作系統(tǒng)。,2. 存儲器, 問題: 揮發(fā)與非揮發(fā)存儲器與速度和容量的矛盾, 發(fā)展的思路: 將非揮發(fā)性、存取速度快、低成本、大容量、低功耗和可無限擦寫等目前所有揮發(fā)性與非揮發(fā)性兩種存儲器的特性(優(yōu)點)集于一身。,揮發(fā)性存儲器: 高速度、小容量、易揮發(fā)。,非揮發(fā)性存儲器: 低速度、大容量、不揮發(fā)。, 幾種典型解決方案 FeRAM存儲器(鐵電存儲器) 利用鐵電薄膜的極化反轉(zhuǎn)來實現(xiàn)數(shù)據(jù)存/取。,MRAM存儲器 通過控制鐵磁體中的電子旋轉(zhuǎn)方向來實現(xiàn)讀/寫電流的大小, 使其具備二進制數(shù)據(jù)存儲能力。,OUM存儲器 由Intel所提出。以Ge、Sb、Te等化合物為材質(zhì), 利用不同溫度造成材料相位的變化來存儲數(shù)據(jù)。,PCM(基于硫系合金的電熱誘導相變轉(zhuǎn)換) 簡稱相變化存儲器, 是近年來研發(fā)的熱點。 基本原理: 利用某些特殊材料電阻差異存取信息。,3. 64位的操作系統(tǒng), 微軟 Windows Server 2003??杉嫒軮ntel和AMD的64位處理器, Windows .NET Server,64位操作系統(tǒng)描述:,“以64位CPU芯片為前提, 為充分發(fā)揮該64位CPU芯片的性能而實行64位擴展的操作系統(tǒng)”。, 1996年DEC公司: Digital UNIX 4.0 64位操作系統(tǒng), 以及Open VMS 7.0 64 位操作系統(tǒng)。 SUN公司: 64位的Solaris操作系統(tǒng), Windows7 64位 、Windows XP X64 、Vista,4、正研究中的未來計算機,一般認為, 目前在半導體基片上光刻電子元件的方式會遭遇極限(工藝和熱量)。,從未來計算機的發(fā)展角度看, 科學界看好的未來計算機目前有以下三類:,(1) 生物計算機 通過控制DNA分子間的生化反應(yīng)完成運算。,在DNA計算機中, 信息將以分子代碼的形式排列于DNA上。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 展覽場地設(shè)備租賃合同(14篇)
- 廣東科學技術(shù)職業(yè)學院《微機原理與應(yīng)用A》2023-2024學年第二學期期末試卷
- 河南工業(yè)職業(yè)技術(shù)學院《種子質(zhì)量檢驗理論與技術(shù)》2023-2024學年第二學期期末試卷
- 青海民族大學《用戶研究與體驗》2023-2024學年第二學期期末試卷
- 揚州中瑞酒店職業(yè)學院《競技武術(shù)套路5》2023-2024學年第二學期期末試卷
- 2025年遼寧省建筑安全員B證考試題庫
- 蘇州大學應(yīng)用技術(shù)學院《色譜學》2023-2024學年第二學期期末試卷
- 2025年江西省安全員C證(專職安全員)考試題庫
- 山西財貿(mào)職業(yè)技術(shù)學院《工程信息學》2023-2024學年第二學期期末試卷
- 哈爾濱幼兒師范高等專科學?!队⒄Z課程標準解析與教材研究》2023-2024學年第二學期期末試卷
- 空天地一體化公路智能巡查技術(shù)應(yīng)用與實踐
- CJJ129-2009 城市快速路設(shè)計規(guī)程
- punctuation-英語標點的使用
- 股權(quán)糾紛案例分析申訴報告
- 2022云南省中考道法真題試卷和答案
- 如何在質(zhì)保到期后提供售后服務(wù)
- 勞務(wù)經(jīng)濟人培訓課件
- 海爾集團周云杰發(fā)表主題為《無界生態(tài) 無限可能》戰(zhàn)略報告
- 漢字真有趣教學設(shè)計
- 經(jīng)典成語故事葉公好龍
- 自導式教學心得體會范文【3篇】
評論
0/150
提交評論