




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1計算機系統(tǒng)結構課程介紹Computer Architecture“建筑學”、“建筑物的設計或式樣”,通常是指一個系統(tǒng)的外貌。計算機系統(tǒng)結構 計算機體系結構研究內容從外部來研究計算機系統(tǒng)使用者所看到的物理計算機的抽象2編寫出能夠在機器上正確運行的程序所必須了解到的計算機的屬性。軟硬件功能分配及分界面的確定學習目的建立計算機系統(tǒng)的完整概念學習計算機系統(tǒng)的分析方法和設計方法掌握新型計算機系統(tǒng)的基本結構及其工作原理3學科方向一級學科:計算機科學與技術二級學科:計算機系統(tǒng)結構、計算機軟件 計算機應用技術與其他課程的交叉主要包括:計算機組成原理、計算機操作系統(tǒng)、匯編語言、數據結構、微機原理、高級語言等新
2、內容:超標量處理機、超流水線處理機、向量處理機、并行處理機、多處理機等交叉點內容:提高,建立完整概念4教材計算機系統(tǒng)結構,清華大學出版社,鄭瑋民,湯志忠編著,2001年第二版主要參考書1 Advanced Computer Architecture and Parallel processingHesham EL-Rewini, 2李學干,蘇東莊,計算機系統(tǒng)結構,西安電子科技大學出版社。5計算機系統(tǒng)結構第一章 基本概念第二章 指令系統(tǒng)第三章 存儲系統(tǒng)第四章 輸入輸出系統(tǒng)第五章 標量處理機第六章 向量處理機第七章 互連網絡第八章 并行處理機第九章 多處理機6第一章基本概念1.1 計算機系統(tǒng)結構的
3、定義1.2 計算機系統(tǒng)的評價標準1.3 計算機系統(tǒng)的設計方法1.4 計算機系統(tǒng)結構的發(fā)展1.5 計算機系統(tǒng)的分類71.1 計算機系統(tǒng)結構的定義1.1.1 兩種定義1. 定義一Amdahl于1964年在推出IBM360系列計算機時提出:程序員所看到的計算機系統(tǒng)的屬性,即概念性結構概念性結構和功能特性功能特性程序員:匯編語言、機器語言、編譯程序、操作系統(tǒng)看到的:編寫出能夠在機器上正確運行的程序所必須了解到的8主存儲器主存控制器CPUIOP打印機卡片機終端IOP磁盤機 磁帶機概念結構9功能特性:指令系統(tǒng)及其執(zhí)行模式數據表示:硬件能夠直接辯認和處理的數據類型和格式;尋址方式:最小尋址單位、尋址方式的種
4、類和地址運算等;寄存器組織:操作數寄存器、變址寄存器、控制寄存器及專用寄存器的定義、數量和使用規(guī)則等;指令系統(tǒng):機器指令的操作類型、格式,指令間的排序和控制機制等;10中斷系統(tǒng):中斷類型、中斷級別和中斷響應方式等;存儲系統(tǒng):最小編址單位、編址方式、主存容量、最大尋址空間等;處理機工作狀態(tài):定義和切換方式,如管態(tài)和目態(tài)等;輸入輸出系統(tǒng):連接方式、數據交換方式、數據交換過程的控制等;信息保護:包括信息保護方式和硬件對信息保護的支持等。112. 透明性概念本來存在的事物或屬性,從某種角度看似乎不存在例如:浮點數表示、乘法指令對高級語言程序員、應用程序員透明對匯編語言程序員、機器語言程序員 不透明例如
5、:數據總線寬度、微程序對匯編語言程序員、機器語言程序員 透明對硬件設計者、計算機維修人員不透明123. 定義二:計算機系統(tǒng)結構主要研究軟硬件功能分配和對軟硬件界面的確定計算機系統(tǒng)由軟件、硬件和固件組成,它們在功能上是同等的。同一種功能可以用硬件實現,也可以用軟件或固件實現。不同的組成只是性能和價格不同。131.1.2 計算機組成計算機組成是指計算機系統(tǒng)結構的邏輯實現,主要包括:確定數據通路的寬度確定各種操作對功能部件的共享程度確定專用的功能部件確定功能部件的并行度設計緩沖和排隊策略14設計控制機構確定采用何種可靠性技術1.1.3 計算機系統(tǒng)的實現計算機實現是指計算機組成的物理實現,包括:處理機
6、、主存儲器等部件的物理結構器件的集成度和速度專用器件的設計15器件、模塊、插件、底版的劃分與連接信號傳輸技術電源、冷卻及裝配技術,相關制造工藝及技術等計算機系統(tǒng)結構、計算機組成和計算機實現是三個不同的概念,但隨著技術、器件和應用的發(fā)展,三者之間的界限越來越模糊。161.1. 4 計算機系統(tǒng)的層次結構1. 虛擬機概念從不同角度所看到的計算機系統(tǒng)的屬性是不同的,包括:高級語言程序員、匯編語言程序員、系統(tǒng)管理員、硬件設計者大部分人對計算機的認識只需要在某一個層次上17廣義語言解釋或編譯虛擬計算機觀察者作用對象182. 層次結構(接下頁)中央處理機第2級 機器語言機器語言程序員指令系統(tǒng)目標程序硬聯邏輯
7、第0級 硬聯邏輯硬件設計員操作時序邏輯電路微程序控制第1級 微程序控制邏輯設計員指令時序寄存器邏輯19(接下頁)匯編程序第4級 匯編程序匯編語言程序員匯編語言可執(zhí)行程序操作系統(tǒng)第3級 操作系統(tǒng)系統(tǒng)操作員系統(tǒng)原語鍵盤命令系統(tǒng)資源(續(xù)上頁)20應用程序第6級 應用程序用戶應用語言信息處理系統(tǒng)高級語言第5級 高級語言高級語言程序員解釋程序編譯程序可執(zhí)行程序(續(xù)上頁)212. 層次結構第0級由硬件實現第1級由微程序實現第2級至第6級由軟件實現由軟件實現的機器稱為:虛擬機第2級是傳統(tǒng)指令系統(tǒng)(機器語言)機器第3級是操作系統(tǒng)機器操作系統(tǒng)是運行在第級上的解釋程序第4級是匯編語言機器22第5級是高級語言機器第
8、6級是應用語言機器從學科領域來劃分第0和第1級屬于計算機組成與系統(tǒng)結構第3至第5級是系統(tǒng)軟件第6級是應用軟件23它們之間仍有交叉第0級要求一定的數字邏輯基礎第2級涉及匯編語言程序設計的內容第3級與計算機系統(tǒng)結構密切相關。在特殊的計算機系統(tǒng)中,有些級別可能不存在。24第一章基本概念1.1 計算機系統(tǒng)結構的定義1.2 計算機系統(tǒng)的評價標準1.3 計算機系統(tǒng)的設計方法1.4 計算機系統(tǒng)結構的發(fā)展1.5 計算機系統(tǒng)的分類251.2 計算機系統(tǒng)的評價標準:性能和價格1.2.1 性能評測的常用方法:運算速度1. 時鐘頻率(主頻):用于同類處理機之間 如:Pentium/450 比 Pentium/300快
9、50,2. 指令執(zhí)行速度 一種很經典的表示方法MIPS (Million Instructions Per Second), KIPS, GIPS, TIPSMIPS10FzCPIIPC Fz6指令條數執(zhí)行時間26其中,Fz為處理機的工作主頻;CPI (Cycles Per Instruction)為每條指令所需的平均時鐘周期數;IPC (Instruction Per Cycle)為每個時鐘周期平均執(zhí)行的指令條數例1:計算Pentium II 450處理機的運算速度。解:由于PentiumII 450處理機的IPC2 (或CPI0.5), Fz450MHz,因此,MIPSPentium II
10、 450FzIPC4502900(MIPS)27主要缺點:(1)不同指令的速度差別很大(2)指令使用頻度差別很大(3)有相當多的非功能性指令283. 等效指令速度:吉普森(Gibson)法其中,Wi:指令使用頻度,i:指令種類靜態(tài)指令使用頻度:在程序中直接統(tǒng)計)(等效等效指令速度等效指令執(zhí)行時間niiiniiiniiiWCPICPIMIPSWMIPSTWT111/1)(29動態(tài)指令使用頻度:在程序執(zhí)行過程中統(tǒng)計在計算機發(fā)展的早期,用加法指令的運算速度來衡量計算機的速度。通常:加、減法50,乘法15,除法5,程序控制15,其他15例2:我國最早研制的小型計算機DJS-130,定點16位,加法每秒
11、50萬次,但沒有硬件乘法和除法指令,用軟件實現乘法和除法,速度低100倍左右。求等效速度。30解:定點等效速度為:即每秒2萬次,由于乘法和除法用軟件實現,等效速度降低了25倍。例3:假設在程序中浮點開平方操作FPSQR的比例為2,它的CPI為100;其他浮點操作FP的比例為23,它的CPI 4.0;等效指令速度()MIPS1/0.800.50.200.5/1000.02MIPS31其余75指令的CPI1.33,計算該處理機的等效CPI。如果FPSQR操作的CPI也為4.0,重新計算等效CPI。解:由于改進了僅占2的FPSQR操作的CPI,使等效速度提高了近一倍。等效CPI110024231.3
12、3753.92等效CPI24251.33752.00324. 核心程序法把應用程序中用得最頻繁的那部分核心程序作為評價計算機性能的標準程序。稱為基準程序 (benchmark)整數測試程序:Dhrystone用C語言編寫,100條語句。包括:各種賦值語句,各種數據類型和數據區(qū),各種控制語句,過程調用和參數傳送,整數運算和邏輯操作。VAX-11/780的測試結果為每秒1757個33Dhrystones,即:1VAX MIPS1757 Dhrystones/Second浮點測試程序:Linpack用FORTRAN語言編寫,主要是浮點加法和浮點乘法操作。用 MFLOPS(Million Floati
13、ng Point Operations Per Second)表示;GFLOPS、TFLOPSWhetstone基準測試程序用FORTRAN語言編寫的綜合性測試程序,34主要包括:浮點運算、整數算術運算、功能調用、數組變址、條件轉移、超越函數。測試結果用Kwips表示。SPEC基準測試程序 (System performance evaluation Cooperative)由30個左右世界知名計算機大廠商所支持的非盈利的合作組織,包括:IBM、AT&T、BULL、Compaq、CDC、DG、DEC、Fujitsu、HP、Intel、MIPS、Motolola、SGI、SUN、Unis
14、ys等;35SPEC能夠全面反映機器的性能,具有很高的參考價值;以VAX-11/780的測試結果作為基數;SPEC1.0 1989年10月宣布,程序量超過15萬行,包含10個測試程序, 4個定點程序,6個浮點程序;測試結果用SPECint89和SPECfp89表示。1992年,又增加10個測試程序,共有6個定點程序和14個浮點程序,測試結果用SPECint92和SPECfp92表示。1995年,推出SPECint95和SPECfp9536處理機SPECint95SPECfp95PentiumII 40018.513.3PentiumII 45018.713.7PentiumIII 50020.
15、614.7PientiumIII 55022.315.6Celeron 300A12.09.66Celeron 33313.110.20Celeron 36614.110.70Celeron 40015.111.20Celeron 43316.111.60Celeron 46617.012.0037TPC基準程序Transaction Processing Council(事務處理委員會)成立于1988年,已有40多個成員;用于評測計算機的事務處理、數據庫處理、企業(yè)管理與決策支持等方面的性能。1989年10月、1990年8月和1992年7月發(fā)表了TPC-A、TPC-B和TPC-C。385、峰值
16、速度峰值指令速度MIPS、GIPS、TIPSPentium III 500有3條指令流水線,則其峰值指令速度為:3500MHz1500 (MIPS)即每秒15億次例3:一個由8臺機器組成的Cluster系統(tǒng),每臺機器是4個PentiumIII 500組成的SMP系統(tǒng);計算這個Cluster系統(tǒng)的指令峰值速度。39解:峰值指令速度:500MHz 48(GIPS)即每秒480億次。峰值指令速度MIPS、GIPS、TIPS1.2. 2 其他方面的性能1. 存儲能力尋址空間大小,216、224、232、264、40存儲容量,速度,編址單位,編址方式,尋址方式存儲系統(tǒng):Lookahead Cache M
17、ain Memory Online Storage Off-line Storage2. 字長 1幾百位關鍵問題:程序與數據共用同一個主存儲器早期:由指令字長決定當前:由數據字長決定,8的倍數,如:32位、64位等可變字長:任意組合413. 數據類型目前常用:定點、浮點、邏輯已有類型:向量、串、棧、樹發(fā)展方向:自定義4. 指令系統(tǒng)CISC:復雜指令集計算機RISC:精簡指令集計算機VLIW:超長指令字425. 輸入輸出能力輸入輸出方式中斷系統(tǒng)輸入輸出接口6. 兼容性共分12級:011,0級為完全不兼容,11級為自身7. 保護和診斷能力程序與數據的保護43診斷能力:檢錯、糾錯、冗余、自診斷能力可
18、靠性:RAS技術,可靠性R、可用性A、可維護性1.2. 3 其他方面的性能比較1. 價格與性能的關系根據摩爾定理:性能每10年提高100倍,但價格基本不變用同樣的價格,五年之后能買到性能高十倍的機器442. 硬件與軟件的價格比例硬件的比例下降,軟件的比例上升目前軟件價格已經超過硬件價格451.2. 4 計算機性能的比較算術平均值:用速度表示為調和平均:注意:兩個公式等價niimTnA11niimRnH1146加權執(zhí)行時間加權算術平均值:加權調和平均速度:niiimTWA1niiimRWH1147幾何平均速度其中,ETR(execution time ratio),n 指不同的程序幾何平均速度與
19、機器無關,與程序的執(zhí)行時間無關。nniiETRG148第一章基本概念1.1 計算機系統(tǒng)結構的定義1.2 計算機系統(tǒng)的評價標準1.3 計算機系統(tǒng)的設計方法1.4 計算機系統(tǒng)結構的發(fā)展1.5 計算機系統(tǒng)的分類491.3 計算機系統(tǒng)的設計方法1.3.1 軟硬件取舍1.3.2 軟件兼容性設計方法1.3.3 計算機系統(tǒng)設計過程501.3 計算機系統(tǒng)的設計技術1.3.1 軟硬件取舍1. 軟硬件的關系理論上,有兩種極端實現方法全硬件機器,包括操作系統(tǒng)、高級語言、應用程序等硬件只有1位加法和分支操作,其他都用軟件實現51關鍵問題:性能與價格的關系,軟硬件實現在功能上等效計算機系統(tǒng)結構設計者的主要任務就是要確定
20、軟硬件的分界;軟件、硬件和固件的功能分配軟件與硬件實現的特點硬件實現:速度快、成本高;靈活性差、占用內存少軟件實現:速度低、復制費用低;靈活性好、占用內存多發(fā)展趨勢硬件實現的比例越來越高,硬件所占的成本越來越高52發(fā)展不可編程目前計算機最少硬件軟件硬件軟硬件比例53七十年代硬件軟件成本年代542. 從改進性能考慮軟硬件的取舍基本方法:加快經常性事件的執(zhí)行速度Make the common case fast例如加法運算中的溢出和不溢出;中斷處理中的常規(guī)性保護現場和特殊性保護現場;指令切換中的“公操作”是提高計算機速度的瓶頸之一;3. Amdahl定律如何確定經常性事件?或者說應該確定加快處理速
21、度對整個性能的影響如何?55Amdahl定律:系統(tǒng)中某一部件由于采用某種更快的執(zhí)行方式后整個系統(tǒng)性能的提高與這種執(zhí)行方式的使用頻率或占總執(zhí)行時間的比例有關。 在Amdahl定律中,加速比與兩個因素有關:時間改進后改進部分的執(zhí)行時間改進前改進部分的執(zhí)行,時間改進前整個任務的執(zhí)行可改進部分占用的時間SeFe56改進后整個任務的執(zhí)行時間為:其中0為改進前的整個任務的執(zhí)行時間。改進后整個系統(tǒng)的加速比為:其中(1-Fe)表示不可改進部分。TTFFSneee01 ()STTFFSnneee011 ()57例5:假設將某一部件的處理速度加快到10倍,該部件的原處理時間僅為整個運行時間的40%,則采用加快措施
22、后能使整個系統(tǒng)的性能提高多少?解:由題意可知:Fe=0.4, Se=10,根據Amdahl定律,加速比為:Sn110404101064156(. ).58例6:假設某測試程序中FP指令占50%,FPSQR指令占20%,用改進FP指令速度為原來的2倍和改進FPSQR指令速度為原來的10倍,兩種方法中的哪種更好?解:第一種方法:Fe=0.5, Se=2,根據Amdahl定律,加速比為:第一種方法:Fe=0.2, Se=10,根據Amdahl定律,加速比為:33.175.0125 .0)5 .01(1nS22.182.01102 .0)2 .01(1nS594. 改進性能的主要途徑面向目標代碼改進:
23、用一條指令代替一串指令方法:統(tǒng)計某條指令、某類指令或某個指令串的使用頻度包括動態(tài)使用頻度和靜態(tài)使用頻度例如:例1中,增加硬件乘法和除法指令使等效指令速度提高25倍. 例2中,改進FPSQR指令使等效CPI提高近1倍60面向高級語言改進:方法:統(tǒng)計某些語句的使用頻度例如:一般程序中賦值語句占30%以上,為此,許多處理機中設置了寄存器與寄存器、寄存器與存儲器、存儲器與存儲器之間的成組傳送指令。例如:在do循環(huán)中,循環(huán)體只有一、二條的占60%左右,造成循環(huán)控制部分所占的比例很大,因此,增加循環(huán)控制指令。61又例如:條件碼對高級語言幾乎無用。面向操作系統(tǒng)改進:方法:系統(tǒng)結構設計要規(guī)整,消除例外情況,寄
24、存器定義要統(tǒng)一、操作要均勻、所有存儲部件要對稱621.3.2 軟件兼容性設計方法原因:1.軟件相對于硬件的成本越來越貴;2.已積累了大量成熟的系統(tǒng)軟件和應用軟件。兼容種類向后兼容在某一時間生產的機器上運行的目標軟件能夠直接運行于更晚生產的機器上。向前兼容向上兼容在低檔機器上運行的目標軟件能夠直接運行于高檔機器上。63向下兼容其中向后兼容最重要,必須做到向上兼容盡量做到向前兼容和向下兼容,可以不考慮方法1:系列機方法系列機定義:具有相同的系統(tǒng)結構,不同組成和實現的一系列計算機系統(tǒng)實現方法:在系統(tǒng)結構基本不變的基礎上,根據不同性能的要求和當時的器件發(fā)展情況,設計出各種性能、價格不同的計64算機系統(tǒng)
25、。一種系統(tǒng)結構可以有多種組成,一種組成可以有多種物理實現。如IBM370系列機:370/115、125、135、145、158、168等各種型號。相同的系統(tǒng)結構,不同的組成和實現技術,不同的性能和價格。相同的指令系統(tǒng),分別采用順序執(zhí)行、重迭、流水和并行處理方式。相同的32位字長,數據通道的寬度分別為8位、16位、32位、64位。65PC系列機:8088、8086、80186、80286、80386、80484、Pentium、PentiumII、PentiumIII PentiumIV 不同工作主頻;不同擴展功能:Pentium、Pentium Pro、Pentium MMX不同的Cache:
26、PentiumII、Celeron、Xeon不同的字長:8位(8088)、16位(80286)、32位、64位。66采用系列機方法的主要優(yōu)點:系列機之間軟件兼容,可移植性好;插件、接口等相互兼容;便于實現機間通信;便于維修、培訓;有利于提高產量、降低成本采用系列機方法的主要缺點:限制了計算機系統(tǒng)結構的發(fā)展方法2:模擬與仿真 Simulation Emulation定義:在一臺現有的計算機上實現另一臺計算機的指令系統(tǒng)。67全部用軟件實現的叫模擬用硬件、固件或軟件、硬件、固件混合實現的叫仿真模擬的實現方法:在A計算機上通過解釋方法實現B計算機的指令系統(tǒng),即B機器的每一條指令用一段A機器的程序進行解釋執(zhí)行。A機器稱為宿主機,B機器稱為虛擬機。仿真的實現方法:直接用A機器的一段微程序解釋執(zhí)行B機器的每條指令。A機器稱為宿主機,B機稱為目標機。68優(yōu)缺點比較模擬方法速度低,仿真方法速度高仿真需要較多的硬件(包括控制存儲器)系統(tǒng)結構差別大的機器難于完全用仿真方法來實現除了指令系統(tǒng)之外,還有存儲系統(tǒng)、I/O系統(tǒng)、中斷系統(tǒng)、控制臺的操作等除了解釋方法之外,也可以通過編譯方法實現模擬方法用于計算機系統(tǒng)的設計過程在一臺已有的機器上用模擬方法實現另69外一臺正在設計中的機器
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2020-2021深圳寶文學校小學三年級數學下期末第一次模擬試卷(及答案)
- 人教版(2024)七年級英語下冊Unit 7 單元檢測試卷(含答案)
- 甘肅木屋別墅施工方案
- 折扣(教學設計)-2023-2024學年六年級下冊數學人教版
- 統(tǒng)戰(zhàn)理論知識培訓班課件
- 知識產權業(yè)務培訓課件
- 云南省麗江市華坪縣2025屆中考五模生物試題含解析
- epc合作內部合同范例
- 財務共享服務中心的構建計劃
- 公司合同范例填
- 餐廚廢棄物處理臺賬記錄表
- 廣東省廣州市2024年中考數學真題試卷(含答案)
- 存款代持協議書范文模板
- 國家基本藥物培訓課件
- KPI績效考核管理辦法
- 2024年深圳市優(yōu)才人力資源有限公司招考聘用綜合網格員(派遣至吉華街道)高頻難、易錯點500題模擬試題附帶答案詳解
- 零星維修工程投標方案(技術方案)
- 華能內蒙古東部能源有限公司招聘筆試題庫2024
- 橫紋肌溶解癥護理查房
- 2023年部編人教版三年級《道德與法治》下冊全冊課件【全套】
- 部編版六年級語文下冊(10-古詩三首)課件
評論
0/150
提交評論