版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Ch1: Computer Abstractions 計(jì)算機(jī)系統(tǒng)概述計(jì)算機(jī)系統(tǒng)概述2022年年5月月14日星期六日星期六第第1 1講:計(jì)算機(jī)系統(tǒng)概述講:計(jì)算機(jī)系統(tǒng)概述第第2 2講:計(jì)算機(jī)性能評(píng)價(jià)講:計(jì)算機(jī)性能評(píng)價(jià)22022年年5月月14日星期六日星期六第一講第一講 計(jì)算機(jī)系統(tǒng)概述計(jì)算機(jī)系統(tǒng)概述計(jì)算機(jī)發(fā)展簡(jiǎn)史計(jì)算機(jī)發(fā)展簡(jiǎn)史 IAS通用計(jì)算機(jī)模型機(jī):馮通用計(jì)算機(jī)模型機(jī):馮.諾依曼結(jié)構(gòu)諾依曼結(jié)構(gòu) IBM360系列機(jī):引入兼容性(系列機(jī))概念系列機(jī):引入兼容性(系列機(jī))概念 DEC PDP-8:引入總線結(jié)構(gòu):引入總線結(jié)構(gòu)計(jì)算機(jī)系統(tǒng)的組成計(jì)算機(jī)系統(tǒng)的組成 計(jì)算機(jī)硬件:計(jì)算機(jī)硬件:CPU + MM + I
2、/O 計(jì)算機(jī)軟件:系統(tǒng)軟件計(jì)算機(jī)軟件:系統(tǒng)軟件+應(yīng)用軟件應(yīng)用軟件計(jì)算機(jī)層次結(jié)構(gòu)計(jì)算機(jī)層次結(jié)構(gòu) 計(jì)算機(jī)硬件和軟件的接口:指令系統(tǒng)計(jì)算機(jī)硬件和軟件的接口:指令系統(tǒng) 計(jì)算機(jī)軟件如何在硬件上執(zhí)行計(jì)算機(jī)軟件如何在硬件上執(zhí)行本課程主要內(nèi)容本課程主要內(nèi)容32022年年5月月14日星期六日星期六回顧:計(jì)算機(jī)發(fā)展簡(jiǎn)史回顧:計(jì)算機(jī)發(fā)展簡(jiǎn)史第一代:真空管(電子管第一代:真空管(電子管Vacuum Tube )194657年年 46年誕生第年誕生第1臺(tái)電子計(jì)算機(jī)臺(tái)電子計(jì)算機(jī) ENIAC- 體積大,重體積大,重30噸,有噸,有18000多個(gè)真空管,多個(gè)真空管,5000次加法次加法/s- 十進(jìn)制表示十進(jìn)制表示/運(yùn)算,存儲(chǔ)
3、器由運(yùn)算,存儲(chǔ)器由20個(gè)累加器組成,每個(gè)累個(gè)累加器組成,每個(gè)累加器存加器存10位十進(jìn)制數(shù),每一位由位十進(jìn)制數(shù),每一位由10個(gè)真空管表示。個(gè)真空管表示。- 采用手動(dòng)編程,通過設(shè)置開關(guān)和插拔電纜來實(shí)現(xiàn)。采用手動(dòng)編程,通過設(shè)置開關(guān)和插拔電纜來實(shí)現(xiàn)。 馮馮諾依曼機(jī)(諾依曼機(jī)(Von Neumann Machine)- 45年馮年馮諾依曼提出諾依曼提出“存儲(chǔ)程序存儲(chǔ)程序(Stored-program)”思思想,并于想,并于46年開始設(shè)計(jì)年開始設(shè)計(jì)“存儲(chǔ)程序存儲(chǔ)程序”計(jì)算機(jī)。計(jì)算機(jī)。- “存儲(chǔ)程序存儲(chǔ)程序”思想:思想: 將事先編好的程序和原始數(shù)據(jù)送入主存中,然后啟動(dòng)執(zhí)行。計(jì)算機(jī)能在不需操作人員干預(yù)下,自動(dòng)
4、完成逐條取出指令和執(zhí)行指令的任務(wù)。 SKIPThe First Generation: Vacuum Tube Computers (1946 - 1957)The first general-purpose computer - ENIAC52022年年5月月14日星期六日星期六ENIAC-Non von Neumann ModelBACK62022年年5月月14日星期六日星期六馮馮諾依曼結(jié)構(gòu)的主要思想諾依曼結(jié)構(gòu)的主要思想1.1. 計(jì)算機(jī)應(yīng)由運(yùn)算器、控制器、存儲(chǔ)器、輸入設(shè)備和輸出設(shè)備計(jì)算機(jī)應(yīng)由運(yùn)算器、控制器、存儲(chǔ)器、輸入設(shè)備和輸出設(shè)備五個(gè)基本部件組成。五個(gè)基本部件組成。2.2. 各基本部件的
5、功能是:各基本部件的功能是:存儲(chǔ)器存儲(chǔ)器不僅能存放數(shù)據(jù),而且也能存放指令,形式上兩者不僅能存放數(shù)據(jù),而且也能存放指令,形式上兩者沒有區(qū)別,但計(jì)算機(jī)應(yīng)能區(qū)分?jǐn)?shù)據(jù)還是指令;沒有區(qū)別,但計(jì)算機(jī)應(yīng)能區(qū)分?jǐn)?shù)據(jù)還是指令;控制器控制器應(yīng)能自動(dòng)執(zhí)行指令;應(yīng)能自動(dòng)執(zhí)行指令;運(yùn)算器運(yùn)算器應(yīng)能進(jìn)行加應(yīng)能進(jìn)行加/ /減減/ /乘乘/ /除四種基本算術(shù)運(yùn)算,并且也除四種基本算術(shù)運(yùn)算,并且也能進(jìn)行一些邏輯運(yùn)算和附加運(yùn)算;能進(jìn)行一些邏輯運(yùn)算和附加運(yùn)算;操作人員可以通過操作人員可以通過輸入設(shè)備輸入設(shè)備、輸出設(shè)備輸出設(shè)備和主機(jī)進(jìn)行通信。和主機(jī)進(jìn)行通信。3.3. 內(nèi)部以內(nèi)部以二進(jìn)制表示二進(jìn)制表示指令和數(shù)據(jù)。每條指令由操作碼和地址
6、碼指令和數(shù)據(jù)。每條指令由操作碼和地址碼兩部分組成。操作碼指出操作類型,地址碼指出操作數(shù)的地兩部分組成。操作碼指出操作類型,地址碼指出操作數(shù)的地址。由一串指令組成程序。址。由一串指令組成程序。4.4. 采用采用“存儲(chǔ)程序存儲(chǔ)程序”工作方式。工作方式。72022年年5月月14日星期六日星期六計(jì)算機(jī)發(fā)展簡(jiǎn)史計(jì)算機(jī)發(fā)展簡(jiǎn)史第二代:晶體管第二代:晶體管 195864年年 元器件:元器件:邏輯元件采用晶體管,內(nèi)存由磁邏輯元件采用晶體管,內(nèi)存由磁芯構(gòu)成,外存為磁鼓與磁帶。芯構(gòu)成,外存為磁鼓與磁帶。 特點(diǎn):特點(diǎn):變址,浮點(diǎn)運(yùn)算,多路存儲(chǔ)器,變址,浮點(diǎn)運(yùn)算,多路存儲(chǔ)器,I/O處理機(jī),中央交換結(jié)構(gòu)處理機(jī),中央交換
7、結(jié)構(gòu)(非總線結(jié)構(gòu)非總線結(jié)構(gòu))。 軟件:軟件:使用高級(jí)語言,提供了系統(tǒng)軟件。使用高級(jí)語言,提供了系統(tǒng)軟件。 代表機(jī)種:代表機(jī)種:IBM 7094 (scientific)、1401 (business)和和 DEC PDP-1DEC PDP-1晶體管:晶體管:Transistor82022年年5月月14日星期六日星期六計(jì)算機(jī)發(fā)展簡(jiǎn)史計(jì)算機(jī)發(fā)展簡(jiǎn)史第三代:第三代:SSI/MSI 196571年年 元器件:元器件:邏輯元件與主存儲(chǔ)器均由集成電路(邏輯元件與主存儲(chǔ)器均由集成電路(IC)實(shí)現(xiàn)實(shí)現(xiàn) 。 特點(diǎn):特點(diǎn):微程序控制,微程序控制,Cache,虛擬存儲(chǔ)器,流水線等。虛擬存儲(chǔ)器,流水線等。 代表機(jī)種:
8、代表機(jī)種:IBM 360和和DEC PDP-8(大大/巨型機(jī)與小型機(jī)同時(shí)發(fā)展巨型機(jī)與小型機(jī)同時(shí)發(fā)展 )-巨型機(jī)巨型機(jī)(Supercomputer):Cray-1-大型機(jī)大型機(jī)(Mainframe):IBM360系列系列-小型機(jī)小型機(jī)(Minicomputer):DEC PDP-8Cray-192022年年5月月14日星期六日星期六IBM System/360系列計(jì)算機(jī)系列計(jì)算機(jī)IBM公司于公司于1964年研制成功年研制成功引入引入“兼容機(jī)兼容機(jī)”(系列機(jī)系列機(jī))概念概念 兼容機(jī)的特征兼容機(jī)的特征 :-相同的或相似的指令集相同的或相似的指令集-相同或相似的操作系統(tǒng)相同或相似的操作系統(tǒng)-更高的速度
9、更高的速度-更多的更多的I/O端口數(shù)端口數(shù)-更大的內(nèi)存容量更大的內(nèi)存容量-更高的價(jià)格更高的價(jià)格低端機(jī)指令集是高端機(jī)的一個(gè)低端機(jī)指令集是高端機(jī)的一個(gè)子集,稱為子集,稱為“向后兼容向后兼容”。原。原來機(jī)器上的程序可以不改動(dòng)而來機(jī)器上的程序可以不改動(dòng)而在新機(jī)器上運(yùn)行,但性能不同。在新機(jī)器上運(yùn)行,但性能不同。IBM 360問題問題1 1:引入:引入“兼容機(jī)兼容機(jī)”有什么好處?有什么好處?問題問題2 2:保持:保持“兼容兼容”的關(guān)鍵是什么?的關(guān)鍵是什么?102022年年5月月14日星期六日星期六DEC公司的PDP-8機(jī)同在同在64年出現(xiàn)。與年出現(xiàn)。與IBM 360相比,價(jià)格更低、更小巧,因而被相比,價(jià)格
10、更低、更小巧,因而被稱為小型機(jī)(稱為小型機(jī)(Minicomputer)PDP-8“創(chuàng)造了小型機(jī)概念,并使之成為數(shù)十億美元的工業(yè)創(chuàng)造了小型機(jī)概念,并使之成為數(shù)十億美元的工業(yè)”,使,使DEC成為了最大的小型機(jī)制造商。成為了最大的小型機(jī)制造商。主要特點(diǎn):首次采用總線結(jié)構(gòu)。主要特點(diǎn):首次采用總線結(jié)構(gòu)。 具有高度的靈活性,允許將模塊插入總線以形成各種配置。具有高度的靈活性,允許將模塊插入總線以形成各種配置。112022年年5月月14日星期六日星期六PDP8/E計(jì)算機(jī)系統(tǒng)框圖計(jì)算機(jī)系統(tǒng)框圖問題:?jiǎn)栴}:“總線結(jié)構(gòu)總線結(jié)構(gòu)”有什么好處有什么好處?可擴(kuò)充性好(允許將新的符合標(biāo)準(zhǔn)的模塊插入總線形成各種配置)、節(jié)省
11、器件,體積小,價(jià)格便宜Omnibus總線包含了總線包含了96個(gè)獨(dú)立的信號(hào)通道,用以傳送控制、個(gè)獨(dú)立的信號(hào)通道,用以傳送控制、地址和數(shù)據(jù)信號(hào)。地址和數(shù)據(jù)信號(hào)。122022年年5月月14日星期六日星期六計(jì)算機(jī)發(fā)展簡(jiǎn)史計(jì)算機(jī)發(fā)展簡(jiǎn)史 第四代:第四代:LSI/VLSI/ULSI 1972至今至今 微處理器和半導(dǎo)體存儲(chǔ)器技術(shù)發(fā)展迅猛,微型計(jì)算機(jī)出現(xiàn)。微處理器和半導(dǎo)體存儲(chǔ)器技術(shù)發(fā)展迅猛,微型計(jì)算機(jī)出現(xiàn)。 使計(jì)算機(jī)以辦公設(shè)備和個(gè)人電腦的方式走向普通用戶。使計(jì)算機(jī)以辦公設(shè)備和個(gè)人電腦的方式走向普通用戶。半導(dǎo)體存儲(chǔ)器半導(dǎo)體存儲(chǔ)器- 70年年Fairchild公司生產(chǎn)出第一個(gè)相對(duì)大容量半導(dǎo)體存儲(chǔ)器公司生產(chǎn)出第一個(gè)
12、相對(duì)大容量半導(dǎo)體存儲(chǔ)器- 74年位價(jià)格低于磁芯的半導(dǎo)體存儲(chǔ)器出現(xiàn),并快速下跌年位價(jià)格低于磁芯的半導(dǎo)體存儲(chǔ)器出現(xiàn),并快速下跌- 從從70年起,存儲(chǔ)密度呈年起,存儲(chǔ)密度呈4倍提高(幾乎是每倍提高(幾乎是每3年)年)微處理器微處理器- 微處理器芯片密度不斷增加,使微處理器芯片密度不斷增加,使CPU中所有元件放在一塊芯片中所有元件放在一塊芯片上成為可能。上成為可能。71年開發(fā)出第一個(gè)微處理器芯片年開發(fā)出第一個(gè)微處理器芯片4004。 特點(diǎn):共享存儲(chǔ)器,分布式存儲(chǔ)器及大規(guī)模并行處理系統(tǒng)特點(diǎn):共享存儲(chǔ)器,分布式存儲(chǔ)器及大規(guī)模并行處理系統(tǒng)以后幾代(標(biāo)準(zhǔn)、意見不一)以后幾代(標(biāo)準(zhǔn)、意見不一) (注:有稱第四代是
13、(注:有稱第四代是VLSI,從從80年代開始;年代開始;也有稱第四代是也有稱第四代是LSI,從從72年開始;有的又分成年開始;有的又分成LSI時(shí)代和時(shí)代和VLSI時(shí)代)時(shí)代)132022年年5月月14日星期六日星期六Mainframe Eras :1950s-60s13Processor (CPU)I/O資料來源:UC-Berkeley, Course CS61C, Spring 2011 Lecture #1“Big Iron”: IBM, UNIVAC, build $1M computers for businesses = COBOL, Fortran, timesharing OS1
14、42022年年5月月14日星期六日星期六Minicomputer Eras: 1970s資料來源:UC-Berkeley, Course CS61C, Spring 2011 Lecture #114Using integrated circuits, Digital, HP build $10k computers for labs, universities = C, UNIX OS152022年年5月月14日星期六日星期六PC Era: Mid 1980s - Mid 2000s15Using microprocessors, Apple, IBM, build $1k computer
15、 for 1 person = Basic, Java, Windows OS資料來源:UC-Berkeley, Course CS61C, Spring 2011 Lecture #1162022年年5月月14日星期六日星期六PostPC Era: Late 2000s - ?Personal Mobile Devices (PMD): Relying on wireless networking Apple, Nokia, build $500 smartphone and tablet computers for individuals = Objective C, Android OS
16、Cloud Computing: Using Local Area Networks, Amazon, Google, build $200M Warehouse Scale Computers with 100,000 servers for Internet Services for PMDs= MapReduce, Ruby on Rails16資料來源:UC-Berkeley, Course CS61C, Spring 2011 Lecture #1iPhoneiPodiPad172022年年5月月14日星期六日星期六Advanced RISC Machine (ARM)instruc
17、tion set inside the iPhone17資料來源:UC-Berkeley, Course CS61C, Spring 2011 Lecture #1182022年年5月月14日星期六日星期六iPhone Innards181 GHz ARM Cortex A8You will about multiple processors, data level parallelism, caches in 61CI/OI/OI/OProcessorMemory資料來源:UC-Berkeley, Course CS61C, Spring 2011 Lecture #1麻雀雖小,五臟俱全!1
18、92022年年5月月14日星期六日星期六Containers in WSCs19Inside WSCInside Container資料來源:UC-Berkeley, Course CS61C, Spring 2011 Lecture #1202022年年5月月14日星期六日星期六Server, Rack, Array20資料來源:UC-Berkeley, Course CS61C, Spring 2011 Lecture #1212022年年5月月14日星期六日星期六什么是計(jì)算機(jī)?什么是計(jì)算機(jī)?計(jì)算機(jī)是一種能對(duì)計(jì)算機(jī)是一種能對(duì)數(shù)字化信息數(shù)字化信息進(jìn)行進(jìn)行自動(dòng)、高速自動(dòng)、高速算術(shù)算術(shù)和邏輯和邏
19、輯運(yùn)算運(yùn)算的通用處理裝置。的通用處理裝置。計(jì)算機(jī)的功能:計(jì)算機(jī)的功能:數(shù)據(jù)運(yùn)算、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)傳送、數(shù)據(jù)運(yùn)算、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)傳送、控制控制計(jì)算機(jī)的特點(diǎn):計(jì)算機(jī)的特點(diǎn):高速:高速:高速元件和高速元件和”存儲(chǔ)程序存儲(chǔ)程序”工作方式帶來高速性工作方式帶來高速性通用:通用:體現(xiàn)在處理對(duì)象和應(yīng)用領(lǐng)域方面的廣泛性體現(xiàn)在處理對(duì)象和應(yīng)用領(lǐng)域方面的廣泛性準(zhǔn)確:準(zhǔn)確:足夠精度的算術(shù)運(yùn)算帶來準(zhǔn)確性足夠精度的算術(shù)運(yùn)算帶來準(zhǔn)確性智能:智能:邏輯推理能力帶來智能性邏輯推理能力帶來智能性計(jì)算機(jī)的功能和特點(diǎn)計(jì)算機(jī)的功能和特點(diǎn)222022年年5月月14日星期六日星期六計(jì)算機(jī)硬件:打開計(jì)算機(jī)硬件:打開PC來看看來看看232022
20、年年5月月14日星期六日星期六PC主板主板CPU插座插座內(nèi)存條內(nèi)存條PCI總線插槽總線插槽242022年年5月月14日星期六日星期六解剖一臺(tái)計(jì)算機(jī)(分而治之)解剖一臺(tái)計(jì)算機(jī)(分而治之) 個(gè)人計(jì)算機(jī)由主個(gè)人計(jì)算機(jī)由主機(jī)和外設(shè)組成機(jī)和外設(shè)組成主機(jī)中包含主機(jī)中包含多個(gè)電路板多個(gè)電路板每個(gè)電路板中有每個(gè)電路板中有十幾個(gè)集成電路十幾個(gè)集成電路每個(gè)集成電路中每個(gè)集成電路中有十幾個(gè)模塊有十幾個(gè)模塊每個(gè)模塊中有每個(gè)模塊中有上千萬個(gè)單元上千萬個(gè)單元每個(gè)單元中有每個(gè)單元中有十幾個(gè)門電路十幾個(gè)門電路每個(gè)門電路實(shí)現(xiàn)基每個(gè)門電路實(shí)現(xiàn)基本的邏輯運(yùn)算本的邏輯運(yùn)算 所有信息都用二所有信息都用二進(jìn)制編碼表示進(jìn)制編碼表示2520
21、22年年5月月14日星期六日星期六Integrated Circuits manufacturing process 單晶硅錠單晶硅錠圓形薄片圓形薄片 / 硅拋光片硅拋光片(6/8/12寸寸,厚度不足厚度不足1mm)ICIC小片小片 / / 芯片芯片不合格的用磁不合格的用磁漿點(diǎn)上記號(hào)漿點(diǎn)上記號(hào)封裝:將芯片固定在塑膠或陶瓷基座上,把芯片上蝕刻出來的封裝:將芯片固定在塑膠或陶瓷基座上,把芯片上蝕刻出來的引線與基座底部伸出的引腳連接,蓋上蓋板并封焊成芯片引線與基座底部伸出的引腳連接,蓋上蓋板并封焊成芯片約需約需400多多道工序!道工序!“晶圓晶圓” / / 大芯片大芯片282022年年5月月14日星
22、期六日星期六Pentium4處理器內(nèi)部布局處理器內(nèi)部布局控控制制器器控制器控制器指令指令Cache數(shù)據(jù)數(shù)據(jù)CacheI/O接接口口 浮點(diǎn)數(shù)和多媒浮點(diǎn)數(shù)和多媒體處理體處理控制器控制器高級(jí)流水線和高級(jí)流水線和超線程支持超線程支持控制器控制器整數(shù)整數(shù)處理處理二級(jí)二級(jí)Cache和內(nèi)存和內(nèi)存訪問接訪問接口口292022年年5月月14日星期六日星期六Hardware/Software Interface , EXTop=1,ALUSelA=1,ALUSelB=11,ALUop=add,IorD=1,Read,MemtoReg=1,RegWr=1,.temp = vk;vk = vk+1;vk+1 = te
23、mp;lw $15, 0($2)lw $16, 4($2)sw $16, 0($2)sw $15, 4($2)1000 1100 0100 1111 0000 0000 0000 00001000 1100 0101 0000 0000 0000 0000 01001010 1100 0101 0000 0000 0000 0000 00001010 1100 0100 1111 0000 0000 0000 0100軟軟件件硬硬件件302022年年5月月14日星期六日星期六Hardware/Software Interface(界面)(界面)機(jī)器語言由指令代碼構(gòu)成,能被硬件直接執(zhí)行。 軟件和
24、硬件的界面:軟件和硬件的界面: ISA(Instruction Set Architecture ) 指令集體系結(jié)構(gòu)軟件軟件硬件硬件312022年年5月月14日星期六日星期六Software System software(系統(tǒng)軟件系統(tǒng)軟件) - 簡(jiǎn)化編程過程,并使硬件資源被有效利用簡(jiǎn)化編程過程,并使硬件資源被有效利用 操作系統(tǒng)(操作系統(tǒng)(Operating System):):硬件資源管理,用戶接口硬件資源管理,用戶接口 語言處理系統(tǒng):翻譯程序語言處理系統(tǒng):翻譯程序+ Linker, Debug, etc -翻譯程序翻譯程序(Translator)有三類:有三類:匯編程序匯編程序(Assem
25、bler):匯編語言源程序匯編語言源程序機(jī)器語言目標(biāo)程序機(jī)器語言目標(biāo)程序編譯程序編譯程序(Complier):高級(jí)語言源程序高級(jí)語言源程序匯編匯編/機(jī)器語言目標(biāo)程序機(jī)器語言目標(biāo)程序解釋程序解釋程序(Interpreter ):將高級(jí)語言語句逐條翻譯成機(jī)器指令并立將高級(jí)語言語句逐條翻譯成機(jī)器指令并立即執(zhí)行即執(zhí)行,不生成目標(biāo)文件。不生成目標(biāo)文件。 其他實(shí)用程序其他實(shí)用程序: 如:磁盤碎片整理程序、備份程序等如:磁盤碎片整理程序、備份程序等Application software(應(yīng)用軟件應(yīng)用軟件) - 解決具體應(yīng)用問題解決具體應(yīng)用問題/完成具體應(yīng)用任務(wù)完成具體應(yīng)用任務(wù) 各類媒體處理程序:各類媒體處
26、理程序:Word/ Image/ Graphics/ 管理信息系統(tǒng)管理信息系統(tǒng) (MIS) Game, 322022年年5月月14日星期六日星期六Computer Hierarchy(計(jì)算機(jī)系統(tǒng)層次)(計(jì)算機(jī)系統(tǒng)層次)I/OCPUCompilerOperatingSystemApplicationDigital DesignCircuit Design 上圖給出的是計(jì)算機(jī)系統(tǒng)的層次結(jié)構(gòu)上圖給出的是計(jì)算機(jī)系統(tǒng)的層次結(jié)構(gòu) 指令系統(tǒng)(即指令系統(tǒng)(即ISAISA)是軟)是軟/ /硬件的交界面硬件的交界面Instruction Set Architecture不同用戶工作在不同層次,所看到的計(jì)算機(jī)不一樣
27、不同用戶工作在不同層次,所看到的計(jì)算機(jī)不一樣最終用戶最終用戶End User應(yīng)用程序員應(yīng)用程序員Application Programmer系統(tǒng)管理員系統(tǒng)管理員System Administrator系統(tǒng)程序員系統(tǒng)程序員System ProgrammerMMAssembler中間陰影部分就是本課程主要內(nèi)容,處于最核心的部分!中間陰影部分就是本課程主要內(nèi)容,處于最核心的部分!332022年年5月月14日星期六日星期六一個(gè)典型系統(tǒng)的硬件組成一個(gè)典型系統(tǒng)的硬件組成PC:程序計(jì)數(shù)器;程序計(jì)數(shù)器;ALU:算術(shù):算術(shù)/邏輯單元;邏輯單元;USB:通用串行總線:通用串行總線CPUMMInput/Output
28、342022年年5月月14日星期六日星期六一個(gè)典型程序的轉(zhuǎn)換處理過程一個(gè)典型程序的轉(zhuǎn)換處理過程1 #include 23 int main()4 5 printf(hello, worldn);6 經(jīng)典的經(jīng)典的“ hello.c ”C-源程序源程序# i n c l u d e n n i n t m a i n ( ) n 104 62 10 10 105 110 116 32 109 97 105 110 40 41 10 123n p r i n t f ( h e l10 32 32 32 32 112 114 105 110 116 102 40 34 104 101 108l o
29、, w o r l d n ) ; n 108 111 44 32 119 111 114 108 100 92 110 34 41 59 10 125hello.c的的ASCII文本表示文本表示計(jì)算機(jī)能夠直接識(shí)計(jì)算機(jī)能夠直接識(shí)別別hello.c源程序嗎源程序嗎?不能,需要轉(zhuǎn)換為機(jī)器語言不能,需要轉(zhuǎn)換為機(jī)器語言代碼代碼! ! 即:編譯、匯編等即:編譯、匯編等程序的功能是:程序的功能是:輸出輸出“hello,world”352022年年5月月14日星期六日星期六Hello程序的數(shù)據(jù)流動(dòng)過程程序的數(shù)據(jù)流動(dòng)過程“hello”Hello可執(zhí)行文件可執(zhí)行文件Red:shell命令行處理命令行處理Blue
30、:可執(zhí)行文件加載:可執(zhí)行文件加載Cyan:hello程序執(zhí)行過程程序執(zhí)行過程“hello”“hello,world/n”“hello,world/n”所有過程都是在所有過程都是在CPU執(zhí)行指令所產(chǎn)生的控制信號(hào)的作用下進(jìn)行的。執(zhí)行指令所產(chǎn)生的控制信號(hào)的作用下進(jìn)行的。數(shù)據(jù)經(jīng)常在各存儲(chǔ)部件間傳送。故現(xiàn)代計(jì)算機(jī)大多采用數(shù)據(jù)經(jīng)常在各存儲(chǔ)部件間傳送。故現(xiàn)代計(jì)算機(jī)大多采用“緩存緩存”技術(shù)!技術(shù)!Unix./hellohello, worldunixEnter362022年年5月月14日星期六日星期六Hello程序的數(shù)據(jù)流動(dòng)過程程序的數(shù)據(jù)流動(dòng)過程“hello”Hello可執(zhí)行文件可執(zhí)行文件“hello”“he
31、llo,world/n”“hello,world/n”372022年年5月月14日星期六日星期六該課程及實(shí)踐課程的主要學(xué)習(xí)內(nèi)容該課程及實(shí)踐課程的主要學(xué)習(xí)內(nèi)容信息(指令和數(shù)據(jù))在計(jì)算機(jī)中如何表示?信息(指令和數(shù)據(jù))在計(jì)算機(jī)中如何表示?指令系統(tǒng)如何設(shè)計(jì)?指令系統(tǒng)如何設(shè)計(jì)?如何設(shè)計(jì)高性能如何設(shè)計(jì)高性能CPU?如何設(shè)計(jì)存如何設(shè)計(jì)存儲(chǔ)器系統(tǒng)?儲(chǔ)器系統(tǒng)?如何設(shè)計(jì)如何設(shè)計(jì)I/O?如何設(shè)計(jì)總線如何設(shè)計(jì)總線BUS?382022年年5月月14日星期六日星期六第一講小結(jié)第一講小結(jié)性能評(píng)價(jià)(性能評(píng)價(jià)(Performance measurement)計(jì)算機(jī)算術(shù)(計(jì)算機(jī)算術(shù)(Arithmetic for Computer
32、) 數(shù)據(jù)的表示和運(yùn)算數(shù)據(jù)的表示和運(yùn)算存儲(chǔ)器層次結(jié)構(gòu)(存儲(chǔ)器層次結(jié)構(gòu)(Memory Hierarchies )指令集體系結(jié)構(gòu)(指令集體系結(jié)構(gòu)(Instruction Set Architecture)CPU設(shè)計(jì)設(shè)計(jì) 數(shù)據(jù)通路數(shù)據(jù)通路 (Data path) 和控制器和控制器(Control Unit)流水線技術(shù)流水線技術(shù) (Pipelining)系統(tǒng)總線系統(tǒng)總線 (System Buses)輸入輸入/輸出系統(tǒng)(輸出系統(tǒng)(Input / Output system)392022年年5月月14日星期六日星期六第二講第二講 計(jì)算機(jī)性能評(píng)價(jià)計(jì)算機(jī)性能評(píng)價(jià)制造成本(制造成本(manufacturing c
33、ost)衡量計(jì)算機(jī)性能的基本指標(biāo)衡量計(jì)算機(jī)性能的基本指標(biāo) 響應(yīng)時(shí)間(響應(yīng)時(shí)間(response time)- 執(zhí)行時(shí)間(執(zhí)行時(shí)間(execution Time)、等待時(shí)間()、等待時(shí)間(latency) 吞吐量(吞吐量( throughput)- 帶寬(帶寬(bandwidth) 計(jì)算機(jī)性能測(cè)量計(jì)算機(jī)性能測(cè)量 指令執(zhí)行速度(指令執(zhí)行速度(MIPS、MFLOPS/TFLOPS/PFLOPS) 基準(zhǔn)程序(基準(zhǔn)程序( Benchmark) SPEC (Systems Performance Evaluation Committee) Linpack (Linear system package):線
34、性系統(tǒng)軟件包基準(zhǔn)測(cè)試程序:線性系統(tǒng)軟件包基準(zhǔn)測(cè)試程序402022年年5月月14日星期六日星期六回顧回顧:Integrated Circuits manufacturing process 單晶硅錠單晶硅錠圓形薄片圓形薄片 / 硅拋光片硅拋光片(6/8/12寸寸,厚度不足厚度不足1mm)IC小片小片 / 芯片芯片不合格的用磁不合格的用磁漿點(diǎn)上記號(hào)漿點(diǎn)上記號(hào)封裝:將芯片固定在塑膠或陶瓷基座上,把芯片上蝕刻出來的封裝:將芯片固定在塑膠或陶瓷基座上,把芯片上蝕刻出來的引線與基座底部伸出的引腳連接,蓋上蓋板并封焊成芯片引線與基座底部伸出的引腳連接,蓋上蓋板并封焊成芯片約需約需400多多道工序!道工序!“
35、晶圓晶圓” / 大芯片大芯片在考察性能前,先考察成本!在考察性能前,先考察成本!412022年年5月月14日星期六日星期六Integrated Circuits Costs 公式公式Die cost = Dies per wafer = Die Yield = 由此看出:每個(gè)圓晶片上的小片數(shù)、集成電路成本都與芯片面積有關(guān)!由此看出:每個(gè)圓晶片上的小片數(shù)、集成電路成本都與芯片面積有關(guān)!areaDieareawafer_YieldwaferperDiewafterperCost_小片合格率小片合格率芯片成本與以下因素有關(guān):芯片成本與以下因素有關(guān): 圓晶價(jià)格圓晶價(jià)格 圓晶所含小片數(shù)圓晶所含小片數(shù) 小
36、片合格率小片合格率2)_(1 (1areaDieareaperDefectx+422022年年5月月14日星期六日星期六計(jì)算機(jī)性能的基本評(píng)價(jià)指標(biāo)計(jì)算機(jī)性能的基本評(píng)價(jià)指標(biāo)“ 機(jī)器機(jī)器X的速度(性能)是的速度(性能)是Y的的n倍倍” 的含義:的含義:ExTime(Y) Performance(X) = = nExTime(X)Performance(Y)相對(duì)性能用執(zhí)行時(shí)間的倒數(shù)來表示!相對(duì)性能用執(zhí)行時(shí)間的倒數(shù)來表示!計(jì)算機(jī)有兩種不同的性能計(jì)算機(jī)有兩種不同的性能 Time to do the task 響應(yīng)時(shí)間(響應(yīng)時(shí)間(response time) 執(zhí)行時(shí)間(執(zhí)行時(shí)間(execution time
37、) 等待時(shí)間或時(shí)延(等待時(shí)間或時(shí)延(latency) Tasks per day, hour, sec, ns. . 吞吐率(吞吐率(throughput) 帶寬(帶寬(bandwidth) 基本的性能評(píng)價(jià)標(biāo)準(zhǔn)是:基本的性能評(píng)價(jià)標(biāo)準(zhǔn)是:CPU的執(zhí)行時(shí)間的執(zhí)行時(shí)間不同應(yīng)用場(chǎng)合用戶關(guān)心的性能不同:不同應(yīng)用場(chǎng)合用戶關(guān)心的性能不同:-要求吞吐率高的場(chǎng)合,例如:要求吞吐率高的場(chǎng)合,例如: 多媒體應(yīng)用(音多媒體應(yīng)用(音/視頻播放要流暢)視頻播放要流暢)-要求響應(yīng)時(shí)間短的場(chǎng)合:例如:要求響應(yīng)時(shí)間短的場(chǎng)合:例如: 事務(wù)處理系統(tǒng)(存事務(wù)處理系統(tǒng)(存/取款速度要快)取款速度要快)-要求吞吐率高且響應(yīng)時(shí)間短的場(chǎng)合:
38、要求吞吐率高且響應(yīng)時(shí)間短的場(chǎng)合: ATM、文件服務(wù)器、文件服務(wù)器、Web服務(wù)器等服務(wù)器等程序由指令構(gòu)成。CPU執(zhí)行時(shí)間就是執(zhí)行程序中每條指令的時(shí)間。432022年年5月月14日星期六日星期六計(jì)算機(jī)性能的測(cè)量計(jì)算機(jī)性能的測(cè)量比較計(jì)算機(jī)的性能時(shí),用執(zhí)行時(shí)間來衡量比較計(jì)算機(jī)的性能時(shí),用執(zhí)行時(shí)間來衡量 完成同樣工作量所需時(shí)間最短的那臺(tái)計(jì)算機(jī)就是性能最好的完成同樣工作量所需時(shí)間最短的那臺(tái)計(jì)算機(jī)就是性能最好的 處理器時(shí)間往往被多個(gè)程序共享使用,因此,用戶感覺到的程序執(zhí)行時(shí)處理器時(shí)間往往被多個(gè)程序共享使用,因此,用戶感覺到的程序執(zhí)行時(shí)間并不是程序真正的執(zhí)行時(shí)間間并不是程序真正的執(zhí)行時(shí)間(從(從hello程序
39、執(zhí)行過程可知)程序執(zhí)行過程可知) 通常把用戶感覺到的響應(yīng)時(shí)間分成以下兩個(gè)時(shí)間:通常把用戶感覺到的響應(yīng)時(shí)間分成以下兩個(gè)時(shí)間:-CPU時(shí)間:指時(shí)間:指CPU真正花在程序執(zhí)行上的時(shí)間。又包括兩部分:真正花在程序執(zhí)行上的時(shí)間。又包括兩部分:用戶用戶CPU時(shí)間:用來運(yùn)行用戶代碼的時(shí)間時(shí)間:用來運(yùn)行用戶代碼的時(shí)間系統(tǒng)系統(tǒng)CPU時(shí)間:為了執(zhí)行用戶程序而需要運(yùn)行操作系統(tǒng)程序的時(shí)間時(shí)間:為了執(zhí)行用戶程序而需要運(yùn)行操作系統(tǒng)程序的時(shí)間-其他時(shí)間:指等待其他時(shí)間:指等待I/O操作完成或操作完成或CPU花在其他用戶程序的時(shí)間花在其他用戶程序的時(shí)間 系統(tǒng)性能和系統(tǒng)性能和CPU性能不等價(jià),有一定的區(qū)別性能不等價(jià),有一定的區(qū)
40、別-系統(tǒng)性能系統(tǒng)性能(System performance):系統(tǒng)響應(yīng)時(shí)間,與:系統(tǒng)響應(yīng)時(shí)間,與CPU外的其外的其他部分也都有關(guān)系他部分也都有關(guān)系-CPU性能性能(CPU performance):用戶:用戶CPU時(shí)間時(shí)間 本節(jié)主要討論本節(jié)主要討論CPU性能,即:性能,即:CPU真正用在用戶程序執(zhí)行上的時(shí)間真正用在用戶程序執(zhí)行上的時(shí)間 問題:用戶問題:用戶CPU時(shí)間與系統(tǒng)響應(yīng)時(shí)間哪個(gè)更長?時(shí)間與系統(tǒng)響應(yīng)時(shí)間哪個(gè)更長?442022年年5月月14日星期六日星期六CPU執(zhí)行時(shí)間的計(jì)算執(zhí)行時(shí)間的計(jì)算CPU 執(zhí)行時(shí)間執(zhí)行時(shí)間 = CPU時(shí)鐘周期數(shù)時(shí)鐘周期數(shù) / 程序程序 時(shí)鐘周期時(shí)鐘周期 = CPU時(shí)鐘
41、周期數(shù)時(shí)鐘周期數(shù) / 程序程序 時(shí)鐘頻率時(shí)鐘頻率 = 指令條數(shù)指令條數(shù) / 程序程序 CPI 時(shí)鐘周期時(shí)鐘周期CPU時(shí)鐘周期數(shù)時(shí)鐘周期數(shù) / 程序程序 = 指令條數(shù)指令條數(shù) / 程序程序 CPICPI = CPU時(shí)鐘周期數(shù)時(shí)鐘周期數(shù) / 程序程序 指令條數(shù)指令條數(shù) / 程序程序 CPI 用來衡量以下各方面的綜合結(jié)果用來衡量以下各方面的綜合結(jié)果 Instruction Set Architecture(ISA) Implementation of that architecture (Organization & Technology) Program(Compiler、Algorithm) C
42、PI:Cycles Per Instruction452022年年5月月14日星期六日星期六Architecture = Instruction Set Arch. + OrganizationComputer DesignComputer Hardware Design logic & physical Implementation Logic Designers View “Micro-Architecture Computer OrganizationConstruction EngineerInstruction Set Design Machine Language Compiler
43、 View Computer Architecture Instruction Set ArchitectureBuilding Architect“建筑設(shè)計(jì)師建筑設(shè)計(jì)師”: 功能定義與設(shè)計(jì)功能定義與設(shè)計(jì)“建造工程師建造工程師”: 具具體邏輯結(jié)構(gòu)設(shè)計(jì)體邏輯結(jié)構(gòu)設(shè)計(jì) 和物理實(shí)現(xiàn)技術(shù)和物理實(shí)現(xiàn)技術(shù)例如,是否提供例如,是否提供“乘法指令乘法指令”是是ISA設(shè)計(jì)要考慮的問題;如何實(shí)現(xiàn)乘法指設(shè)計(jì)要考慮的問題;如何實(shí)現(xiàn)乘法指令(用專門乘法器還是用一個(gè)加法器令(用專門乘法器還是用一個(gè)加法器+移位器實(shí)現(xiàn))是組成移位器實(shí)現(xiàn))是組成(Organization)考慮的問題;如何布線、用什么材料和工藝設(shè)計(jì)等是實(shí)現(xiàn)技術(shù)
44、考慮的問題;如何布線、用什么材料和工藝設(shè)計(jì)等是實(shí)現(xiàn)技術(shù)(Technology)考慮的問題??紤]的問題。462022年年5月月14日星期六日星期六Aspects of CPU PerformanceCPU time = Seconds = Instructions x Cycles x Seconds Program Program Instruction Cycleinstr. countCPI clock rateProgrammingCompilerInstr. Set Arch.OrganizationTechnology思考:三個(gè)因素與哪些方面有關(guān)?思考:三個(gè)因素與哪些方面有關(guān)?例如,
45、例如,. y=4*x; 472022年年5月月14日星期六日星期六Aspects of CPU PerformanceCPU time = Seconds = Instructions x Cycles x Seconds Program Program Instruction Cycleinstr. countCPI clock rateProgramming X XCompiler X (X)Instr. Set Arch. X XOrganization X XTechnology X問題:計(jì)算機(jī)性能與問題:計(jì)算機(jī)性能與ISA、計(jì)算機(jī)組織(、計(jì)算機(jī)組織(Organization)、計(jì))、
46、計(jì)算機(jī)實(shí)現(xiàn)技術(shù)(算機(jī)實(shí)現(xiàn)技術(shù)(Technology)三者的關(guān)系是什么?)三者的關(guān)系是什么?482022年年5月月14日星期六日星期六如何計(jì)算CPI?對(duì)于某一條特定的指令而言,其CPI是一個(gè)確定的值。但是,對(duì)于某一個(gè)程序或一臺(tái)機(jī)器而言,其CPI是一個(gè)平均值,表示該程序或該機(jī)器指令集中每條指令執(zhí)行時(shí)平均需要多少時(shí)鐘周期。假定CPIi、Fi是各指令CPI和在程序中的出現(xiàn)頻率,則程序綜合CPI為:CPI = where =xniiiFCPI1CountnInstructioCFii_=CPU時(shí)間時(shí)間= 時(shí)鐘周期時(shí)鐘周期 x假定CPIi 和 Ci分別為第i類指令的CPI和指令條數(shù),則程序的總時(shí)鐘數(shù)為:=
47、xniiiCCPI1=xniiiCCPI1總時(shí)鐘數(shù)總時(shí)鐘數(shù) =所以,所以,CPI = (CPU 時(shí)間時(shí)間時(shí)鐘頻率時(shí)鐘頻率) / 指令條數(shù)指令條數(shù) = 總時(shí)鐘周期數(shù)總時(shí)鐘周期數(shù) / 指令條數(shù)指令條數(shù)已知CPU時(shí)間、時(shí)鐘頻率、總時(shí)鐘數(shù)、指令條數(shù),則程序綜合CPI為:問題:指令的問題:指令的CPI、機(jī)器的、機(jī)器的CPI、程序的、程序的CPI各能反映哪方面的性能?各能反映哪方面的性能? 單靠單靠CPI不能反映不能反映CPU性能!為什么?性能!為什么? 例如,單周期處理器例如,單周期處理器CPI=1,但性能差!,但性能差!492022年年5月月14日星期六日星期六Example1程序程序P在機(jī)器在機(jī)器A
48、上運(yùn)行需上運(yùn)行需10 s, 機(jī)器機(jī)器A的時(shí)鐘頻率為的時(shí)鐘頻率為400MHz。 現(xiàn)在要設(shè)計(jì)一臺(tái)機(jī)器現(xiàn)在要設(shè)計(jì)一臺(tái)機(jī)器B,希望該程序在,希望該程序在B上運(yùn)行只需上運(yùn)行只需6 s. 機(jī)器機(jī)器B時(shí)鐘頻率的提高導(dǎo)致了其時(shí)鐘頻率的提高導(dǎo)致了其CPI的增加,使得程序的增加,使得程序P在機(jī)器在機(jī)器B上時(shí)鐘周期數(shù)是在機(jī)器上時(shí)鐘周期數(shù)是在機(jī)器A上的上的1.2倍。機(jī)器倍。機(jī)器B的時(shí)鐘頻率達(dá)到的時(shí)鐘頻率達(dá)到A的多少倍才能使程序的多少倍才能使程序P在在B上執(zhí)行速度是上執(zhí)行速度是A上的上的10/6=1.67倍?倍?Answer: CPU時(shí)間時(shí)間A = 時(shí)鐘周期數(shù)時(shí)鐘周期數(shù)A / 時(shí)鐘頻率時(shí)鐘頻率A 時(shí)鐘周期數(shù)時(shí)鐘周期數(shù)A
49、 = 10 sec x 400MHz = 4000M個(gè)個(gè) 時(shí)鐘頻率時(shí)鐘頻率B = 時(shí)鐘周期數(shù)時(shí)鐘周期數(shù)B / CPU時(shí)間時(shí)間B = 1.2 x 4000M / 6 sec = 800 MHz機(jī)器機(jī)器B的頻率是的頻率是A的兩倍,但機(jī)器的兩倍,但機(jī)器B的速度并不是的速度并不是A的兩倍!的兩倍!502022年年5月月14日星期六日星期六Marketing Metrics (產(chǎn)品宣稱指標(biāo))MIPS= Instruction Count / Second x1/106= Clock Rate / CPI x 1/106Million Instructions Per Second (定點(diǎn)指令定點(diǎn)指令執(zhí)行
50、速度)執(zhí)行速度)因?yàn)槊織l指令執(zhí)行時(shí)間不同,因?yàn)槊織l指令執(zhí)行時(shí)間不同,所以所以MIPS總是總是一個(gè)平均值。一個(gè)平均值。 不同機(jī)器的指令集不同不同機(jī)器的指令集不同 程序由不同的指令混合而成程序由不同的指令混合而成 指令使用的頻度動(dòng)態(tài)變化指令使用的頻度動(dòng)態(tài)變化 Peak MIPS: (不實(shí)用)(不實(shí)用)所以所以MIPS數(shù)不能說明性能的好壞數(shù)不能說明性能的好壞(用下頁中的例子來說明)(用下頁中的例子來說明)MFLOPS = FP Operations / Second x 1/106Million Floating-point Operations Per Second(浮點(diǎn)浮點(diǎn)操作速度)操作速度)
51、不一定是程序中花時(shí)間的部分不一定是程序中花時(shí)間的部分用用MIPS數(shù)表示性數(shù)表示性能有沒有局限能有沒有局限?用用MFLOPS數(shù)表示數(shù)表示性能也有一定局限!性能也有一定局限!問題:?jiǎn)栴}:TFLOPS、PFLOPS等的含義是什么?等的含義是什么?512022年年5月月14日星期六日星期六Example: MIPS數(shù)不可靠!數(shù)不可靠!(書中例書中例1.31.3)Assume we build an optimizing compiler for the load/store machine. The compiler discards 50% of the ALU instructions.1) Wh
52、at is the CPI ?2) Assuming a 20 ns clock cycle time (50 MHz clock rate). What is the MIPS rating for optimized code versus unoptimized code? Does the MIPS rating agree with the rating of execution time?Op Freq Cycle ALU 43%1 Load 21%2 Store 12%2 Branch 24%2New Freq 27% 27% 15% 31%Optimizing compiler
53、CPI 1.57 1.73MIPS 31.8 28.9 結(jié)果:因?yàn)閮?yōu)化后減少了結(jié)果:因?yàn)閮?yōu)化后減少了ALU指令(其他指令數(shù)沒變),所以程指令(其他指令數(shù)沒變),所以程序執(zhí)行時(shí)間一定減少了,但優(yōu)化后的序執(zhí)行時(shí)間一定減少了,但優(yōu)化后的MIPS數(shù)反而降低了。數(shù)反而降低了。21.5/ (21.5+21+12+24)=27%21 / (21.5+21+12+24)=27%12 / (21.5+21+12+24)=15%24 / (21.5+21+12+24)= 31%50M/1.57=31.8MIPS50M/1.73=28.9MIPS僅在軟件上優(yōu)化,沒涉及到任何硬件措施。僅在軟件上優(yōu)化,沒涉及到任何硬件
54、措施。1.57是如何算出來的?是如何算出來的?522022年年5月月14日星期六日星期六選擇性能評(píng)價(jià)程序(選擇性能評(píng)價(jià)程序(Benchmarks)用基準(zhǔn)程序來評(píng)測(cè)計(jì)算機(jī)的性能用基準(zhǔn)程序來評(píng)測(cè)計(jì)算機(jī)的性能 基準(zhǔn)測(cè)試程序是專門用來進(jìn)行性能評(píng)價(jià)的一組程序基準(zhǔn)測(cè)試程序是專門用來進(jìn)行性能評(píng)價(jià)的一組程序 不同用戶使用的計(jì)算機(jī)用不同的基準(zhǔn)程序不同用戶使用的計(jì)算機(jī)用不同的基準(zhǔn)程序 基準(zhǔn)程序通過運(yùn)行實(shí)際負(fù)載來反映計(jì)算機(jī)的性能基準(zhǔn)程序通過運(yùn)行實(shí)際負(fù)載來反映計(jì)算機(jī)的性能 最好的基準(zhǔn)程序是用戶實(shí)際使用的程序或典型的簡(jiǎn)單程序最好的基準(zhǔn)程序是用戶實(shí)際使用的程序或典型的簡(jiǎn)單程序基準(zhǔn)程序的缺陷基準(zhǔn)程序的缺陷 現(xiàn)象:基準(zhǔn)程序的
55、性能與某段短代碼密切相關(guān)時(shí),會(huì)被利用以得到不當(dāng)現(xiàn)象:基準(zhǔn)程序的性能與某段短代碼密切相關(guān)時(shí),會(huì)被利用以得到不當(dāng)?shù)男阅茉u(píng)測(cè)結(jié)果的性能評(píng)測(cè)結(jié)果 手段:硬件系統(tǒng)設(shè)計(jì)人員或編譯器開發(fā)者針對(duì)這些代碼片段進(jìn)行特殊的手段:硬件系統(tǒng)設(shè)計(jì)人員或編譯器開發(fā)者針對(duì)這些代碼片段進(jìn)行特殊的優(yōu)化,使得執(zhí)行這段代碼的速度非??靸?yōu)化,使得執(zhí)行這段代碼的速度非???例例1:Intel Pentium處理器運(yùn)行處理器運(yùn)行SPECint時(shí)用了公司內(nèi)部使用的特時(shí)用了公司內(nèi)部使用的特殊編譯器,使其性能極高殊編譯器,使其性能極高-例例2:矩陣乘法程序:矩陣乘法程序SPECmatrix300有有99%的時(shí)間運(yùn)行在一行語句的時(shí)間運(yùn)行在一行語句
56、上,有些廠商用特殊編譯器優(yōu)化該語句,使性能達(dá)上,有些廠商用特殊編譯器優(yōu)化該語句,使性能達(dá)VAX11/780的的729.8倍!倍!532022年年5月月14日星期六日星期六Successful Benchmark: SPEC 1988年,年,5家公司(家公司( Sun, MIPS, HP, Apollo, DEC )聯(lián)合提出了)聯(lián)合提出了SPEC (Systems Performance Evaluation Committee) SPEC給出了一組標(biāo)準(zhǔn)的測(cè)試程序、標(biāo)準(zhǔn)輸入和測(cè)試報(bào)告。它們是一些實(shí)給出了一組標(biāo)準(zhǔn)的測(cè)試程序、標(biāo)準(zhǔn)輸入和測(cè)試報(bào)告。它們是一些實(shí)際的程序,包括際的程序,包括 OS cal
57、ls、 I/O等。等。版本版本 89:10 programs = 4 for integer + 6 for FP, 用每個(gè)程序的執(zhí)行時(shí)用每個(gè)程序的執(zhí)行時(shí)間求出一個(gè)綜合性能指標(biāo)間求出一個(gè)綜合性能指標(biāo) 版本版本92:SPECInt92 (6 integer programs) and SPECfp92 (14 floating point programs) 整數(shù)和浮點(diǎn)數(shù)單獨(dú)提供衡量指標(biāo):整數(shù)和浮點(diǎn)數(shù)單獨(dú)提供衡量指標(biāo):SPECInt92和和SPECfp92 增加增加 SPECbase: 禁止使用任何與程序有關(guān)的編譯優(yōu)化開關(guān)禁止使用任何與程序有關(guān)的編譯優(yōu)化開關(guān)版本版本95: 8 int + 10f
58、p較新版本:較新版本: include SPEC HPC96, SPEC JVM98, SPEC WEB99, SPEC OMP2001. SPEC CPU2000,See “benchmarks useful for 3 years” Base machine is changed from VAX-11/780 to Sun SPARC 10/40542022年年5月月14日星期六日星期六如何給出綜合評(píng)價(jià)結(jié)果如何給出綜合評(píng)價(jià)結(jié)果?Program 1: 1 sec on machine A, 10 sec on machine BProgram 2: 1000 sec on A,100 sec on BWhat are your conclusions? A is
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 滬科版八年級(jí)物理全一冊(cè)《2.1聲音的產(chǎn)生與傳播》同步測(cè)試題含答案
- 高一化學(xué)第四單元非金屬及其化合物第四講氨硝酸硫酸練習(xí)題
- 2024屆河南省淇縣某中學(xué)高考模擬試卷(化學(xué)試題文)試卷含解析
- 2024高中地理第4章區(qū)域經(jīng)濟(jì)發(fā)展第2節(jié)第2課時(shí)問題和對(duì)策學(xué)案新人教版必修3
- 2024高中語文第四單元?jiǎng)?chuàng)造形象詩文有別賞析示例過小孤山大孤山學(xué)案新人教版選修中國古代詩歌散文欣賞
- DB37-T 5307-2024 住宅小區(qū)供水設(shè)施建設(shè)標(biāo)準(zhǔn)
- 肩周炎中醫(yī)診療指南
- 深圳城市的發(fā)展歷程
- 2025版:勞動(dòng)合同法企業(yè)合規(guī)培訓(xùn)及風(fēng)險(xiǎn)評(píng)估合同3篇
- 三講課件知識(shí)課件
- 2025年工程合作協(xié)議書
- 2025年山東省東營市東營區(qū)融媒體中心招聘全媒體采編播專業(yè)技術(shù)人員10人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年宜賓人才限公司招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- KAT1-2023井下探放水技術(shù)規(guī)范
- 駕駛證學(xué)法減分(學(xué)法免分)題庫及答案200題完整版
- 2024年四川省瀘州市中考英語試題含解析
- 2025屆河南省九師聯(lián)盟商開大聯(lián)考高一數(shù)學(xué)第一學(xué)期期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)模擬試題含解析
- 撫養(yǎng)權(quán)起訴狀(31篇)
- 2024年“一崗雙責(zé)”制度(五篇)
- 美容美發(fā)店突發(fā)停電應(yīng)急預(yù)案
- 彈性力學(xué)材料模型:分層材料的熱彈性行為教程
評(píng)論
0/150
提交評(píng)論