微型計算機原理及應用第2章-3資料_第1頁
微型計算機原理及應用第2章-3資料_第2頁
微型計算機原理及應用第2章-3資料_第3頁
微型計算機原理及應用第2章-3資料_第4頁
微型計算機原理及應用第2章-3資料_第5頁
已閱讀5頁,還剩89頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、2.3 輝煌(huhung)的歷程共九十四頁2.3.1 輝煌的歷程 CPU的飛速發(fā)展。 微處理器走過了短暫(dunzn)的36年,人類也從工業(yè)社會跨入了信息社會,其中當然得益于微電子技術造就的各種微數(shù)字處理設備的迅猛發(fā)展,首要的就是通用微處理器CPU的飛速發(fā)展。共九十四頁位CPU 1971年Intel公司,在11月15日的電子新聞上推出了世界(shji)上第一款用于計算器4位微處理器4004,是劃時代的產(chǎn)品。 共九十四頁 8位CPU 隨后英特爾又推出了8008,由于運算性能很差,其市場反應十分不理想(lxing)。 CPU的發(fā)展歷程就是Intel公司X86系列CPU的發(fā)展歷程。 1974年,8

2、位的CPU8008發(fā)展成首款真正的通用微處理器Intel 8080,時鐘頻率為2MHz。Zilog公司生產(chǎn)了8080的增強型Z80,摩托羅拉公司生產(chǎn)了6800,都屬于第二代微處理器。 共九十四頁 16位CPU 1978年,Intel公司首次生產(chǎn)出16位的微處理器8086,采用了3微米制造技術,集成度達到29000個晶體管,內(nèi)部和外部總線都是16位,具有16位數(shù)據(jù)通道,內(nèi)存尋址能力為1MB,20位,主頻達4.77MHZ,最高主頻速度為8MHz。 1981年,美國IBM公司將8088芯片用于其研制的PC機中,個人電腦(dinno)(PC)的概念開始建立起來。 共九十四頁 1979年,Intel公司

3、(n s)推出了8088微處理器芯片,是8060的低價版本。 8088內(nèi)部數(shù)據(jù)總線都是16位,外部數(shù)據(jù)總線是8位。能與8位外部設備相兼容。 共九十四頁 1982年Intel推出了80286芯片,雖然它仍舊是16位結構,但是在CPU的內(nèi)部含有13.4萬個半導體管,68個引腳,采用四列直插式封裝,分開設置16條(內(nèi)部和外部統(tǒng)一)數(shù)據(jù)線和24條地址線,可尋址16MB物理內(nèi)存。時鐘頻率由最初的6MHz逐步提高到8、10、12、16、20、25MHz。 80286在四個方面比8086有顯著的改進:支持更大的內(nèi)存;能夠模擬內(nèi)存空間;能同時運行多個(du )任務;提高了處理速度。 共九十四頁從80286開始

4、,CPU的工作方式演變(ynbin)出兩種來:實模式和保護模式。在實模式下,與8086一樣,DOS應用程序占用全部系統(tǒng)資源,但執(zhí)行速度更快。微處理器可以訪問的內(nèi)存總量限制在1兆字節(jié)(20位的物理地址);而在保護方式之下,80286可直接訪問16MB的內(nèi)存,提供1GB的虛地址(見“第6章 存儲器”)空間,并能實現(xiàn)段寄存器、存儲器訪問及特權級和任務之間的保護,通過硬件控制,可以在多任務之間快速切換,因而,80286支持多用戶多任務系統(tǒng)。在保護方式之下,可以保護操作系統(tǒng),使之不像實模式或8086等不受保護的微處理器那樣,在遇到異常應用時會使系統(tǒng)停機。共九十四頁與8086相比,80286的BIU被分成

5、(fn chn)了地址部件AU、指令預取部件IU和總線部件BU。這樣,80286的CPU內(nèi)部的四個部件都可以異步并行操作,比8086的運行速度快。最早PC機的速度是4MHz。1984年IBM發(fā)布采用Intel 286處理器的PC-AT機(XT機的改進型),奠定了X86系統(tǒng)結構在PC市場的統(tǒng)治地位。 共九十四頁4. 32位CPU 1984年,摩托羅拉的68000是最早推出的32位微處理器, 并獲得蘋果公司青睞,在自己的劃時代個人電腦“PCMAC”中采用該芯片。 1985年10月17日,英特爾劃時代的產(chǎn)品80386正式發(fā)布了,其內(nèi)部包含(bohn)27.5萬個晶體管,時鐘頻率為12.5MHz,后逐

6、步提高到20MHz、25MHz、 33MHz,最后還有少量40MHz產(chǎn)品。 共九十四頁 Intel給80386設計了三個技術要點:使用“類286”結構,開發(fā)80387微處理器,增強浮點運算能力,開發(fā)高速緩存解決(jiju)內(nèi)存速度瓶頸. 80386系列有兩類產(chǎn)品386DX和386SX。80386DX有比80286更多的指令,頻率為12.5MHz的80386每秒鐘可執(zhí)行6百萬條指令,比頻率為16MHz的80286快2.2倍。除了具有實模式和保護模式以外,還增加了一種“虛擬8086”的工作方式??梢酝瑫r模擬多個8086微處理器來提供多任務能力,也可以兼容從8086到80386的軟件。 共九十四頁

7、80386系列有兩類產(chǎn)品386DX和386SX。80386DX有比80286更多的指令,頻率為12.5MHz的80386每秒鐘可執(zhí)行6百萬條指令,比頻率為16MHz的80286快2.2倍。 由于32位微處理器的強大運算能力,PC的應用擴展(kuzhn)到很多的領域,如商業(yè)辦公和計算、工程設計和計算、數(shù)據(jù)中心、個人娛樂。80386的32位CPU成了PC工業(yè)的標準。 共九十四頁后來(huli), Intel公司又推出了80486CPU 內(nèi)含120萬個晶體管, 使用1微米的制造工 藝,時鐘頻率從25MHz 逐步提高到33MHz、 40MHz、50MHz。與80386相比,80486在各方面都是一個飛

8、躍。 共九十四頁 在Intel處理器中,80486CPU第一次采用一級(即把高速緩存、浮點運算單元80387協(xié)處理器和CPU集成于一塊芯片上)高速緩存(8KB),減少了訪問內(nèi)存RAM的次數(shù);內(nèi)部高速緩存縮短(sudun)了微處理器與慢速DRAM的等待時間;它提供的突發(fā)模式總線結構加快了RAM和CPU之間的數(shù)據(jù)傳輸交換速度;486也有DX和SX之分。 80486DX是將80386和數(shù)學協(xié)微處理器80387以及一個8KB的高速緩存集成在一個芯片內(nèi)。80486DX的性能比帶有80387數(shù)學協(xié)微處理器的80386 DX性能提高了4倍。80486SX則沒有集成數(shù)學協(xié)微處理器,但它和80486DX的管腳是

9、通用的。 共九十四頁 因PC機外部設備受工藝限制,工作頻率有限,這就阻礙了CPU主頻的進一步提高。為此(wi c),80486 DX2采用了時鐘CPU倍頻技術。80486 DX2的內(nèi)部時鐘頻率主要有40MHz、50MHz、66MHz等。80486 DX4也是采用了時鐘倍頻技術的芯片,它允許其內(nèi)部單元以2倍或接近4倍于外部總線的速度運行,但仍以原有時鐘速度與外界通訊。486 DX2、486 DX4的名字便是由此而來。為了支持這種提高了的內(nèi)部工作頻率,它的片內(nèi)高速緩存擴大到16KB。80486 DX4的時鐘頻率為100MHz,其運行速度比66MHz的80486 DX2快40%。 共九十四頁5Pen

10、tium系列(xli)Intel在1993年推出了全新一代的高性能處理器Pentium,并起了一個相當好聽的中文名字:“奔騰”。 Pentium的內(nèi)部含有的半導體管數(shù)量高達310萬個,時鐘頻率由最初推出的60MHz和66MHz,最后提高到200MHz。單單是最初版本的66MHz的Pentium微處理器,它的運算性能比33MHz的80486 DX就提高了3倍多,而100MHz的Pentium則比33MHz的80486 DX要快6至8倍。作為世界上第一個586級處理器,Pentium也是第一個超頻最多的處理器。共九十四頁 Pentium系列的處理器使用微米級的半導體制造(zhzo)工藝。因為芯片尺

11、寸越小,功耗也越小;密度越高,性能就越強,工作頻率也就越高。早期的奔騰75MHz120MHz使用0.微米的制造工藝,后期120MHz頻率以上的奔騰則改用0.35微米工藝。 Pentium的主要性能特點有:(1)超標量流水線。Pentium微處理器由 “U”,“V”兩條指令流水線構成超標量流水線結構,每條流水線分指令預取、指令譯碼、地址生成、指令執(zhí)行和回寫等五個步驟,極大地提高了指令的執(zhí)行速度。(2)重新設計了浮點部件FPU。其執(zhí)行過程分8級流水,使每個時鐘周期能完成一個浮點操作(或兩個浮點操作),使它的浮點運算速度比80486快35倍. 共九十四頁(3)所有的Pentium CPU都內(nèi)置了16

12、K的一級緩存,分為兩個獨立的8KB指令Cache和8KB數(shù)據(jù)Cache。(4)采用了分支預測技術。Pentium提供了一個稱為 BTB(Branch Target Buffer,分支目標緩沖器)的小的 Cache來動態(tài)地預測程序的分支操作,當某條指令導致程序分支,BTB就記下該條指令和分支目標的地址,并用這些信息預測該指令再次產(chǎn)生分支的路徑,不致使指令流水線的執(zhí)行產(chǎn)生停滯(tngzh)和混亂,從而大大提高了流水線執(zhí)行的效率。 共九十四頁(5)采用64位外部數(shù)據(jù)總線。由于Pentium芯片內(nèi)部ALU和通用寄存器仍是32位的,所以還是32位微處理器,但它同內(nèi)存儲器進行數(shù)據(jù)交換的外部數(shù)據(jù)總線采用64

13、位總線,兩者之間的數(shù)據(jù)傳送速度可達 528MBs。Pentium微處理器還有與80X86系列微處理器兼容、增強了錯誤檢測與報告功能、采用RISC技術等優(yōu)點。經(jīng)典奔騰的性能相當平均,整數(shù)運算(yn sun)和浮點運算(yn sun)都不錯。Pentium不能插在486的主板上,因此從486升級到Pentium的代價是大的。 共九十四頁 同時代的CPU,AMD有AM5x86,Cyrix也很快推出了自己的新一代產(chǎn)品(chnpn)5x86。它們?nèi)匀谎佑迷瓉?86系列的CPU插座,可以使用486的主板,功能遠遠不及Pentium,一般將它們看成是486到586的過渡產(chǎn)品。共九十四頁 1995年Intel

14、推出了第六代X86系列CPU,專為服務器和工作站設計的Pentium Pro(高能奔騰,686級的CPU),它的核心體系結構代號為P6(也是未來P、P所使用的核心體系結構),這是P6第一代產(chǎn)品。內(nèi)部時鐘頻率為:133/66MHz (工程樣品),150/60MHz、166/66MHz、180/60MHz、200/66MHz。Pentium Pro的內(nèi)部含有高達550萬個的半導體管,處理速度幾乎是100MHz的Pentium的2倍。Pentium Pro的片內(nèi)一級高速緩存分為8KB指令緩存和8KB數(shù)據(jù)緩存。值得注意的是在Pentium Pro的封裝中除Pentium Pro芯片外,還包括有一個25

15、6KB或512KB,最大有1MB的二級緩存Cache芯片。兩個芯片之間用高帶寬的內(nèi)部通訊總線互連,處理器與高 速緩存的連接線路(xinl)也被安置在該封裝中,這樣就使高速緩存能更容易地運行在更高的與處理器相同的頻率上。共九十四頁在Pentium Pro中設置了三條超標量流水線,可以在每一個時鐘周期中來同時執(zhí)行三條指令的目的。同時Pentium pro又具有14級超級流水線結構,將任一條CISC(復雜指令集計算機)結構的指令的全部執(zhí)行分成一連串的像RISC(精簡指令集計算機)指令的微操作指令步(這里分成14個指令步),使它能在流水線上并行執(zhí)行,提高了處理器的并行處理能力。而Pentium Pro

16、另一個引人注目的地方(dfng),是它具有一項稱為“亂序執(zhí)行和推測執(zhí)行,或稱動態(tài)執(zhí)行(Dynamic Exec4tion)”的創(chuàng)新技術,這是繼Pentium在超標量體系結構技術上實現(xiàn)實破之后的又一次飛躍。它能很容易就能升級到多(2個或2個以上)處理器系統(tǒng)。 共九十四頁Pentium Pro 為了競爭,AMD推出K5,Cyrix推出了6x86。這兩款CPU均以價廉著稱,而且(r qi)與Pentium的主板完全兼容。共九十四頁 1996年底Intel又推出Pentium MMX(多能奔騰)。 增加 4種新的數(shù)據(jù)類 型、8個64位寄存器和 57條MMX新指令來實 現(xiàn)的。此外,將CPU芯 片內(nèi)的L1

17、緩存由原來的 16KB增加到32KB(16KB指令Cache,和16KB數(shù)據(jù)Cache),因此在運行含有MMX指令的程序時,MMX CPU比普通CPU處理多媒體的能力(nngl)上提高了60左右。在運行頻繁使用浮點運算單元的3D游戲或軟件時,有出色的性能表現(xiàn),而且穩(wěn)定。 共九十四頁 Pentium MMX還包含了一個Pentium Pro采用過的分枝(fn zh)預測單元,以及一個只有IBM/Cyrix/6x86處理器才具有的返回堆棧。Pentium MMX系列的臺式機的頻率只有三種166/200/233, Pentium MMX系列的便攜機的頻率有六種:133/150/166/200/233

18、/266。 AMD和Cyrix兩家公司也推出了擁有MMX指令系統(tǒng)的CPUK6和6X86MX。它們除了在浮點運算方面不及Pentium MMX外,其他性能均超過了Pentium MMX,而且價格也比Pentium MMX便宜,K6和6X86MX以及Pentium Overdiwer都能安裝在雙電壓Socket 7的主板上。共九十四頁 K6 6X86MX 1997年5月,Intel推出了和Pentium Pro同一個級別(P6級)的產(chǎn)品,也就是影響力最大的CPU Pentium ,集成了750萬個晶體管。它采用了與Pentium Pro相同的核心結構,從而繼承了原有Pentium Pro處理器優(yōu)秀

19、的32位性能。Pentium 加快了段寄存器寫操作的速度,它把多媒體增強技術(MMX技術)融入“高能奔騰”處理器中,使“奔騰”芯片既保持了“高能奔騰”原有的強大處理功能,又增強了PC機在三維圖形、圖像和多媒體方面的可視化計算(j sun)功能和交互功能。 共九十四頁 在Pentium 里面,Intel將750萬個半導體管集成到一個203平方毫米的硅片上。比Pentium Pro大6平方毫米,卻比Pentium Pro多容納了200萬個半導體管。由于使用0.28微米的工藝,因此加快了半導體管的速度,從而達到了X86前所未有的時鐘速度。與Pentium Pro一樣,Pentium 在運行頻繁使用浮

20、點運算單元(dnyun)的3D游戲或軟件時,同樣有出色的性能表現(xiàn),但二者都在運行含有MMX增強指令的游戲或軟件時會出現(xiàn)一些問題,不太穩(wěn)定。 共九十四頁 總線方面,Pentium 處理器采用了雙獨立總線 (DIB)結構,即其中一 條總線聯(lián)接二級高速緩存, 另一條負責主要內(nèi)存。 在接口技術方面,為了擊垮Intel的競爭對手,以及獲得更大的內(nèi)部總線帶寬,Pentium 首次采用了最新的Slot-1接口標準。但由于(yuy)Pentium Pro 的L2Cache的訪問速度比Pentium 的快得多,所以大多數(shù)重要的服務器仍采用Pentium Pro而不用Pentium 。 共九十四頁 Celeron

21、是Intel為搶占低端市場而專門推出的。它是Pentium 的精簡產(chǎn)品,后來發(fā)展到Pentium 的精簡版本,主頻提升(tshng)到的800MHz,外頻也升級至100MHz,其良好的超頻性能,杰出的性價比,曾經(jīng)紅透CPU市場半邊天。Celeron采用了最新的Slot- 1接口標準,能工作在大部分BX主板上。Celeron具有比Pentium 更出色的超頻特性,Celeron 300A-Covington的倍頻鎖定在4.5,如果使用外頻為112MHz ,就可以超頻到504 MHz 。共九十四頁 1999年2月17日,Intel推出采用P6內(nèi)核的最后一款處理器Pentium 處理器,內(nèi)含900萬

22、個晶體管,制造工藝為0.25mm到0.18mm的CMOS,主頻從450MHz起,到1GHz以上。具有32KB(16KB數(shù)據(jù)/16KB指令)L1高速緩存和512KB的L2高速緩存;如前所述,新采用SSE(Streaming SIMD Extensions,單指令多數(shù)據(jù)擴展)指令集,大大(d d)增強了3D圖形、語言識別、視頻實時壓縮和數(shù)學運算所要求的浮點運算性能。相比Pentium ,Pentium 使處理器對高速緩存和主存的存取更加合理;首創(chuàng)處理器序列號功能(PSN),系統(tǒng)和用戶可以通過Internet及PC機進行使用者的身份認證,具有出色的安全性能;可以通過Internet服務器登陸管理及電

23、子文件交換;也可以用于商業(yè)資產(chǎn)管理、遠程控制系統(tǒng)的架構和監(jiān)視。Pentium 具有一個流水線式的浮點運算單元(FPU),可支持32位、64位和80位的浮點運算;100MHz系統(tǒng)總線,后提升至133MHz,增加了帶寬和性能。Pentium 和Pentium 同樣,采用了雙獨立總線(DIB)結構,SECC2單邊接觸卡盒封裝等等技術。共九十四頁 Pentium 1998年AMD又公開發(fā)布了K6-2處理器,AMD第一次在浮點運算方面趕上(n shn)了Intel。為了對付INTEL,AMD又推出的第三代k6。 共九十四頁 AMD于1999年2月推出了代號為“Sharp tooth”(利齒)的K6,19

24、99年6月23日,AMD公司推出了具有重大戰(zhàn)略意義的K7微處理器,并將其正式命名為Athlon(速龍)。在主頻和性能上超過Intel.之后推出的第二代PentiumIII處理器。 Duron微處理器是AMD首款 基于Athlon核心改進的低端 微處理器,即低成本低功耗 而又高性能。在浮點性能上,基于K7體系的Duron明顯優(yōu)于采用P6核心設計的Intel系列微處理器,它具有三個全流水(lishu)亂序執(zhí)行單元,一個用于加/減運算,一個用于復合指令還有一個是浮點存儲單元。 共九十四頁 隨著(su zhe)Intel的Pentium 4出現(xiàn), AMD又推出了新一代的Athlon CPUAthlon

25、 XP,通俗的叫法是“Athlon 4”。 Duron Pentium 4 AnthonXP共九十四頁 潮流(choli)和未來共九十四頁2.3.2 潮流(choli)和未來1奔騰4的時代2000年11月21日,Intel推出了代號(diho)Willamette的處理器(全新的Socket 423插座),這就是Pentium 4,業(yè)界常簡稱為“P4”。Pentium 4集成了4200萬個晶體管,采用了全新的32位微體系結構NetBurst,起步頻率為1.3GHz。它集成256KB-512KB的ON-Die(晶元級別上)的L2緩存,支持更為強大的SSE2指令集,多達20級的全新的超標量流水線,

26、搭配i850/i845系列芯片組。NetBurst微體系結構是Pentinum 4處理器的基石,是一個完全重新設計的處理機,它匯集了許多具有創(chuàng)新特點的新技術和能力。共九十四頁 2000年11月21日,Intel推出了代號Willamette的處理器(全新的Socket 423插座(chzu),這就是Pentium 4,業(yè)界常簡稱為“P4”(注意:P4實際上應該寫作Pentium ,不是Intel 80486,那時,還沒有Pentium)。Pentium 4集成了4200萬個晶體管,沒有沿用PIII(指Intel 80686)系列的的微體系結構,而是采用了全新的32位微體系結構NetBurst,

27、起步頻率為1.3GHz。等效于400MHz(實際上這些總線的運做速度達不到400MHz)前端總線(100 x 4), 替代GTL+總線。Willamette的傳輸速度為3.2GB/sec ( 400MHz , 64bit ,支持Tehama 的雙流水線RDRAM),這要比133MHz GTL+ 1,064GB/ 秒 ( 400MHz , 64bit )快得多。它集成256KB-512KB的ON-Die(晶元級別上)的L2緩存,支持更為強大的SSE2指令集,多達20級的全新的超標量流水線,搭配i850/i845系列芯片組,在許多方面超過了奔騰/等上兩代的IA-32 CPU。之后又推出了1.4GH

28、z-2.0GHz的第二代P4 (針角更多的socket478)。 共九十四頁 P4與一般的CPU在設計上有所不同,P4每時鐘周期所處理的指令(IPC)相對其他CPU來說比較少,從某方面來講正是這種低IPC的設計才使得其運行頻率能夠如此之高。CPU真實性能的惟一測量是執(zhí)行(zhxng)給定應用程序所用的時間量。真正的性能是時鐘頻率(MHz)與IPC的結合: 性能=MHz IPC 時鐘頻率是制造工藝(制程)和微體系結構的函數(shù),在給定的時鐘頻率下,IPC是處理機微體系結構和被執(zhí)行的特定應用的函數(shù)。 共九十四頁 Intel公司1996年在采用MMX技術的Pentinum 處理機上首次實現(xiàn)了64位的整數(shù)

29、SIMD指令,其后在Pentinum 處理機上引入128位的SIMD單精度浮點(SSE)指令。而Pentium 4裝備了新的SSE2指令集:SSE2的引入使NetBurst微體系結構擴充了MMX技術和SSE技術的SIMD能力:憑借144條新指令,128位SIMD整數(shù)運算操作(cozu),128位SIMD雙精度浮點操作。這些新指令提供了減少執(zhí)行特定程序任務所需的指令總數(shù)的能力,最終對性能改善作出貢獻。它們促進了范圍廣泛的應用,包括視頻、語音、圖像、圖片處理、加密、財政、工程和科學應用。共九十四頁下面我們體會一下NetBurst微體系結構特點細節(jié):超流水線技術: 加倍了流水線深度,關鍵的一條流水線

30、分支預測/恢復流水線是用20段實現(xiàn)的。這種技術顯著增加了以微體系結構為基礎的處理機的性能和頻率擴展能力。執(zhí)行追蹤Cache: 執(zhí)行追蹤Cache是實現(xiàn)L1指令Cache的一種創(chuàng)新方法(fngf)。它緩存已譯碼的x86指令(micro-ops微操作碼),因而從主執(zhí)行循環(huán)中消除了譯碼器的譯碼時延。另外,執(zhí)行追蹤Cache以程序執(zhí)行流路徑的順序保存這些微操作碼,例如,如果指令A從100的位置跳到了指令B在200的位置。那么執(zhí)行追蹤Cache則會將“第二條指令B恰好在指令A后面的位置”記錄下來。這將幫助消除分支預測錯誤。共九十四頁快速執(zhí)行引擎REE: 通過體系結構、物理和電路設計的配合,處理機中簡單的

31、算術邏輯單元ALU可運行于兩倍處理機核心頻率。這就允許ALU用1/2核心時鐘寬度的時延執(zhí)行某些指令,除減少執(zhí)行時延外,可產(chǎn)生更高的執(zhí)行吞吐量。400MHz 系統(tǒng)總線: 通過一種四泵(quad pumping)的物理信號發(fā)送和緩沖方案,允許在100MHz時鐘的系統(tǒng)總線上持續(xù)不變地以400MHz進行數(shù)據(jù)傳輸。先進的動態(tài)執(zhí)行引擎: 先進的動態(tài)執(zhí)行引擎是一個很深的亂序推測執(zhí)行引擎,通過提供很大的指令窗口(chungku),執(zhí)行單元可從中選取指令??杀苊庥捎诘却敖鉀Q相關問題的指令”引起的流水線停滯。共九十四頁圖2-23 Pentium IV 處理器及搭配的RDRAM內(nèi)存條先進的傳輸Cache: L2

32、Cache(ATC)容量為256KB,它提供了在L2 Cache和處理機核心通道(tngdo)之間很高的數(shù)據(jù)吞吐量。共九十四頁264位CPU目前主流CPU使用的64位技術主要有AMD公司的AMD64位技術、Intel公司的EM64T技術、和Intel公司的IA-64技術。2001年,Intel推出它的首款(shu kun)64位Itanium(安騰)處理器。這是第一個從IA-32到IA-64體系結構轉(zhuǎn)換的產(chǎn)品,用于工作站和服務器。共九十四頁264位CPU: 目前(mqin)主流CPU使用的64位技術主要有AMD公司的AMD64位技術、Intel公司的EM64T技術、和Intel公司的IA-64

33、技術。其中IA-64是Intel獨立開發(fā),不兼容現(xiàn)在的傳統(tǒng)的32位計算機,僅用于Itanium(安騰)以及后續(xù)產(chǎn)品Itanium 2。 2001年,Intel推出它的首款64位Itanium(安騰)處理器。這是第一個從IA-32到IA-64體系結構轉(zhuǎn)換的產(chǎn)品,用于工作站和服務器。共九十四頁共九十四頁共九十四頁英特爾公司企業(yè)平臺集團的總經(jīng)理邁克表示,代號為Nocona的3.6GHz至強芯片將在第二季度問世,它集成有1MB的二級緩存,有3種不同的運行模式:純32位模式、32/64位混合模式、純64位模式。邁克說,明年(mngnin),至強 MP芯片也將支持64位擴展技術。英特爾公司需要更多的時間將

34、這一技術應用到配置多個處理器的用品上。英特爾公司還于當?shù)貢r間本周三發(fā)布了集成有2MB緩存、時鐘頻率為3.2GHz的至強芯片,老版至強芯片集成了1MB的緩存。共九十四頁AMD的64位CPU 另一家公司AMD與Intel公司不同,類似(li s)十幾年前Intel在386上做的那樣,他們改編并延續(xù)x86指令集,擴展到64 bit支持,使CPU不僅能完整支持32位程序,還能兼容64位系統(tǒng)指令,發(fā)布了與Intel的IA-64完全不同的64 位體系結構,并稱之為x86-64體系結構。x86-64可以提供一個既能運行32位程序又能運行64位程序的平臺,而且是在同一個芯片上就可以完成所有功能。共九十四頁 這

35、個解決方案的優(yōu)勢是十分顯著的,你可以從AMD提供(tgng)的系統(tǒng)中直接得到32位的最佳解決方案,同時也能得到64位系統(tǒng)的兼容。兩者被合并到一個內(nèi)核。這就減輕了用戶選擇64位系統(tǒng)的困難。 隨后AMD發(fā)布了代號“大錘”的x86-64體系結構的處理器K8。目前AMD方面支持64位技術的CPU有Athlon(速龍) 64系列、Athlon FX系列、Sempron(閃龍)系列和Opteron(皓龍)系列。 共九十四頁 現(xiàn)在,讓我們討論IA-64體系結構和AMD的x86-64體系結構以及EM64T技術各自的特點: (1)IA-64體系結構的特點相比AMD的x86-64體系結構,IA-64顯得清晰明了。

36、首先,IA-64在硬件(yn jin)上不支持x86的很大一批指令集,也就意味著不支持現(xiàn)有的包括Microsoft Windows 2000和Windows Me等等操作系統(tǒng)。其次,它擁有完整的64位CPU的一切特性和功能,屬于不折不扣的高端產(chǎn)品,能在它上面運行的程序只有純64位操作系統(tǒng)和應用軟件。據(jù)悉,個人電腦的軟件業(yè)霸主Microsoft已經(jīng)打算開發(fā)基于IA-64系統(tǒng)的64位操作系統(tǒng),可能是Windows 2000的64 bit版本,或者是Windows 2000的后繼者Whistler的64位版本。共九十四頁 在過去,復雜指令集(CISC)和精簡指令集(RISC)曾經(jīng)進行過一番斗爭,最終

37、,IBM等公司采用了RISC技術,占據(jù)了高端的服務器、大型終端和大型計算機領域,而Intel采用了CISC(后來包含了一定的RISC指令成分),占領了低端和PC市場。競爭到現(xiàn)在這樣一個階段,顯然Intel認為CISC已經(jīng)發(fā)展到盡頭,它對資源的低利用效率已經(jīng)不能再依靠高頻率來彌補,所以決定將整個體系結構更偏向RISC。IA-64就是這樣的一個產(chǎn)物,當然由于CISC在某些應用中的優(yōu)勢(yush),它還保留了不少CISC指令。共九十四頁IA-64體系結構究竟做了些什么呢?1)更改現(xiàn)有(xin yu)工業(yè)標準體系,建立IA-64體系結構后,將采用并行運算方式的體系;2)單指令簡化,即每條指令執(zhí)行的功能

38、減少,但執(zhí)行效率變高;3)由于運行指令并行化,并且采用了程序控制指令,使分支預測更加準確,提高運算的利用效率;4)增加程序運行時的并行運算預測能力,使內(nèi)存中需要的數(shù)據(jù)更容易在Cache中命中;5)增加內(nèi)存的總?cè)萘?,擴展到2的64次方,由原先的4GB內(nèi)存擴展到驚人的180億GB容量,并支持64位浮點數(shù)和32位浮點數(shù),高精度的數(shù)字計算,提供高達82位的數(shù)據(jù)寬度。共九十四頁6)利用大規(guī)模寄存器堆棧(GR Stack)來降低保存/重新啟動(save/restore)等操作需要的調(diào)用,使用的是寄存器堆棧引擎Register Stacker Engine(RSE);使用全新的寄存器,減少寄存器使用數(shù)量,總

39、共128個64位寄存器,其中32個是靜態(tài)的,96個是動態(tài)的。7)現(xiàn)有流水線采用的是順序結構,一條運行結束后進行下一條,IA-64采用并行流水線結構,提高了工作效率。8)高速運算功能,在平行運算時,提供了2倍于運算頻率的運算速度。IA-64還有很多特性,但我們不能一一講述,其最主要的功能已經(jīng)基本提到了。如果簡單地用同樣頻率的Pentium Xeon 500和Itanium 500MHz相比的話,性能比較應該在2:15左右。在未來幾年中,Intel對IA-64的開發(fā)占優(yōu)先地位,并且(bngqi)依照市場能否順利轉(zhuǎn)向IA-64而決定是否繼續(xù)開發(fā)IA-32系列產(chǎn)品。共九十四頁(2)x86-64體系結構

40、特點AMD的64位技術包括了完整的x86-64結構體系,這個體系是通過對x86結構的擴展,增加64位指令集而得到的。使這款芯片在硬件上兼容原來的32位X86軟件,并同時支持X86-64的擴展64位計算,使得這款芯片成為真正的64位X86芯片,具有64位的尋址能力(nngl)。 X86-64新增的幾組CPU寄存器將提供更快的執(zhí)行效率。寄存器是CPU內(nèi)部用來創(chuàng)建和儲存CPU運算結果和其它運算結果的地方。標準的32位 x86體系結構包括8個通用寄存器(GPR),AMD在X86-64中又增加了8組(R8-R9),將寄存器的數(shù)目提高到了16組。X86-64寄存器默認64位。還增加了8組128位XMM寄存

41、器(也叫SSE寄存器,XMM8-XMM15),將能給單指令多數(shù)據(jù)流技術(SIMD)運算提供更多的空間,這些128位的寄存器將提供在矢量和標量計算模式下進行128位雙精度處理,為3D建模、矢量分析和虛擬現(xiàn)實的實現(xiàn)提供了硬件基礎。通過提供了更多的寄存器,按照X86-64標準生產(chǎn)的CPU可以更有效的處理數(shù)據(jù),可以在一個時鐘周期中傳輸更多的信息。 共九十四頁x86-64體系結構通過兩個主要的特性來對原有的x86體系進行擴展:一個被成為“長模式(Long Mode)”的64位擴展,另一個就是擴充寄存器。長模式是由兩個子模式構成的:兼容模式(Compatibility Mode)和純64位模式(64 bi

42、t Mode)。兼容模式是提供整個系統(tǒng)運行32位和64位程序的模式。該模式允許16位和32位軟件不需要經(jīng)過重新編譯就可以在長模式下直接應用。在兼容模式下,所有的應用軟件對于內(nèi)存的操作都只能位于前4GB的實物理內(nèi)存地址之間,標準的x86命令也迫使對寄存器的操作界于16位和32位,64位系統(tǒng)的優(yōu)勢(yush)在這里并沒有展現(xiàn)。共九十四頁純64位模式支持如下的新特性:1)64位實地址模式;2)通過寄存器前綴(qinzhu)(REX)來達到寄存器擴展;3)增加8個新的通用寄存器(GPRs),代號為R8到R15;4)擴展通用寄存器的寬度到64位;5)增加8個128位的SSE寄存器,標號為XMM8到XMM

43、15;6)新的關聯(lián)數(shù)據(jù)地址模式RIP;7)單一字節(jié)寄存器地址。共九十四頁還有一種原始(yunsh)模式(Legacy Mode),這個模式完全與x86模式相同。如果希望模擬一個完整的,并且真實的x86結構模式的話,那么只需要安裝一個現(xiàn)有的操作系統(tǒng),包括Windows 98和Windows 2000,那么CPU將自動調(diào)整為這個模式,并完全兼容現(xiàn)有程序,使用的時候與K7和Pentium 沒有什么區(qū)別。(3)EM64T技術 Intel公司這樣定義EM64T的:EM64T全稱Extended Memory 64 Technology,即擴展64bit內(nèi)存技術。EM64T是Intel IA-32(Int

44、el Architectur-32 extension)體系結構的擴展,即IA-32e。 共九十四頁在兼容IA-32軟件的情況下,允許軟件利用更多的內(nèi)存地址空間,并且允許軟件進行32 bit線性地址寫入。EM64T特別強調(diào)的是對32 bit和64 bit的兼容性。Intel為新核心增加了8個64 bit通用寄存器GPRs(R8-R15),并且把原有通用寄存器GRPs全部擴展為64 bit,這樣可以提高整數(shù)運算(yn sun)能力。增加8個128bit SSE寄存器(XMM8-XMM15),是為了增強多媒體性能,包括對SSE、SSE2和SSE3的支持。 Intel為支持EM64T技術的處理器設計

45、了兩大模式:傳統(tǒng)IA-32模式(legacy IA-32 mode)和IA-32e擴展模式(IA-32e mode)。 共九十四頁 在支持EM64T技術的處理器內(nèi),有一個稱之為擴展功能激活寄存器(extended feature enable register,IA32_EFER)的部件(bjin),其中的bit10的控制著EM64T是否激活。當bit10長模式有效(long mode active,LMA)時,記LMA1,EM64T便被激活,處理器會運行在IA-32e擴展模式下;當bit10被稱作IA-32模式有效時,記LMA0,處理器運行在傳統(tǒng)IA-32模式。 共九十四頁3CPU的型號新標

46、注法 在下面的討論之前,我們先說一說Intel的CPU的型號新標注法。 英特爾自從90nM工藝推出后,其新款CPU不再象以前(yqin)那樣,用主頻來標注CPU,而是改用一個三位數(shù)字來標注CPU,英特爾借助這個使自己的產(chǎn)品全面覆蓋高中低端的市場。英特爾近期的新品CPU為3、5、6、8、9幾個系列(服務器版及至尊版不在討論之列)。 3就是賽揚D,分478引腳和775引腳兩種,478引腳的CPU的標注型號為5的倍數(shù),775引腳的CPU標注 共九十四頁型號尾號為5的倍數(shù)再+1。比方說:賽揚D325就是478引腳的CPU,因為325是5的倍數(shù),而賽揚D326就是775引腳的CPU,因為326就是325

47、+1,賽揚D325和賽揚D326主頻相同(xin tn),同為2.53G MHz,唯一區(qū)別就是一個是478引腳,一個是775引腳,另外,現(xiàn)在INTEL英特775引腳的CPU全線支持64位,所以賽揚D326還是一款64位的CPU。英特爾3系列的產(chǎn)品特性為533MHz 前端系統(tǒng)總線,二級緩存235K,不支持超線程。 共九十四頁 5就是Pentium 4的普及版,除了最早的520和530(已停產(chǎn))外,現(xiàn)在的5系列都是533MHz 前端系統(tǒng)總線,1M二級緩存,不支持超線程。因為同為775引腳,所以標注型號為5的倍數(shù)+1,如506、511、516等等。 6是Pentium 4的增強版,產(chǎn)品(chnpn)

48、特性為800MHz 前端系統(tǒng)總線,1M二級緩存,支持超線程。6的標注型號以10為步進,每增10,主頻增加200MHz,如630是3.0G的,640是3.2G的。 共九十四頁 8是Pentium 4的超強版,因為8產(chǎn)品性能過于優(yōu)秀,所以已經(jīng)不再叫Pentium 4,而改稱Pentium D或簡稱PD。其產(chǎn)品特性為800MHz前端系統(tǒng)總線(除了以前(yqin)推出的PD 805之外),內(nèi)部集成兩個物理核心,分別擁有一個1M 二級緩存。8的標注型號也是以10為步進,每增10,主頻增加200MHz,如820是2.8G的,830是3.0G的。 9是Pentium D的超強版,性能比8更強,擁有一個2M

49、二級緩存和800MHz前端系統(tǒng)總線。不過價格較貴。共九十四頁3CPU的型號(xngho)新標注法-2AMD的CPU編號規(guī)律如下。按順序有七個部分:頭三個字母:CPU的類型 SDA指閃龍(Sempron)系列; ADA指速龍(Athlon)系列,ADA(X2)則指雙核速龍(Athlon 64 X2 )系列;連續(xù)四個數(shù)字:CPU的PR標稱值 例如,AMD CPU的“2600+”并不是(b shi)說它的頻率是2.6GHz,而是表示CPU的速度的檔次,即PR標稱值。至于CPU的真實頻率,請查下表2-8。共九十四頁表2-8 AMD的新編號(bin ho)CPU性能CPU的類型代碼 所屬類型 PR標稱值

50、 主頻(MHz) ADA Athlon 64 2800+18003000+1800,2000,3200+2000,22003400+,3500+22003700+,3800+24004000+2400ADA(X2)Athlon 64 X2 4200+,4400+ 2200 4600+,4800+ 2400 共九十四頁表2-8 AMD的新編號(bin ho)CPU性能CPU的類型代碼 所屬類型 PR標稱值 主頻(MHz) SDA Sempron 2500 1400 2600,2800 1600 3000,3100,3200 18003300,3400,3500 2000共九十四頁PR標稱值后第一

51、個字母:引腳規(guī)格與封裝,以便和主板匹配。A 表示是Socket 754引腳規(guī)格與普通(ptng)封裝;B 表示是Socket 754引腳規(guī)格與金屬外殼封裝;C 表示是Socket 940引腳規(guī)格與金屬外殼封裝;D 表示是Socket 939引腳規(guī)格與金屬外殼封裝。一般是Athlon 64;E 同C。引腳規(guī)格與封裝后一個英文字母:表示核心工作電壓。 A-1.351.4V; C-1.55V; E-1.50V;I-1.40V;K-1.35V; M-1.30V;O-1.25V;Q-1.20V;S-1.15V;電壓后的一個英文字母:表示極限溫度 A-不確定; I-63;K-65;M-67;O-69;Q-

52、1.20V;P-70;X-95;Y-100;共九十四頁溫度后的一位數(shù)字:表示二級緩存的容量 2-二級緩存的容量為128kB;3-二級緩存的容量為256kB; 4-二級緩存的容量為512kB;5-二級緩存的容量為1MB; 6-二級緩存的容量為2MB;最后兩個字母:表示CPU的制程。制程越小,能耗和發(fā)熱也越小。 A或LA,表示0.13微米(wi m)工藝;B或C或LD,表示90納米工藝;大家可要注意,在選擇CPU時,千萬不要只考慮主頻,現(xiàn)在電腦的CPU主頻并不代表一切,比方說630的主頻是3.0的,但它卻沒有820(主頻2.8)貴,為什么呢,630是Pentium 4的增強版,820是Pentiu

53、m 4的超強版。共九十四頁4雙核與雙芯(Dual Core Vs. Dual CPU): 雙核處理器是指在一個處理器上集成兩個運算核心,從而提高計算能力。 目前流行的AMD Athlon 64 X2雙核處理器有Athlon64 2 3800+和Athlon64 2 3600+。 AMD公司(n s)表示將于2007年正式向市場推出四核CPU芯片,Ientel公司也表示將于2007年初發(fā)布其首款四核處理器產(chǎn)品。 共九十四頁共九十四頁4雙核與雙芯(Dual Core Vs. Dual CPU): 由于功耗和散熱(高主頻帶來了處理器巨大的發(fā)熱量)等多重問題,處理器廠商無法再依靠主頻的提升來提升產(chǎn)品性

54、能,因此英特爾和AMD都瞄準了雙內(nèi)核處理器架構。2006年4月中旬,英特爾發(fā)布了應用于臺式機的雙核處理器。 雙核處理器是指在一個處理器上集成兩個運算核心(hxn),從而提高計算能力。“雙核”的概念最早是由IBM、HP、Sun等支持RISC架構的高端服務器廠商提出的,不過由于RISC架構的服務器價格高、應用面窄,沒有引起廣泛的注意。共九十四頁 到底什么是雙內(nèi)核?毫無疑問,雙內(nèi)核應該具備(jbi)兩個物理上的運算內(nèi)核,而這兩個內(nèi)核的設計方式卻大有文章可作。 AMD和Intel兩家的思路不同。英特爾是將放在不同Die(晶元)上的兩個完整的CPU封裝在一起,連接到同一個前端總線上??梢栽O想,這樣的兩個

55、核心必然會產(chǎn)生總線競用,影響性能。不僅如此,還對于未來更多核心的集成埋下了隱患,因為會加劇處理器競用前端總線帶寬,成為提升系統(tǒng)性能的瓶頸。AMD從一開始設計時就考慮到了對多核心的支持。據(jù)現(xiàn)有的 共九十四頁資料顯示,AMD Opteron(皓龍) 處理器從一開始設計時就考慮到了添加第二個內(nèi)核,兩個CPU內(nèi)核做在一個Die(晶元)上,通過直連微體系結構連接起來,集成度更高。核心之間以芯片速度通信,進一步降低了處理器之間的延遲。AMD直連微體系結構(也就是通過超傳輸技術讓CPU內(nèi)核直接跟外部I/O相連,不通過前端總線)和集成內(nèi)存控制器技術,使得每個內(nèi)核都自己的高速緩存可資遣用,都有自己的“專用車道”

56、直通I/O,沒有(mi yu)資源競用的問題,實現(xiàn)雙核和多核更 共九十四頁容易。兩個CPU內(nèi)核使用相同的系統(tǒng)請求接口(SRI)、HyperTransport(超傳輸超線程技術,)技術和內(nèi)存(ni cn)控制器,兼容90納米單內(nèi)核處理器所使用的940引腳接口。 可以說,AMD的解決方案是真正的“雙核”,而英特爾的解決方案則是“雙芯”。我們知道,CPU的性能是由體系結構決定的。因此可以說,AMD的體系結構為實現(xiàn)雙核和多核奠定了堅實的基礎。 共九十四頁 AMD的方案能夠使雙核CPU的管腳、功耗等指標跟單核CPU保持一致,從單核升級到雙核,不需要更換電源、芯片組、散熱系統(tǒng)和主板,只需要刷新BIOS軟件

57、即可,這對于主板廠商、計算機廠商和最終用戶的投資保護是非常有利的。客戶可以利用其現(xiàn)有的90納米基礎設施(j ch sh sh),通過BIOS更改移植到雙核心的系統(tǒng)。計算機廠商可以輕松地提供同一硬件的單核心與雙核心版本,使那些既想提高性能又想保持IT環(huán)境穩(wěn)定性的客戶能夠在不中斷業(yè)務的情況下升級到雙核心。 共九十四頁 Intel 的中端的雙核心處理器擁有一個全新的名字 Pentium D ,目前推出 820 、 830 、 840 三款,它們的頻率分別是: 2.8 、 3.0 、 3.2GHz 。Pentium D除擁有兩顆物理核心外, 還具有(jyu) EM64T 擴展技術,可以支持 64 位指

58、令集。Pentium D 每個內(nèi)核都具有 1MB 的二級緩存,采用兩路互聯(lián)總線,能夠提高調(diào)用與存儲操作時的緩存命中率,它的兩個內(nèi)核之間通過前端總線交換數(shù)據(jù)。 Pentium D 采用 LGA775 封裝,需要 945P/G 或者 955X 芯片組配合,使用雙通道 DDR2 667 內(nèi)存。 Pentium D 830/840 還具有 EIST 技術,它們都支持 Execute Disable Bit 防病毒技術。都具有超標量流水線,先進的動態(tài)執(zhí)行,非常深的亂序執(zhí)行,增強的指令分支預測精度。它具有增強的浮點和多媒體單元,可以提高視頻、音頻、加密和 3D 的性能,可以說 Pentium D 能夠適合

59、多任務和高端視頻與游戲應用。 共九十四頁 在2006年度春季英特爾開發(fā)者論壇大會(Intel Developer Forum,IDF)上,Intel宣布了下一代處理器將統(tǒng)一采用全新的微體系結構,并將其正式命名(mng mng)為Core(酷睿)。2006年1月9日,Intel發(fā)布了中文名字為酷睿的新款雙核處理器。Core微體系結構擁有雙核心、64bit指令集、4發(fā)射的超標量體系結構和亂序執(zhí)行機制等技術,使用65nm制造工藝生產(chǎn),支持36bit的物理尋址和48bit的虛擬內(nèi)存尋址,支持包括SSE4在內(nèi)的Intel所有擴展指令集。Core微架構的每個內(nèi)核擁有32KB的一級指令緩存、32KB的雙端口

60、一級數(shù)據(jù)緩存,2個內(nèi)核共同擁有4MB或2MB的共享式二級緩存。 共九十四頁 英特爾酷睿TM2雙核處理器在2006年7月27日全球同步上市。有人認為:這在計算機處理器發(fā)展史上具有劃時代意義。 當Intel發(fā)布酷睿2桌面處理器后,在Intel的產(chǎn)品線中,有高端的酷睿2,中端的Pentium D,低端的Pentium 4和Celeron D。目前流行的AMD Athlon 64 X2雙核處理器有Athlon64 2 3800+和Athlon64 2 3600+。Athlon64 2 3600+和3800+是非常相似的。核心(hxn)相同,一級緩存相同,只是二級緩存減 共九十四頁半(Athlon64

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論