本科系統(tǒng)結(jié)構(gòu)課件 2006年CPU的詳解_第1頁
本科系統(tǒng)結(jié)構(gòu)課件 2006年CPU的詳解_第2頁
本科系統(tǒng)結(jié)構(gòu)課件 2006年CPU的詳解_第3頁
本科系統(tǒng)結(jié)構(gòu)課件 2006年CPU的詳解_第4頁
本科系統(tǒng)結(jié)構(gòu)課件 2006年CPU的詳解_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2006年CPU的詳解CPU的外頻是CPU乃至整個計算機系統(tǒng)的基準(zhǔn)頻率,單位是MHz(兆赫茲)。在早期的電腦中,內(nèi)存與主板之間的同步運行的速度等于外頻,在這種方式下,可以理解為CPU外頻直接與內(nèi)存相連通,實現(xiàn)兩者間的同步運行狀態(tài)。對于目前的計算機系統(tǒng)來說,兩者完全可以不相同,但是外頻的意義仍然存在,計算機系統(tǒng)中大多數(shù)的頻率都是在外頻的基礎(chǔ)上,乘以一定的倍數(shù)來實現(xiàn),這個倍數(shù)可以是大于1的,也可以是小于1的。說到處理器外頻,就要提到與之密切相關(guān)的兩個概念:倍頻與主頻,主頻就是CPU的時鐘頻率;倍頻即主頻與外頻之比的倍數(shù)。主頻、外頻、倍頻,其關(guān)系式:主頻=外頻×倍頻。在486之前,CPU的主頻還處于一個較低的階段,CPU的主頻一般都等于外頻。而在486出現(xiàn)以后,由于CPU工作頻率不斷提高,而PC機的一些其他設(shè)備(如插卡、硬盤等)卻受到工藝的限制,不能承受更高的頻率,因此限制了CPU頻率的進(jìn)一步提高。因此出現(xiàn)了倍頻技術(shù),該技術(shù)能夠使CPU內(nèi)部工作頻率變?yōu)橥獠款l率的倍數(shù),從而通過提升倍頻而達(dá)到提升主頻的目的。倍頻技術(shù)就是使外部設(shè)備可以工作在一個較低外頻上,而CPU主頻是外頻的倍數(shù)。在Pentium時代,CPU的外頻一般是60/66MHz,從PentiumⅡ350開始,CPU外頻提高到100MHz,目前CPU外頻已經(jīng)達(dá)到了200MHz。由于正常情況下外頻和內(nèi)存總線頻率相同,所以當(dāng)CPU外頻提高后,與內(nèi)存之間的交換速度也相應(yīng)得到了提高,對提高電腦整體運行速度影響較大。外頻與前端總線(FSB)頻率很容易被混為一談。前端總線的速度指的是CPU和北橋芯片間總線的速度,更實質(zhì)性的表示了CPU和外界數(shù)據(jù)傳輸?shù)乃俣?。而外頻的概念是建立在數(shù)字脈沖信號震蕩速度基礎(chǔ)之上的,也就是說,100MHz外頻特指數(shù)字脈沖信號在每秒鐘震蕩一萬萬次,它更多的影響了PIC及其他總線的頻率。之所以前端總線與外頻這兩個概念容易混淆,主要的原因是在以前的很長一段時間里(主要是在Pentium4出現(xiàn)之前和剛出現(xiàn)Pentium4時),前端總線頻率與外頻是相同的,因此往往直接稱前端總線為外頻,最終造成這樣的誤會。隨著計算機技術(shù)的發(fā)展,人們發(fā)現(xiàn)前端總線頻率需要高于外頻,因此采用了QDR(QuadDateRate)技術(shù),或者其他類似的技術(shù)實現(xiàn)這個目的。這些技術(shù)的原理類似于AGP的2X或者4X,它們使得前端總線的頻率成為外頻的2倍、4倍甚至更高,從此之后前端總線和外頻的區(qū)別才開始被人們重視起來。主頻,就是CPU的時鐘頻率,簡單說是CPU運算時的工作頻率(1秒內(nèi)發(fā)生的同步脈沖數(shù))的簡稱。單位是Hz。它決定計算機的運行速度,隨著計算機的發(fā)展,主頻由過去MHZ發(fā)展到了現(xiàn)在的GHZ(1G=1024M)。通常來講,在同系列微處理器,主頻越高就代表計算機的速度也越快,但對與不同類型的處理器,它就只能作為一個參數(shù)來作參考。另外CPU的運算速度還要看CPU的流水線的各方面的性能指標(biāo)。由于主頻并不直接代表運算速度,所以在一定情況下,很可能會出現(xiàn)主頻較高的CPU實際運算速度較低的現(xiàn)象。因此主頻僅僅是CPU性能表現(xiàn)的一個方面,而不代表CPU的整體性能。說到處理器主頻,就要提到與之密切相關(guān)的兩個概念:倍頻與外頻,外頻是CPU的基準(zhǔn)頻率,單位也是MHz。外頻是CPU與主板之間同步運行的速度,而且目前的絕大部分電腦系統(tǒng)中外頻也是內(nèi)存與主板之間的同步運行的速度,在這種方式下,可以理解為CPU的外頻直接與內(nèi)存相連通,實現(xiàn)兩者間的同步運行狀態(tài);倍頻即主頻與外頻之比的倍數(shù)。主頻、外頻、倍頻,其關(guān)系式:主頻=外頻×倍頻。早期的CPU并沒有“倍頻”這個概念,那時主頻和系統(tǒng)總線的速度是一樣的。隨著技術(shù)的發(fā)展,CPU速度越來越快,內(nèi)存、硬盤等配件逐漸跟不上CPU的速度了,而倍頻的出現(xiàn)解決了這個問題,它可使內(nèi)存等部件仍然工作在相對較低的系統(tǒng)總線頻率下,而CPU的主頻可以通過倍頻來無限提升(理論上)。我們可以把外頻看作是機器內(nèi)的一條生產(chǎn)線,而倍頻則是生產(chǎn)線的條數(shù),一臺機器生產(chǎn)速度的快慢(主頻)自然就是生產(chǎn)線的速度(外頻)乘以生產(chǎn)線的條數(shù)(倍頻)了。現(xiàn)在的廠商基本上都已經(jīng)把倍頻鎖死,要超頻只有從外頻下手,通過倍頻與外頻的搭配來對主板的跳線或在BIOS中設(shè)置軟超頻,從而達(dá)到計算機總體性能的部分提升。所以在購買的時候要盡量注意CPU的外頻。cpu中的浮點運算和整數(shù)運算是什么意思?CPU性能源自超標(biāo)量浮點運算結(jié)構(gòu)乍看題目,一個“超標(biāo)量浮點運算結(jié)構(gòu)”就使我們很頭疼,那我們就暫且將它擱淺起來,先看看電腦使用時的某些表現(xiàn)。當(dāng)我們用不同的電腦計算圓周率時,結(jié)果就會發(fā)現(xiàn)一臺電腦的計算較另一臺來講結(jié)果更加精確?;蛘呶覀冊谶M(jìn)行槍戰(zhàn)游戲的時候,當(dāng)一粒子彈擊中墻壁時,墻上就會相應(yīng)的剝落下一塊墻皮,同樣的場面在一臺電腦上的表現(xiàn)就是一個完整的多邊形墻皮從墻上掉下來,非常的呆板、做作;而在另外一臺電腦上就會看到非常生動形象的一塊墻皮的剝落圖像,幾乎墻皮剝落時冒出的灰煙、墻皮一圈還支愣著即將掉下的土,就如同我們在現(xiàn)實中看到的所差無幾。以上我們看到的一切,都源于CPU內(nèi)部添加的“浮點運算功能”。具有強大浮點運算功能的CPU,可以使電腦運算更加精確、電腦圖像更加逼真生動。在電腦中,顯示器上所有圖像的表現(xiàn)都是通過內(nèi)部復(fù)雜的運算形成的,如果說1、2、3等是整數(shù)的話,那么浮點就是整數(shù)后面所存在的小數(shù)點,而電腦應(yīng)用中絕大多數(shù)應(yīng)用的都是浮點運算功能。浮點運算能力是關(guān)系到CPU的多媒體,3D圖形處理的一個重要指標(biāo)。P4中只有2個浮點執(zhí)行單元,而其中一個單元要同時處理:FADD,FMUL,MMX,SSE,和SSE2,而P4的浮點運算完全取決于SSE的優(yōu)化,所以P4處理器的浮點單元設(shè)計應(yīng)該是整個處理器設(shè)計中最薄弱的部分。AMD則為Athlon設(shè)計了3個并行的浮點、多媒體執(zhí)行單元。其中一個是浮點的存儲,一個是浮點加,一個是浮點乘,其中浮點加和浮點乘是分開的,所以Athlon中就有兩個并行的浮點通道,三個執(zhí)行單元,而且相互之間完全不受干擾,這是所謂的超標(biāo)量的浮點結(jié)構(gòu),可以說Athlon的浮點運算無疑是目前最強的。一、誰優(yōu)誰劣?——AMD與Intel產(chǎn)品對比分析1.AMD與Intel的產(chǎn)品線概述AMD目前的主流產(chǎn)品線按接口類型可以分成兩類,分別是基于Socket754接口的中低端產(chǎn)品線和基于Socket939接口的中高端產(chǎn)品線;而按處理器的品牌又分為Sempron、Athlon64、Opteron系列,此外還有雙核的Athlon64X2系列,其中Sempron屬于低端產(chǎn)品線,Athlon64,Opteron和Athlon64X2屬于中高端產(chǎn)品線。這樣看來,AMD家族同一品牌的處理器除了接口類型不同之外,同時還存在著多種不同的核心,這給消費者帶來了不小的麻煩??梢哉fAMD現(xiàn)在的產(chǎn)品線是十分混亂的。與AMD復(fù)雜的產(chǎn)品線相比,Intel的產(chǎn)品線可以說是相當(dāng)清晰的。Intel目前主流的處理器都采用LGA775接口,按市場定位可以分成低端的CeleronD系列、中端的Pentium45xx系列和高端的Pentium46xx系列、雙核的PentiumD系列。除了PentiumD處理器以外,其他目前在市面上銷售的處理器都是基于Prescott核心,主要以頻率和二級緩存的不同來劃分檔次,這給了消費者一個相當(dāng)清晰的印象,便于選擇購買。(鑒于目前市場上銷售的CPU產(chǎn)品都已經(jīng)全面走向64位,32位的CPU無論在性能或者價格上都不占優(yōu)勢,因此我們所列舉的CPU并不包括32位的產(chǎn)品。同樣道理,AMD平臺的SocketA接口和Intel的Socket478接口的產(chǎn)品都已經(jīng)在兩家公司的停產(chǎn)列表之上,而AMD的Athlon64FX系列和Intel的PentiumXE/EE系列以及服務(wù)器領(lǐng)域的產(chǎn)品也不容易在市面上購買到,因此也不在本文談?wù)摲秶畠?nèi)。)2.AMD與Intel產(chǎn)品線對比雙核處理器可以說是2005年CPU領(lǐng)域最大的亮點。畢竟X86處理器發(fā)展到了今天,在傳統(tǒng)的通過增加分支預(yù)測單元、緩存的容量、提升頻率來增加性能之路似乎已經(jīng)難以行通了。因此,當(dāng)單核處理器似乎走到盡頭之際,Intel、AMD都不約而同地推出了自家的雙核處理器解決方案:PentiumD、Athlon64X2!所謂雙核處理器,簡單地說就是在一塊CPU基板上集成兩個處理器核心,并通過并行總線將各處理器核心連接起來。雙核其實并不是一個全新概念,而只是CMP(ChipMultiProcessors,單芯片多處理器)中最基本、最簡單、最容易實現(xiàn)的一種類型。處理器協(xié)作機制:AMDAthlon64X2Athlon64X2其實是由Athlon64演變而來的,具有兩個Athlon64核心,采用了獨立緩存的設(shè)計,兩顆核心同時擁有各自獨立的緩存資源,而且通過“SystemRequestInterface”(系統(tǒng)請求接口,簡稱SRI)使Athlon64X2兩個核心的協(xié)作更加緊密。SRI單元擁有連接到兩個二級緩存的高速總線,如果兩個核心的緩存數(shù)據(jù)需要同步,只須通過SRI單元完成即可。這樣子的設(shè)計不但可以使CPU的資源開銷變小,而且有效的利用了內(nèi)存總線資源,不必占用內(nèi)存總線資源。PentiumD與Athlon64X2一樣,PentiumD兩個核心的二級高速緩存是相互隔絕的,不過并沒有專門設(shè)計協(xié)作的接口,而只是在前端總線部分簡單的合并在一起,這種設(shè)計的不足之處就在于需要消耗大量的CPU周期。即當(dāng)一個核心的緩存數(shù)據(jù)更改之后,必須將數(shù)據(jù)通過前端總線發(fā)送到北橋芯片,接著再由北橋芯片發(fā)往內(nèi)存,而另外一個核心再通過北橋讀取該數(shù)據(jù),也就是說,PentiumD并不能像Athlon64X2一樣,在CPU內(nèi)部進(jìn)行數(shù)據(jù)同步,而是需要通過訪問內(nèi)存來進(jìn)行同步,這樣子就比Athlon64X2多消耗了一些時間。二級緩存對比:二級緩存對于CPU的處理能力影響不小,這一點可以從同一家公司的產(chǎn)品線上的高低端產(chǎn)品當(dāng)中明顯的體現(xiàn)出來。二級緩存做為一個數(shù)據(jù)的緩沖區(qū),其大小具有相當(dāng)重大的意義,越大的緩存也就意味著所能容納的數(shù)據(jù)量越多,這就大大地減輕了由于總線與內(nèi)存的速度無法配合CPU的處理速度,而浪費了CPU的資源。事實上也證明了,較大的高速緩存意味著可以一次交換更多的可用數(shù)據(jù),而且還可以大大降低高速緩存失誤情況的出現(xiàn),以及加快數(shù)據(jù)的訪問速度,使整體的性能更高。就目前而言,AMD的CPU在二級高速緩存的設(shè)計上,由于制造工藝的原因,還是比較小,高端的最高也只達(dá)到2M,不少中低端產(chǎn)品只有512K,這對于數(shù)據(jù)的處理多多少少會帶來一些不良的影響,特別是處理的數(shù)據(jù)量較大的時候。Intel則相反,在這方面比較重視,如PentiumD核心內(nèi)部便集成了2M的二級高速緩存,這在處理數(shù)據(jù)的時候具有較大的優(yōu)勢,在高端產(chǎn)品中,甚至集成4M的二級高速緩存,可以說是AMD的N倍。在一些實際測試所得出來的數(shù)據(jù)也表明,二級緩存較大的Intel分?jǐn)?shù)要高于二級緩存較小的AMD不少。內(nèi)存架構(gòu)對比:由Athlon64開始,AMD便開始采用將內(nèi)存控制器集成于CPU內(nèi)核當(dāng)中的設(shè)計,這種設(shè)計的好處在于,可以縮短CPU與內(nèi)存之間的數(shù)據(jù)交換周期,以前都是采用內(nèi)存控制器集成于北橋芯片組的設(shè)計,改成集成于CPU核心當(dāng)中,這樣一來CPU無需通過北橋,直接可以對內(nèi)存進(jìn)行訪問操作,在有效的提高了處理效率的同時,還減輕了北橋芯片的設(shè)計難度,使主板廠商節(jié)約了成本。不過這種設(shè)計在提高了性能的同時,也帶來了一些麻煩,一個是兼容性問題,由于內(nèi)存控制器集成于核心之內(nèi),不像內(nèi)置于北橋芯片內(nèi)部,兼容性較差,這就給用戶在選購內(nèi)存的時候帶來一些不必要的麻煩。除了內(nèi)存兼容性較差之外,由于采用核心集成內(nèi)存控制器的緣故,對于內(nèi)存種類的選擇也有著很大的制約。就現(xiàn)在的內(nèi)存市場上來看,很明顯已經(jīng)像DDR2代過渡,而到目前為止Athlon64所集成的還只是DDR內(nèi)存控制器,換句話說,現(xiàn)有的Athlon64不支持DDR2,這不僅對性能起到了制約,對用戶選擇上了造成了局限性。而Intel的CPU卻并不會有這樣子的麻煩,只需要北橋集成了相應(yīng)的內(nèi)存控制器,就可以輕松的選擇使用哪種內(nèi)存,靈活性增強了不少。還有一個問題,如若用戶采用集成顯卡時,AMD的這種設(shè)計會影響到集成顯卡性能的發(fā)揮。目前集成顯卡主要是通過動態(tài)分配內(nèi)存做為顯存,當(dāng)采用AMD平臺時,集成在北橋芯片當(dāng)中的顯卡核心需要通過CPU才能夠?qū)?nèi)存操作,相比直接對內(nèi)存進(jìn)行操作,延遲要長許多。平臺帶寬對比:隨著主流的雙核處理器的到來,以及945、955系列主板的支持,Intel的前端總線將提升到1066Mhz,配合上最新的DDR2667內(nèi)存,將I/O帶寬進(jìn)一步提升到8.5GB/S,內(nèi)存帶寬也達(dá)到了10.66GB/S,相比AMD目前的8.0GB/S(I/O帶寬)、6.4GB/S(內(nèi)存帶寬)來說,Intel的要遠(yuǎn)遠(yuǎn)高出,在總體性能上要突出一些。功耗對比:在功耗方面,Intel依然比較AMD的要稍為高一些,不過,近期的已經(jīng)有所好轉(zhuǎn)了。Intel自推出了Prescott核心,由于采用0.09微米制程、集成了更多的L2緩存,晶體管更加的細(xì)薄,從而導(dǎo)致漏電現(xiàn)象的出現(xiàn),也就增加了漏電功耗,更多的晶體管數(shù)量帶來了功耗及熱量的上升。為了改進(jìn)Prescott核心處理器的功耗和發(fā)熱量的問題,Intel便將以前應(yīng)用于移動處理器上的EIST(EnhancedIntelSpeedstepTechnolog)移植到目前的主流Prescott核心CPU上,以保證有效的控制降低功耗及發(fā)熱量。而AMD方面則加入了Cool‘n’Quiet技術(shù),以降低CPU自身的功耗,其工作原理與Intel的SpeedStep動態(tài)調(diào)節(jié)技術(shù)相似,都是通過調(diào)節(jié)倍頻等等來實現(xiàn)降低功耗的效果。實際上,Intel的CPU功率之所以目前會高于AMD,其主要的原因在于其內(nèi)部集成的晶體管遠(yuǎn)遠(yuǎn)要比AMD的CPU多得多,再加上工作頻率上也要比AMD的CPU高出不少,這才會變得功率較大。不過在即將來臨的Intel新一代CPU架構(gòu)Conroe,這個問題將會得到有效的解決。其實Conroe是由目前的PentiumM架構(gòu)變化而來的,它延續(xù)了PentiumM的絕大多數(shù)優(yōu)點,如功耗更加低,在主頻較低的情況下已然能夠獲得較好的性能等等這些??梢钥闯?,未來Intel將把移動平臺上的Conroe移植到桌面平臺上來,取得統(tǒng)一。流水線對比:自踏入P4時代以來,Intel的CPU內(nèi)部的流水線級要比AMD的高出一些。以前的Northwood和Willamette核心的流水線為20級,相對于當(dāng)時的PIII或者AthlonXP的10級左右的流水線來說,增長了幾乎一倍。而目前市場上采用Proscott核心CPU流水線為31級。很多人會有疑問,為何要加長流水線呢?其實流水線的長短對于主頻影響還是相當(dāng)大的。流水線越長,頻率提升潛力越大,若一旦分支預(yù)測失敗或者緩存不中的話,所耽誤的延遲時間越長,為此在Netburst架構(gòu)中,Intel將8級指令獲取/解碼的流水線分離出來,而Proscott核心有兩個這樣的8級流水線,因此嚴(yán)格說起來,Northwood和Willamette核心有28級流水線,而Proscott有39級流水線,是現(xiàn)在Athlon64(K8)架構(gòu)流水線的兩倍。相信不少人都知道較長流水線不足之處,不過,是否有了解過較長流水線的優(yōu)勢呢?在NetBurst流水線內(nèi)部功能中,每時鐘周期能夠處理三個操作數(shù)。這和K7/K8是相同的。理論上,NetBurst架構(gòu)每時鐘執(zhí)行3指令乘以時鐘速度,便是最后的性能,由此可見頻率至上論有其理論基礎(chǔ)。以此為準(zhǔn)來計算性能的話,則K8也非NetBurst對手。不過影響性能的因素有很多,最主要的就是分支預(yù)測失敗、緩存不中、指令相關(guān)性三個方面。這三個方面的問題每個CPU都會遇到,只是各種解決方法及效果存在著差異而已。而NetBurst天生的長流水線既是它的最大優(yōu)勢,也是它的最大劣勢。如果一旦發(fā)生分支預(yù)測失敗或者緩存不中的情況,Prescott核心就會有39個周期的延遲。這要比其他的架構(gòu)延遲時間多得多。不過由于其工作主頻較高,加上較大容量的二級高速緩存在一定程度上彌補了NetBurst架構(gòu)的不足之處。不過流水線的問題在Intel的新一代CPU架構(gòu)Conroe得到了較好的解決,這樣子以來,大容量的高速緩存,以及較低的流水線,配合雙核心設(shè)計,使得未來的IntelCPU性能更加優(yōu)異?!罢婕匐p核”在雙核處理器推廣的過程中,我們聽到了一些不和諧的音符:AMD宣揚自己的雙核Opteron和Athlon-64X2才符合真正意義上的雙核處理器準(zhǔn)則,并隱晦地表示Intel雙核處理器只是“雙芯”,暗示其為“偽雙核”,聲稱自己的才是“真雙核”,真假雙核在外界引起了爭議,也為消費者的選擇帶來了不便。AMD認(rèn)為,它的雙核之所以是“真雙核”,就在于它并不只是簡單地將兩個處理器核心集成在一個硅晶片(或稱DIE)上,與單核相比,它增添了“系統(tǒng)請求接口”(SystemRequestInterface,SRI)和“交叉開關(guān)”(CrossbarSwitch)。它們的作用據(jù)AMD方面介紹應(yīng)是對兩個核心的任務(wù)進(jìn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論