版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、從性能角度來(lái)看,處理器、內(nèi)存和I/O這三個(gè)子系統(tǒng)在服務(wù)器中是最重要的,它們也是最容易出現(xiàn)性能瓶頸的地方。目前市場(chǎng)上主流的服務(wù)器大多使用英特爾Nehalem、Westmere微內(nèi)核架構(gòu)的三個(gè)家族處理器:Nehalem-EP,Nehalem-EX和Westmere-EP。下表總結(jié)了這些處理器的主要特性:Nehalem-EPWestmere-EPNehalem-EXNehalem-EX商業(yè)名稱至強(qiáng)5500至強(qiáng)5600至強(qiáng)6500至強(qiáng)7500支持的最插座數(shù)2228每插座最大核心數(shù)4688每插座最大線程數(shù)8121616MB緩存(3級(jí))8121824最大內(nèi)存DIMM數(shù)181832128在本文中,我們將分別
2、從處理器、內(nèi)存、I/O三大子系統(tǒng)出發(fā),帶你一起來(lái)梳理和了解最新英特爾架構(gòu)服務(wù)器的變化和關(guān)鍵技術(shù)。一、處理器的演變現(xiàn)代處理器都采用了最新的硅技術(shù),但一個(gè)單die(構(gòu)成處理器的半導(dǎo)體材料塊)上有數(shù)百萬(wàn)個(gè)晶體管和數(shù)兆存儲(chǔ)器。多個(gè)die組織到一起就形成了一個(gè)硅晶片,每個(gè)die都是獨(dú)立切塊,測(cè)試和用陶瓷封裝的,下圖顯示了封裝好的英特爾至強(qiáng)5500處理器外觀。圖1英特爾至強(qiáng)5500處理器插座處理器是通過(guò)插座安裝到主板上的,下圖顯示了一個(gè)英特爾處理器插座,用戶可根據(jù)自己的需要,選擇不同時(shí)鐘頻率和功耗的處理器安裝到主板上。圖2英特爾處理器插座主板上插座的數(shù)量決定了最多可支持的處理器數(shù)量,最初,服務(wù)器都只有一個(gè)
3、處理器插座,但為了提高服務(wù)器的性能,市場(chǎng)上已經(jīng)出現(xiàn)了包含2,4和8個(gè)插座的主板。在處理器體系結(jié)構(gòu)的演變過(guò)程中,很長(zhǎng)一段時(shí)間,性能的改善都與提高時(shí)鐘頻率緊密相關(guān),時(shí)鐘頻率越高,完成一次計(jì)算需要的時(shí)間越短,因此性能就越好。隨著時(shí)鐘頻率接近4GHz,處理器材料物理性質(zhì)方面的原因限制了時(shí)鐘頻率的進(jìn)一步提高,因此必須找出提高性能的替代方法。核心晶體管尺寸不斷縮?。∟ehalem使用45nm技術(shù),Westmere使用32nm技術(shù)),允許在單塊die上集成更多晶體管,利用這個(gè)優(yōu)勢(shì),可在一塊die上多次復(fù)制最基本的CPU(核心),因此就誕生了多核處理器?,F(xiàn)在市場(chǎng)上多核處理器已經(jīng)隨處可見(jiàn),每顆處理器包含多個(gè)CP
4、U核心(通常是2,4,6,8個(gè)),每個(gè)核心都有一級(jí)緩存(L1),通常所有的核心會(huì)共享二級(jí)(L2)、三級(jí)緩存(L3)、總線接口和外部連接,下圖顯示了一個(gè)雙核心的CPU架構(gòu)。DiddlCPU匚orp匚tHpCPU|_1CachesCPUCoraLICaches&U5InterfaceandL2Caches你的服劈聶頻道圖3雙核心CPU架構(gòu)示意圖現(xiàn)代服務(wù)器通常提供了多個(gè)處理器插座,例如,基于英特爾至強(qiáng)5500系列(Nehalem-EP)的服務(wù)器通常包含兩個(gè)插座,每個(gè)插座四個(gè)核心,總共可容納八個(gè)核心,而基于英特爾至強(qiáng)7500系列(Nehalem-EX)的服務(wù)器通常包含八個(gè)插座,每個(gè)插座八個(gè)核心
5、,總共可容納64個(gè)核心。下圖顯示了更詳細(xì)的雙核處理器架構(gòu)示意圖,CPU的主要組件(提取指令,解碼和執(zhí)行)都被復(fù)制,但系統(tǒng)總線是公用的。Syst-emBus主1!nstru<tionFetchPreQe<odeInstructionOuueRename/AllocL2Cacheaddcotwo一Reorder0uerRetirementUnitSchedulersLID-CacheandD-TLB卜咽lmIf41I4iW:掘>H:I誕吳圭±QjMl£z7=l迥=libli圖4雙核處理器的詳細(xì)架構(gòu)示意圖線程為了更好地理解多核架構(gòu)的含義,我們先看一下程序是如何執(zhí)
6、行的,服務(wù)器會(huì)運(yùn)行一內(nèi)核(如Linux,Windows的內(nèi)核)和多個(gè)進(jìn)程,每個(gè)進(jìn)程可進(jìn)一步細(xì)分為線程,線程是分配給核心的最小工作單元,一個(gè)線程需要在一個(gè)核心上執(zhí)行,不能進(jìn)一步分割到多個(gè)核心上執(zhí)行。下圖顯示了進(jìn)程和線程的關(guān)系。P#1圖5進(jìn)程和線程的關(guān)系進(jìn)程可以是單線程也可以是多線程的,單線程進(jìn)程同一時(shí)間只能在一個(gè)核心上執(zhí)行,其性能取決于核心本身,而多線程進(jìn)程同一時(shí)間可在多個(gè)核心上執(zhí)行,因此它的性能就超越了單一核心上的性能表現(xiàn)。因?yàn)樵S多應(yīng)用程序都是單線程的,在多進(jìn)程環(huán)境中,多插座、多核心的架構(gòu)通常會(huì)帶來(lái)方便,在虛擬化環(huán)境中,這個(gè)道理一樣正確Hypervisor允許在一臺(tái)物理服務(wù)器上整合多個(gè)邏輯服務(wù)
7、器,創(chuàng)建一個(gè)多進(jìn)程和多線程的環(huán)境。英特爾超線程技術(shù)雖然單線程不能再拆分到兩個(gè)核心上運(yùn)行,但有些現(xiàn)代處理器允許同一時(shí)間在同一核心上運(yùn)行兩個(gè)線程,每個(gè)核心有多個(gè)并行工作能力的執(zhí)行單元,很難看到單個(gè)線程會(huì)讓所有資源繁忙起來(lái)。下圖展示了英特爾超線程技術(shù)是如何工作的,同一時(shí)間在同一核心上有兩個(gè)線程執(zhí)行,它們使用不同的資源,因此提高了吞吐量。PhysicalprocessorsTnroughpueAGO-QL_E>aj_lH50cLogicalprocessorvisibletoOSPhysicalprocessorresourcealocationAEQO亡上u出l-Hj.苣server.it1E
8、:8.coi-ti圖6英特爾超線程技術(shù)工作原理前端總線在多插座和多核心的情況下,理解如何訪問(wèn)內(nèi)存和兩個(gè)核心之間是如何通信的非常重要,下圖顯示了過(guò)去許多英特爾處理器使用的架構(gòu),被稱作前端總線(FSB)架構(gòu)。在FSB架構(gòu)中,所有通信都是通過(guò)一個(gè)單一的,共享的雙向總線發(fā)送的。在現(xiàn)代處理器中,64位寬的總線以4倍速總線時(shí)鐘速度運(yùn)行,在某些產(chǎn)品中,F(xiàn)SB信息傳輸速率已經(jīng)達(dá)到1.6GT/S。Pracess-orProcess-orMemoiyInterfaceserver.it'圖7基于前端總線的服務(wù)器平臺(tái)架構(gòu)FSB將所有處理器連接到芯片組的叫做北橋(也叫做內(nèi)存控制器中樞),北橋連接所有處理器共享
9、訪問(wèn)的內(nèi)存。這種架構(gòu)的優(yōu)點(diǎn)是,每個(gè)處理器都可以訪問(wèn)其它所有處理可以訪問(wèn)的所有內(nèi)存,每個(gè)處理器都實(shí)現(xiàn)了緩存一致性算法,保證它的內(nèi)部緩存與外部存儲(chǔ)器,以及其它所有處理器的緩存同步。但這種方法設(shè)計(jì)的平臺(tái)要爭(zhēng)奪共享的總線資源,隨著總線上信號(hào)傳輸速度的上升,要連接新設(shè)備就變得越來(lái)越困難了,此外,隨著處理器和芯片組性能的提升,FSB上的通信流量也會(huì)上升,會(huì)導(dǎo)致FSB變得擁擠不堪,成為瓶頸。雙獨(dú)立總線為了進(jìn)一步提高帶寬,單一共享總線演變成了雙獨(dú)立總線架構(gòu)(DIB),其架構(gòu)如下圖所示,帶寬基本上提高了一倍。圖8基于雙獨(dú)立總線的服務(wù)器平臺(tái)架構(gòu)但在雙獨(dú)立總線架構(gòu)中,緩存一致性通信必須廣播到兩條總線上,因此減少了總
10、有效帶寬,為了減輕這個(gè)問(wèn)題,在芯片組中引入了“探聽(tīng)過(guò)濾器”來(lái)減少帶寬負(fù)載。如果緩存未被擊中,最初的處理器會(huì)向FSB發(fā)出一個(gè)探聽(tīng)命令,探聽(tīng)過(guò)濾器攔截探聽(tīng),確定是否需要傳遞探聽(tīng)給其它FSB。如果相同F(xiàn)SB上的其它處理器能滿足讀請(qǐng)求,探聽(tīng)過(guò)濾器訪問(wèn)就被取消,如果相同F(xiàn)SB上其它處理器不滿意讀請(qǐng)求,探聽(tīng)過(guò)濾器就會(huì)確定下一步的行動(dòng)。如果讀請(qǐng)求忽略了探聽(tīng)過(guò)濾器,數(shù)據(jù)就直接從內(nèi)存返回,如果探聽(tīng)過(guò)濾器表示請(qǐng)求的目標(biāo)緩存在其它FSB上不存在,它將向其它部分反映探聽(tīng)情況。如果其它部分仍然有緩存,就會(huì)將請(qǐng)求路由到該FSB,如果其它部分不再有目標(biāo)緩存,數(shù)據(jù)還是直接從內(nèi)存返回,因?yàn)閰f(xié)議不支持寫請(qǐng)求,寫請(qǐng)求必須全部傳播到
11、有緩存副本的所有FSB上。專用高速互聯(lián)在雙獨(dú)立總線之后又出現(xiàn)了專用高速互聯(lián)架構(gòu)(DedicatedHigh-SpeedInterconnect,DHSI),其架構(gòu)如下圖所示。ProcessorPracessarProcessorChipsetMemoryInterfaceUp!34<jB/sPlatformElandwidth11*禰中服務(wù)器頻直圖9基于DHSI的服務(wù)器平臺(tái)架構(gòu)基于DHSI的平臺(tái)使用四個(gè)獨(dú)立的FSB,每個(gè)處理器使用一個(gè)FSB,引入探聽(tīng)過(guò)濾器實(shí)現(xiàn)了更好的帶寬擴(kuò)容,F(xiàn)SB本身沒(méi)多大變化,只是現(xiàn)在變成點(diǎn)對(duì)點(diǎn)的配11117置了。使用這種架構(gòu)設(shè)計(jì)的平臺(tái)仍然要處理快速FSB上的電信號(hào)
12、挑戰(zhàn),DHSI也增加了芯片組上的針腳數(shù)量,需要擴(kuò)展PCB路線,才能為所有FSB建立好連接。英特爾QuickPath互聯(lián)隨英特爾酷睿i7處理器引入了一種新的系統(tǒng)架構(gòu),即著名的英特爾QuickPath互聯(lián)(QuickPathInterconnect,QPI),這個(gè)架構(gòu)使用了多個(gè)高速單向連接將處理器和芯片組互聯(lián),使用這種架構(gòu)使我們認(rèn)識(shí)到了: .多插座和多核心通用的內(nèi)存控制器是一個(gè)瓶頸; .引入多個(gè)分布式內(nèi)存控制器將最符合多核處理器的內(nèi)存需要; .在大多數(shù)情況下,在處理器中集成內(nèi)存控制器有助于提升性能; .提供有效的方法處理多插座系統(tǒng)一致性問(wèn)題對(duì)大規(guī)模系統(tǒng)是至關(guān)重要的。下圖顯示了一個(gè)多核處理器,集成了
13、內(nèi)存控制器和多個(gè)連接到其它系統(tǒng)資源的英特爾QuickPath的功能示意圖。圖10集成英特爾QPI和DDR3內(nèi)存通道的處理器架構(gòu)在這個(gè)架構(gòu)中,每個(gè)插座中的所有核心共享一個(gè)可能有多個(gè)內(nèi)存接口的IMC(IntegratedMemoryControllers,集成內(nèi)存控制器)。IMC可能有不同的外部連接: .DDR3內(nèi)存通道-在這種情況下,DDR3DIMM直接連接到插座,如下圖所示,Nehalem-EP(至強(qiáng)5500)和Westmere-EP(至強(qiáng)5600)就使用了這種架構(gòu)。ProcessorCoresCoreHfIvSpeefiMenwryChannehChanneki蠱花ofiu-_-Cor-e你
14、的、服瞬頻道server.it168.corn圖11具有高速內(nèi)存通道的處理器 .高速串行內(nèi)存通道-如下圖所示,在這種情況下,外部芯片(SMB:ScalableMemoryBuffer,可擴(kuò)展內(nèi)存緩存)創(chuàng)建DDR3內(nèi)存通道,DDR3DIMM通過(guò)這個(gè)通道連接,Nehalem-EX使用了這種架構(gòu)。BoLk?fc-EXBot?ora-EXPCIe2.0server,itl68.curTi圖12四插座Nehalem-EXIMC和插座中的不同核心使用英特爾QPI相互通信,實(shí)現(xiàn)了英特爾QPI的處理器也可以完全訪問(wèn)其它處理器的內(nèi)存,同時(shí)保持緩存的一致性,這個(gè)架構(gòu)也叫做“緩存一致性NUMA(Non-Unifor
15、mMemoryArchitecture非統(tǒng)一內(nèi)存架構(gòu))”,內(nèi)存互聯(lián)系統(tǒng)保證內(nèi)存和所有潛在的緩存副本總是一致的。英特爾QPI是一個(gè)端到端互聯(lián)和消息傳遞方案,在目前的實(shí)現(xiàn)中,每個(gè)連接由最高速度可達(dá)25.6GB/s或6.4GT/s的20條線路組成。英特爾QPI使用端到端連接,因此在插座中需要一個(gè)內(nèi)部交叉路由器,提供全局內(nèi)存訪問(wèn),通過(guò)它,不需要完整的連接拓?fù)渚涂梢詷?gòu)建起系統(tǒng)了。圖12顯示了四插座Nehalem-EX配置,每個(gè)處理器有四個(gè)QPI與其它三個(gè)處理器和Boxboro-EX芯片組互聯(lián)。二、內(nèi)存子系統(tǒng)電子業(yè)在內(nèi)存子系統(tǒng)上付出了艱辛的努力,只為緊跟現(xiàn)代處理器需要的低訪問(wèn)時(shí)間和滿足當(dāng)今應(yīng)用程序要求的高
16、容量需求。解釋當(dāng)前內(nèi)存子系統(tǒng)之前,我們先了解一下與內(nèi)存有關(guān)的一些常用術(shù)語(yǔ)。 .RAM(隨機(jī)訪問(wèn)存儲(chǔ)器) .SRAM(靜態(tài)RAM) .DRAM(動(dòng)態(tài)RAM) .SDRAM(同步DRAM) .SIMM(單列直插式內(nèi)存模塊) .DIMM(雙列直插內(nèi)存模塊) .UDIMM(無(wú)緩沖DIMM) .RDIMM(帶寄存器的DIMM) .DDR(雙數(shù)據(jù)速率SDRAM) .DDR2(第二代DDR).DDR3(第三代DDR)電子器件工程聯(lián)合委員會(huì)(JointElectronDeviceEngineeringCouncil,JEDEC)是半導(dǎo)體工程標(biāo)準(zhǔn)化機(jī)構(gòu),JEDEC21,22定義了從256位SRAM到最新的DDR
17、3模組的半導(dǎo)體存儲(chǔ)器標(biāo)準(zhǔn)?,F(xiàn)代服務(wù)器的內(nèi)存子系統(tǒng)是由RAM組成的,允許數(shù)據(jù)在一個(gè)固定的時(shí)間按任意順序訪問(wèn),不用考慮它所在的物理位置,RAM可以是靜態(tài)的或動(dòng)態(tài)的。SRAMSRAM(靜態(tài)RAM)通常非???,但比DRAM的容量要小,它們有一塊芯片結(jié)構(gòu)維持信息,但它們不夠大,因此不能作為服務(wù)器的主要內(nèi)存。DRAMDRAM(動(dòng)態(tài)RAM)是服務(wù)器的唯一選擇,術(shù)語(yǔ)“動(dòng)態(tài)”表示信息是存儲(chǔ)在集成電路的電容器內(nèi)的,由于電容器會(huì)自動(dòng)放電,為避免數(shù)據(jù)丟失,需要定期充電,內(nèi)存控制器通常負(fù)責(zé)充電操作。SDRAMSDRAM(同步DRAM)是最常用的DRAM,SDRAM具有同步接口,它們的操作與時(shí)鐘信號(hào)保持同步,時(shí)鐘用于驅(qū)動(dòng)
18、流水線內(nèi)存訪問(wèn)的內(nèi)部有限狀態(tài)機(jī),流水線意味著上一個(gè)訪問(wèn)未結(jié)束前,芯片可以接收一個(gè)新的內(nèi)存訪問(wèn),與傳統(tǒng)DRAM相比,這種方法大大提高了SDRAM的性能。DDR2和DDR3是兩個(gè)最常用的SDRAM,下圖顯示了一塊DRAM芯片的內(nèi)部結(jié)構(gòu)。內(nèi)存陣列是由存儲(chǔ)單元按矩陣方式組織組成的,每個(gè)單元都一個(gè)行和列地址,每一位都是存儲(chǔ)在電容器中的。為了提高性能,降低功耗,內(nèi)存陣列被分割成多個(gè)“內(nèi)存庫(kù)(bank)”,下圖顯示了一個(gè)4-bank和一個(gè)8-bank的內(nèi)存陣列組織方式。DRAMDaain/Ouf3uersMerrw-ryAtrayCo-lumnDecodQrwPOMaiCalumiiDecadQfSense
19、Ampsr»auW0uiBuen你的參蠱一MemoryArray孝erP圖14內(nèi)存bankDDR2芯片有四個(gè)內(nèi)部?jī)?nèi)存bank,DDR3芯片有八個(gè)內(nèi)部?jī)?nèi)存bank。DIMM需要將多個(gè)內(nèi)存芯片組裝到一起才能構(gòu)成一個(gè)內(nèi)存子系統(tǒng),它們就是按著名的DIMM(雙列直插內(nèi)存模塊)組織的。下圖顯示了內(nèi)存子系統(tǒng)的傳統(tǒng)組織方式,例如,內(nèi)存控制器連接四個(gè)DIMM,每一個(gè)由多塊DRAM芯片組成,內(nèi)存控制器有一個(gè)地址總線,一個(gè)數(shù)據(jù)總線和一個(gè)命令(也叫做控制)總線,它負(fù)責(zé)讀,寫和刷新存儲(chǔ)在DIMM中的信息。圖15傳統(tǒng)內(nèi)存子系統(tǒng)示例下圖展示了一個(gè)內(nèi)存控制器與一個(gè)DDR3DIMM連接的示例,該DIMM由八塊DRAM
20、芯片組成,每一塊有8位數(shù)據(jù)存儲(chǔ)能力,每存儲(chǔ)字(內(nèi)存數(shù)據(jù)總線的寬度)則共有64位數(shù)據(jù)存儲(chǔ)能力。地址總線有15位,它可在不同時(shí)間運(yùn)送“行地址”或“列地址”,總共有30個(gè)地址位。此外,在DDR3芯片中,3位的bank地址允許訪問(wèn)8個(gè)bank,可被視作提高了控制器的地址空間總?cè)萘?,但即使?nèi)存控制器有這樣的地址容量,市面上DDR3芯片容量還是很小。最后,RAS(RowAddressSelection,行地址選擇),CAS(ColumnAddressSelection,列地址選擇),WE(WriteEnabled,寫啟用)等都是命令總線上的。11401,Barak2X)|RA.CASi*,WE#,CSff
21、,CKECK,匚KJiDj1j7OJJalX仔;SJ-nataJcUj/Jtd55:40/Da.ta17!4OData|時(shí):制加飾StrobeDataMask你的與服務(wù)藹頻道圖16DDR3內(nèi)存控制器示例F面是一個(gè)DIMM的示意圖。4J2fiO(IOa.2Q4?44(1O7.7ai1Z511.18-;!,務(wù)器顧道server.1.D10(25.651圖17DIMM示意圖上圖顯示了8個(gè)DDR3芯片,每個(gè)提供了8位信息(通常表示為x8)。ECC和Chipkill數(shù)據(jù)完整性是服務(wù)器架構(gòu)最關(guān)注的一個(gè)點(diǎn),很多時(shí)候需要安裝額外的DIMM檢測(cè)和恢復(fù)內(nèi)存錯(cuò)誤,最常見(jiàn)的辦法是增加8位ECC(糾錯(cuò)碼),將存儲(chǔ)字從6
22、4位擴(kuò)大到72位,就象海明碼一樣,允許糾正一位錯(cuò)誤,檢測(cè)兩位錯(cuò)誤,它們也被稱作SEC(SingleErrorCorrection,單糾錯(cuò))/DED(DoubleErrorDetection,雙檢錯(cuò))o先組織存儲(chǔ)字再寫入到內(nèi)存芯片中,EEC可以用于保護(hù)任一內(nèi)存芯片的失效,以及單內(nèi)存芯片的任意多位錯(cuò)誤,這些功能有幾個(gè)不同的名字。 .Chipkill是IBM的商標(biāo) .Oracle稱之為擴(kuò)展EEC .惠普稱之為Chipspare .英特爾有一個(gè)類似的功能叫做x4單設(shè)備數(shù)據(jù)校正(Intelx4SDDC)Chipkill通過(guò)跨多個(gè)內(nèi)存芯片位散射EEC字的位實(shí)現(xiàn)這個(gè)功能,任一內(nèi)存芯片失效只會(huì)影響到一個(gè)ECC
23、位,它允許重建內(nèi)存中的內(nèi)容。下圖了顯示了一個(gè)讀和寫128位數(shù)據(jù)的內(nèi)存控制器,增加EEC后就變成144位了,144位分成4個(gè)36位的存儲(chǔ)字,每個(gè)存儲(chǔ)字將是SEC/DEDo如果使用兩個(gè)DIMM,每個(gè)包含18個(gè)4位芯片,可以按照下圖所示的方法重組位,如果芯片失效,每4個(gè)字中只會(huì)有一個(gè)錯(cuò)誤,但因?yàn)樽质荢EC/DED的,每4個(gè)字可以糾正一個(gè)錯(cuò)誤,因此所有錯(cuò)誤都可以被糾正過(guò)來(lái)。Divide-144bitslrto4words144b36bwordS6bword36bward36bw*rdInterleavetheModulesuehthateachwordcoBiains1bilfromeachmcsdu
24、lewardword36bwardbwordI1斛|嗣|肅的照尊器頻適Eerver.itlGEigcirn圖18Chipkill示例內(nèi)存Rank我們重新回到DIMM是如何組織的,一組產(chǎn)生64位有用數(shù)據(jù)(不計(jì)ECC)的芯片叫做一個(gè)Rank,為了在DIMM上存儲(chǔ)更多的數(shù)據(jù),可以安裝多個(gè)Rank,目前有單,雙和四個(gè)Rank的DIMM,下圖顯示了這三種組織方法。OtMMHunk14b14b(斗匕(4IJ#4L-伽4bDuof-rankyb嚴(yán)嚴(yán)rver.itl68.corn圖19DIMM和內(nèi)存排上圖最前面顯示的是一個(gè)單Rank的RAM,由9個(gè)8位芯片組成,一般表示為1Rx8,中間顯示的是一個(gè)1Rx4,由
25、18個(gè)4位芯片組成,最后顯示的是一個(gè)2Rx8,由18個(gè)8位芯片組成。內(nèi)存Rank不能使用地址位選擇,只能使用芯片選擇,現(xiàn)代內(nèi)存控制器最多可達(dá)8個(gè)獨(dú)立的芯片選擇,因此最大可支持8個(gè)Rank。UDIMM和RDIMMSDRAMDIMM進(jìn)一步細(xì)分為UDIMM(無(wú)緩沖DIMM)和RDIMM(帶寄存器的DIMM),在UDIMM中,內(nèi)存芯片直接連接到地址總線和控制總線,無(wú)任何中間部分。RDIMM在傳入地址和控制總線,以及SDRAM之間有額外的組件(寄存器),這些寄存器增加了一個(gè)延遲時(shí)鐘周期,但它們減少了內(nèi)存控制器上的電負(fù)荷,允許內(nèi)存控制器安裝更多的DIMM。RDIMM通常更貴,因?yàn)樗枰郊咏M件,但它們?cè)诜?/p>
26、務(wù)器中得到了普遍使用,因?yàn)閷?duì)于服務(wù)器來(lái)說(shuō),擴(kuò)展能力和穩(wěn)定性比價(jià)格更重要。雖然理論上帶寄存器/無(wú)緩沖的和ECC/非ECCDIMM是可以任何組合的,但大多數(shù)服務(wù)器級(jí)內(nèi)存模塊都同時(shí)具有ECC和帶寄存器功能。下圖顯示了一個(gè)ECCRDIMM,寄存器是箭頭指向的芯片,這個(gè)ECCDIMM由9個(gè)內(nèi)存芯片組成。圖20ECCRDIMMDDR2和DDR3第一代SDRAM技術(shù)叫做SDR(SingleDataRate),表示每個(gè)時(shí)鐘周期傳輸一個(gè)數(shù)據(jù)單元,之后又出現(xiàn)了DDR(DoubleDataRate)標(biāo)準(zhǔn),其帶寬幾乎是SDR的兩倍,無(wú)需提高時(shí)鐘頻率,可在時(shí)鐘上升沿和下降沿信號(hào)上同時(shí)傳輸數(shù)據(jù),DDR技術(shù)發(fā)展到今天形成了
27、兩套標(biāo)準(zhǔn):DDR2和DDR3。DDR2SDRAM的工作電壓是1.8V,采用240針DIMM模塊封裝,通過(guò)改善總線信號(hào),它們可以以兩倍于DDR的速度工作在外部數(shù)據(jù)總線上,規(guī)則是: .每DRAM時(shí)鐘數(shù)據(jù)傳輸兩次 .每次數(shù)據(jù)傳輸8個(gè)字節(jié)(64位)下表顯示了DDR2標(biāo)準(zhǔn)。表2.DDR2DIMM標(biāo)準(zhǔn)名稱DRAM時(shí)鐘頻率每秒傳輸?shù)臄?shù)據(jù)(百萬(wàn))模塊名稱峰值傳輸速率GB/sDDR2-400200MHz400PC2-32003.200DDR2-533266MHz533PC2-42004.266DDR2-667333MHz667PC2-5300PC2-54005.333DDR2-800400MHz800PC2-6
28、4006.400DDR2-1066533MHz1,066PC2-8500PC2-86008.533DDR3SDRAM在DDR2的基礎(chǔ)上對(duì)以下這些方面做了改進(jìn): .將工作電壓降低到1.5v,減少功耗; .通過(guò)引入0.5-8Gb的芯片增加了內(nèi)存密度,單Rank的容量最大可達(dá)16GB; .增加了內(nèi)存帶寬,內(nèi)存突發(fā)長(zhǎng)度從4字增加到8字,增加突發(fā)長(zhǎng)度是為了更好地滿足不斷增長(zhǎng)的外部數(shù)據(jù)傳輸速率,隨著傳輸速率的增長(zhǎng),突發(fā)長(zhǎng)度(傳輸?shù)拇笮?必須增長(zhǎng),但不能超出DRAM核心的訪問(wèn)速度。DDR3DIMM有240針,數(shù)量和尺寸都和DDR2-樣,但它們?cè)陔姎馓匦陨鲜遣患嫒莸?,缺口位置不一樣,未?lái),DDR3將工作在更快
29、的時(shí)鐘頻率,目前,市面上存在DDR3-800,1066和1333三種類型。下表對(duì)不同的DDR3DIMM模塊進(jìn)行了總結(jié)。表3.DDR3DIMM標(biāo)準(zhǔn)名稱RAM時(shí)鐘頻率每秒傳輸?shù)臄?shù)據(jù)(百萬(wàn))模塊名稱峰值傳輸速率GB/sDDR3-800400MHz800PC3-64006.400DDR3-1066533MHz1,066PC3-85008.533DDR3-1333667MHz1,333PC3-1060010.667DDR3-1600800MHz1,600PC3-1280012.800DDR3-1866933MHz1,866PC3-1490014.900三、I/O子系統(tǒng)I/O子系統(tǒng)負(fù)責(zé)在服務(wù)器內(nèi)存和外部世
30、界之間搬運(yùn)數(shù)據(jù),傳統(tǒng)上,它是通過(guò)服務(wù)器主板上兼容PCI標(biāo)準(zhǔn)的I/O總線實(shí)現(xiàn)的,開(kāi)發(fā)PCI的目的就是讓計(jì)算機(jī)系統(tǒng)的外圍設(shè)備實(shí)現(xiàn)互聯(lián),PCI的歷史非常悠久,現(xiàn)在最新的進(jìn)化版叫做PCI-Express。外圍組件互聯(lián)特殊興趣小組(PeripheralComponentInterconnectSpecialInterestGroup,PCI-SIG)負(fù)責(zé)開(kāi)發(fā)和增強(qiáng)PCI標(biāo)準(zhǔn)。PCIExpressPCIExpress(PCIe)是一個(gè)計(jì)算機(jī)擴(kuò)展接口卡格式,旨在替代PCI,PCI-X和AGPo它消除了整個(gè)所有I/O引起的限制,如服務(wù)器總線缺少I/O帶寬,目前所有的操作系統(tǒng)都支持PCIExpresso上一代基
31、于總線拓?fù)涞膒ci和pci-x已經(jīng)被點(diǎn)到點(diǎn)連接取代,由此產(chǎn)生的拓?fù)浣Y(jié)構(gòu)是一個(gè)單根聯(lián)合體的樹(shù)形結(jié)構(gòu),根聯(lián)合體負(fù)責(zé)系統(tǒng)配置,枚舉PCIe資源,管理中斷和PCIe樹(shù)的錯(cuò)誤。根聯(lián)合體和它的端點(diǎn)共享一個(gè)地址空間,通過(guò)內(nèi)存讀寫和中斷進(jìn)行通信。PCIe使用點(diǎn)到點(diǎn)鏈接連接兩個(gè)組件,鏈接由N個(gè)通道組成,每個(gè)通道包含兩對(duì)電路,一對(duì)用于傳輸,另一對(duì)用于接收。南橋(也叫做ICH:I/OControllerHub)通常會(huì)提供多個(gè)PCIe通道實(shí)現(xiàn)根聯(lián)合體的功能。每個(gè)通道連接到PCIExpress端點(diǎn),PCIExpressSwitch,個(gè)PCIe或一個(gè)PCIe橋,如下圖所示。CPUPCIRootCompl已xP亡IExpr
32、essEndpoint圖21PCIExpress根聯(lián)合體根據(jù)通道編號(hào)使用不同的連接器,下圖顯示了四個(gè)不同的連接器,及單/雙向時(shí)的速度。PCIExpress-BandwidthX1SingleDifctiDRH2.5Gbps/ZWMBp?DuafDirections;5Gbfr'4DDMBpiBandwidthSingleDir-ection:lOGlips/SOClMBpsDufDiwtioni!2DCibps/1.6GBp你的*服劈盟頻這;feerver.:it1SS'.c'om內(nèi):崢CardTranirFerRateXl1Ltne:-1bicTransferRjte
33、X2工lafm-i二Ibl旳盯山PCIeQrrfTrannferRaleX1212lm時(shí)=125pc-rLylIcPCbCard你旳服筠器頻亙server.it1SBandwidthX8SingIeDirecHo忙211GLi口*1£GEpsDua!Dir«ctio-n$:4t>Gbps/3.2GBpsBandwidthX16SingleDiwtlDn:daijtip5/-2GBpDualDirectiDHSB(?Gbps/6.4GBps圖22PCIExpress連接器在PCIe1.1中,通道運(yùn)行在2.5Gbps,可同時(shí)部署16條通道,如下圖所示,可支持的速度從2Gb
34、ps(1x)到32Gbps(16x),由于協(xié)議開(kāi)銷,支持10GE接口需要8x。圖23PCIExpress通道PCIe2.0(也叫第二代PCIe)帶寬提升了一倍,從2Gbit/s提高到4Gbit/s,通道數(shù)量也擴(kuò)大到了32x,PCIe4x就足以支持10GE了。PCIe3.0將會(huì)再增加一倍帶寬,最終的PCIe3.0規(guī)范預(yù)計(jì)會(huì)在2010年年中發(fā)布,到2011年就可看到支持PCIe3.0的產(chǎn)品,PCIe3.0能有效地支持40GE(下一代以太網(wǎng)標(biāo)準(zhǔn))。目前所有的PCIExpress產(chǎn)品都是單根的(SingleRoot,SR),如控制多個(gè)端點(diǎn)的單I/O控制器中樞(ICH)o多根(MultiRoot,MR)
35、也發(fā)展了一段時(shí)間,但目前還未見(jiàn)到曙光,由于缺少元件和關(guān)注,目前還有諸多問(wèn)題。SR-IOV(SingleRootI/OVirtualization,單根I/O虛擬化)是PCI-SIG開(kāi)發(fā)的另一個(gè)相關(guān)標(biāo)準(zhǔn),主要用于連接虛擬機(jī)和Hypervisor。四、英特爾微架構(gòu)英特爾Nehalem和Westmere微架構(gòu),也被稱為32和45nm酷睿微架構(gòu)。Nehalem微架構(gòu)于2009年初引入了服務(wù)器,也是第一使用45nm硅技術(shù)的架構(gòu),Nehalem處理器可應(yīng)用于高端桌面應(yīng)用程序,超大規(guī)模服務(wù)器平臺(tái)等,代號(hào)名來(lái)源于美國(guó)俄勒岡州的Nehalem河。根據(jù)英特爾的說(shuō)法,處理器的發(fā)展速度就象嘀嗒(TickandTock
36、)鐘聲的節(jié)奏一樣,如下圖所示,Tick是對(duì)現(xiàn)有處理器架構(gòu)進(jìn)行縮小,而Tock則是在前一代技術(shù)上發(fā)展起來(lái)的全新架構(gòu),Nehalem就是45nm的Tock,Westmere就是緊跟Nehalem的32nmTick。SandyMeromPenrynNehalemWestmereBridgeNEWNEWNEWNEWNEWMicroirchit«ciurProcessProcess.Micj-oarchirtecture65nm45nm45nm32nmTockTkkJock你吟(険器頻進(jìn).corn圖24英特爾“嘀嗒”處理器開(kāi)發(fā)模式Nehalem和Westmere在不同需求之間取得了平衡:.與新
37、興應(yīng)用程序(如多媒體)相比,現(xiàn)有應(yīng)用程序的性能;.對(duì)輕量級(jí)或重量級(jí)應(yīng)用程序的支持同樣良好; .可用范圍從筆記本到服務(wù)器全包括。平臺(tái)架構(gòu)這可能是近10年來(lái)英特爾最大的平臺(tái)架構(gòu)轉(zhuǎn)變,包括多個(gè)高速點(diǎn)到點(diǎn)連接,如英特爾的QuickPath互聯(lián),集成內(nèi)存控制器(IMC)等。下圖顯示了一雙插座英特爾至強(qiáng)5500(Nehalem-EP)系統(tǒng)示例,請(qǐng)注意CPU插座之間,以及CPU插座與I/O控制器之間的QPI鏈接,內(nèi)存DIMM直接附加到CPU插座。ICH(l;OControllerHub)你的服勢(shì)翻頃懂軸廂S3.corn圖25雙插座英特爾至強(qiáng)5500(Nehalem-EP)集成內(nèi)存控制器(IMC)在Nehal
38、em-EP和Westmere-EP中,每個(gè)包含集成內(nèi)存控制器(IMC)的插座支持三個(gè)DDR3內(nèi)存通道,與DDR2相比,DDR3內(nèi)存運(yùn)行在更高的頻率,因此它具有更高的內(nèi)存帶寬。此外,對(duì)于雙插座架構(gòu),有兩套內(nèi)存控制器,所有這些改進(jìn)與前一代英特爾平臺(tái)相比,帶寬提高了3.4倍,如下圖所示。3AXstreamBandwidthMbyte»?SecTrU)97766102二ZWi觸日缺頻道.關(guān)彌時(shí)1圖26RAM帶寬隨著時(shí)間的推移,帶寬以后還會(huì)繼續(xù)增加,有了集成的內(nèi)存控制器后,延遲也減小了。其功耗也減少了,因?yàn)镈DR3的工作電壓是1.5V,DDR2是1.8V,功耗與電壓的平方成正比,因此電壓降低2
39、0%,功耗就減少40%。最后,IMC支持單,雙和四RankRDIMM和UDIMM。Nehalem-EX有一個(gè)類似的,但不完全相同的架構(gòu),在Nehalem-EX中,每個(gè)插座有兩個(gè)IMC,每個(gè)IMC支持兩個(gè)英特爾可擴(kuò)展內(nèi)存互聯(lián)(ScalableMemoryInterconnects,SMI)連接到兩個(gè)可擴(kuò)展內(nèi)存緩沖區(qū)(ScalableMemoryBuffers,SMB),每個(gè)插座就可以連接到四個(gè)SMB,如下圖所示,每個(gè)SMB有兩個(gè)DDR3總線,每條總線連接到兩個(gè)DIMM,因此每個(gè)插座可連接的RDIMM總量就是16。2xDDR34xSMINehalem-EX7500(6500BsSai你的111輕崗
40、執(zhí)DHWMS圖27SMI/SMBNehalem-EX系統(tǒng)的總內(nèi)存容量與插座數(shù)量,以及RDIMM的容量總結(jié)如下表所示。表4.Nehalem-EX內(nèi)存容量4GBRDIMM8GBRDIMM16GBRDIMM2sockets128GB256GB512GB4sockets256GB512GB1TB8sockets512GB1TB2TB英特爾QuickPath互聯(lián)(QPI)所有的通信架構(gòu)都從總線架構(gòu)向點(diǎn)到點(diǎn)連接演變,因?yàn)辄c(diǎn)到點(diǎn)連接架構(gòu)具有更快的速度,更好的擴(kuò)展性,在Nehalem中,英特爾QuickPath互聯(lián)已經(jīng)取代了前端總線,如下圖所示。英特爾QuickPath互聯(lián)是一個(gè)一致的點(diǎn)到點(diǎn)協(xié)議,不局限于任何
41、特定的處理器,可在處理器,I/O設(shè)備和其它設(shè)備,如加速器之間提供通信??捎玫腝PI數(shù)量取決于處理器的類型,在Nehalem-EP和Westmere-EP中,每個(gè)插座有兩個(gè)QPI,如圖25所示,Nehalem-EX支持四個(gè)QPI,允許更多無(wú)縫的拓?fù)浣Y(jié)構(gòu),如下圖所示。SProcessorsIOHU8Giuetessdpttrt4t1hfl-p2hpE疥包服霧耙頊道詛erver.it1E:E:3E圖29Nehalem-EX拓?fù)浣Y(jié)構(gòu)英特爾至強(qiáng)7500處理器也與第三方節(jié)點(diǎn)控制器兼容,可以擴(kuò)大到8個(gè)插座以外,實(shí)現(xiàn)更大規(guī)模的擴(kuò)展。CPU架構(gòu)在Nehalem中,英特爾通過(guò)一些技術(shù)革新,增加了每個(gè)CPU每秒執(zhí)行
42、的指令數(shù),如下圖所示。NewSSE4.2ImprovedlockAdmttDnGlCachtngSupportHferarchyLlData口電電p電*BuffenErMirtiofiMemoryOrtfwi&ExecuticnL2Cache&川Tf叩十ServicingOui-Gf-Grtfcr5c/au/fn&Fietirment二LirrmrvctiarjDecode&MicrocodeInstructionFe#cfr涉口Cachear-.kugH*口SimultaneodjsFflst«rBetterSiunctiMulti-Treading
43、瞰簡(jiǎn)羯瞬黑頻道徘蹣c牖山圖30Nehalem微架構(gòu)創(chuàng)新其中有些創(chuàng)新是不言自明的,我們將集中介紹最重要的性能和功耗方面的創(chuàng)新。在比較性能和功耗時(shí),通常是1%的性能增強(qiáng)就會(huì)增多3%的功耗,因?yàn)闇p少1%的電壓,功耗幾乎總是降低3%。英特爾最重要的創(chuàng)新就是增強(qiáng)1%的性能,而功耗僅增多了1%。英特爾超線程技術(shù)英特爾超線程技術(shù)(HT)可在相同內(nèi)核上同時(shí)運(yùn)行多個(gè)線程,在Nehalem/Westmere中實(shí)現(xiàn)了兩個(gè)線程,提高了性能和能源效率。超線程的基本思想是增加每個(gè)執(zhí)行單元的復(fù)雜度,對(duì)于單線程,要保持執(zhí)行單元繁忙是很困難的,通過(guò)在相同核心上運(yùn)行兩個(gè)線程,讓所有資源保持忙碌的可能性更大,這樣整體效率就提高了,
44、如下圖所示,超線程使用的領(lǐng)域非常有限(不到5%),但在多線程環(huán)境中極大地提高了效率,超線程也不能取代多核心,它是對(duì)核心的合理補(bǔ)充。Thread?CoreCoreTh用疋ThreadsCoreCoreNehalem你的哪酸郃餓&寳圖31英特爾超線程技術(shù)緩存分級(jí)一個(gè)理想的內(nèi)存系統(tǒng)的需求是它應(yīng)該有無(wú)限的容量,無(wú)限的帶寬和零延遲,當(dāng)然沒(méi)有人知道如何構(gòu)建這樣的系統(tǒng),最接近的方法是使用分級(jí)的內(nèi)存子系統(tǒng),從大到小,從慢到快設(shè)計(jì)緩存級(jí)別,在Nehalem中,英特爾將緩存層增加到了3層,如下圖所示。CCL't必口Kachej32ALI卜JDwtrhe32k11Dok恥:2冰L2c-xhedata
45、1佰乩daro+CoreCorerr32kLTD-cacheEn口+/nsr,1,FaoilappUnionsfnduiiveeachepalrcyto你的眼務(wù)器頻道server.it1SajornJ圖32緩存分級(jí)結(jié)構(gòu)與英特爾以前的設(shè)計(jì)相比,一級(jí)緩存(L1,指令和數(shù)據(jù))沒(méi)有發(fā)生變化,在英特爾過(guò)去的設(shè)計(jì)中,所有內(nèi)核共享二級(jí)緩存(L2),如果核心數(shù)量限制為2,那這種設(shè)計(jì)倒是可行的,但Nehalem將核心數(shù)增加到了4或8,二級(jí)緩存不能再繼續(xù)共享下去,因?yàn)閹捄椭俨谜?qǐng)求都會(huì)變多(可能會(huì)達(dá)到8倍),為此,英特爾在Nehalem中為每個(gè)核心獨(dú)立增加了二級(jí)緩存(指令和數(shù)據(jù)),現(xiàn)在核心之間共享的只有三級(jí)緩存(
46、L3)了。模塊Nehalem采用了模塊化設(shè)計(jì),核心,緩存和英特爾QPI都是組成Nehalem處理器的模塊實(shí)例,如圖30所示。這些模塊都是獨(dú)立設(shè)計(jì)的,它們可以工作在不同頻率,不同電壓下,將模塊粘接在一起的是一種新的同步通信協(xié)議,它提供了非常低的延遲,以前曾嘗試過(guò)異步協(xié)議,事實(shí)證明那樣做的效率非常低。集成功率門限這是一種電源管理技術(shù),它是“時(shí)鐘門控”技術(shù)的進(jìn)化版本,所有現(xiàn)代英特爾處理器都使用了時(shí)鐘門控技術(shù),遇到空閑邏輯時(shí),時(shí)鐘門控會(huì)自動(dòng)關(guān)閉時(shí)鐘信號(hào),從而消除了開(kāi)關(guān)電源,但仍然存在漏電流,漏電流引起了無(wú)用的功耗。功率門控代替了時(shí)鐘門控,讓一個(gè)空閑的核心消耗的電力幾乎為零,如下圖所示,對(duì)于軟件和應(yīng)用程
47、序來(lái)說(shuō)這完全是透明的。Voltage(Core?)<匚areOCorl匸oeJI/OV。治W継?圖33Nehalem功率門控package-likemetal(M創(chuàng)depositedonSiliconTocreatelowon-resistancepowergocg從技術(shù)角度來(lái)看實(shí)現(xiàn)功率門控是很難的,傳統(tǒng)的45nm工藝就有明顯的泄露,它需要新的晶體管技術(shù)和大量的銅層(7mm),以前可從來(lái)沒(méi)有這么做過(guò),如下圖所示。transistordevelopedforhighoff-resistancefor你的服務(wù)騎頻道鸚竄er.itl6&.com圖34功率門控晶體管Nehalem-EP和
48、Westmere-EP都擁有“動(dòng)態(tài)的”功率門控能力,當(dāng)核心不需要執(zhí)行工作負(fù)載時(shí),它可以完全關(guān)掉電源,當(dāng)工作負(fù)載需要核心的計(jì)算能力時(shí),核心的電源又重新激活。Nehalem-EX擁有“靜態(tài)的”功率門控功能,當(dāng)個(gè)別核心失去工作能力時(shí),核心電源被完全關(guān)閉,例如,當(dāng)8核心變成6核心時(shí),這些被停用的核心不能重新打開(kāi)。對(duì)于前一代處理器,在工廠中停用的核心仍然會(huì)消耗一些電力,但在Nehalem-EX中,電源是完全關(guān)閉的。電源管理功率傳感器是建設(shè)電源管理系統(tǒng)的關(guān)鍵,上一代英特爾處理器內(nèi)置有熱傳感器,但沒(méi)有功率傳感器,Nehalem既有熱傳感器又有功率傳感器,通過(guò)集成的微控制器(PCU)負(fù)責(zé)電源管理和監(jiān)控,如下圖
49、所示。PLLfPLLHo你刖FreqWSensorsFreq1Senior?r-UncoreLLCOFinegrtedproprietarymicrocon(rollerShiftsconLralfromhardwaretoemhedldedfirniwsreRedIlima仙知百foiternperjEute,currenLpowerFlexibtliiysophiiticaredalgor;thims,tundfor亡urrenioperatingconditionsor3ScnsonFreq<Ensors服算器頻道-aerveitlGff.cpm圖35電源控制單元(PowerCon
50、trolUnit,PCU)英特爾TurboBoost技術(shù)功率門控和電源管理是英特爾TurboBoost技術(shù)的基礎(chǔ)組件,當(dāng)操作系統(tǒng)需要更好的性能時(shí)可以使用英特爾的TurboBoost模式,如果條件允許(足夠的制冷和供電能力),例如,因?yàn)橐换蚨鄠€(gè)核心被關(guān)閉,英特爾TurboBoost會(huì)提高活動(dòng)核心的頻率(以及功耗),從而提高核心的性能,如下圖所示,但它算不上一個(gè)巨大的改進(jìn)(3%-11%),但在無(wú)線程,不是所有核心都被并行使用的環(huán)境中,它還是很有價(jià)值的。每上升一步,頻率提高133Mhz。Normal4CTurbo<4CTurboduuencrM亠亠AiicoresnnLJLLK目IhEQrat
51、-efrequencyAficorsFeivmc&reso-pateormayoperarecr圖36英特爾TurboBoost技術(shù)上圖顯示了三個(gè)不同的可能性,正常情況下,所有核心都運(yùn)行在標(biāo)稱頻率(2.66GHz),在“4CTurbo”模式下,所有核心的頻率上升一步(達(dá)到了2.79GHz),在“<4CTurbo”模式下,兩個(gè)核心的頻率上升了兩步(達(dá)到了2.93GHz)。四、硬件輔助虛擬化英特爾虛擬化技術(shù)(VirtualizationTechnology,VT)擴(kuò)展了核心平臺(tái)架構(gòu),可以更好地支持虛擬化軟件,如VM(虛擬機(jī))和Hypervisor(也叫做虛擬機(jī)監(jiān)視器),如下圖所示。A
52、pp畑湎iAp-pJiCQifomAppJicaifomAppli-c口51C'PUrArter?Tory盼mtual)CfiJ.iAcmary.IQP際iTrttiVirtualMachineMonitor(VMM)11IIjPI炯mHardware(Ph燦隘f觀轆側(cè)器打圖37虛擬化支持VT包含四個(gè)主要的組件: .英特爾VT-x指的是英特爾64和IA32處理器中所有的虛擬化輔助技術(shù); .英特爾VT-d指的是英特爾芯片組中所有虛擬化輔助技術(shù); .英特爾VT-c指的是英特爾網(wǎng)絡(luò)和I/O設(shè)備中所有虛擬化輔助技術(shù); .簡(jiǎn)化虛擬機(jī)移動(dòng)的VTFlexMigration。a)英特爾VT-x增強(qiáng)的功
53、能包括: .一新的,更高特權(quán)的Hypervisor-允許客戶機(jī)操作系統(tǒng)和應(yīng)用程序運(yùn)彳丁在他們?cè)O(shè)計(jì)的特權(quán)級(jí)別中,確保Hypervisor有權(quán)控制平臺(tái)資源; .基于硬件的轉(zhuǎn)移-在Hypervisor和客戶機(jī)操作系統(tǒng)之間轉(zhuǎn)移在硬件級(jí)得到了支持,減少了復(fù)雜的,計(jì)算密集的軟件轉(zhuǎn)換需求; .基于硬件的內(nèi)存保護(hù)-處理器狀態(tài)信息在專用地址空間為Hypervisor和每個(gè)客戶機(jī)操作系統(tǒng)保留著。此外,Nehalem還增加了: .EPT(ExtendedPageTable,擴(kuò)展頁(yè)表) .VPID(VirtualProcessorID,虛擬處理器ID) .客戶機(jī)計(jì)時(shí)器優(yōu)先(GuestPreemptionTimer)
54、.描述符表退出(DescriptorTableExiting) 英特爾虛擬化技術(shù)FlexPriority .暫停退出循環(huán)(PauseLoopExiting)VTFlexMigrationFlexMigration允許在不同指令集處理器之間移動(dòng)VM,它是通過(guò)同步所有處理器都支持的最小指令集來(lái)實(shí)現(xiàn)的。當(dāng)VM第一次實(shí)例化時(shí),它會(huì)查詢處理器獲取指令集水平(SSE2,SSE3,SSE4),處理器返回商定的最低指令集水平,而不是處理器本身支持的指令集水平,這樣就允許VMotion在不同指令集處理器之間移動(dòng)VM了。擴(kuò)展頁(yè)表(EPT)EPT是一種新的處于Hypervisor控制下的頁(yè)表結(jié)構(gòu),如下圖所示,它定義了客戶機(jī)地址和宿主物理地址之間的映射。EFTeasePainterVirtualAddFe5sIntel*64PageTatiesGuestEPTPaceFablesFhyskdl-Address圖38擴(kuò)展頁(yè)表虛擬化之前,每個(gè)操作系統(tǒng)負(fù)責(zé)虛擬應(yīng)用程序地
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Unit3 Weather A let's learn(說(shuō)課稿)-2023-2024學(xué)年人教PEP版英語(yǔ)四年級(jí)下冊(cè)001
- 2025寫場(chǎng)地租賃合同范文
- 2025工程建設(shè)招標(biāo)投標(biāo)合同履約銀行保證書
- Unit 1 Playtime Lesson 3(說(shuō)課稿)-2023-2024學(xué)年人教新起點(diǎn)版英語(yǔ)二年級(jí)下冊(cè)
- 2023九年級(jí)歷史下冊(cè) 第一單元 殖民地人民的反抗與資本主義制度的擴(kuò)展第3課 美國(guó)內(nèi)戰(zhàn)說(shuō)課稿 新人教版
- 2025泵車租賃合同
- 2024-2025學(xué)年高中歷史 專題二 近代中國(guó)資本主義的曲折發(fā)展 2.1 近代中國(guó)民族工業(yè)的興起說(shuō)課稿1 人民版必修2
- 蔬菜物資發(fā)放方案
- 養(yǎng)生館前臺(tái)合同范例
- 代理經(jīng)營(yíng)店鋪合同范例
- 遼寧中考英語(yǔ)2022-2024真題匯編-教師版-專題06 語(yǔ)篇填空
- 法律職業(yè)資格考試客觀題(試卷一)試題及解答參考(2024年)
- 教學(xué)的模樣讀書分享
- 老年髖部骨折患者圍術(shù)期下肢深靜脈血栓基礎(chǔ)預(yù)防專家共識(shí)(2024版)解讀 課件
- 江蘇省無(wú)錫市2024年中考語(yǔ)文試卷【附答案】
- 五年級(jí)上冊(cè)小數(shù)脫式計(jì)算200道及答案
- 2024年秋新滬科版物理八年級(jí)上冊(cè) 第二節(jié) 測(cè)量:物體的質(zhì)量 教學(xué)課件
- 2024義務(wù)教育英語(yǔ)課程標(biāo)準(zhǔn)2022版考試題庫(kù)附含答案
- 多旋翼無(wú)人機(jī)駕駛員執(zhí)照(CAAC)備考試題庫(kù)大全-下部分
- 浙教版七年級(jí)上冊(cè)數(shù)學(xué)第4章代數(shù)式單元測(cè)試卷(含答案)
- 七年級(jí)下冊(cè)第六章《人體生命活動(dòng)的調(diào)節(jié)》作業(yè)設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論