英特爾睿頻加速技術(shù)深度解析_第1頁
英特爾睿頻加速技術(shù)深度解析_第2頁
英特爾睿頻加速技術(shù)深度解析_第3頁
英特爾睿頻加速技術(shù)深度解析_第4頁
英特爾睿頻加速技術(shù)深度解析_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

隨著英特爾的Nehalem架構(gòu)處理器的發(fā)布,英特爾睿頻加速技術(shù)一時成為了熱點。我們都知道一直以來英特爾是反對超頻的,那么這項加速技術(shù)與超頻有什么關(guān)聯(lián)與區(qū)別呢?這個技術(shù)到底是遵循怎樣的途徑發(fā)揮作用,其原理又是什么呢?這項技術(shù)又有何種應(yīng)用前景?這里我們就來一探究竟。今非昔比一此加速非彼超頻首先我們先來解釋一下英特爾睿頻加速技術(shù)。所謂睿頻加速,就是根據(jù)需要,自動調(diào)節(jié)多個CPU內(nèi)核的負載以達到最佳運算效果。這樣一來,處理器的主頻能夠適應(yīng)運算需要,擴展性能以滿足峰值性能需求。英特爾睿頻加速技術(shù)的特點在于可以隨時隨地提供所需性能。它支持每個處理器內(nèi)的特定內(nèi)核在設(shè)定的范圍內(nèi)以超出額定頻率的頻率運行,根據(jù)需要提升頻率以提高執(zhí)行效率。我們知道,提高頻率就會導致功耗提升,但是處理應(yīng)用時間縮短的話,總功耗是不會增加的。關(guān)閉一些內(nèi)核,降低功耗,同時給另外一些內(nèi)核超頻,這樣就可以實現(xiàn)在總設(shè)計熱功率TDP(ThermalDesignPower)上限之內(nèi)進行加速,對于部分單線程應(yīng)用來講大有裨益。需要多核心并行處理的任務(wù),那么就讓多核心以設(shè)定的頻率同時運算,提高并行處理能力。需要單核心處理的任務(wù),就關(guān)掉幾個核心,給一個核心進行超頻,提高單線程的運算能力。通過這種方式,總功耗不會增加,相應(yīng)地發(fā)熱量也不會增加,卻可以實現(xiàn)靈活的運算切換??吹竭@里,有些讀者朋友疑惑了,英特爾睿頻加速技術(shù)和以前我們提到的動態(tài)超頻的概念(DynamicOverclocking)是很類似的。其實雖然都是根據(jù)需要進行超頻或者加速,但是這兩者差別是很大的。所謂動態(tài)超頻,是主板自帶的程序針偵測處理器負載高低,調(diào)整處理器的運作頻率。但是需要注意的是,動態(tài)超頻是強制處理器的所有內(nèi)核都運行在額定頻率范圍之外,這必然導致功耗、電流、電壓和溫度等指標超出安全范圍,對處理器的穩(wěn)定運行是有較大影響的。而睿頻加速技術(shù),是根據(jù)系統(tǒng)負載,動態(tài)調(diào)節(jié)處理器內(nèi)核運行頻率從而提升性能,并全程保持處理器運行在技術(shù)規(guī)范限定的功耗、電流、電壓和溫度范圍內(nèi)。我們知道,英特爾一直以來都是公開反對超頻的,甚至有一個反超頻的技術(shù)。

的UH氓新EEDETECTED從上圖我們可以看到英特爾反超頻技術(shù)的特點,反超頻技術(shù)包括兩個部分,一是頻率分辨,二是頻率控制。芯片內(nèi)部有一個讀取電路,讀取CPU的額定頻率,再由板載時鐘信號將其轉(zhuǎn)換成固定時鐘頻率,并與檢測到的實際時鐘頻率相比較。從圖中我們可以看出,固定的時鐘頻率32.968kHz,采用了一個32.968kMHz的晶振。通過CPU運行的頻率與32.968kHz的比值來進行判斷。當實際頻率與32.968kHz的比值高于CPU額定頻率與32.968kHz的比值,則判斷出CPU進行了超頻。利用英特爾的檢測軟件英特爾ProcessorFrequencyIDUtility,可以讀出英特爾CPU內(nèi)置的NameString信息,然后將該數(shù)據(jù)與檢測到的CPU實際工作頻率進行比較,可以很輕易的檢測CPU是否被超頻。舊瓶新酒一英特爾的奇思妙想如果說睿頻加速技術(shù)是英特爾為了提高CPU運算能力而超頻核心讓人很難理解的話,那么說睿頻加速技術(shù)是英特爾為了CPU在高效運算時候而進行降溫,這樣就比較容易理解了。說到CPU的降溫,我們很容易想到HLT指令。我們知道,CPU大約有40%的情況下空閑(空閑模式,IdleMode)。目前,幾乎所有的CPU設(shè)計都有空閑模式。當操作系統(tǒng)發(fā)現(xiàn)CPU當前沒有可執(zhí)行的任務(wù)時,便將CPU置于空閑狀態(tài)。在空閑模式下,可以關(guān)閉不需要的時鐘,以減少不必要的功耗。當系統(tǒng)發(fā)生中斷時,CPU從空閑狀態(tài)被喚醒。大多數(shù)系統(tǒng)都有操作系統(tǒng)計時器中斷,這樣CPU在一秒鐘之內(nèi)可能幾千次地進出空閑狀態(tài)。CPU時鐘的“閑置”通常由“停止”或“閑置”指令觸發(fā),在應(yīng)用或操作系統(tǒng)

C9Wwfcins*閑置時進行調(diào)用。目前的降溫軟件就是通過在CPU空閑時發(fā)送HLT(halt)指令,CPU將HLT指令插入指令序列,并停止處理指令序列,直到發(fā)生中斷為止。發(fā)生中斷后,CPU重新回到Normal狀態(tài)處理指令,處理完中斷代碼后繼續(xù)從HLT指令的下一條指令執(zhí)行,進入Halt模式。這個過程實現(xiàn)起來也很簡單,可以做一個最低優(yōu)先級的任務(wù)做死循環(huán)處理,系統(tǒng)在空閑時都進入該任務(wù)。然后此任務(wù)的循環(huán)中加入一條HLT指令即可,這樣就實現(xiàn)了AutoHaltC9Wwfcins*j網(wǎng)地INIFtNW.NT?,RESET*」PffibeincomingProbeiProbe冰8kH)■PffibeincomingProbeiProbe冰8kH)■箕5套費DMJSwla.■制fc.:葺isMerSlopCrantyCatlwSncwfMijfc,處理器在進入Halt模式后功耗將有所下降,我們在CPU的溫度監(jiān)控上可以看到7攝氏度左右的降低,估計在CPU內(nèi)核應(yīng)該有10攝氏度左右的降溫。而且通過HLT指令降溫不會對系統(tǒng)的執(zhí)行效率和實時性構(gòu)成影響。HLT指令有Halt、ProbeState、StopGrant、Working>StopGrantCacheNotSnoopableSleep等幾個電源模式。其中,Working為CPU正常運行狀態(tài)。當系統(tǒng)執(zhí)行HLT指令,CPU進入Halt狀態(tài),但此時不關(guān)閉SMI#,INTR,NMI,INIT#RESET#偵聽,當CPU收到在RESET#指令后,同時初始化回到Working狀態(tài)。在Halt狀態(tài)下,系統(tǒng)會產(chǎn)生一個STPCLK#信號,當CPU接收到STPCLK#信號,則進入Stop-Grant狀態(tài),在Stop-Grant狀態(tài),RESET#信號會讓CPU迅速的初始化。當STPCLK#中斷后,CPU返回Halt狀態(tài)。在Stop-Grant狀態(tài)和Halt狀態(tài),CPU可以對系統(tǒng)總線發(fā)出的snoop事件做出反應(yīng)。而且Halt狀態(tài)對CPU占用率、系統(tǒng)操作的實時性并沒有影響。在Halt狀態(tài)和非Halt狀態(tài),CPU占用率是一樣的,因為操作系統(tǒng)計算任務(wù)的CPU占用時間時是以任務(wù)的上下文切換作為統(tǒng)計觸發(fā)條件。當任務(wù)在執(zhí)行HLT指令時操作系統(tǒng)并沒有進行任務(wù)上下文切換,操作系統(tǒng)把CPU進入Halt狀態(tài)的這段時間依然認為是被該任務(wù)占用的時間。英特爾現(xiàn)在做的就是對這幾個電源管理狀態(tài)重新進行了調(diào)整和擴充。英特爾將新的電源管理狀態(tài)調(diào)整為C0、C1、C3和C6。在一些狀態(tài)下,將CPU頻率定義為基準頻率+133n,n可以設(shè)置為1、2、3、4、5等,于是就實現(xiàn)了自動超頻。這樣我們就明白了,所謂自動超頻,就是電源管理模式的擴充而已,只是相對以前而言,更加精準。管中窺豹一睿頻加速技術(shù)探究從上文得知,英特爾通過定義新的電源管理狀態(tài),實現(xiàn)了自動超頻。那么具體到CPU電路上,自動超頻是如何實現(xiàn)的呢,這是我們要探討的問題。要深入地了解睿頻加速技術(shù)的工作原理,就要先來看CPU的基本工作原理和超頻。我們知道現(xiàn)在的CPU的核心DIE都是以硅為基板,以銅為導線,CPU中最基本的單位為三極管。從工藝上來說,CPU的工藝一般分為CMOS(采用MOSFET管)和biCMOS(采用bipolar管)。對于MOSFET來說,在P型或N型襯底上設(shè)置兩個距離接近、與襯底極性相反的區(qū)域,構(gòu)成源極和漏極。并在此區(qū)域形成一層極薄的氧化硅絕緣層,覆上電極,構(gòu)成柵極。當工作電流從源極流入,柵極上存在適當電壓,就會在柵極下形成溝道來連接源極和漏極。電流進而在漏極形成輸出,然后再驅(qū)動其它三極管的柵極。這個過程中,能量消耗發(fā)生在電流從源極到漏極的跨越上;對于bipolar來說,晶體管有兩個相反的P-N結(jié),集電極的電流一般不能穿過這兩結(jié)到達發(fā)射極。如果加一個與集電極同向的電壓在兩個結(jié)之間的基區(qū),這樣,就打破了原來兩個結(jié)之間的平衡狀態(tài),從而使電流通過。這個過程中,能量消耗發(fā)生在電流穿越兩重PN結(jié)上。我們知道,在門電路中,高電平表示1,低電平表示0。如果要消去一些1,或是通過轉(zhuǎn)化為負信號抵消,或是把高電平倒入GND,這樣一些電流就被消耗掉??朔邿崾浅l中的一個很重要的方面,超頻以后,頻率提高,晶體管工作越頻繁,處理速度加快,但是高的頻率也使功耗增大。我們來看公式:P=CfV2。公式顯示了功耗P,CMOS門電容C,開關(guān)頻率f及供電電壓V之間的關(guān)系。其中,CMOS門電容C為常量。開關(guān)頻率f和供電電壓V可根據(jù)實際的應(yīng)用要求而調(diào)整。供電電壓V和開關(guān)頻率f之間的關(guān)系為:V-f。即更高的開關(guān)頻率需要更高的供電電壓支持。這也是晶體管加電壓和超頻的關(guān)系。這個公式只是CPU的動態(tài)功率,漏電流造成的靜態(tài)功率并沒有考慮。從CMOS的角度來看,執(zhí)行一個指令所需的功耗是相同的,所以降低CMOS頻率不能減少耗電量,因為在高的時鐘頻率下,CPU僅僅是加快了完成工作的速度,但在空閑狀態(tài)下停留的時間會更長。在實際工作中,CPU并非一直處于工作狀態(tài),即滿負荷(fullload),大約有40%的情況下空閑(noload),即空閑模式(IdleMode)。所以空閑狀態(tài)的存在是只降低頻率無法節(jié)約能耗的原因。如果電壓隨著頻率一起降低,從公式P=CfV2可以看出,電壓的平方V2與功耗P成正比,降低一點電壓,功耗便大大減少。這樣,每執(zhí)行一條指令的能耗就隨之降低。但是在實際的超頻過程中,我們都需要提高電壓,來增強系統(tǒng)的穩(wěn)定性。為什么我們需要提高電壓呢?這還要從晶體管的角度來加以說明。在超頻的過程中適當?shù)奶岣唠妷?,之所以能使超頻以后的CPU工作起來穩(wěn)定一些,是因為加壓后可以增加電流,從而為提高頻率工作的晶體管正常工作提供足夠的電流。同時提高電壓以后,使晶體管的控制極工作電壓提高,即0、1信號更清晰。MOSFET管的柵極到達晶體管的充電時間縮短,而且柵極電場強

度增加,溝道的打開更迅速。但是電壓不可以無限制提高的,過高的電壓會"^N結(jié)擊穿。從這些分析我們不難看出,睿頻加速技術(shù)要想實現(xiàn)自動超頻,就要解決自動調(diào)整電壓和控制CPU的溫度升高。二者必須實時的實現(xiàn)良好互動并求得一個平衡,該技術(shù)才可謂成功。那么英特爾是怎么實現(xiàn)的呢?我們來繼續(xù)分析。我們來看Nehalem處理器的Die晶體管排列圖,最上面的是內(nèi)存控制器。下面依次是四個SMT內(nèi)核和L2緩存,最下面是L3緩存。左右是I/O接口和QPI總線。要想實時的控制這4個核心,關(guān)閉閑置的核心并將執(zhí)行運算的核心超頻,就需要有個單獨的處理單元。這就是度增加,溝道的打開更迅速。但是電壓不可以無限制提高的,過高的電壓會"^N結(jié)擊穿。從這些分析我們不難看出,睿頻加速技術(shù)要想實現(xiàn)自動超頻,就要解決自動調(diào)整電壓和控制CPU的溫度升高。二者必須實時的實現(xiàn)良好互動并求得一個平衡,該技術(shù)才可謂成功。那么英特爾是怎么實現(xiàn)的呢?我們來繼續(xù)分析。PowerManagement:PowerControlUnit此LFrequencySensorsF*q皿叫SensorsVccFreQUEnc^SensorsfrequencySensorsJntegratedmicfoccntrolCentreIledbyfirmwareRealtimesensorsforcurrent/powecvoltage此LFrequencySensorsF*q皿叫SensorsVccFreQUEnc^SensorsfrequencySensorsEnablessophisticated^algorithmsfarcurrentoperatingconditionsLLC--fl.LLC從圖中我們可以看出來,在英特爾Nehalem架構(gòu)的處理器中,每個處理核心都帶有自己的PLL同步邏輯單元,每個核心Core的時鐘頻率Frequency都是獨立的,而且每個處理核心都是有自己單獨的溫度傳感器Sensors。傳感器實時的和PCU單元進行信息交換,便可以及時地控制核心溫度。我們看到有個BCLK(Busclockfrequency,基準BCLK是133.33MHz,英特爾作為一個步進)CPU的核心頻率,通過幾次PLL后,就會加上幾個步進的頻率,得到超頻后的頻率。比如Corei7-860的核心頻率是2.80GHz,超頻以后,加上一個步進2800+133X1=2933(2.93GHz),加上四個步進2800+133X4=3332(3.33GHz),加上五個步進2800+133X5=3465(3.46GHz)0PLL電路每上拉一次,核心頻率就增加一個步進133.33MHz。而Vcc是接入電路的電壓,代表高電平。在核心超頻時PCU將該核心的供電電路上拉到Vcc,即可以為該核心增加一個電壓,比如0.1v。如果該核心需要關(guān)閉,只需要PCU關(guān)閉該核心的供電即可。這樣的好處是在深度睡眠的時候,個別的處理核心幾乎可以完全被關(guān)閉。而在之前的多核心處理器中,所有的處理核心都具備相同的核心電壓,也就是說活躍的處理核心與不活躍的處理核心都要消耗相同的功耗。PCU可以監(jiān)控操作系統(tǒng)的性能,并且向其發(fā)出命令請求。因此它可以非常智能地決定系統(tǒng)的運行狀態(tài)一一是在高性能模式,還是在節(jié)電模式。PCU的調(diào)節(jié)是非常靈活的,當應(yīng)用負載提高時,系統(tǒng)可以在TDP允許范圍內(nèi)對核心主頻進行超頻:如果4個CPU內(nèi)核中有一個或兩個核心檢測到負荷不高,那么其功耗將會被切斷,也就是將相關(guān)核心的工作電壓設(shè)置為0,而節(jié)省下來的電力就會被用來提升高負荷內(nèi)核的電壓,從而提升核心頻率最終提升性能。當然不僅限于這一種狀態(tài),也可以是關(guān)閉一個核心或者是關(guān)閉三個核心。這樣就可以讓CPU的能耗曲線更為接近應(yīng)用負載曲線(負載高時,頻率高、能耗高。負載低時,頻率低、能耗低),讓每一份的電源能耗都用到實處。張弛有度一睿頻加速技術(shù)的工作流程睿頻加速技術(shù)自動超頻技術(shù)是一種新的性能控制思路,與以前一味的降低主頻以達到控制能耗的想法不同,睿頻加速技術(shù)自動超頻技術(shù)的主旨在于:在不超過總TDP的前提下,盡量挖掘CPU的性能潛力。明白了睿頻加速技術(shù)的工作原理,下面我們來看看睿頻加速技術(shù)是如何工作的。下圖就是睿頻加速技術(shù)的工作模式圖解:1代表在TDP的限制下,四個核心共同工作。2代表當應(yīng)用負載只在兩個核心上,那么可以把另外兩個核心關(guān)閉,并把節(jié)省下的電力提供給剩余的兩個核心。這樣系統(tǒng)就可以關(guān)閉兩個核心,同時在TD

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論