Intel Xeon phi計(jì)算卡片的解析_第1頁(yè)
Intel Xeon phi計(jì)算卡片的解析_第2頁(yè)
Intel Xeon phi計(jì)算卡片的解析_第3頁(yè)
Intel Xeon phi計(jì)算卡片的解析_第4頁(yè)
Intel Xeon phi計(jì)算卡片的解析_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

IntelXeonphi協(xié)處理器實(shí)際上它更像是與CPU協(xié)同工作的GPU。XeonPhi協(xié)處理器在很大程度上繼承了流產(chǎn)的獨(dú)立顯卡項(xiàng)目Larrabee的遺志,外部造型看似顯卡,其實(shí)是和Tesla類(lèi)似的專(zhuān)用加速計(jì)算卡,其架構(gòu)采用順序、雙發(fā)射x86,支持64位運(yùn)算,每個(gè)核心支持最多四個(gè)線程,最多61個(gè)核心、244個(gè)線程,并且每個(gè)核心都搭配一個(gè)512-bitSIMD矢量引擎。當(dāng)然了,這里的"核心”跟Tesla里邊的CUDA核心是沒(méi)有直接可比性的,它們分別來(lái)自CPU、GPU的世界。雖然在性能預(yù)估上與NVIDIA的TeslaK20核心相比沒(méi)有占到上風(fēng),但是XeonPhi在編程易用性上有優(yōu)勢(shì),除非開(kāi)發(fā)者需要使用新功能,否則多數(shù)代碼都不需要重寫(xiě)。英特爾推出這款處理器就是為了達(dá)到和英偉達(dá)和AMD處理器一樣的效果,提高軟件的并行加速計(jì)算能力。英特爾公布了兩個(gè)XeonPhi系列,其中一個(gè)系列是XeonPhi5110P,現(xiàn)在已經(jīng)上市,而另外一個(gè)系列XeonPhi3100需要到2013年第一季度上市。這兩個(gè)系列處理器都是采用22nm的COMS制程工藝,擁有50億個(gè)晶體管,采用的是英特爾Many-IntegratedCore(MIC)眾核架構(gòu)。XeonPhi5110P擁有60個(gè)核心,每一個(gè)核心都有著4個(gè)線程,1.05GHz,2級(jí)緩存為30MB,最大支持8GB的GDDR5內(nèi)存尋址,內(nèi)存帶寬高達(dá)32OGbps,雙精度浮點(diǎn)計(jì)算能力能夠達(dá)到1TFLOPS,在此次超級(jí)計(jì)算機(jī)TOP500中,戴爾的Stampede采用的是一個(gè)客戶定制版本SE10,擁有著61個(gè)核心,2級(jí)緩存也比30M要大一點(diǎn)。對(duì)于2013年將要發(fā)布的XeonPhi3100,XeonPhi3100擁有57個(gè)核心,頻率1.1GHz,位寬384bit,搭配6GBGDDR5顯存,支持ECC,帶寬超過(guò)240GB/S,可提供1TFLOPS雙精度浮點(diǎn)性能,TDP為300W。在并行加速計(jì)算領(lǐng)域,似乎將要演變成為x86協(xié)同處理器與GPU加速器之間的競(jìng)爭(zhēng),英特爾區(qū)分這兩者之間的區(qū)別是theXeonPhi能夠運(yùn)行操作系統(tǒng),而GPU加速器則不能,XeonPhi能夠運(yùn)行紅帽Linux或者是SuSELinux。不過(guò)更為重要的是這些并行加速處理器是怎樣提高超級(jí)計(jì)算機(jī)的計(jì)算性能,在這些方面軟件等方面起到的作用要比操作系統(tǒng)更重要。例:田納西州大學(xué)的田納西高級(jí)計(jì)算中心(TACC)正在他們的新超級(jí)計(jì)算機(jī)“Stampede”(驚跑)里安裝XeonPhi,也讓我們得以一睹其真容:不明說(shuō)的話肯定會(huì)以為這是塊標(biāo)準(zhǔn)的顯卡吧?Tesla其實(shí)也是這個(gè)樣子,標(biāo)準(zhǔn)的雙插槽體積PCI-Exl6擴(kuò)展卡,而且是因?yàn)閷?zhuān)用于計(jì)算的,都沒(méi)有視頻輸出接口(AMD的還有)。XeonPhi也有主動(dòng)散熱、被動(dòng)散熱兩種版本,這里用的是被動(dòng)散熱的,外殼下邊是厚

重的均熱板和散熱片,尾部則能看到一個(gè)六針和一個(gè)八針輔助供電接口,最大供電能力300W。至于實(shí)際性能如何,很可能現(xiàn)在哪兒都不具備測(cè)試條件,畢竟這玩意兒因?yàn)榧軜?gòu)的緣故要求操作系統(tǒng)、工具軟件都得在一定程度上重新編寫(xiě)和優(yōu)化,Intel也一再?gòu)?qiáng)調(diào)優(yōu)化的重要性。Intel也沒(méi)有一味夸大加速計(jì)算的優(yōu)勢(shì),而是首先澄清了一個(gè)誤解。Intel拿出了一段Fortran代碼,先運(yùn)行未優(yōu)化的單線程代碼,然后優(yōu)化并以XeonPhi運(yùn)行,性能差異達(dá)到了恐怖的300倍。NVIDIATesla宣稱(chēng)的性能提升差不多就是這樣對(duì)比而來(lái)的,讓加速計(jì)算的結(jié)果和單線程結(jié)果對(duì)比,幾十乃至幾百倍的提升就輕松得來(lái)。Intel則證明了其謬誤:在雙路XeonE5上重新運(yùn)行相同的代碼,XeonPhi只快了大

約兩倍而已。也就是說(shuō),如果代碼本身就針對(duì)多核心處理器做過(guò)優(yōu)化,加速計(jì)算的真實(shí)優(yōu)勢(shì)會(huì)小得多。CompiiewithGEZCC++,measurewalltime[Generatessnngrethreadedcode)在另一個(gè)C++的例子中,109倍的提升被證明其實(shí)只有2-2.5倍。AnatomyofaCompiiewithGEZCC++,measurewalltime[Generatessnngrethreadedcode)在另一個(gè)C++的例子中,109倍的提升被證明其實(shí)只有2-2.5倍。Anatomyofa109xImprovement~693secsThe>1OxperformancegaincomesfromparalletismRunsamecodeonInterXewi'ProcessorT耳「q已tingCPU,nocoprocessorOptimizeforIntel*XeonPh廠usingParallelStudioXEjbo^lsjNohandcodedassenib^*495^ExampleofapublicfinanetaidsrivaliumapplicatianccmbinincibinomialtreesndMonteCarlo,writteninC++隨后,Intel展示了XeonPhi協(xié)處理加速計(jì)算所帶來(lái)的真正性能提升,通過(guò)IntelMKL理論測(cè)試得到的幅度為最多2.2-2.9倍,實(shí)際應(yīng)用中則普遍只有最多1.7-2.53倍,只有金融服務(wù)方面取得了10倍左右的突飛猛進(jìn)(布萊克斯克爾斯期權(quán)定價(jià)模型和蒙特卡羅算法)。SGEMMfUF")upto2,5X9.M4DGEMHWF/?)gto2.5io~STREAMTriadXeonPhi?CoprtK?$w:Increa-sesApplicationPerformanceuptolOxApplicationPerformanceExamplesCw^tornvrAppH-at-jpn-Pl<f>[>rVMn?flIlKiTMM'1W,J筆斗*ft■LcrsAlamMNalMularDyrajiflllCIUp申弧昨Wv啊審避0T*ftfer*i>9E^p<YdinibhtrrlwrtfLab*LAHiCtQCD叩ta2.Z7xFlgnctyServicesBlKkScholHSPW&nteCwto51*vptalC,75xno2a.^ix5IK41M4[耐0斤0Upth2.52j(J5oncl?mtaMMFE葉mE>RwiiMWJOtDJ.Tx1bvt*)Rji^TriKlnDfivcFwrm■4Pt|'UptDi.Wjt'B工w■3種耳丘R比聲雪粧仲j■tt*nEl■&nMlSBKwnMVI^血rg^jiKM8LJ¥XW味feKHalHh"爐阿囲詞屮審爐1打斡"“和?暉屮 UrimiPimiiw3-BL1VM1wt 4JKW.M"34rHd?ck^tov,nti *k^JBKima"{[[xncmMmicLutH[■PriBriWT*a<rimflwrihckd1juw-RiTgprnorifJQbMrtb|■W WWIntelXeonPhi"CoprocessorFamilyReferenceTablerHiiteuktaNmUCWf*nr|-faSMPlACIMm■wwLt.yIMtA如"WtSJf-4111KJ■?>K4f

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論