單顆芯片上的超級(jí)計(jì)算_第1頁(yè)
單顆芯片上的超級(jí)計(jì)算_第2頁(yè)
單顆芯片上的超級(jí)計(jì)算_第3頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、單顆芯片上的超級(jí)計(jì)算引 :位于美國(guó) Austin 的 Texas大學(xué)的計(jì)算機(jī)科學(xué)家們正 在設(shè)計(jì)一種革命性的微處理器架構(gòu),它將解決目前處理器設(shè) 計(jì)者所面臨的一些最棘手的問(wèn)題,例如工作負(fù)載過(guò)重以及發(fā) 熱量過(guò)大等。這項(xiàng)研究由美國(guó)國(guó)防部資助,如果研制成功,它將為處理 器的性能和靈活性帶來(lái)前所未有的飛躍。據(jù)悉,這種有望在 2012 年實(shí)現(xiàn)商業(yè)化的新型微處理器, 將實(shí)現(xiàn)每秒一萬(wàn)億次的 運(yùn)算速度。挖掘多核處理器的優(yōu)勢(shì)在過(guò)去幾十年間,芯片中半導(dǎo)體元件的數(shù)量至少每?jī)赡?就翻一番,并且微處理器設(shè)計(jì)者都可以充分利用這些為斷進(jìn) 步的半導(dǎo)體元件。先進(jìn)的電路設(shè)計(jì)使用了程序流程預(yù)測(cè)以及 隨機(jī)測(cè)試來(lái)建立復(fù)雜的指令“流水線(xiàn)”

2、,通過(guò)讓處理器同時(shí) 執(zhí)行多條指令,提高其運(yùn)算能力。但是隨著電路設(shè)計(jì)復(fù)雜程 度和芯片發(fā)熱量的上升,這種設(shè)計(jì)模式將會(huì)走到盡頭。處理 器制造商開(kāi)始另辟蹊徑,不再制造更快的處理器內(nèi)核,而是 將多個(gè)內(nèi)核放到同一塊芯片上。Texas大學(xué)計(jì)算機(jī)科學(xué)教授 Doug Burger 說(shuō),多內(nèi)核設(shè)計(jì) 面臨的問(wèn)題是:要想發(fā)揮多內(nèi)核的優(yōu)勢(shì),程序設(shè)計(jì)人員必須 編寫(xiě)出能夠進(jìn)行并行處理的程序,在某些情況下這是非常困 難甚至不可能實(shí)現(xiàn)的?,F(xiàn)在處理器面臨的障礙是,某些情況 下程序無(wú)法編寫(xiě)。要想克服這個(gè)障礙,關(guān)鍵要看軟件設(shè)計(jì)者 的努力,程序員必須為這樣的處理器設(shè)計(jì)出相應(yīng)的程序。Burger 和他的同事計(jì)劃通過(guò)全新的微處理器和指令集

3、架 構(gòu)來(lái)解決這個(gè)問(wèn)題,項(xiàng)目的名稱(chēng)為 Trips(Tera-op Reliable Intelligently Adaptive Processing System ,每秒萬(wàn)億次運(yùn)算的 可靠智能適應(yīng)處理系統(tǒng) ),其目標(biāo)是充分發(fā)揮并行運(yùn)算的優(yōu)勢(shì) (不管程序是如何設(shè)計(jì)的 ) 。Trips 為實(shí)現(xiàn)這個(gè)目標(biāo)使用了多種技術(shù)。首先, Trips 的 編譯器將指令以“指令包”的形式發(fā)送給處理器,每個(gè)指令 包內(nèi)含有 128 條指令。處理器每次執(zhí)行一個(gè)指令包中的所有 指令,就如同執(zhí)行一條指令一樣,這樣可以大大緩解與指令 的處理和列隊(duì)相關(guān)的工作量。其次,每個(gè)指令包內(nèi)部包含的指令以“數(shù)據(jù)流”的形式 出現(xiàn),也就是說(shuō)只要

4、輸入數(shù)據(jù)抵達(dá),指令會(huì)立刻執(zhí)行,而不是按編譯器或者程序員設(shè)計(jì)的流程執(zhí)行。 “從本質(zhì)上說(shuō),數(shù) 據(jù)是從指令上流過(guò)去的, ” Steve Keckler 解釋說(shuō),他也是一 位計(jì)算機(jī)科學(xué)教授,和 Burger 一起領(lǐng)導(dǎo) Trips 項(xiàng)目。提高效率另外一種技巧是, 在每個(gè)指令包內(nèi)部, Trips 編譯器能夠 將兩條在不同路徑上的指令合并為一個(gè),前提是它們的目標(biāo) 數(shù)和運(yùn)算符相同。與比較傳統(tǒng)的數(shù)據(jù)流設(shè)計(jì)模式相比, “我 們的數(shù)據(jù)流模式更好,編譯器能夠輸出更加緊密、更加高效 的代碼,”負(fù)責(zé) Trips 項(xiàng)目編譯器設(shè)計(jì)的 Kathryn McKinley 說(shuō)。最終,數(shù)據(jù)流的執(zhí)行通過(guò)“直接目標(biāo)編碼”實(shí)現(xiàn),也就 是一

5、條指令的執(zhí)行結(jié)果直接作為需要這個(gè)結(jié)果的下一條執(zhí) 行的輸入,而不需要臨時(shí)存儲(chǔ)到中央寄存器中。這樣將會(huì)進(jìn) 一步降低處理器的性能耗費(fèi),提高計(jì)算速度。與提高處理器 性能的傳統(tǒng)方式 (提高時(shí)鐘頻率以及實(shí)現(xiàn)更復(fù)雜的流水線(xiàn) )相 比,通過(guò)上述這些技術(shù)提高性能帶來(lái)的功耗增加比較少。在設(shè)計(jì)多內(nèi)核處理器的過(guò)程中,如何處理功耗問(wèn)題一直 是處理器設(shè)計(jì)者面臨的一大挑戰(zhàn)。 Austin 的 Coherent Logix 公司的工程副總裁 Mark McDermott 以前曾經(jīng)是 Intel 公司工 程師,他說(shuō):“注意一下 Pentium 處理器你會(huì)發(fā)現(xiàn), 處理器中 含有大量的控制邏輯、用于控制的元器件,他們不執(zhí)行運(yùn)算 操

6、作, 但是會(huì)消耗電力。 Trips 的設(shè)計(jì)目標(biāo)之一就是要將原本 由處理器完成的部分復(fù)雜工作交給編譯器來(lái)完成。 ”他認(rèn)為, Trips 真正發(fā)揮作用的領(lǐng)域是非常高性能的數(shù)據(jù)流嵌入式計(jì) 算,比如軟件無(wú)線(xiàn)電。但不知道是否存在更好的解決方案, 因?yàn)橄嚓P(guān)的研究還有很多。根據(jù) Trips 設(shè)計(jì)者的看法, Trips 的數(shù)據(jù)流技術(shù)可以很好 地支持軟件中常見(jiàn)的三種并行處理情況,分別是指令級(jí)、線(xiàn) 程級(jí)以及數(shù)據(jù)級(jí)。 正因?yàn)檫@個(gè)原因, Trips 被認(rèn)為是“多態(tài)的”, 也就是說(shuō)它能夠在多種不同類(lèi)型的應(yīng)用程序中表現(xiàn)出 色科學(xué)計(jì)算、商業(yè)應(yīng)用以及嵌入式應(yīng)用。這恰恰就是 DARPA( 美國(guó)國(guó)防部高級(jí)研究項(xiàng)目機(jī)構(gòu) )在 其多

7、態(tài)計(jì)算架構(gòu) (Polymorphous Computing Architectures) 項(xiàng)目 中所要實(shí)現(xiàn)的目標(biāo)。 DARPA 為 Trips 項(xiàng)目投入了 1540 萬(wàn)美 元資金,要求設(shè)計(jì)出在很多應(yīng)用領(lǐng)域中都能達(dá)到每秒鐘 1 萬(wàn) 億次運(yùn)算速度的處理器。商業(yè)化前景及日程Texas 大學(xué)將把 Trips 的設(shè)計(jì)方案提交給 IBM 來(lái)制造原 型產(chǎn)品,并在 2006年 2月份交付給 Texas大學(xué)。這款原型產(chǎn) 品有兩個(gè)內(nèi)核,每個(gè)內(nèi)核可以同時(shí)執(zhí)行16 條指令。Keckler 說(shuō),該產(chǎn)品的運(yùn)行時(shí)鐘頻率為 500MHz ,每秒鐘 能夠執(zhí)行 160 億次運(yùn)算。Texas 大學(xué)將會(huì)向企業(yè)尋求幫助以對(duì)產(chǎn)品進(jìn)行商業(yè)

8、化, 同時(shí)計(jì)劃在 2012 年時(shí)生產(chǎn)出滿(mǎn)足 DARPA 要求的產(chǎn)品, 即運(yùn) 行頻率為 10GHz 、每秒鐘執(zhí)行 1 萬(wàn)億次運(yùn)算?!拔覀儗?duì)產(chǎn)品的商業(yè)化很感興趣,并且正在積極尋找商 業(yè)化合作伙伴, ”Burger 說(shuō)。廣泛的商業(yè)化也是 DARPA 的愿 望。這種產(chǎn)品具有多態(tài)性的特點(diǎn),因此美國(guó)國(guó)防部有可能會(huì) 購(gòu)買(mǎi)這種價(jià)格低廉、可以立刻投入使用的產(chǎn)品。目前該部在 一些系統(tǒng)中使用了專(zhuān)門(mén)定制的特殊處理器,它們有可能被這 種產(chǎn)品代替。AMD 公司的資深員工 Chuck Moore 認(rèn)為 Trips 具有廣闊 的前景:“它的概念和代碼的實(shí)際執(zhí)行方式高度一致, Trips 的多態(tài)特性可以讓它在各種類(lèi)型的工作應(yīng)用

9、中有出色表 現(xiàn)?!彼€認(rèn)為,要想成為主流的商業(yè)處理器, Trips 面臨的 一大挑戰(zhàn)是如何實(shí)現(xiàn)對(duì)現(xiàn)有軟件和系統(tǒng)的兼容,尤其和 x86 兼容。他預(yù)計(jì),實(shí)現(xiàn)兼容的一種途徑是將 Trips 作為協(xié)處理 器使用?!巴ㄓ锰幚砥?(x86 處理器 )可以將繁重的工作負(fù)擔(dān)交 給協(xié)處理器完成,而自己完成保持兼容的工作” ,他說(shuō)。盡管 Trips 技術(shù)很有前途,但是 Moore 仍然謹(jǐn)慎地說(shuō): “從市場(chǎng)的層面上看,引入全新的東西往往是非常微妙的。 這意味著它必須首先進(jìn)入某個(gè)高端市場(chǎng),并在那里展示自己 的優(yōu)勢(shì)。它必須能夠在一些關(guān)鍵的市場(chǎng)上證明自己的使用價(jià) 值,才有可能得到更廣泛的應(yīng)用。 ”Trips 編譯器Tri

10、ps 的神奇之處不僅僅是硬件,還有軟件。這里說(shuō)的軟件其實(shí)就是指 Trips 的 C 語(yǔ)言以及 Fortran 語(yǔ) 言編譯器。編譯器的設(shè)計(jì)目標(biāo)是:通過(guò)使用創(chuàng)新技術(shù),一方 面提高處理器的性能,另一方面又不至于增加程序設(shè)計(jì)者的 負(fù)擔(dān)。“我們相信, Trips 在分配編譯器和硬件所應(yīng)承擔(dān)的任 務(wù)方面達(dá)到了很好的平衡, ”Trips 項(xiàng)目編譯器負(fù)責(zé)人 Kathryn McKinley 說(shuō)。在早先的數(shù)據(jù)流架構(gòu)中, 例如 MIT 在 1970 和 1980 年代開(kāi)發(fā)的架構(gòu),必須要用專(zhuān)門(mén)的編程語(yǔ)言簡(jiǎn)化編譯器。 “但是 Trips 將數(shù)據(jù)流限制為固定尺寸的指令包, 與早期的數(shù)據(jù)流架 構(gòu)相比可以極大地簡(jiǎn)化編譯器的工作, ” Mckinley 說(shuō)。不過(guò)她同時(shí)補(bǔ)充說(shuō): “我們還沒(méi)有完成工作。一些傳統(tǒng) 的優(yōu)化

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論