FPGA的定義以及和GPU的類比_第1頁(yè)
FPGA的定義以及和GPU的類比_第2頁(yè)
FPGA的定義以及和GPU的類比_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

FPGA的定義以及和GPU的類比FPGA是一堆晶體管,你可以把它們連接(wireup)起來(lái)做出任何你想要的電路。它就像一個(gè)納米級(jí)面包板。使用FPGA就像芯片流片,但是你只需要買這一張芯片就可以搭建不一樣的設(shè)計(jì),作為交換,你需要付出一些效率上的代價(jià)。從字面上講這種說(shuō)法并不對(duì),因?yàn)槟悴⒉恍枰剡B(rewire)FPGA,它實(shí)際上是一個(gè)通過路由網(wǎng)絡(luò)(routingnetwork)連接的查找表2D網(wǎng)格,以及一些算術(shù)單元和內(nèi)存。FPGA可以模擬任意電路,但它們實(shí)際上只是在模仿,就像軟件電路仿真器模擬電路一樣。這個(gè)答案不恰當(dāng)?shù)牡胤皆谟?,它過分簡(jiǎn)化了人們實(shí)際使用FPGA的方式。接下來(lái)的兩個(gè)定義能更好地描述FPGA。電路模擬是FPGA的經(jīng)典主流用例,這也是FPGA最早出現(xiàn)的原因。FPGA的關(guān)鍵在于硬件設(shè)計(jì)是用HDL形式編碼的,而且買一些便宜的硬件就可以得到和ASIC相同的效果。當(dāng)然,你不可能在FPGA和真正的芯片上使用完全相同的Verilog代碼,但至少它們的抽象范圍是一樣的。這是與ASIC原型設(shè)計(jì)不同的一個(gè)用例。和電路仿真不同,計(jì)算加速是FPGA的新興用例。這也是微軟最近成功加速搜索和深度神經(jīng)網(wǎng)絡(luò)的原因。而且關(guān)鍵的是,計(jì)算實(shí)例并不依賴于FPGA和真正ASIC之間的關(guān)系:開發(fā)人員針對(duì)基于FPGA的加速編寫的Verilog代碼不需要與用來(lái)流片的Verilog代碼有任何的相似性。

這兩種實(shí)例在編程、編譯器和抽象方面存在巨大差異。我比較關(guān)注后者,我將其稱為「計(jì)算FPGA編程」(computaTIonalFPGAprogramming)。我的論點(diǎn)是,目前計(jì)算FPGA的編程方法都借鑒了傳統(tǒng)的電路仿真編程模型,這是不對(duì)的。如果你想開發(fā)ASIC原型的話,Verilog和VHDL都是正確的選擇。但如果目標(biāo)是計(jì)算的話,我們可以也應(yīng)該重新思考整個(gè)堆棧。讓我們開門見山地說(shuō)吧。FPGA是一類很特殊的硬件,它用來(lái)高效執(zhí)行模擬電路描述的特殊軟件。FPGA配置需要一些底層軟件——它是為了ISA編寫的程序??梢杂肎PU做類比在深度學(xué)習(xí)和區(qū)塊鏈?zhǔn)⑿兄?,有一段時(shí)間GPU是用來(lái)處理圖形的。在21世紀(jì)初,人們意識(shí)到他們?cè)谔幚頉]有圖形數(shù)據(jù)的計(jì)算密集型任務(wù)時(shí),也會(huì)大量使用GPU作為加速器:GPU設(shè)計(jì)師們已經(jīng)構(gòu)建了更通用的機(jī)器,3D渲染只是其中一個(gè)應(yīng)用而已。

FPGA的定義以及和GPU的類比計(jì)算FPGA遵循了相同的軌跡。我們的想法是要多多使用這一時(shí)興的硬件,當(dāng)然不是為了電路仿真,而是利用適合電路執(zhí)行的計(jì)算模式,用類比的形式來(lái)看GPU和FPGA。為了讓GPU發(fā)展成今天的數(shù)據(jù)并行加速器,人們不得不重新定義GPU輸入的概念。我們過去常常認(rèn)為GPU接受奇特的、強(qiáng)烈的、特定領(lǐng)域的視覺效果描述。我們實(shí)現(xiàn)了GPU執(zhí)行程序,從而解鎖了它們真正的潛力。這樣的實(shí)現(xiàn)讓GPU的目標(biāo)從單個(gè)應(yīng)用域發(fā)展為整個(gè)計(jì)算域。我認(rèn)為計(jì)算FPGA正處于類似的轉(zhuǎn)變中,現(xiàn)在還沒有針對(duì)FPGA擅長(zhǎng)的基本計(jì)算模式的簡(jiǎn)潔描述。但它和潛在的不規(guī)則并行性、數(shù)據(jù)重用以及大多數(shù)靜態(tài)的數(shù)據(jù)流有關(guān)。和GPU一樣,F(xiàn)PGA也需要能夠體現(xiàn)這種計(jì)算模式的硬件抽象,Verilog用于計(jì)算FPGA的問題在于它在低級(jí)硬件抽象中效果不好,在高級(jí)編程抽象中的效果也不好。讓我們通過反證法想象一下,如果用RTL(寄存器傳輸級(jí))取代這些角色會(huì)是什么樣。甚至RTL專家可能也無(wú)法相信Verilog是可以高效開發(fā)主流FPGA的方式。它不會(huì)把編程邏輯推向主流。對(duì)于經(jīng)驗(yàn)豐富的硬件黑客來(lái)說(shuō),RTL設(shè)計(jì)似乎是友好而熟悉的,但它與軟件語(yǔ)言之間的生產(chǎn)力差距是不可估量的。事實(shí)上,對(duì)現(xiàn)在的計(jì)算FPGA來(lái)說(shuō),Verilog實(shí)際上就是ISA。主要的FPGA供應(yīng)商工具鏈會(huì)將Verilog作為輸入,而高級(jí)語(yǔ)言的編譯器則將Verilog作為輸出。供應(yīng)商一般會(huì)對(duì)比特流格式保密,因此Verilog在抽象層次結(jié)構(gòu)中會(huì)處于盡可能低的位置。把Verilog當(dāng)做ISA的問題是它和硬件之間的距離太遠(yuǎn)了。RTL和FPGA硬件之間的抽象差距是巨大的,從傳統(tǒng)角度講它至少要包含合成、技術(shù)映射以及布局布線——每一個(gè)都是復(fù)雜而緩慢的過程。因此,F(xiàn)PGA上RTL編程的編譯/編輯/運(yùn)行周期需要數(shù)小時(shí)或數(shù)天,更糟糕的是,這是一個(gè)無(wú)法預(yù)測(cè)的過程,工具鏈的深層堆??赡軙?huì)掩蓋RTL中的改變,這可能會(huì)影響設(shè)計(jì)性能和能源特性。好的ISA應(yīng)該直接展示底層硬件未經(jīng)修飾的真實(shí)情況。像匯編語(yǔ)言一樣,它其實(shí)不需要很方便編程。但也像匯編語(yǔ)言一樣,它的編譯速度需要非???,而且結(jié)果可預(yù)測(cè)。如果想要構(gòu)建更高級(jí)的抽象和編譯器,就需要一個(gè)不會(huì)出現(xiàn)意外的低級(jí)目標(biāo)。而RTL不是這樣的目標(biāo)。如果計(jì)算FPGA是特定類算法模式的加速器,那

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論