GPU的架構(gòu)知識(shí)介紹_第1頁(yè)
GPU的架構(gòu)知識(shí)介紹_第2頁(yè)
GPU的架構(gòu)知識(shí)介紹_第3頁(yè)
GPU的架構(gòu)知識(shí)介紹_第4頁(yè)
GPU的架構(gòu)知識(shí)介紹_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 PAGE8 頁(yè) 共 NUMPAGES8 頁(yè)GPU的架構(gòu)知識(shí)介紹GPU的起GPU縮寫(xiě)為Graphics Processing Unit的,一般稱為視覺(jué)處理單元。GPU被廣泛用于嵌入式系統(tǒng)、挪動(dòng) 、個(gè)人電腦、工作站和電子游戲解決方案當(dāng)中?,F(xiàn)代的GPU對(duì)圖像和圖形處理是非常高效率的,這是因?yàn)镚PU被設(shè)計(jì)為很高的并行架構(gòu)這樣使得比通用途理器CPU在大的數(shù)據(jù)塊并行處理算法上更具有優(yōu)勢(shì)。1985年 8月20日 ATi公司成立,同年10月ATi使用ASIC技術(shù)開(kāi)發(fā)出了第一款圖形芯片和圖形卡,1992年 4月 ATi發(fā)布了 Mach32 圖形卡集成了圖形加速功能,1998年 4月 ATi被IDC評(píng)選為圖形

2、芯片工業(yè)的市場(chǎng)指導(dǎo)者,但那時(shí)候這種芯片還沒(méi)有GPU的稱號(hào),很長(zhǎng)的一段時(shí)間ATI都是把圖形處理器稱為VPU,直到AMD收買ATI之后其圖形芯片才正式采用GPU的名字。NVIDIA公司在1999年發(fā)布GeForce 256圖形處理芯片時(shí)首先提出GPU的概念。從此NVIDIA顯卡的芯片就用這個(gè)新名字GPU來(lái)稱呼。GPU使顯卡削減了對(duì)CPU的依賴,并執(zhí)行局部本來(lái)CPU的工作,尤其是在3D圖形處理時(shí)。GPU所采用的核心技術(shù)有鋼體TL、立方環(huán)境材質(zhì)貼圖與頂點(diǎn)混合、紋理壓縮及凹凸映射貼圖、雙重紋理四像素256位渲染引擎等,而硬體TL技術(shù)可以說(shuō)是GPU的標(biāo)志。工作原理電腦顯卡的處理器稱為圖形處理單元(GPU)

3、,它對(duì)于顯卡的功能就相當(dāng)于CPU對(duì)于整臺(tái)電腦,但是GPU的設(shè)計(jì)初衷是為了處理圖形渲染所需要的復(fù)雜的數(shù)學(xué)和幾何運(yùn)算。一些高速的GPU往往包含比CPU更多的晶體管,而且,GPU的運(yùn)行會(huì)產(chǎn)生大量的熱量,因此,它們一般都安裝有必需的散熱片或者散熱風(fēng)扇。GPU是可以從硬件上支持TL(Transform and Lighting,多邊形轉(zhuǎn)換與光處理)的顯示芯片,因?yàn)門L是3D渲染中的一個(gè)重要局部,其作用是計(jì)算多邊形的3D位置和處理動(dòng)態(tài)光線效果,也可以稱為“幾何處理”。一個(gè)好的TL單元,可以提供細(xì)致的3D物體和高級(jí)的光線特效;只大多數(shù)PC中,TL的大局部運(yùn)算是交由CPU處理的(這也就是所謂的軟件TL),由于

4、CPU的任務(wù)繁多,除了TL之外,還要做內(nèi)存管理、輸入響應(yīng)等非3D圖形處理工作,因此在實(shí)際運(yùn)算的時(shí)候性能會(huì)大打折扣,常常出現(xiàn)顯卡等待CPU數(shù)據(jù)的情況,其運(yùn)算速度遠(yuǎn)跟不上今天復(fù)雜三維游戲的要求。即使CPU的工作頻率超過(guò)1GHz或更高,對(duì)它的幫助也不大,由于這是PC本身設(shè)計(jì)造成的問(wèn)題,與CPU的速度無(wú)太大關(guān)系。GPU是顯示卡的“大腦”,它決定了該顯卡的檔次和大局部性能,同時(shí)也是2D顯示卡和3D顯示卡的區(qū)別根據(jù)。2D顯示芯片在處理3D圖像和特效時(shí)主要依賴CPU的處理才能,稱為“軟加速”。3D顯示芯片是將三維圖像和特效處理功能集中在顯示芯片內(nèi),也即所謂的“硬件加速”功能。GPU加速技術(shù)當(dāng)前CPU開(kāi)展速度

5、已經(jīng)落后于摩爾定律,而GPU正以超過(guò)摩爾定律的速度快速開(kāi)展。在SIGGRAPH2022大會(huì)上,許多業(yè)界泰斗級(jí)人物發(fā)表了關(guān)于利用GPU進(jìn)展各種運(yùn)算的設(shè)想和實(shí)驗(yàn)?zāi)P?。SIGGRAPH會(huì)議還特地安排了時(shí)間進(jìn)展GPGPU的研討交流。與此同時(shí),在計(jì)算機(jī)進(jìn)入DirectX 9 Shader Model 3.0時(shí)代,新的Shader Model在指令槽、流控制方面的顯著增強(qiáng)使得對(duì)應(yīng)GPU的可編程性能得到了大大的提升。GPGPU的研究由此進(jìn)入快車道。下面對(duì)幾個(gè)值得關(guān)注的技術(shù)做簡(jiǎn)單介紹。CUDA為充分利用GPU的計(jì)算才能,NVIDIA在2022年推出了CUDA(ComputeUnified Device Arc

6、hitecture,統(tǒng)一計(jì)算設(shè)備架構(gòu))這一編程模型。CUDA是一種由NVIDIA推出的通用并行計(jì)算架構(gòu),該架構(gòu)使GPU可以解決復(fù)雜的計(jì)算問(wèn)題。它包含了CUDA指令集架構(gòu)(ISA)以及GPU內(nèi)部的并行計(jì)算引擎。開(kāi)發(fā)人員如今可以使用C語(yǔ)言來(lái)為CUDA架構(gòu)編寫(xiě)程序。通過(guò)這個(gè)技術(shù),用戶可利用NVIDIA的GeForce 8以后的GPU和較新的QuadroGPU進(jìn)展計(jì)算。以GeForce 8800 GTX為例,其核心擁有128個(gè)內(nèi)處理器。利用CUDA技術(shù),就可以將那些內(nèi)處理器串通起來(lái),成為線程處理器去解決數(shù)據(jù)密集的計(jì)算。而各個(gè)內(nèi)處理器可以交換、同步和共享數(shù)據(jù)。從CUDA體系構(gòu)造的組成來(lái)說(shuō),包含了三個(gè)局部

7、:開(kāi)發(fā)庫(kù)、運(yùn)行期環(huán)境和驅(qū)動(dòng)。開(kāi)發(fā)庫(kù)是基于CUDA技術(shù)所提供的應(yīng)用開(kāi)發(fā)庫(kù)。CUDA的1.1版提供了兩個(gè)標(biāo)準(zhǔn)的數(shù)學(xué)運(yùn)算庫(kù)CUFFT(離散快速傅立葉變換)和CUBLAS(離散根本線性計(jì)算)的實(shí)現(xiàn)。這兩個(gè)數(shù)學(xué)運(yùn)算庫(kù)所解決的是典型的大規(guī)模的并行計(jì)算問(wèn)題,也是在密集數(shù)據(jù)計(jì)算中非常常見(jiàn)的計(jì)算類型。開(kāi)發(fā)人員在開(kāi)發(fā)庫(kù)的根底上可以快速、方便的建立起自己的計(jì)算應(yīng)用。此外,開(kāi)發(fā)人員也可以在CUDA的技術(shù)根底上實(shí)現(xiàn)出更多的開(kāi)發(fā)庫(kù)。運(yùn)行期環(huán)境提供了應(yīng)用開(kāi)發(fā)接口和運(yùn)行期組件,包括根本數(shù)據(jù)類型的定義和各類計(jì)算、類型轉(zhuǎn)換、內(nèi)存管理、設(shè)備訪問(wèn)和執(zhí)行調(diào)度等函數(shù)?;贑UDA開(kāi)發(fā)的程序代碼在實(shí)際執(zhí)行中分為兩種,一種是運(yùn)行在CPU上的

8、宿主代碼(Host Code),一種是運(yùn)行在GPU上的設(shè)備代碼(Device Code)。不同類型的代碼由于其運(yùn)行的物理位置不同,可以訪問(wèn)到的資不同,因此對(duì)應(yīng)的運(yùn)行期組件也分為公共組件、宿主組件和設(shè)備組件三個(gè)局部,根本上囊括了所有在GPGPU開(kāi)發(fā)中所需要的功能和可以使用到的資接口,開(kāi)發(fā)人員可以通過(guò)運(yùn)行期環(huán)境的編程接口實(shí)現(xiàn)各種類型的計(jì)算。由于目前存在著多種GPU版本的NVIDIA顯卡,不同版本的GPU之間都有不同的差異,因此驅(qū)動(dòng)局部根本上可以理解為是CUDA-enable的GPU的設(shè)備抽象層,提供硬件設(shè)備的抽象訪問(wèn)接口。CUDA提供運(yùn)行期環(huán)境也是通過(guò)這一層來(lái)實(shí)現(xiàn)各種功能的。由于體系構(gòu)造中硬件抽象

9、層的存在,CUDA今后也有可能開(kāi)展成為一個(gè)通用的GPGPU標(biāo)準(zhǔn)接口,兼容不同廠商的GPU產(chǎn)品OpenCLOpenCL是Open Computing Language(開(kāi)放式計(jì)算語(yǔ)言)的簡(jiǎn)稱,它是第一個(gè)為異構(gòu)系統(tǒng)的通用并行編程而產(chǎn)生的統(tǒng)一的、免費(fèi)的標(biāo)準(zhǔn)。OpenCL最早由蘋果公司研發(fā),其標(biāo)準(zhǔn)是由Khronos Group推出的。OpenCL支持由多核的CPU、GPU、Cell類型架構(gòu)以及信號(hào)處理器(DSP)等其他的并行設(shè)備組成的異構(gòu)系統(tǒng)。OpenCL的出現(xiàn),使得軟件開(kāi)發(fā)人員編寫(xiě)高性能效勞器、桌面計(jì)算系統(tǒng)以及手持設(shè)備的代碼變得更加快捷。OpenCL是一個(gè)為異構(gòu)平臺(tái)編寫(xiě)程序的框架,此異構(gòu)平臺(tái)可由CP

10、U,GPU或其他類型的處理器組成。OpenCL由一門用于編寫(xiě)kernels (在OpenCL設(shè)備上運(yùn)行的函數(shù))的語(yǔ)言(基于C99)和一組用于定義并控制平臺(tái)的API組成。其框架如下:OpenCL平臺(tái)API:平臺(tái)API定義了宿主機(jī)程序發(fā)現(xiàn)OpenCL設(shè)備所用的函數(shù)以及這些函數(shù)的功能,另外還定義了為OpenCL應(yīng)用創(chuàng)立上下文的函數(shù)。OpenCL運(yùn)行時(shí)API:這個(gè)API管理上下文來(lái)創(chuàng)立命令隊(duì)列以及運(yùn)行時(shí)發(fā)生的其他操作。例如,將命令提交到命令隊(duì)列的函數(shù)就來(lái)自O(shè)penCL運(yùn)行時(shí)API。OpenCL編程語(yǔ)言:這是用來(lái)編寫(xiě)內(nèi)核代碼的編程語(yǔ)言。它基于ISO C99標(biāo)準(zhǔn)的一個(gè)擴(kuò)展子集,因此通常稱為OpenCL C

11、編程語(yǔ)言。OpenCL由用于編寫(xiě)內(nèi)核程序的語(yǔ)言和定義并控制平臺(tái)的API組成,提供了基于任務(wù)和基于數(shù)據(jù)的兩種并行計(jì)算機(jī)制,使得GPU的計(jì)算不在僅僅局限于圖形領(lǐng)域,而可以進(jìn)展更多的并行計(jì)算。OpenCL還是一個(gè)開(kāi)放的工業(yè)標(biāo)準(zhǔn),它可以為CPU和GPU等不同的設(shè)備組成的異構(gòu)平臺(tái)進(jìn)展編程。OpenCL是一種語(yǔ)言,也是一個(gè)為并行編程而提供的框架,編程人員可以利用OpenCL編寫(xiě)出一個(gè)可以在GPU上執(zhí)行的通用程序。在游戲、娛樂(lè)、科研、醫(yī)療等各種領(lǐng)域都有廣闊的開(kāi)展前景。AMD Fusion與Nvidia不同,AMD走了一條全新的路子:將CPU和GPU融為一體,打造了AMDFusion,即APU(Acceler

12、ated Processing Units)。這是AMD融聚將來(lái)理念的產(chǎn)品,它第一次將處理器和獨(dú)顯核心做在一個(gè)晶片上,協(xié)同計(jì)算、彼此加速,同時(shí)具有高性能處理器和最新支持DX11獨(dú)立顯卡的處理性能,大幅提升電腦運(yùn)行效率,實(shí)現(xiàn)了CPU與GPU真正的交融。與傳統(tǒng)的x86中央處理器相比, APU提出了“異構(gòu)系統(tǒng)架構(gòu)”(Heterogeneous System Architecture,HSA),即單芯片上兩個(gè)不同的架構(gòu)進(jìn)展協(xié)同運(yùn)作。以往集成圖形核心一般是內(nèi)置于主板的北橋中。而AMD Fusion工程那么是結(jié)合現(xiàn)時(shí)的處理器和繪圖核心,即是將處理一般事務(wù)的CPU核心、處理3D幾何任務(wù)以及圖形核心之?dāng)U展功能的現(xiàn)代GPU核心、以及主板的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論