計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)—第五章(向量處理機(jī))ppt課件_第1頁(yè)
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)—第五章(向量處理機(jī))ppt課件_第2頁(yè)
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)—第五章(向量處理機(jī))ppt課件_第3頁(yè)
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)—第五章(向量處理機(jī))ppt課件_第4頁(yè)
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)—第五章(向量處理機(jī))ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩62頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、幻燈片 1 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系w 根本概念根本概念w 根本構(gòu)造根本構(gòu)造w 設(shè)計(jì)目的設(shè)計(jì)目的w 關(guān)鍵技術(shù)關(guān)鍵技術(shù)w 協(xié)處置器協(xié)處置器w 性能評(píng)價(jià)性能評(píng)價(jià)幻燈片 2 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容w 向量處置機(jī)向量處置機(jī)w 什么是向量處置什么是向量處置w 向量處置方式向量處置方式幻燈片 3 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本概念 具有向量數(shù)據(jù)表示和向量指令系

2、統(tǒng)的處置機(jī),具有向量數(shù)據(jù)表示和向量指令系統(tǒng)的處置機(jī),是處理數(shù)值計(jì)算問(wèn)題的一種高性能計(jì)算機(jī)構(gòu)造。是處理數(shù)值計(jì)算問(wèn)題的一種高性能計(jì)算機(jī)構(gòu)造。有兩個(gè)主要優(yōu)點(diǎn):效率高和適用性廣,普通都采有兩個(gè)主要優(yōu)點(diǎn):效率高和適用性廣,普通都采用流水線構(gòu)造,有多條流水線并行任務(wù)。用流水線構(gòu)造,有多條流水線并行任務(wù)。 向量處置機(jī)通常屬大型或巨型機(jī),也可以用向量處置機(jī)通常屬大型或巨型機(jī),也可以用微機(jī)加一臺(tái)向量協(xié)處置器組成。普通向量計(jì)算機(jī)微機(jī)加一臺(tái)向量協(xié)處置器組成。普通向量計(jì)算機(jī)中包括有一臺(tái)高性能標(biāo)量處置機(jī)。中包括有一臺(tái)高性能標(biāo)量處置機(jī)。 必需把要處理的問(wèn)題轉(zhuǎn)化為向量運(yùn)算,向量必需把要處理的問(wèn)題轉(zhuǎn)化為向量運(yùn)算,向量處置機(jī)才

3、干充分發(fā)揚(yáng)作用處置機(jī)才干充分發(fā)揚(yáng)作用2 之 1幻燈片 4 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本概念2 之 2幻燈片 5 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本概念 用用Fortran言語(yǔ)編寫(xiě)的一個(gè)簡(jiǎn)單程序:言語(yǔ)編寫(xiě)的一個(gè)簡(jiǎn)單程序:DO 100 I=1,NA(I) =B(I)+C(I)100 B(I)=2*A(I+1)3 之 1幻燈片 6 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章

4、內(nèi)容根本概念I(lǐng)NITIALIZE I=110READB(I);讀數(shù)指令讀數(shù)指令READC(I)ADD B(I)+C(I);運(yùn)算指令運(yùn)算指令STOREA(I)B(I)+C(I);存數(shù)指令存數(shù)指令READA(I+1)MULTIPLY2*A(I+1) ;運(yùn)算指令運(yùn)算指令STOREB(I)2*A(I+1);存數(shù)指令存數(shù)指令I(lǐng)NCREMENT II+1 ;運(yùn)算指令運(yùn)算指令I(lǐng)F IN GOTO 10;條件轉(zhuǎn)移指令條件轉(zhuǎn)移指令STOP3 之 2幻燈片 7 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本概念3 之 3幻燈片 8 / 67Com

5、puter ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系w 橫向處置方式w 縱向處置方式w 縱橫處置方式本章內(nèi)容根本概念幻燈片 9 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本概念向量處置方式2 之 1幻燈片 10 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本概念向量處置方式2 之 2幻燈片 11 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本概念向量處置方

6、式2 之 1幻燈片 12 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本概念向量處置方式2 之 2幻燈片 13 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本概念向量處置方式3 之 1幻燈片 14 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本概念向量處置方式3 之 2幻燈片 15 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根

7、本概念向量處置方式3 之 3幻燈片 16 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容 向量處置機(jī)的最關(guān)鍵問(wèn)題是存儲(chǔ)器系統(tǒng)可以滿向量處置機(jī)的最關(guān)鍵問(wèn)題是存儲(chǔ)器系統(tǒng)可以滿足運(yùn)算部件帶寬的要求。主要采用兩種方法:足運(yùn)算部件帶寬的要求。主要采用兩種方法: 存儲(chǔ)器存儲(chǔ)器構(gòu)造存儲(chǔ)器存儲(chǔ)器構(gòu)造 多個(gè)獨(dú)立的存儲(chǔ)器模塊并行任務(wù)。處置機(jī)構(gòu)造多個(gè)獨(dú)立的存儲(chǔ)器模塊并行任務(wù)。處置機(jī)構(gòu)造簡(jiǎn)單,對(duì)存儲(chǔ)系統(tǒng)的訪問(wèn)速度要求很高。簡(jiǎn)單,對(duì)存儲(chǔ)系統(tǒng)的訪問(wèn)速度要求很高。 存放器存放器構(gòu)造存放器存放器構(gòu)造 運(yùn)算經(jīng)過(guò)向量存放器進(jìn)展。需求大量高速存放運(yùn)算經(jīng)過(guò)向量存放器進(jìn)展

8、。需求大量高速存放器,對(duì)存儲(chǔ)系統(tǒng)訪問(wèn)速度的要求降低,而且利用器,對(duì)存儲(chǔ)系統(tǒng)訪問(wèn)速度的要求降低,而且利用高速存放器可完成對(duì)矩陣元素的特殊運(yùn)算。高速存放器可完成對(duì)矩陣元素的特殊運(yùn)算?;脽羝?17 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本構(gòu)造 假設(shè)假設(shè)A、B、C都是有都是有8個(gè)元素的向量,現(xiàn)向個(gè)元素的向量,現(xiàn)向量處置機(jī)需完成如下運(yùn)算:量處置機(jī)需完成如下運(yùn)算:C=A+B。多端口多端口存儲(chǔ)器系統(tǒng)存儲(chǔ)器系統(tǒng)流水構(gòu)造加法器流水構(gòu)造加法器BAC=A+B3 之 1幻燈片 18 / 67Computer ArchitectureV3同濟(jì)大學(xué)

9、.電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本構(gòu)造MMMMMMMM流水構(gòu)造流水構(gòu)造加法器加法器ABC=A+B3 之 2幻燈片 19 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系 采用多個(gè)存儲(chǔ)體交叉和并行訪問(wèn)來(lái)提高采用多個(gè)存儲(chǔ)體交叉和并行訪問(wèn)來(lái)提高存儲(chǔ)器速度,但應(yīng)該留意處理存儲(chǔ)器訪問(wèn)沖存儲(chǔ)器速度,但應(yīng)該留意處理存儲(chǔ)器訪問(wèn)沖突。下面分情況進(jìn)展引見(jiàn)假設(shè)一個(gè)存儲(chǔ)周突。下面分情況進(jìn)展引見(jiàn)假設(shè)一個(gè)存儲(chǔ)周期占兩個(gè)處置機(jī)周期:期占兩個(gè)處置機(jī)周期:本章內(nèi)容根本構(gòu)造w 理想情況理想情況w 實(shí)踐情況實(shí)踐情況3 之 3幻燈片 20 / 67Compute

10、r ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本構(gòu)造存儲(chǔ)器存儲(chǔ)器構(gòu)造模塊模塊0A0B6C4模塊模塊1A1B7C5模塊模塊2A2B0C6模塊模塊3A3B1C7模塊模塊4A4B2C0模塊模塊5A5B3C1模塊模塊6A6B4C2模塊模塊7A7B5C32 之 1幻燈片 21 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本構(gòu)造存儲(chǔ)器存儲(chǔ)器構(gòu)造流水段流水段401234567流水段流水段301234567流水段流水段201234567流水段流水段101234567存儲(chǔ)體存儲(chǔ)體7RB5 RB5 RA

11、7 RA7 W3 W3存儲(chǔ)體存儲(chǔ)體6RB4 RB4 RA6 RA6 W2 W2存儲(chǔ)體存儲(chǔ)體5RB3 RB3 RA5 RA5 W1 W1存儲(chǔ)體存儲(chǔ)體4RB2 RB2 RA4 RA4 W0 W0存儲(chǔ)體存儲(chǔ)體3RB1 RB1 RA3 RA3存儲(chǔ)體存儲(chǔ)體2 RB0 RB0 RA2 RA2W6存儲(chǔ)體存儲(chǔ)體1RA1 RA1RB7 RB7W5 W5存儲(chǔ)體存儲(chǔ)體0 RA0 RA0RB6 RB6W4 W42 之 2幻燈片 22 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本構(gòu)造存儲(chǔ)器存儲(chǔ)器構(gòu)造多端口多端口存儲(chǔ)器系統(tǒng)存儲(chǔ)器系統(tǒng)流水構(gòu)造加法器流水構(gòu)

12、造加法器BAC=A+B3 之 1幻燈片 23 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本構(gòu)造存儲(chǔ)器存儲(chǔ)器構(gòu)造流水段流水段4012345流水段流水段30123456流水段流水段201234567流水段流水段101234567存儲(chǔ)體存儲(chǔ)體7RA7 RA7 RB7 RB7存儲(chǔ)體存儲(chǔ)體6RA6 RA6 RB6 RB6存儲(chǔ)體存儲(chǔ)體5RA5 RA5 RB5 RB5存儲(chǔ)體存儲(chǔ)體4RA4 RA4 RB4 RB4W4存儲(chǔ)體存儲(chǔ)體3RA3 RA3 RB3 RB3W3 W3存儲(chǔ)體存儲(chǔ)體2RA2 RA2 RB2 RB2W2 W2存儲(chǔ)體存儲(chǔ)體1RA

13、1 RA1 RB1 RB1W1 W1存儲(chǔ)體存儲(chǔ)體0 RA0 RA0 RB0 RB0W0 W03 之 2幻燈片 24 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本構(gòu)造存儲(chǔ)器存儲(chǔ)器構(gòu)造3 之 3 操作數(shù)緩沖器和寫(xiě)結(jié)果緩沖器主要用于處理操作數(shù)緩沖器和寫(xiě)結(jié)果緩沖器主要用于處理訪問(wèn)存儲(chǔ)器沖突。主要優(yōu)缺陷:硬件構(gòu)造簡(jiǎn)單訪問(wèn)存儲(chǔ)器沖突。主要優(yōu)缺陷:硬件構(gòu)造簡(jiǎn)單, 造造價(jià)低;但速度相對(duì)較低。價(jià)低;但速度相對(duì)較低。操作數(shù)緩沖器操作數(shù)緩沖器寫(xiě)結(jié)果緩沖器寫(xiě)結(jié)果緩沖器主存主存儲(chǔ)器儲(chǔ)器流水線流水線運(yùn)算運(yùn)算部件部件幻燈片 25 / 67Computer

14、 ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本構(gòu)造 把存儲(chǔ)器把存儲(chǔ)器-存儲(chǔ)器構(gòu)造中的緩沖器改為向量存存儲(chǔ)器構(gòu)造中的緩沖器改為向量存放器,運(yùn)算部件需求的操作數(shù)從向量存放器中讀放器,運(yùn)算部件需求的操作數(shù)從向量存放器中讀取,運(yùn)算的中間結(jié)果也寫(xiě)到向量存放器中。取,運(yùn)算的中間結(jié)果也寫(xiě)到向量存放器中。 向量存放器與標(biāo)量存放器的主要差別是:一向量存放器與標(biāo)量存放器的主要差別是:一個(gè)向量存放器可以保管一個(gè)向量,例如:個(gè)向量存放器可以保管一個(gè)向量,例如:64個(gè)個(gè)64位存放器,用以實(shí)現(xiàn)延續(xù)訪問(wèn)一個(gè)向量的各個(gè)分位存放器,用以實(shí)現(xiàn)延續(xù)訪問(wèn)一個(gè)向量的各個(gè)分量。量。 需求有標(biāo)量

15、存放器和地址存放器等共同任務(wù)。需求有標(biāo)量存放器和地址存放器等共同任務(wù)。3 之 1幻燈片 26 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本構(gòu)造8個(gè)向量存放器個(gè)向量存放器(V)8個(gè)個(gè)64個(gè)個(gè)64bit主存主存儲(chǔ)器儲(chǔ)器8MB64個(gè)個(gè)個(gè)體個(gè)體12個(gè)個(gè)流水流水線結(jié)線結(jié)構(gòu)的構(gòu)的運(yùn)算運(yùn)算部件部件緩沖存放器緩沖存放器(T)64個(gè)個(gè)64bit標(biāo)量存放器標(biāo)量存放器(S)8個(gè)個(gè)64bit緩沖存放器緩沖存放器(B)64個(gè)個(gè)24bit地址存放器地址存放器(A)8個(gè)個(gè)24bit指令緩沖存放器指令緩沖存放器256個(gè)個(gè)16bit指令存放器指令存放器程序計(jì)

16、數(shù)器程序計(jì)數(shù)器3 之 2幻燈片 27 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容根本構(gòu)造3 之 3 主要向量處置機(jī)都采用存放器存放器構(gòu)造,主要向量處置機(jī)都采用存放器存放器構(gòu)造,包括包括Cray處置機(jī)處置機(jī)Cray-1、Cray-2、 X-MP、Y-MP、C90、 T90和和 SV1)、日本的超級(jí)計(jì)算機(jī)、日本的超級(jí)計(jì)算機(jī)NEC SX/2 SX/5、Fujitsu VP200 VPP5000、Hitachi S820 和和S-8300和小型超級(jí)和小型超級(jí)計(jì)算機(jī)計(jì)算機(jī)Convex C-1 C-4。第一臺(tái)向量處置。第一臺(tái)向量處置機(jī)機(jī)C

17、DC采用存儲(chǔ)器存儲(chǔ)器構(gòu)造。采用存儲(chǔ)器存儲(chǔ)器構(gòu)造。 從如今開(kāi)場(chǎng),我們集中討論存放器存放器從如今開(kāi)場(chǎng),我們集中討論存放器存放器構(gòu)造。構(gòu)造?;脽羝?28 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容w 較好地維持向量較好地維持向量/標(biāo)量性能平衡標(biāo)量性能平衡w 可擴(kuò)展性隨處置機(jī)數(shù)目的添加而提高可擴(kuò)展性隨處置機(jī)數(shù)目的添加而提高w 添加存儲(chǔ)器系統(tǒng)的容量和性能添加存儲(chǔ)器系統(tǒng)的容量和性能w 提供高性能的提供高性能的I/O和易訪問(wèn)的網(wǎng)絡(luò)和易訪問(wèn)的網(wǎng)絡(luò)幻燈片 29 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.

18、計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容設(shè)計(jì)目的 實(shí)踐的運(yùn)用問(wèn)題中通常既有向量計(jì)算又實(shí)踐的運(yùn)用問(wèn)題中通常既有向量計(jì)算又有標(biāo)量計(jì)算,而且兩類(lèi)計(jì)算有一定的比例。有標(biāo)量計(jì)算,而且兩類(lèi)計(jì)算有一定的比例。關(guān)鍵問(wèn)題是:希望向量硬件和標(biāo)量硬件都可關(guān)鍵問(wèn)題是:希望向量硬件和標(biāo)量硬件都可以充分利用,不要空閑。以充分利用,不要空閑。 3 之 1幻燈片 30 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容設(shè)計(jì)目的 向量平衡點(diǎn)向量平衡點(diǎn)(vector balance point):為了使向量為了使向量/標(biāo)量硬件設(shè)備的利用率相等,標(biāo)量硬件設(shè)備的利用率相等,一個(gè)程序中向量

19、代碼所占的百分比。一個(gè)程序中向量代碼所占的百分比。 例如:一個(gè)系統(tǒng)的向量運(yùn)算速度為例如:一個(gè)系統(tǒng)的向量運(yùn)算速度為90Mflops,標(biāo)量運(yùn)算速度為,標(biāo)量運(yùn)算速度為 10Mflops。假。假設(shè)程序的設(shè)程序的90是向量運(yùn)算,是向量運(yùn)算,10是標(biāo)量運(yùn)是標(biāo)量運(yùn)算,硬件利用率最高;那么向量平衡點(diǎn)為算,硬件利用率最高;那么向量平衡點(diǎn)為0.9。3 之 2幻燈片 31 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容設(shè)計(jì)目的 向量處置機(jī)的向量平衡點(diǎn)必需與用戶程向量處置機(jī)的向量平衡點(diǎn)必需與用戶程序的向量化程度相匹配。例如:序的向量化程度相匹配。例如:I

20、BM向量計(jì)向量計(jì)算機(jī)維持較低的向量與標(biāo)量比例,定在算機(jī)維持較低的向量與標(biāo)量比例,定在35的范圍之間。這種做法可以順應(yīng)通用運(yùn)用的范圍之間。這種做法可以順應(yīng)通用運(yùn)用問(wèn)題對(duì)標(biāo)量和向量處置要求。但大多數(shù)超級(jí)問(wèn)題對(duì)標(biāo)量和向量處置要求。但大多數(shù)超級(jí)計(jì)算機(jī)的向量平衡點(diǎn)在計(jì)算機(jī)的向量平衡點(diǎn)在90%或更高,此時(shí)對(duì)或更高,此時(shí)對(duì)目的代碼向量化比例的依賴也大。目的代碼向量化比例的依賴也大。3 之 3幻燈片 32 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容設(shè)計(jì)目的 可擴(kuò)展性是指在確定的運(yùn)用背景下,向可擴(kuò)展性是指在確定的運(yùn)用背景下,向量處置機(jī)系統(tǒng)要隨處

21、置機(jī)數(shù)目的添加而線性量處置機(jī)系統(tǒng)要隨處置機(jī)數(shù)目的添加而線性地提高。地提高。 可擴(kuò)展性的三個(gè)目的為:規(guī)??蓴U(kuò)展性、可擴(kuò)展性的三個(gè)目的為:規(guī)??蓴U(kuò)展性、換代可擴(kuò)展性和問(wèn)題可擴(kuò)展性。換代可擴(kuò)展性和問(wèn)題可擴(kuò)展性?;脽羝?33 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容w 鏈接技術(shù)鏈接技術(shù)w 向量循環(huán)向量循環(huán)/分段開(kāi)采技術(shù)分段開(kāi)采技術(shù)w 向量遞歸技術(shù)向量遞歸技術(shù)w 稀疏矩陣的處置技術(shù)稀疏矩陣的處置技術(shù)幻燈片 34 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)w 向

22、量指令的類(lèi)型向量指令的類(lèi)型w 向量運(yùn)算中的相關(guān)和沖突向量運(yùn)算中的相關(guān)和沖突w 向量鏈接技術(shù)向量鏈接技術(shù)幻燈片 35 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)鏈接技術(shù) 以以CRAY-1向量處置機(jī)為例,有四類(lèi)指令:向量處置機(jī)為例,有四類(lèi)指令: 向量與向量操作:向量與向量操作:ViVj op Vk 向量與標(biāo)量操作:向量與標(biāo)量操作:ViSj op Vk 向量?。合蛄咳。篤i存儲(chǔ)器存儲(chǔ)器 向量存:向量存:存儲(chǔ)器存儲(chǔ)器Vi2 之 1幻燈片 36 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.

23、計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)鏈接技術(shù)2 之 21234nVjVkVi1234nSjVkVi123456主存主存Vi123456主存主存Vi幻燈片 37 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)鏈接技術(shù)V0V1V2V0V1V2V3V4V5V3V0V4(a) 不相關(guān)的指令不相關(guān)的指令(b) 寫(xiě)讀數(shù)據(jù)相關(guān)寫(xiě)讀數(shù)據(jù)相關(guān)V0V1V2V0V1V2V3V4V5V3V1V4(c) 功能部件沖突功能部件沖突(d) 讀讀數(shù)據(jù)相關(guān)讀讀數(shù)據(jù)相關(guān)提示:采用順序發(fā)射順序完成方式。提示:采用順序發(fā)射順序完成方式?;脽羝?38 / 67Com

24、puter ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)鏈接技術(shù) 對(duì)于有寫(xiě)讀數(shù)據(jù)相關(guān)的向量指令,可以對(duì)于有寫(xiě)讀數(shù)據(jù)相關(guān)的向量指令,可以采用采用“相關(guān)公用通道相關(guān)公用通道:從一個(gè)流水線部件:從一個(gè)流水線部件得到的結(jié)果直接送入另一個(gè)流水線部件的操得到的結(jié)果直接送入另一個(gè)流水線部件的操作數(shù)存放器,這樣多條向量指令可以并行執(zhí)作數(shù)存放器,這樣多條向量指令可以并行執(zhí)行,這種技術(shù)稱(chēng)為流水線的鏈接技術(shù)。行,這種技術(shù)稱(chēng)為流水線的鏈接技術(shù)。7 之 1幻燈片 39 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本

25、章內(nèi)容關(guān)鍵技術(shù)鏈接技術(shù)w 沒(méi)有向量存放器沖突和運(yùn)算部件沖突;沒(méi)有向量存放器沖突和運(yùn)算部件沖突;w 只需當(dāng)前一條指令的第一個(gè)結(jié)果分量送入結(jié)果只需當(dāng)前一條指令的第一個(gè)結(jié)果分量送入結(jié)果向量存放器的那一個(gè)時(shí)鐘周期方可鏈接,否那向量存放器的那一個(gè)時(shí)鐘周期方可鏈接,否那么只能串行執(zhí)行;么只能串行執(zhí)行;w 假設(shè)一條向量指令的兩個(gè)源操作數(shù)分別是兩條假設(shè)一條向量指令的兩個(gè)源操作數(shù)分別是兩條先行指令的結(jié)果時(shí),要求:先行指令的結(jié)果時(shí),要求:w 先行的兩條指令產(chǎn)生結(jié)果的時(shí)間必需相等;先行的兩條指令產(chǎn)生結(jié)果的時(shí)間必需相等;w 先行的兩條指令的向量長(zhǎng)度必需相等。先行的兩條指令的向量長(zhǎng)度必需相等。7 之 2幻燈片 40 /

26、 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)鏈接技術(shù) 假設(shè)要進(jìn)展向量運(yùn)算:假設(shè)要進(jìn)展向量運(yùn)算:D=A(BC),假設(shè)向量長(zhǎng)度假設(shè)向量長(zhǎng)度64,且,且B和和C已由存儲(chǔ)器取已由存儲(chǔ)器取至至V0和和V1,那么下面,那么下面3條向量指令即可完成條向量指令即可完成上述運(yùn)算。上述運(yùn)算。V3AV2V0+V1V4V2*V37 之 3幻燈片 41 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)鏈接技術(shù)7 之 4幻燈片 42 / 67Computer Architectur

27、eV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)鏈接技術(shù)7 之 5幻燈片 43 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)鏈接技術(shù)7 之 6幻燈片 44 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)鏈接技術(shù)浮點(diǎn)加浮點(diǎn)加71 2 3 4 5 6MemV0V1V2V3V41 2 3 4 5 61 2 3 4 5 6浮點(diǎn)乘浮點(diǎn)乘7 之 7幻燈片 45 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)

28、院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù) 當(dāng)向量的長(zhǎng)度大于向量存放器的長(zhǎng)度時(shí),當(dāng)向量的長(zhǎng)度大于向量存放器的長(zhǎng)度時(shí),必需把長(zhǎng)向量分生長(zhǎng)度固定的段,采用循環(huán)必需把長(zhǎng)向量分生長(zhǎng)度固定的段,采用循環(huán)構(gòu)造處置這個(gè)長(zhǎng)向量,這種技術(shù)稱(chēng)為向量循構(gòu)造處置這個(gè)長(zhǎng)向量,這種技術(shù)稱(chēng)為向量循環(huán)開(kāi)采技術(shù),也稱(chēng)為向量分段開(kāi)采技術(shù)。環(huán)開(kāi)采技術(shù),也稱(chēng)為向量分段開(kāi)采技術(shù)。 這種分段和循環(huán)由系統(tǒng)硬件和軟件控制這種分段和循環(huán)由系統(tǒng)硬件和軟件控制完成,對(duì)于程序員是透明的。完成,對(duì)于程序員是透明的。3 之 1幻燈片 46 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)

29、3 之 2幻燈片 47 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容關(guān)鍵技術(shù)3 之 3幻燈片 48 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系 向量協(xié)處置器是為處文科學(xué)計(jì)算所要向量協(xié)處置器是為處文科學(xué)計(jì)算所要求的大量向量處置而設(shè)計(jì)的一種安裝。它普求的大量向量處置而設(shè)計(jì)的一種安裝。它普通和中、小型計(jì)算機(jī)組合起來(lái),作為主計(jì)算通和中、小型計(jì)算機(jī)組合起來(lái),作為主計(jì)算機(jī)的外圍設(shè)備,承當(dāng)處置向量的義務(wù)。這樣,機(jī)的外圍設(shè)備,承當(dāng)處置向量的義務(wù)。這樣,就可以得到較高的吞吐率和精度,其價(jià)

30、錢(qián)又就可以得到較高的吞吐率和精度,其價(jià)錢(qián)又可以為普通中、小用戶所接受。可以為普通中、小用戶所接受。本章內(nèi)容2 之 1幻燈片 49 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容處置機(jī)處置機(jī)主存儲(chǔ)器主存儲(chǔ)器協(xié)處置機(jī)協(xié)處置機(jī)本地存儲(chǔ)器本地存儲(chǔ)器高速總線高速總線帶向量協(xié)處置器的計(jì)算機(jī)構(gòu)造框圖帶向量協(xié)處置器的計(jì)算機(jī)構(gòu)造框圖2 之 2幻燈片 50 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系w 向量指令處置時(shí)間向量指令處置時(shí)間Tvpw 最大性能最大性能Rw 半性能向量長(zhǎng)度半性能向量長(zhǎng)

31、度n1/2w 向量長(zhǎng)度臨界值向量長(zhǎng)度臨界值nv本章內(nèi)容幻燈片 51 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容性能評(píng)價(jià)w 一條向量指令的處置時(shí)間一條向量指令的處置時(shí)間w 一批向量指令的處置時(shí)間一批向量指令的處置時(shí)間幻燈片 52 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容性能評(píng)價(jià)向量指令處置時(shí)間Tvp2 之 1幻燈片 53 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容性能評(píng)價(jià)向量指令處置時(shí)間Tvp

32、2 之 2 假設(shè)每段執(zhí)行時(shí)間都等于一個(gè)時(shí)鐘周期,那么假設(shè)每段執(zhí)行時(shí)間都等于一個(gè)時(shí)鐘周期,那么有:有:Tvps + e + (n - 1) 其中:其中: s為向量流水線建立時(shí)間所需的時(shí)鐘周期數(shù);為向量流水線建立時(shí)間所需的時(shí)鐘周期數(shù); e為向量流水線流過(guò)時(shí)間所需的時(shí)鐘周期數(shù);為向量流水線流過(guò)時(shí)間所需的時(shí)鐘周期數(shù); n為向量長(zhǎng)度;為向量長(zhǎng)度; 為時(shí)鐘周期長(zhǎng)度。為時(shí)鐘周期長(zhǎng)度?;脽羝?54 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容性能評(píng)價(jià)向量指令處置時(shí)間Tvp 一組向量操作的執(zhí)行時(shí)間主要取決于:一組向量操作的執(zhí)行時(shí)間主要取決于:向量

33、的長(zhǎng)度、向量操作之間能否存在流水功向量的長(zhǎng)度、向量操作之間能否存在流水功能部件的沖突和數(shù)據(jù)的相關(guān)性。能部件的沖突和數(shù)據(jù)的相關(guān)性。 把幾條能在一個(gè)時(shí)鐘周期內(nèi)同時(shí)開(kāi)場(chǎng)執(zhí)把幾條能在一個(gè)時(shí)鐘周期內(nèi)同時(shí)開(kāi)場(chǎng)執(zhí)行的向量指令稱(chēng)為一個(gè)編隊(duì);同一個(gè)編隊(duì)中行的向量指令稱(chēng)為一個(gè)編隊(duì);同一個(gè)編隊(duì)中的指令一定不存在功能部件沖突和數(shù)據(jù)相關(guān)。的指令一定不存在功能部件沖突和數(shù)據(jù)相關(guān)。將編隊(duì)數(shù)記作將編隊(duì)數(shù)記作Tchime。2 之 1幻燈片 55 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容性能評(píng)價(jià)向量指令處置時(shí)間Tvpw 向量長(zhǎng)度向量長(zhǎng)度向量存放器長(zhǎng)度時(shí)向量存放

34、器長(zhǎng)度時(shí)w 向量長(zhǎng)度向量存放器長(zhǎng)度時(shí)向量長(zhǎng)度向量存放器長(zhǎng)度時(shí)2 之 2幻燈片 56 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容性能評(píng)價(jià)向量指令處置時(shí)間Tvp一批向量指令的處置時(shí)間 其中:其中:Tstart為每個(gè)編隊(duì)的向量啟動(dòng)開(kāi)銷(xiāo),即流水線建為每個(gè)編隊(duì)的向量啟動(dòng)開(kāi)銷(xiāo),即流水線建立時(shí)間立時(shí)間+流過(guò)時(shí)間;流過(guò)時(shí)間;Tc為流水線為流水線“瓶頸瓶頸段的執(zhí)行時(shí)間;段的執(zhí)行時(shí)間;n為向量長(zhǎng)度;為向量長(zhǎng)度;Tchime為編隊(duì)數(shù)。為編隊(duì)數(shù)。3 之 1幻燈片 57 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院

35、.計(jì)算機(jī)科學(xué)與工程系 在某臺(tái)向量處置機(jī)上執(zhí)行在某臺(tái)向量處置機(jī)上執(zhí)行DAXPY代碼代碼(Y=aXY),代碼如下:代碼如下:LV V1, Rx ;取向量取向量X MULTSV V2,F0,V1 ;向量和標(biāo)量相乘向量和標(biāo)量相乘 LV V3,Ry ;取向量取向量YADDV V4,V2,V3 ;加法加法SV Ry,V4 ;存結(jié)果存結(jié)果問(wèn):這組向量操作能劃分成幾個(gè)編隊(duì)?假設(shè)每種流水功能問(wèn):這組向量操作能劃分成幾個(gè)編隊(duì)?假設(shè)每種流水功能部件只需一個(gè),且啟動(dòng)開(kāi)銷(xiāo)分別為:取數(shù)和存數(shù)部件為部件只需一個(gè),且啟動(dòng)開(kāi)銷(xiāo)分別為:取數(shù)和存數(shù)部件為12個(gè)時(shí)鐘周期、乘法部件為個(gè)時(shí)鐘周期、乘法部件為7個(gè)、加法部件為個(gè)、加法部件為

36、6個(gè)。請(qǐng)計(jì)算完個(gè)。請(qǐng)計(jì)算完成這一組向量操作所需的總時(shí)間為多少?成這一組向量操作所需的總時(shí)間為多少?本章內(nèi)容性能評(píng)價(jià)向量指令處置時(shí)間Tvp一批向量指令的處置時(shí)間3 之 2幻燈片 58 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容性能評(píng)價(jià)向量指令處置時(shí)間Tvp一批向量指令的處置時(shí)間3 之 3 可分成可分成4個(gè)編隊(duì):第個(gè)編隊(duì):第1條指令條指令LV為第為第1個(gè)編隊(duì),個(gè)編隊(duì),MULTSV指令和第指令和第2條條LV指令為第指令為第2個(gè)編隊(duì),個(gè)編隊(duì),ADDV指令為指令為第第3個(gè)編隊(duì),個(gè)編隊(duì),SV指令為第指令為第4個(gè)編隊(duì)。個(gè)編隊(duì)。編隊(duì)編隊(duì)開(kāi)始時(shí)

37、間開(kāi)始時(shí)間第第1個(gè)個(gè)結(jié)果時(shí)間結(jié)果時(shí)間最后最后1個(gè)個(gè)結(jié)果時(shí)間結(jié)果時(shí)間LV11211+nMULTSV、LV12+n23+n22+2nADDV23+2n28+2n27+3nSV28+3n39+3n38+4n幻燈片 59 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容性能評(píng)價(jià)向量指令處置時(shí)間Tvp 一批向量指令的處置時(shí)間 需進(jìn)展分段開(kāi)采,向量長(zhǎng)度為需進(jìn)展分段開(kāi)采,向量長(zhǎng)度為n的一組向量操的一組向量操作的整個(gè)執(zhí)行時(shí)間為:作的整個(gè)執(zhí)行時(shí)間為:其中:其中:Tloop為執(zhí)行標(biāo)量代碼的開(kāi)銷(xiāo),為執(zhí)行標(biāo)量代碼的開(kāi)銷(xiāo),Tstart為每為每個(gè)編隊(duì)的向量啟動(dòng)

38、開(kāi)銷(xiāo),個(gè)編隊(duì)的向量啟動(dòng)開(kāi)銷(xiāo), Tchime為編隊(duì)數(shù),為編隊(duì)數(shù),MVL是向量存放器的長(zhǎng)度。是向量存放器的長(zhǎng)度。 Tloop可以看作是一可以看作是一個(gè)常數(shù),個(gè)常數(shù),Cray 1機(jī)的機(jī)的 Tloop約等于約等于15。3 之 1幻燈片 60 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系 在某臺(tái)向量處置機(jī)上執(zhí)行在某臺(tái)向量處置機(jī)上執(zhí)行DAXPY代碼代碼(Y=aXY),代碼如下:代碼如下:1:LV V1,Rx;取向量;取向量X2:MULTSV V2,F0,V1 ;向量和標(biāo)量相乘;向量和標(biāo)量相乘3:LV V3,Ry;取向量;取向量Y4:ADDV V4,

39、V2,V3 ;加法;加法5:SV Ry,V4;存結(jié)果;存結(jié)果 向量存放器長(zhǎng)度為向量存放器長(zhǎng)度為64,向量長(zhǎng)度為,向量長(zhǎng)度為n ,各功能部件的,各功能部件的啟動(dòng)時(shí)間與上例一樣。求總的執(zhí)行時(shí)間。啟動(dòng)時(shí)間與上例一樣。求總的執(zhí)行時(shí)間。本章內(nèi)容性能評(píng)價(jià)向量指令處置時(shí)間Tvp一批向量指令的處置時(shí)間3 之 2幻燈片 61 / 67Computer ArchitectureV3同濟(jì)大學(xué).電子與信息工程學(xué)院.計(jì)算機(jī)科學(xué)與工程系本章內(nèi)容性能評(píng)價(jià)向量指令處置時(shí)間Tvp一批向量指令的處置時(shí)間3 之 3 指令指令1、2,指令,指令3、4和指令和指令5分成三個(gè)編隊(duì),前兩個(gè)分成三個(gè)編隊(duì),前兩個(gè)編隊(duì)中兩條指令如采用鏈接技術(shù)執(zhí)行,那么:編隊(duì)中兩條指令如采用鏈接技術(shù)執(zhí)行,那么:Tchime=3,Tloop=15, MVL=64 ,Tstart

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論