版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
6.1向量數(shù)據(jù)表示方式6.2向量處理機(jī)的結(jié)構(gòu)6.3向量處理方式6.4向量處理機(jī)的關(guān)鍵技術(shù)6.5向量處理機(jī)實(shí)例6.6向量處理機(jī)的性能評(píng)價(jià)6.7向量處理機(jī)的發(fā)展
第6章向量處理機(jī)
2/2/20231計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)具有向量數(shù)據(jù)表示和向量指令系統(tǒng)的處理機(jī)向量處理機(jī)是解決數(shù)值計(jì)算問(wèn)題的一種高性能計(jì)算機(jī)向量處理機(jī)屬大型或巨型機(jī),也可以用微機(jī)加一臺(tái)向量協(xié)處理器組成向量處理機(jī)一般都采用流水線結(jié)構(gòu),通常有有多條并行工作的流水線必須把要解決的問(wèn)題轉(zhuǎn)化為向量運(yùn)算,才能發(fā)揮向量處理機(jī)的效率2/2/20232計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)6.1向量數(shù)據(jù)表示方式6.1.1從標(biāo)量到向量6.1.2等間距向量表示法6.1.3帶位移量的向量表示法6.1.4稀疏向量表示法2/2/20233計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)例6.1:一個(gè)簡(jiǎn)單的C語(yǔ)言程序如下:
for(i=10;i<=1010;i++)
c[i]=a[i]+b[i+5];在向量處理機(jī)上,可以只用一條指令:
C(10:1010)=A(10:1010)+B(15:1015)
一條向量指令可處理N個(gè)或N對(duì)操作數(shù)在標(biāo)量處理機(jī)上用10多條指令,其中有8條指令要循環(huán)1000次。采用多寄存器結(jié)構(gòu)的兩地址指令編寫程序存儲(chǔ)器采用字節(jié)編址方式,字長(zhǎng)為32位6.1.1從標(biāo)量到向量2/2/20234計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)在一般標(biāo)量處理機(jī)中需要如下指令序列來(lái)實(shí)現(xiàn)(A、B、C分別是向量a、b、c在內(nèi)存中的起始地址):START: LOAD R0, ST;讀循環(huán)初值10 LOAD R1, ED;讀循環(huán)終值1010 LOAD R2, L;讀內(nèi)存地址增量4 MOVE R3, R2 MUL R3, R0;計(jì)算向量偏移量,;初始值為40LOOP: LOAD R4,A(R3);讀A向量的一個(gè)元素2/2/20235計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)
LOAD R5,B(R3);讀B向量的一個(gè)元素ADD R4,R5;加一個(gè)元素STORE R4,C(R3);寫C向量的一個(gè)元素ADD R3,R2 ;改變向量偏移量INC R0 ;循環(huán)次數(shù)增1CMP R0,R1 ;循環(huán)是否結(jié)束BLE LOOP ;循環(huán)未結(jié)束轉(zhuǎn)LOOP, ;否則繼續(xù)HALT;停機(jī)ST:10 ;循環(huán)初值ED:1010 ;循環(huán)終值L:4 ;內(nèi)存地址增量2/2/20236計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)三個(gè)參數(shù)表示一個(gè)等間距向量:
向量起始地址:A 向量長(zhǎng)度:L 向量間距:f6.1.2等間距向量表示法2/2/20237計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)例如:我國(guó)研制的銀河向量機(jī),有8個(gè)向量寄存器V0~V7,每個(gè)向量寄存器由64個(gè)64位的寄存器組成,存儲(chǔ)器字長(zhǎng)64位,采用字節(jié)編址方式,則連續(xù)向量的間距為f=8。向量指令采用三地址形式:例如:ViVjOPVk,向量長(zhǎng)度(VL)=50,則實(shí)際完成的運(yùn)算是: V3,00~V3,49與V5,00~V5,49分別相加,結(jié)果放在V1,00~V1,49中。2/2/20238計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)6.1.3帶位移量的向量表示法用三個(gè)參數(shù)表示一個(gè)向量:向量基地址:A向量長(zhǎng)度:L向量位移量:f向量有效長(zhǎng)度:L-f向量起始地址:A+f優(yōu)點(diǎn):每個(gè)向量可以帶有位移,能夠通過(guò)控制向量實(shí)現(xiàn)可變?cè)隽?。能夠表示稀疏向量?/2/20239計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)帶位移量的向量表示法2/2/202310計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)2/2/202311計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)2/2/202312計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)6.1.4稀疏向量表示法定義:0元素很多,非0元素很少的向量稱為稀疏向量采用壓縮方法存儲(chǔ)稀疏向量可以節(jié)省存儲(chǔ)空間。可以還原之后進(jìn)行運(yùn)算,也可以用壓縮方法直接進(jìn)行運(yùn)算2/2/202313計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)2/2/202314計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)6.2向量處理機(jī)的結(jié)構(gòu)主要采用兩種方法:存儲(chǔ)器-存儲(chǔ)器結(jié)構(gòu)
多個(gè)獨(dú)立的存儲(chǔ)器模塊并行工作
處理機(jī)結(jié)構(gòu)簡(jiǎn)單對(duì)存儲(chǔ)系統(tǒng)的訪問(wèn)速度要求很高寄存器-寄存器結(jié)構(gòu)
運(yùn)算通過(guò)向量寄存器進(jìn)行
需要大量高速寄存器對(duì)存儲(chǔ)系統(tǒng)訪問(wèn)速度的要求降低2/2/202315計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)1.存儲(chǔ)器-存儲(chǔ)器結(jié)構(gòu)向量處理機(jī)中有多個(gè)高速流水線運(yùn)算部件,存儲(chǔ)器的訪問(wèn)速度是關(guān)鍵采用多個(gè)存儲(chǔ)體交叉和并行訪問(wèn)來(lái)提高存儲(chǔ)器速度例如:CRAY-1有64個(gè)存儲(chǔ)體,每個(gè)處理機(jī)訪問(wèn)4個(gè)存儲(chǔ)體
STAR-100采用32個(gè)存儲(chǔ)體交叉,每個(gè)存儲(chǔ)體并行讀出8個(gè)64位數(shù)據(jù)
我國(guó)研制的YH-1向量計(jì)算機(jī)有37個(gè)存儲(chǔ)體2/2/202316計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)操作數(shù)緩沖棧和寫結(jié)果緩沖棧主要用于解決訪問(wèn)存儲(chǔ)器沖突。雖然采用質(zhì)數(shù)個(gè)存儲(chǔ)體能消除訪問(wèn)存儲(chǔ)器的沖突,但是,數(shù)據(jù)經(jīng)過(guò)多次運(yùn)算之后,在存儲(chǔ)體中分布必然發(fā)生改變主要優(yōu)缺點(diǎn):
硬件結(jié)構(gòu)簡(jiǎn)單,造價(jià)低;速度相對(duì)較低操作數(shù)緩沖棧寫結(jié)果緩沖棧主存
儲(chǔ)器流水線運(yùn)算部件2/2/202317計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)2.寄存器-寄存器結(jié)構(gòu)
把存儲(chǔ)器-存儲(chǔ)器結(jié)構(gòu)中的緩沖棧改為向量寄存器
運(yùn)算部件需要的操作數(shù)從向量寄存器中讀取,運(yùn)算的中間結(jié)果也寫到向量寄存器中。
向量寄存器與標(biāo)量寄存器的主要差別是:
一個(gè)向量寄存器能夠保存一個(gè)向量,連續(xù)訪問(wèn)一個(gè)向量的各個(gè)分量。
需要有標(biāo)量寄存器和地址寄存器等。2/2/202318計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)采用寄存器-寄存器結(jié)構(gòu)的主要優(yōu)點(diǎn):
降低主存儲(chǔ)器的流量
例如:采用寄存器-寄存器結(jié)構(gòu)的CRAY-1與采用存儲(chǔ)器-存儲(chǔ)器結(jié)構(gòu)的STAR-100比較,運(yùn)算速度高3倍多,而主存流量低2.5倍。2/2/202319計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)8個(gè)向量寄存器8×64×64主存
儲(chǔ)器8MB64個(gè)
個(gè)體12個(gè)流水線結(jié)構(gòu)的運(yùn)算部件緩沖寄存器64×64標(biāo)量寄存器8×64緩沖寄存器64×24地址寄存器8×24指令緩沖寄存器256×16CRAY-1向量處理機(jī)結(jié)構(gòu)2/2/202320計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)有三種處理方式:橫向處理方式,又稱為水平處理方式,橫向加工方式等。向量計(jì)算是按行的方式從左至右橫向地進(jìn)行??v向處理方式,又稱為垂直處理方式,縱向加工方式等。向量計(jì)算是按列的方式自上而下縱向地進(jìn)行??v橫處理方式,又稱為分組處理方式,縱橫向加工方式等。橫向處理和縱向處理相結(jié)合的方式。6.3向量處理方式2/2/202321計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)要根據(jù)向量運(yùn)算的特點(diǎn)和向量處理機(jī)的類型選擇向量的處理方式。以一個(gè)簡(jiǎn)單的C語(yǔ)言編寫的程序?yàn)槔?,說(shuō)明向量的三種處理方式的工作原理。
for(i=1;i<=n;i++)
y[i]=a[i]×(b[i]+c[i]);2/2/202322計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)1.橫向處理方式也稱為水平處理方式,橫向加工方式等
逐個(gè)分量進(jìn)行處理:假設(shè)中間結(jié)果為T(I)
計(jì)算第1個(gè)分量:
T(1)=B(1)+C(1)
Y(1)=A(1)×T(1)
計(jì)算第2個(gè)分量:
T(2)=B(2)+C(2)
Y(2)=A(2)×T(2)
……
計(jì)算最后一個(gè)分量:
T(N)=B(N)+C(N)
Y(N)=A(N)×T(N)2/2/202323計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)存在兩個(gè)問(wèn)題:
在計(jì)算向量的每個(gè)分量時(shí),都發(fā)生寫讀數(shù)據(jù)相關(guān)。流水線效率低
如果采用多功能流水線,必須頻繁進(jìn)行流水線切換
橫向處理方式對(duì)向量處理機(jī)不適合
即使在標(biāo)量處理機(jī)中,也經(jīng)常通過(guò)編譯器進(jìn)行指令流調(diào)度。2/2/202324計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)2.縱向處理方式也稱為垂直處理方式,縱向加工方式等
T(1)=B(1)+C(1)
T(2)=B(2)+C(2)
……
T(n)=B(n)+C(n)
Y(1)=A(1)×T(1)
Y(2)=A(2)×T(2)
……
Y(N)=A(N)×T(N)2/2/202325計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)采用向量指令只需要2條:
VADD B,C,T
VMUL A,T,Y
這種處理方式適用于向量處理機(jī)
數(shù)據(jù)相關(guān)不影響流水線連續(xù)工作。不同的運(yùn)算操作只需要切換1次。這種處理方式適用于存儲(chǔ)器-存儲(chǔ)器結(jié)構(gòu)2/2/202326計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)3.縱橫處理方式用于寄存器-寄存器結(jié)構(gòu)的向量處理機(jī)中,向量寄存器的長(zhǎng)度是有限的。當(dāng)向量長(zhǎng)度N大于向量寄存器長(zhǎng)度n時(shí),需要分組處理。分組方法:N=K·n+r其中:r?yàn)橛鄶?shù),共分K+1組。組內(nèi)采用縱向處理方式,組間采用橫向處理方式。因此,也稱為分組處理方式,縱橫向加工方式等。2/2/202327計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)運(yùn)算過(guò)程為:
第1組:
T(1,n)=B(1,n)+C(1,n)
Y(1,n)=A(1,n)×T(1,n)
第2組:
T(n+1,2n)=B(n+1,2n)+C(n+1,2n)
Y(n+1,2n)=A(n+1,2n)×T(n+1,2n)
……
最后第k+1組:
T(kn+1,N)=B(kn+1,N)+C(kn+1,N)
Y(kn+1,N)=A(kn+1,N)+T(kn+1,N)2/2/202328計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)每組用兩條向量指令,每組發(fā)生相關(guān)兩次,其中組內(nèi)發(fā)生數(shù)據(jù)相關(guān)一次,組間切換時(shí)發(fā)生相關(guān)一次。主要優(yōu)點(diǎn):
減少訪問(wèn)主存儲(chǔ)器的次數(shù)
例如:中間變量T不寫入主存儲(chǔ)器2/2/202329計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)實(shí)際的應(yīng)用問(wèn)題中通常既有向量計(jì)算又有標(biāo)量計(jì)算,而且兩類計(jì)算有一定的比例
向量平衡點(diǎn)(vectorbalancepoint):為了使向量硬件設(shè)備和標(biāo)量硬件設(shè)備的利用率相等,一個(gè)程序中向量代碼所占的百分比。
關(guān)鍵問(wèn)題是:希望向量硬件和標(biāo)量硬件都能夠充分利用,不要空閑。6.4向量處理機(jī)的關(guān)鍵技術(shù)
6.4.1向量與標(biāo)量性能的平衡2/2/202330計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)
例如:一個(gè)系統(tǒng)的向量運(yùn)算速度為90Mfolps,標(biāo)量運(yùn)算速度為10Mfolps。如果程序的90%是向量運(yùn)算,10%是標(biāo)量運(yùn)算。則向量平衡點(diǎn)為0.9。硬件利用率最高。向量處理機(jī)的向量平衡點(diǎn)必須與用戶程序的向量化程度相匹配。IBM向量計(jì)算機(jī)的設(shè)計(jì)思想與上述方法不同,它維持較低的向量與標(biāo)量比例,定在3~5的范圍之間。這種做法能夠適應(yīng)通用應(yīng)用問(wèn)題對(duì)標(biāo)量和向量處理要求。2/2/202331計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)機(jī)器型號(hào)幾種超級(jí)計(jì)算機(jī)的向量性能和標(biāo)量性能FujitsuVP400CrayISCray2SCrayX-MPCrayY-MPHitachiS820NECSX2向量性能
Mflops標(biāo)量性能
Mflops向量平衡點(diǎn)85.09.80.90151.511.20.93143.313.10.92201.617.00.92737.317.80.98424.29.50.98207.16.60.972/2/202332計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)6.4.2向量鏈接技術(shù)向量指令的類型以CRAY-1向量處理機(jī)為例,有四類指令,兩種指令格式:
(1)向量與向量操作:ViVjOPVk
(2)向量與標(biāo)量操作:ViSjOPVk
(3)向量取:Vi存儲(chǔ)器
(4)向量存:存儲(chǔ)器Vi2/2/202333計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)一種向量處理機(jī)的指令格式2/2/202334計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)向量運(yùn)算中的相關(guān)和沖突向量運(yùn)算中的數(shù)據(jù)相關(guān)和功能部件沖突:
采用順序發(fā)射順序完成方式
(1)寫讀數(shù)據(jù)相關(guān)。
(2)讀讀數(shù)據(jù)相關(guān),或向量寄存器沖突。
(3)運(yùn)算部件沖突。V0V1+V2 V0V1+V2
V3V4×V5 V3V0×V4
(a)不相關(guān)的指令 (b)寫讀數(shù)據(jù)相關(guān)2/2/202335計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)
V0V1+V2 V0V1+V2
V3V4+V5 V3V1×V4
(c)功能部件沖突 (d)讀讀數(shù)據(jù)相關(guān)
向量鏈接技術(shù)(chaining)當(dāng)前一條指令的結(jié)果寄存器可以作為后繼指令的操作數(shù)寄存器時(shí),多條有數(shù)據(jù)相關(guān)的向量指令并行執(zhí)行,這種技術(shù)稱為兩條流水線的鏈接技術(shù)。2/2/202336計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)例如:有如下3條向量指令:
1:V3A
2:V2V0+V1
3:V4V2×V3第1、2條指令沒有數(shù)據(jù)相關(guān)和功能部件沖突,可以同時(shí)開始執(zhí)行。第3條指令與第1、2條指令均存在寫讀數(shù)據(jù)相關(guān),可以鏈接執(zhí)行。2/2/202337計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)浮點(diǎn)加7123456MemV0V1V2V3V4123456123456浮點(diǎn)乘2/2/202338計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)三種執(zhí)行方式比較:(1)如果向量長(zhǎng)度為N,三條指令采用串行方法執(zhí)行的時(shí)間為:
[(1+6+1)+N-1]+[(1+6+1)+N-1]+[(1+7+1)+N-1]=3N+22拍(2)如果前兩條指令并行執(zhí)行,第三條指令串行執(zhí)行,則執(zhí)行時(shí)間為:
[(1+6+1)+N-1]+[(1+7+1)+N-1]=2N+15拍(3)如果采用鏈接技術(shù),則執(zhí)行時(shí)間為:
(1+6+1)+(1+7+1)+(N-1)=17+N-1=N+16拍2/2/202339計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)實(shí)現(xiàn)鏈接的條件:(1)沒有向量寄存器沖突和運(yùn)算部件沖突。(2)只有第一個(gè)結(jié)果送入向量寄存器的那一個(gè)周期可以鏈接。(3)先行的兩條指令產(chǎn)生運(yùn)算結(jié)果的時(shí)間必須相等。(4)兩條向量指令的向量長(zhǎng)度必須相等。2/2/202340計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)6.4.3向量循環(huán)開采技術(shù)當(dāng)向量的長(zhǎng)度大于向量寄存器的長(zhǎng)度時(shí),必須把長(zhǎng)向量分成長(zhǎng)度固定的段,采用循環(huán)結(jié)構(gòu)處理這個(gè)長(zhǎng)向量,這種技術(shù)稱為向量循環(huán)開采技術(shù),也稱為向量分段開采技術(shù)。例6.2:A和B為長(zhǎng)度N的向量。 for(i=1;i<N;i++)a[i]=5*b(i)+c;當(dāng)向量長(zhǎng)度N為64或更小時(shí),計(jì)算A數(shù)組的7條指令序列是:2/2/202341計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī) 1:S15.0 在標(biāo)量寄存器內(nèi)設(shè)置常數(shù) 2:S2C 將常數(shù)C裝入標(biāo)量寄存器 3:VLN 在VL寄存器內(nèi)設(shè)置向量長(zhǎng)度 4:VoB 將B向量讀入向量寄存器 5:V1S1
VoB數(shù)組的每個(gè)分量乘常數(shù) 6:V2S2+V1C和5B(x)相加 7:AV2
將結(jié)果向量存入A數(shù)組當(dāng)N超過(guò)64時(shí),要采用向量循環(huán)開采技術(shù)。
在進(jìn)入循環(huán)前,把N除以64,確定循環(huán)次數(shù)。 如果有余數(shù),則在第一次循環(huán)中首先計(jì)算。2/2/202342計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)第4條到第7條指令組成循環(huán)1:S15.0 在標(biāo)量寄存器內(nèi)設(shè)置常數(shù) 2:S2C 將常數(shù)C裝入標(biāo)量寄存器 3:VLN 在VL寄存器內(nèi)設(shè)置向量長(zhǎng)度
for(i=0;i>=N/64;i++){
4:VoB 將B向量讀入向量寄存器
5:V1S1
VoB數(shù)組的每個(gè)分量乘常數(shù)
6:V2S2+V1C和5B(x)相加
7:AV2
將結(jié)果向量存入A數(shù)組
}2/2/202343計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)6.4.4向量遞歸技術(shù)向量指令一般為3地址,但遞歸運(yùn)算用兩地址。用遞歸向量技術(shù)求和:V0V0+V1C0和C1分別是與向量寄存器V0和V1相關(guān)的分量計(jì)數(shù)器。初始時(shí),計(jì)數(shù)器C0和C1都置成0,V00中的初始值也置成0。浮點(diǎn)加法流水線的延遲時(shí)間為8個(gè)周期。假定向量長(zhǎng)度為64,只作一個(gè)向量循環(huán)。在開始的8個(gè)周期,計(jì)數(shù)器C0一直為0,在此之后,每個(gè)周期期加1。C1每個(gè)周期加1。2/2/202344計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)V00=V00+V10=0+V10V01=V00+V11=0+V11……V07=V00+V17=0+V17V08=V00+V18=V10+V18……V015=V07+V115=V17+V115
V016=V08+V116=V10+V18+V116……V056=V048+V156=V10+V18+V116+V124+V132+V140+V148+V156 ……V063=V055+V163=V17+V115+V123+V131+V139+V147+V155+V163經(jīng)過(guò)8次運(yùn)算,得到8個(gè)結(jié)果,分別是8個(gè)數(shù)的和第1次加法第2次加法第8次加法2/2/202345計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)6.5向量處理機(jī)實(shí)例 6.5.1典型向量處理機(jī) 6.5.2CRAYY-MP向量處理機(jī) 6.5.3向量協(xié)處理器2/2/202346計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)向量處理機(jī)主要出自美國(guó)和日本。美國(guó)著名的向量計(jì)算機(jī)公司有:CRAYCDCTI等日本公司有:NECFujitsuHitachi等6.5.1典型的向量處理機(jī)2/2/202347計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)機(jī)器型號(hào)美國(guó)和日本制造的向量處理機(jī)CrayIS配置特點(diǎn)有10條流水線的
單處理機(jī),12.5
ns,COS/CF7
2.1第一臺(tái)基于ECL
的超級(jí)計(jì)算機(jī),
1976年問(wèn)世典型向量處理機(jī)Cray2S/4-256256M字存儲(chǔ)器
的4臺(tái)處理機(jī),
4.lns,COS或
UNIX/CF773.016K字的本地存
儲(chǔ)器,移植了
UNIXV,
1985問(wèn)世2/2/202348計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)機(jī)器型號(hào)CrayX-MP416配置特點(diǎn)16M字存儲(chǔ)器的
4臺(tái)處理機(jī),128
M字SSD,8.5ns,
COSCF775.0使用共享寄存器
組用于IPC,
1983年問(wèn)世CrayY-MP832128M字存儲(chǔ)器的
8臺(tái)處理機(jī),6ns,
CF775.0X-MP的改進(jìn)
型,1988年問(wèn)世每臺(tái)處理機(jī)2條
向量流水線,16
臺(tái)處理機(jī),4.2ns,
Unicos/CF775.0Cray
Y-MP
C-90最大的Cray機(jī)器1991年問(wèn)世2/2/202349計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)機(jī)器型號(hào)CDCCyber205配置特點(diǎn)有4條流水線的
單處理機(jī),20ns,
虛擬OS/FTN200存儲(chǔ)器到存儲(chǔ)器
系統(tǒng)結(jié)構(gòu),
1982年問(wèn)世ETA10E單處理機(jī),
10.5ns,ETAV/FTN200Cyber205的后
繼型號(hào),
1985年問(wèn)世每臺(tái)處理機(jī)4組
流水線,4臺(tái)處理
機(jī),2.9ns,F77SX,
22GflopsNECSX-X/441991年問(wèn)世2/2/202350計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)機(jī)器型號(hào)FujitsuVP2600/10配置特點(diǎn)5條流水線的單
處理機(jī)和雙標(biāo)量
處理機(jī),3.2ns,
MSP.EX
/F77EX/VP使用可重構(gòu)微
向量寄存器和
屏蔽,
1991年問(wèn)世512MB存儲(chǔ)器,
18條流水線的單
處理機(jī),4ns,
FORT77/HAP
V23-OCHitachi820/8064個(gè)通道,最大
傳輸速率
288MB/S,
1988年問(wèn)世2/2/202351計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)6.5.2CRAYY-MP向量處理機(jī)由1至8個(gè)處理機(jī)組成,共享中央存儲(chǔ)器、I/O子系統(tǒng)、處理機(jī)通信子系統(tǒng)和實(shí)時(shí)鐘。中央存儲(chǔ)器由256個(gè)交叉訪問(wèn)的存儲(chǔ)體組成。每個(gè)處理機(jī)對(duì)4個(gè)存儲(chǔ)器端口交叉訪問(wèn)。CPU的時(shí)鐘周期為6ns。每個(gè)CPU由14個(gè)功能部件組成,分為向量、標(biāo)量、地址和控制四個(gè)子系統(tǒng)。使用了大量地址寄存器、標(biāo)量寄存器、向量寄存器、中間寄存器和臨時(shí)寄存器??梢詫?shí)現(xiàn)功能流水線靈活的鏈接。I/O子系統(tǒng)支持三類通道,傳輸速率分別為6兆字節(jié)/秒,100兆字節(jié)/秒和1G字節(jié)/秒。2/2/202352計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)536.5.3向量協(xié)處理器以中小型機(jī)或微機(jī)作主機(jī),向量處理部件作為外圍設(shè)備,加速向量的處理速度。向量協(xié)處理器是為中小型用戶設(shè)計(jì)的,解決科學(xué)計(jì)算中大量向量處理任務(wù)的一種裝置。FPS-164是最典型的向量協(xié)處理器,美國(guó)浮點(diǎn)系統(tǒng)公司生產(chǎn)。每個(gè)向量處理器有兩個(gè)乘加部件,兩組向量寄存器,兩組標(biāo)量寄存器。向量寄存器有2組4個(gè)2K個(gè)操作數(shù),每個(gè)操作數(shù)4個(gè)字節(jié)。各向量處理器同步地運(yùn)算,但它們處理的數(shù)據(jù)各不相同。向量操作可以和標(biāo)量處理器中的標(biāo)量操作同時(shí)進(jìn)行2/2/202354計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)
FPS-164向量協(xié)處理器的結(jié)構(gòu)
2/2/202355計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)6.6向量處理機(jī)的性能評(píng)價(jià)衡量向量處理機(jī)性能的主要指標(biāo)有:
向量指令處理時(shí)間Tvp、最大性能R、半性能向量長(zhǎng)度n1/2等。1.向量指令處理時(shí)間Tvp執(zhí)行一條長(zhǎng)度為n的向量指令的時(shí)間Tvp表示為:
Tvp=Ts
+Tvf
+(n-1)Tc 其中:Ts為向量流水線的建立時(shí)間。 Tvf為向量流水線的流過(guò)時(shí)間。Tc為流水線“瓶頸”段的執(zhí)行時(shí)間。2/2/202356計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)如果每段執(zhí)行時(shí)間都等于一個(gè)時(shí)鐘周期,則有:
Tvp=[s+e+(n-1)] 其中:s為向量流水線建立所需的時(shí)鐘周期數(shù)。 e為向量流水線流過(guò)所需的時(shí)鐘周期數(shù)。 n為向量長(zhǎng)度。為時(shí)鐘周期長(zhǎng)度。通常把幾條能在一個(gè)時(shí)鐘周期內(nèi)同時(shí)開始執(zhí)行的向量指令稱為一個(gè)編隊(duì)(Chime)。同一個(gè)編隊(duì)中的指令不存在功能部件沖突和數(shù)據(jù)相關(guān)。2/2/202357計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)例6.3:假設(shè)一臺(tái)向量處理機(jī)中功能部件的啟動(dòng)開銷為:取數(shù)和存數(shù)部件12個(gè)時(shí)鐘周期、乘法部件7個(gè)時(shí)鐘周期、加法部件6個(gè)時(shí)鐘周期。先把下列向量操作分成編隊(duì),然后計(jì)算每個(gè)編隊(duì)的開始時(shí)間、獲得第一個(gè)結(jié)果元素的時(shí)間和獲得最后一個(gè)結(jié)果元素的時(shí)間。LVV1,Rx;取向量xMULTSVV2,F(xiàn)0,V1;向量和標(biāo)量相乘 LVV3,Ry;取向量Y ADDVV4,V2,V3;加法 SVRy,V4;存結(jié)果2/2/202358計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)解:第一條指令LV為第1個(gè)編隊(duì)。 MULTSV指令和第2條LV指令為第2個(gè)編隊(duì)。 ADDV指令為第3個(gè)編隊(duì)。 SV指令為第4個(gè)編隊(duì)。 如果向量長(zhǎng)度為n,則每個(gè)編隊(duì)的開始時(shí)間、獲得第一個(gè)結(jié)果元素和最后一個(gè)結(jié)果元素時(shí)間如下表所示:2/2/202359計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)如果有3個(gè)訪問(wèn)存儲(chǔ)器部件,并且不考慮控制的復(fù)雜性,采用向量鏈接技術(shù),只需要:12+7+6+12+n–1=36+n個(gè)周期。如果考慮向量長(zhǎng)度大于向量寄存器長(zhǎng)度時(shí),則需要分段開采。 向量長(zhǎng)度為n的一組向量操作的整個(gè)執(zhí)行時(shí)間為: 其中:Tloop為執(zhí)行標(biāo)量代碼的開銷, Tstart為每個(gè)編隊(duì)的向量啟動(dòng)開銷,MVL是向量寄存器的長(zhǎng)度, Tloop是一個(gè)常數(shù),在Cray1中機(jī)為15。2/2/202360計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)例6.5:在一臺(tái)向量處理機(jī)上實(shí)現(xiàn)A=B×s操作,其中A和B是長(zhǎng)度為200的向量,s是一個(gè)標(biāo)量。向量寄存器長(zhǎng)度為64。各功能部件的啟動(dòng)時(shí)間與上例相同。求總的執(zhí)行時(shí)間。解:因?yàn)橄蛄块L(zhǎng)度超過(guò)了向量寄存器的長(zhǎng)度,所以要采取分段開采方法。每次循環(huán)主要由下面三條向量指令組成:LV V1,Rb ;取向量BMULTVSV2,V1,F(xiàn)s;向量和標(biāo)量相乘SV Ra,V2 ;存向量 假設(shè)A和B分別放在Ra和Rb之中,s放在Fs中2/2/202361計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)三條指令之間存在有寫讀數(shù)據(jù)相關(guān),因此必須把它們分成3個(gè)編隊(duì),Tchime=3。
T200=4×(15+Tstart)+200×3=60+(4×Tstart)+600 =660+(4×Tstart) 其中:Tstart=12+7+12=31,因此,T200=660+4×31=784每個(gè)結(jié)果元素的平均執(zhí)行時(shí)間為:768/200=3.9個(gè)周期。2/2/202362計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)例6.6:在某臺(tái)向量處理機(jī)上的執(zhí)行代碼由如下5條指令組成: 1:LVV1,Rx ;取向量x 2:MULTSVV2,F(xiàn)0,V1 ;向量和標(biāo)量相乘 3:LVV3,Ry ;取向量Y 4:ADDVV4,V2,V3 ;加法 5:SVRy,V4 ;存結(jié)果 主要參數(shù)與上例相同,求總的執(zhí)行時(shí)間。2/2/202363計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)解:指令1、2,指令3、4和指令5分成三個(gè)編隊(duì),前兩個(gè)編隊(duì)中兩條指令采用向鏈接技術(shù)執(zhí)行。 Tchime=3,Tloop=15,Tstart=12+7+12+6+12=49,MVL=64。2/2/202364計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)第六章向量處理機(jī)2.最大性能RR表示當(dāng)向量長(zhǎng)度為無(wú)窮大時(shí)的向量流水線的最大性能。常在評(píng)價(jià)峰值性能時(shí)使用。 其中:n為向量長(zhǎng)度; Tn為一組向量操作的整
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 綜合管廊施工重、難點(diǎn)分析及應(yīng)對(duì)措施
- 旋挖樁施工質(zhì)量問(wèn)題原因分析及防治措施
- 園林綠化施工技術(shù)方案及技術(shù)措施
- 排水排污管道清疏的清理施工方法及安全措施
- 國(guó)際貿(mào)易協(xié)議
- 裝飾階段工程承包合同
- 北京市憑規(guī)格銷售合同
- 保養(yǎng)工程合同
- 外匯交易服務(wù)協(xié)議
- 交通樞紐環(huán)境優(yōu)化施工方案
- 《義務(wù)教育語(yǔ)文課程標(biāo)準(zhǔn)》2022年修訂版原版
- 2024年影視藝術(shù)概論復(fù)習(xí)考試題(附答案)
- 寧波文旅會(huì)展集團(tuán)有限公司招聘筆試題庫(kù)2024
- 高速公路收費(fèi)站員工年度考評(píng)辦法
- 山東省泰安市泰山區(qū)2023-2024學(xué)年七年級(jí)上學(xué)期期末考試英語(yǔ)試題
- 【《現(xiàn)金流視角下的綠地集團(tuán)財(cái)務(wù)風(fēng)險(xiǎn)防范探究(定量論文)》11000字】
- 小學(xué)二年級(jí)口算及豎式計(jì)算練習(xí)題
- DL∕T 681.1-2019 燃煤電廠磨煤機(jī)耐磨件技術(shù)條件 第1部分:球磨機(jī)磨球和襯板(代替DLT 681-2012)
- DB23T 1727-2016 地理標(biāo)志產(chǎn)品 克東天然蘇打水
- 水電站施工合同水電站施工合同(2024版)
- 渭南市白水縣2021-2022學(xué)年七年級(jí)上學(xué)期期末考試數(shù)學(xué)試卷【帶答案】
評(píng)論
0/150
提交評(píng)論