計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)-第六章練習(xí) 答案_第1頁
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)-第六章練習(xí) 答案_第2頁
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)-第六章練習(xí) 答案_第3頁
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)-第六章練習(xí) 答案_第4頁
計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)-第六章練習(xí) 答案_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)_第六章練習(xí)答案計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)_第六章練習(xí)答案計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)_第六章練習(xí)答案xxx公司計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)_第六章練習(xí)答案文件編號:文件日期:修訂次數(shù):第1.0次更改批準(zhǔn)審核制定方案設(shè)計(jì),管理制度第六章向量處理機(jī)1.在大型數(shù)組的處理中常常包含向量計(jì)算,按照數(shù)組中各計(jì)算相繼的次序,我們可以把向量處理方法分為哪三種類型橫向處理方式,縱向處理方式,縱橫處理方式橫向處理方式:向量計(jì)算是按行的方式從左至右橫向的進(jìn)行縱向處理方式:向量計(jì)算是按列的方式自上而下縱向的進(jìn)行縱橫處理方式:橫向處理和縱向處理相結(jié)合的方式2.解釋下列與向量處理有關(guān)的術(shù)語。(1)向量和標(biāo)量的平衡點(diǎn):為了使向量硬件設(shè)備和標(biāo)量設(shè)備的利用率相等,一個(gè)程序中向量代碼所占的百分比(2)用戶代碼的向量化比值:用戶代碼可向量化的部分占全部的比重(3)向量化編譯器或量化器:將標(biāo)量運(yùn)算進(jìn)行向量化或者將向量運(yùn)算進(jìn)行適當(dāng)?shù)男薷氖怪軌蜻M(jìn)入向量處理進(jìn)行向量處理的編譯器3.簡要敘述提高向量處理機(jī)性能的常用技術(shù)(1)鏈接技術(shù)(2)向量循環(huán)或分段開采技術(shù)(3)向量遞歸技術(shù)(4)稀疏矩陣的處理技術(shù)4.下述的幾個(gè)需要解決的問題中,那個(gè)是向量處理機(jī)所最需要關(guān)心的A.計(jì)算機(jī)指令的優(yōu)化技術(shù)B.設(shè)計(jì)滿足運(yùn)算器帶寬要求的存儲器C.如何提高存儲器的利用率,增加存儲器系統(tǒng)的容量D.縱橫處理方式的劃分問題5.假設(shè)系統(tǒng)在向量模式下面能夠達(dá)到9Mflops,在標(biāo)量模式下能夠達(dá)到1Mflops速度,而代碼的90%是向量運(yùn)算,10%是標(biāo)量運(yùn)算,這樣花在兩種模式上的計(jì)算時(shí)間相等。那么向量平衡點(diǎn)是:一個(gè)程序中向量代碼所占的百分比D.以上都不是6.查看下面三條指令:V3←AV2←V0+V1V4←V2*V3假設(shè)向量長度小于64,且前后其他的指令均沒有相關(guān)性,數(shù)據(jù)進(jìn)入和流出每個(gè)功能部件,包括訪問存儲器都需要一拍的時(shí)間,假設(shè)向量的長度為N。三條指令全部采用串行的方法,那么執(zhí)行的時(shí)間是:+20+21+22+237.下面一組向量操作能分成幾個(gè)編隊(duì)假設(shè)每種流水功能部件只有一個(gè)。LV V1,Rx ;取向量MULTSV V2,F0,V1 ;向量和標(biāo)量相乘LV V3,Ry ;取向量YADDV V4,V2,V3 ;加法SV Ry,V4 ;存結(jié)果可以劃分成四個(gè)編隊(duì):(1)LV(2)MULTSVLV(3)ADDV(4)SV8.在一臺向量處理機(jī)上實(shí)現(xiàn)A=B×s操作,其中A和B是長度為200的向量,s是一個(gè)標(biāo)量。向量寄存器長度為64。功能部件的啟動開銷為:取數(shù)和存數(shù)部件為12個(gè)時(shí)鐘周期,乘法部件為7個(gè)時(shí)鐘周期,加法部件為6個(gè)時(shí)鐘周期??偟膱?zhí)行時(shí)間是9.簡述三種向量處理方式,他們對向量處理機(jī)結(jié)構(gòu)要求有什么不同。解:水平處理方式:向量長度為N,則水平處理方式相當(dāng)于執(zhí)行N次循環(huán)。不適合對向量進(jìn)行流水處理。(或者叫做橫向處理方式)垂直處理方式:將整個(gè)向量按相同的運(yùn)算處理完畢之后,再去執(zhí)行其他的運(yùn)算,適合對向量進(jìn)行流水處理,向量運(yùn)算指令的源/目向量都放在存儲器內(nèi),使得流水線運(yùn)算部件的輸入輸出端直接與存儲器相聯(lián),構(gòu)成M-M型的運(yùn)算流水線。分組處理方式:把長度為N的向量分為若干組,每組按照縱向處理10.解釋下列與向量處理有關(guān)的術(shù)語。(1)向量規(guī)約指令(2)收集和散播指令解:(1)將向量化轉(zhuǎn)化為標(biāo)量的指令(2)收集指令可以把非連續(xù)存儲單元的內(nèi)容傳送到向量寄存器組中若干個(gè)連續(xù)的寄存器;散播指令與此相反。他們用于稀疏矩陣的存儲與運(yùn)算,可以節(jié)省空間。11.查看下面三條指令:V3←AV2←V0+V1V4←V2*V3假設(shè)向量長度小于64,且前后其他的指令均沒有相關(guān)性,數(shù)據(jù)進(jìn)入和流出每個(gè)功能部件,包括訪問存儲器都需要一拍的時(shí)間,假設(shè)向量的長度為N。三條指令采用鏈接的方法,那么執(zhí)行的時(shí)間是:+22+15+16+1712.在一臺向量處理機(jī)上實(shí)現(xiàn)A=B×s操作,其中A和B是長度為200的向量,s是一個(gè)標(biāo)量。向量寄存器長度為64。功能部件的啟動開銷為:取數(shù)和存數(shù)部件為12個(gè)時(shí)鐘周期,乘法部件為7個(gè)時(shí)鐘周期,加法部件為6個(gè)時(shí)鐘周期。那么一個(gè)結(jié)果元素的平均執(zhí)行時(shí)間(包括啟動開銷)為:某向量處理機(jī)有16個(gè)向量寄存器,其中V0-V5種分別存放有向量A,B,C,D,E,F,向量的長度是8,向量各元素均為浮點(diǎn)數(shù);處理部件采用兩個(gè)單功能流水線,加法功能部件時(shí)間為2拍,乘法功能部件時(shí)間為3拍。采用類似CRAY-1的鏈接技術(shù),先計(jì)算(A+B)*C,在流水線不停的情況下,接著計(jì)算(D+E)*F。求此鏈接流水線的通過時(shí)間是多少拍(設(shè)寄存器出入各需1拍)14.名詞解釋向量流水處理機(jī)解:處理機(jī)具有向量數(shù)據(jù)表示,并通過向量指令對向量的各元素進(jìn)行處理。15.某向量處理機(jī)有16個(gè)向量寄存器,其中V0-V5種分別存放有向量A,B,C,D,E,F,向量的長度是8,向量各元素均為浮點(diǎn)數(shù);處理部件采用兩個(gè)單功能流水線,加法功能部件時(shí)間為2拍,乘法功能部件時(shí)間為3拍。采用類似CRAY-1的鏈接技術(shù),先計(jì)算(A+B)*C,在流水線不停的情況下,接著計(jì)算(D+E)*F。每拍時(shí)間是50ns,完成這些計(jì)算并且把結(jié)果存進(jìn)相應(yīng)的寄存器,此處理部件實(shí)際吞吐率是多少M(fèi)FLOPS(設(shè)寄存器出入各需1拍).一臺單處理機(jī)可以以標(biāo)量方式運(yùn)行,也可以以向量方式運(yùn)行。在向量方式情況下,計(jì)算可比標(biāo)量方式快9倍。設(shè)某基準(zhǔn)程序在此計(jì)算機(jī)上運(yùn)行的時(shí)間是T。另外,已知T的25%用于向量方式,其余機(jī)器時(shí)間則以標(biāo)量方式運(yùn)行。請計(jì)算在上述條件下與完全不用向量方式條件下相比的加速比,并計(jì)算上述程序中向量化代碼所占的百分比。加速比=*9+*1)/T=3由于T中向量化代碼所占的時(shí)間為,則串行代碼用時(shí)==,所以完全不用向量方式執(zhí)行該段代碼用時(shí)=+9*=3T,因此加速比=3T/T=3.根據(jù)Amdahl定律.17.一臺向量計(jì)算機(jī)一次只能以下述兩種方式中的一種運(yùn)行:一種是向量方式,執(zhí)行速度為10Mflops;另一種是標(biāo)量方式,執(zhí)行速度為1Mflops。設(shè)α是該計(jì)算機(jī)的典型程序代碼中可以向量化部分的百分比。如果要使平均執(zhí)行的速度達(dá)到,那么向量化百分比應(yīng)該多大1/[a/Rv+(1-a)/Rs]=所以a=18.在CARY1機(jī)器上,設(shè)向量長度均為32,s是標(biāo)量寄存器,加法需要6拍,乘法需要7拍,從存儲器讀數(shù)需要6拍,打入寄存器及啟動功能部件(包括寄存器)各需要1拍。則下面的指令組完成所需要的拍數(shù)是:V3←存儲器打入1,啟動1,讀數(shù)6V2←V0+V1s0←s2+s3V3←V1×V48+31+9+3119.在CRAY-1機(jī)器上,鏈接方式執(zhí)行下面4條向量指令(括號中給出相應(yīng)功能部件的時(shí)間),如果向量寄存器和功能部件之間的數(shù)據(jù)傳輸需要1拍,試求此鏈接流水線的流過時(shí)間為多少拍V0←存儲器 (存儲器取數(shù)7拍)9V1←V0+V1 (向量加3拍)5V3←V2<A3 (按照A3左移4拍)6V5←V3∧V4 (向量邏輯乘2拍)420.一臺單處理機(jī)可以以標(biāo)量方式運(yùn)行,也可以以向量方式運(yùn)行。在向量方式情況下,計(jì)算可比標(biāo)量方式快18倍。設(shè)某基準(zhǔn)程序在此計(jì)算機(jī)上運(yùn)行的時(shí)間是T。另外,已知T的25%用于向量方式,其余機(jī)器時(shí)間則以標(biāo)量方式運(yùn)行。那么在上述條件下與完全不用向量方式的條件下相比的加速比是:以上均不正確1/[18+1]21.一臺向量計(jì)算機(jī)一次只能以下述兩種方式中的一種運(yùn)行:一種是向量方式,執(zhí)行速度為10Mflops;另一種是標(biāo)量方式,執(zhí)行速度為1Mflops。設(shè)α是該計(jì)算機(jī)的典型程序代碼中可以向量化部分的百分比。求平均執(zhí)行速度的計(jì)算公式。1/[a/Rv+(1-a)/Rs]=10/(10-9a)22.向量處理機(jī)有那兩種最基本的結(jié)構(gòu)存儲器--存儲器結(jié)構(gòu)寄存器--寄存器結(jié)構(gòu)23.研制高性能的向量處理機(jī)主要需要解決哪幾個(gè)問題較好的維持向量/標(biāo)量性能平衡可擴(kuò)展性隨處理機(jī)數(shù)目的增加而提高增加存儲器系統(tǒng)的容量和性能提供高性能的I/O和易訪問的網(wǎng)絡(luò)24.為了提高向量處理機(jī)的性能,會采用一些特殊的技術(shù),下面那一項(xiàng)不是提高向量處理機(jī)性能而采用的技術(shù)A.鏈接技術(shù)B.向量遞歸技術(shù)緩存技術(shù)D.稀疏矩陣的處理技術(shù)25.在CARY1機(jī)器上,設(shè)向量長度均為32,s是標(biāo)量寄存器,加法需要6拍,乘法需要7拍,從存儲器讀數(shù)需要6拍,打入寄存器及啟動功能部件(包括寄存器)各需要1拍。則下面的指令組完成所需要的拍數(shù)是:V0←存儲器V2←V0+V1V3←V2×V1V5←V3×V426.若要進(jìn)行向量運(yùn)算D=A×(B+C),假設(shè)向量長度N<64,且B和C已經(jīng)存至V0和V1,則下面三條指令就可以完成上述的運(yùn)算。V3←A (6拍)V2←V0+V1 (6拍)V4←V2×V3 (7拍)分別求三條指令全部用串行的方法和鏈接技術(shù)執(zhí)行的時(shí)間(讀寫各需1拍)。27.在某臺向量處理機(jī)上執(zhí)行DAXPY代碼,即完成Y=a×X+Y,其中X和Y是向量,最初存放在內(nèi)存,a是一個(gè)標(biāo)量,他們的向量指令如下:LV V1,Rx ;取向量MULTSV V2,F0,V1 ;標(biāo)量和向量相乘LV V2,Ry ;取向量YADDV V4,V2,V3 ;相加SV Ry,V4 ;存結(jié)果求總的執(zhí)行時(shí)間。假設(shè)其中存取數(shù)需要12拍,乘法需要7拍,加法需要6拍,向量長度是n。28.假設(shè)某向量處理機(jī)上執(zhí)行DAXPY代碼所需要的時(shí)鐘周期是4n+64,其中n是向量長度,時(shí)鐘頻率是200MHz,那么最大性能是多少A.90MFLOPSB.80MFLOPSMFLOPSD.100MFLOPS29.假設(shè)某向量處理機(jī)上執(zhí)行DAXPY代碼所需要的時(shí)鐘周期是4n+64,其中n是向量長度,時(shí)鐘頻率是200MHz,那么半性能向量長度是:30.日本FOCOM向量處理機(jī)VP-200具有流水線鏈接和并行化功能。它有2條存儲流水線到向量寄存器,兩者可以并行工作。此外尚有加法和乘法流水線。各流水線間均可以鏈接操作。若現(xiàn)在要在Vp-200向量機(jī)上實(shí)現(xiàn)以下的向量操作:A(I)=B(I)×C(I)+D(I)×E(I)+F(I)×G(I)I=1,2,…,N。假定所有流水線的延遲時(shí)間都相等,取/存操作轉(zhuǎn)換時(shí)將有t的流水線重構(gòu)延遲時(shí)間。求完成操作所需要的時(shí)間。所以時(shí)間為:4N+t31.在CARY1機(jī)器上,設(shè)向量長度均為32,s是標(biāo)量寄存器,加法需要6拍,乘法需要7拍,從存儲器讀數(shù)需要6拍,打入寄存器及啟動功能部件(包括寄存器)各需要1拍。則下面的指令組完成所需要的拍數(shù)是:V3←存儲器V2←V0+V1V4←V2×V3存儲器←V432.表示向量流水方式的工作速度優(yōu)于標(biāo)量串行方式工作時(shí)間時(shí)所需要的向量長度的臨界值。請問該參數(shù)主要衡量那些標(biāo)準(zhǔn)衡量建立時(shí)間,也衡量標(biāo)量向量的速度比對性能的影響。33.有關(guān)半性能向量長度,下面哪種說法正確A.該值是最大性能的一半B.該值越大說明向量計(jì)算機(jī)性能越好C.該值是為達(dá)到一半最大性能所需要的向量長度D.該值必須是整數(shù),計(jì)算的時(shí)候應(yīng)該向下取整34.考慮一個(gè)如圖所示的4級加法流水線,其中X和Y為流水線輸入線,Z為輸出線。流水線輸出端有一個(gè)寄存器R,他用來暫時(shí)存儲中間結(jié)果并且在適當(dāng)時(shí)刻反饋帶S1。輸入X和Y分別與輸出R,Z經(jīng)相應(yīng)多路開關(guān)接到S1和2個(gè)輸入端。假設(shè)向量A的所有元素以每個(gè)周期一個(gè)元素速率,通過輸入端送入流水線。如果需要計(jì)算N個(gè)元素的向量累加和,則最少需要多少個(gè)時(shí)鐘周期約定無操作數(shù)輸入,就認(rèn)為是將1個(gè)0值送入,而且流水線的設(shè)置時(shí)間可以忽略不計(jì)。N+11如圖所示,當(dāng)進(jìn)行完第4個(gè)周期,開始第5個(gè)周期時(shí),暫存在寄存器R中的A(1)將和Y輸入端輸入的A(5)相加,其和放入S1,當(dāng)進(jìn)入下一個(gè)周期,A(1)+A(5)進(jìn)入S2,而A(2)+A(6)放入S1,……依次遞推。當(dāng)?shù)贜個(gè)周期完成時(shí),S1中放的是A(1)+A(5)+A(9)+A(13)+…;S2中放的是A(2)+A(6)+A(10)+A(14)+…;S3中放的是A(3)+A(7)+A(11)+A(15)+…;S4中放的是A(4)+A(8)+A(12)+A(16)+…;然后該計(jì)算這四段的總和,不妨設(shè)這四段分別為Y1,Y2,Y3,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論