




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、基礎(chǔ)并行算法及其開源軟件,計算力學(xué)研究所,算法是解題方法的精確描述,是一組有窮的規(guī)則,它們規(guī)定了解決某一特定類型問題的一系列運算。并行算法(Parallel Algorithm)是一些可同時執(zhí)行的諸進程的集合,這些進程相互作用和協(xié)調(diào)動作從而達到給定問題的求解。并行算法可以分成數(shù)值計算和非數(shù)值計算的并行算法。并行數(shù)值算法就是求解諸如矩陣運算、多項式求值、求解線性方程組等數(shù)值計算問題的并行算法。,在科學(xué)與工程計算的許多問題中,數(shù)值計算問題,特別是矩陣相乘、求解線性方程組和矩陣特征值問題是最基本的內(nèi)核。隨著MPP(Massively Parallel Processing)并行計算機、機群以及消息傳
2、遞并行環(huán)境(MPI 等)的不斷發(fā)展和完善,為了充分發(fā)揮分布式并行計算機的功效,掌握針對分布式并行計算機的并行數(shù)值計算方法變得越來越重要。這里著重考慮矩陣向量運算和求解線性方程組的多種并行算法。,第一節(jié) 并行矩陣向量乘法,預(yù)備幾個記號,內(nèi)積,Saxpy,Gaxpy,串行矩陣向量乘法,稱之為Gaxpy,常規(guī)方式是每次修正一個分量,Gaxpy:行型算法,例:,Gaxpy:列型算法,例:,Ax表示成為A的列向量的線性組合。,矩陣的劃分,帶狀劃分:將矩陣整行或整列地分成若干個組,每組指派給一個處理器。這些行列可以是連續(xù)的,也可以是等距相間的,前者稱為塊帶狀劃分,后者稱為循環(huán)帶狀劃分。,nn的矩陣(0,1
3、,n-1),p個處理器(0,1,p-1),塊帶狀劃分: 每個處理器均勻連續(xù)地分配有n/p行(列),其中第i個處理器上包含:,P0,P1,P2,P3,0 1 2 3,4 5 6 7,8 9 10 11,12 13 14 15,以4個處理器,16列矩陣為例,假設(shè)n能被p整除,循環(huán)帶狀劃分: 每個處理器均勻相間地分配有n/p行(列),其中第i個處理器上包含:,以4個處理器,16列矩陣為例,棋盤劃分:將方陣劃分成若干個子方陣,每個子方陣指派給一個處理器,此時每個處理器均不包含整行或整列。棋盤劃分也可分為塊棋盤劃分和循環(huán)棋盤劃分。,nn的矩陣(0,1,n-1),p個處理器(組成 的二維處理器陣列),每個
4、處理器均勻地分配有 個矩陣元素。,塊棋盤劃分:,以16個處理器,88矩陣為例,循環(huán)棋盤劃分:,行塊帶狀劃分的矩陣向量乘法,劃分成p塊,假設(shè)n能被p整除,第k塊:(0k p-1),假設(shè)Ak,xk,yk存儲再進程k上,分別存在局部存儲器,在給定進程k上,每步計算中需要用到的子矩陣A的行標(biāo)號始終不變,說明在每步計算時用到的A的塊實際上都一直處于本進程上。而x的塊位于不同的處理機上,需要進行數(shù)據(jù)通信。本處采用每計算一次將x的塊在同列進程中循環(huán)上移一個位置的方式來實現(xiàn)這種數(shù)據(jù)通信。算法具體描述如下:,算法:,以p3,n3為例,yAx,第1步,第2步,第3步,P0,P1,P2,第二節(jié) 并行矩陣矩陣乘法,串
5、行矩陣矩陣乘法,矩陣乘法:ijk形式,標(biāo)量描述,矩陣乘法中三個求和循環(huán)可任意排序,從而一共3!6種形式,如jki形式(標(biāo)量描述),這6種可能性(ijk,jik,ikj,jki,kij,kji)的任何一個都對應(yīng)一內(nèi)層運算,而且具有自己數(shù)據(jù)流動形式。例如ijk形式,內(nèi)層運算是點積,數(shù)據(jù)用到的是A的行和B的列。,矩陣乘法:點積形式(ijk),記,則上述算法可表示為,進一步可表示為,其中,或表示為,ijk形式的內(nèi)部兩層循環(huán)實質(zhì)上是基于行的Gaxpy運算,矩陣乘法:Saxpy形式(jki),假定A和C的列分劃為,比較兩邊第j列,可知,一系列Saxpy運算,k循環(huán)實質(zhì)上是一Gaxpy運算,得到如下算法,矩
6、陣乘法:外積形式,考慮kji形式,記,則內(nèi)部的兩層循環(huán)是一個外積修正,可得到以下算法,可見其中的AB是p個外積之和。,并行矩陣矩陣乘法,假設(shè),行列劃分算法,將A和B矩陣分別劃分為如下的行塊子矩陣和列塊子矩陣,算法中ClCmyid,l,AAmyid,B在處理器中每次循環(huán)向前移動一個處理器。mm1myid1p mod p。,初始狀態(tài),Ai、Bi和Cij(j=0,1,p-1)存放在Pi中。,為 矩陣,將Cij的計算放在Pi上進行,這樣在初始數(shù)據(jù)分布時,數(shù)據(jù)Ai已經(jīng)在Pi上,但進程Pi上只有Bi,其它Bj處于其它進程上,需要對B的塊進行循環(huán)移位的方式實現(xiàn)。由于使用p個處理器,每次每個處理器計算出一個C
7、ij,計算C需要p次計算。Cij的計算是按對角線進行的,計算流程如下:,以p3,n3為例,CAB,第1步,第2步,第3步,P0,P1,P2,行行劃分算法,初始狀態(tài),Aij、Bi和Ci(j=0,1,p-1)存放在Pi中。將Ci的計算放在Pi上進行,這樣在初始數(shù)據(jù)分布時,數(shù)據(jù)Ai已經(jīng)在Pi上,但進程Pi上只有Bi,其它Bj處于其它進程上,需要對B的塊進行循環(huán)移位的方式實現(xiàn)。,以p3,n3為例,CAB,第1步,第2步,第3步,P0,P1,P2,與Saxpy形式、ikj形式對應(yīng),列列劃分算法,初始狀態(tài),Aj、Bi,j和Cj(i=0,1,p-1)存放在Pj中。將Cj的計算放在Pj上進行,這樣在初始數(shù)據(jù)分布時,數(shù)據(jù)Bj已經(jīng)在Pj上,但進程Pi上只有Aj,其它Ai處于其它進程上,需要對A的塊進行循環(huán)移位的方式實現(xiàn)。,以p3,n3為例,CAB,第1步,第2步,第3步,P0,P1,P2,與Saxpy形式、jki形式對應(yīng),列行劃分算法,假設(shè)C按列存放,初始狀態(tài),Ai、Bi,j和Ci(i=0,1,p-1)存放在Pi中。將Cj的計算放在Pj上進行,這樣在初始數(shù)據(jù)分布時,數(shù)據(jù)Ai和Bi都已經(jīng)在Pi上,每次計算得到Cj的部分和,存儲在Pj上,需要數(shù)據(jù)通信實現(xiàn)這種存儲。,以p3,n3為例,CAB,第1步,第2步,第3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園獲獎公開課:大班語言繪本《方格子老虎》教案
- 學(xué)科大觀念的提取及其教學(xué)意義-以小學(xué)數(shù)學(xué)為例研究報告
- 2024年中國特種高壓氣瓶行業(yè)發(fā)展現(xiàn)狀、運行格局及投資前景分析報告(智研咨詢)
- 防恐防暴幼兒園教師培訓(xùn)
- 甜菜批發(fā)企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報告
- 卡通背包企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報告
- 流動零售企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 果品、蔬菜零售企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 智能牙刷兒童趣味互動游戲行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 機器人自動化金屬分選線行業(yè)跨境出海戰(zhàn)略研究報告
- 從《南方周末》的批評性報道看輿論監(jiān)督
- 全新人教精通版六年級英語下冊教案(全冊 )
- (新版教材)粵教粵科版六年級下冊科學(xué)全冊教案(教學(xué)設(shè)計)
- 2021-2022學(xué)年貴州省貴陽一中高一下學(xué)期第二次月考數(shù)學(xué)試題(原卷版)
- 數(shù)學(xué)人教A版(2019)必修第二冊6.3.1平面向量基本定理(共16張ppt)
- 三年級藍色的家園海洋教育全冊教案.
- 《雪糕棒制作教學(xué)》課件ppt
- 《我愛你漢字》PPT課件
- 審核評估報告(課堂PPT)
- 管弦樂隊校本課程
- 總平面布置及CAD
評論
0/150
提交評論