高性能計(jì)算綜述_第1頁
高性能計(jì)算綜述_第2頁
高性能計(jì)算綜述_第3頁
高性能計(jì)算綜述_第4頁
高性能計(jì)算綜述_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、高性能計(jì)算綜述*摘要:高性能計(jì)算簡稱HPC(High Performance Computing),是計(jì)算機(jī)科學(xué)的一個(gè)分支,特指當(dāng)今具有超強(qiáng)計(jì)算能力的一類計(jì)算機(jī)。它致力于開發(fā)高性能計(jì)算機(jī),主要采用模擬方法,解算當(dāng)今超大、超高、超復(fù)雜的計(jì)算任務(wù),研究并行算法及開發(fā)相關(guān)軟件。高性能計(jì)算已被公認(rèn)為繼理論科學(xué)和實(shí)驗(yàn)科學(xué)之后,人類認(rèn)識世界改造世界的第三大科學(xué)研究方法。本文就這一領(lǐng)域技術(shù)的地位作用、優(yōu)勢、現(xiàn)狀與發(fā)展、分類、技術(shù)難點(diǎn)和研究方向、應(yīng)用、發(fā)展展望等問題作一概要介紹。關(guān)鍵詞:超級計(jì)算;高性能計(jì)算;高效能計(jì)算;大規(guī)模并行處理 1 引言高性能計(jì)算( High Performance Computing

2、,HPC)是計(jì)算機(jī)科學(xué)的1個(gè)分支,主要指從體系結(jié)構(gòu)、并行算法和軟件開發(fā)等多個(gè)方面研究開發(fā)高性能計(jì)算機(jī)的技術(shù)。高性能計(jì)算本身并沒有確切定義,它是指通過一定途徑,獲得比當(dāng)前主流計(jì)算機(jī)更高性能的計(jì)算能力的技術(shù)。 高性能計(jì)算已被公認(rèn)為繼理論科學(xué)和實(shí)驗(yàn)科學(xué)之后,人類認(rèn)識世界、改造世界的第三大科學(xué)研究方法,是科技創(chuàng)新的重要手段。在當(dāng)前社會情況下,高性能計(jì)算已經(jīng)成為一個(gè)國家綜合實(shí)力的體現(xiàn),對國家戰(zhàn)略的發(fā)展有著重要影響。目前,高性能計(jì)算技術(shù)已經(jīng)廣泛應(yīng)用于航空航天、汽車制造、核試驗(yàn)?zāi)M、軍事情報(bào)搜集處理、天氣預(yù)報(bào)等多方面。通過高性能計(jì)算,人們可以完成很多目前計(jì)算機(jī)無法完成的實(shí)驗(yàn),既可以免除真實(shí)實(shí)驗(yàn)的巨大費(fèi)用,又

3、不會對環(huán)境造成任何的影響。 通常來講,高性能計(jì)算有2種表現(xiàn)方式:提升單機(jī)的計(jì)算能力;通過網(wǎng)絡(luò)連接多臺計(jì)算機(jī),進(jìn)而提升計(jì)算能力。第一種方式多是指提升CPU的處理能力,而隨著CPU主頻的提高受制于制作工藝,CPU的發(fā)展方向已經(jīng)由單核向多核發(fā)展。事實(shí)證明,很多情況下CPU 過多的核心反而會降低CPU的處理能力。近幾年出現(xiàn)的GPGPU技術(shù)已經(jīng)成為提升單機(jī)處理能力的主要技術(shù)。第2種方式是通過整合多臺網(wǎng)絡(luò)計(jì)算機(jī)而提升計(jì)算能力,因此性價(jià)比較 高,已經(jīng)逐漸成為主流方式。2 高性能計(jì)算的地位作用美國在計(jì)算機(jī)與信息技術(shù)領(lǐng)域,一直處世界霸主地位。高性能計(jì)算機(jī)與高性能計(jì)算技術(shù)被認(rèn)為是美國國家的制高點(diǎn)技術(shù),歷屆政府都高

4、度重視,重點(diǎn)發(fā)展??肆诸D總統(tǒng)時(shí)代,大力推進(jìn)HPCC(High Performance Computing & Communications)計(jì)劃,大力研制一代代新機(jī)器, 建設(shè)許多超級計(jì)算中心,利用高性能計(jì)算機(jī)解決許多科技方面的“大挑戰(zhàn)問題”,推動眾多科學(xué)和技術(shù)領(lǐng)域的大發(fā)展。HPCC計(jì)劃還把因特網(wǎng)(Internet)公開民用,推向全球,推動了信 息化時(shí)代的到來。布什總統(tǒng)時(shí)代,雖然重點(diǎn)是反恐,但對高性能計(jì)算的發(fā)展絲毫沒有放松。2005年總統(tǒng)IT顧問委員會的專題咨詢報(bào)告,再次提出“HPC是國家核心競爭力,要大力發(fā)展”。奧巴馬總統(tǒng)執(zhí)政以來,經(jīng)濟(jì)問題、醫(yī)改問題一直是當(dāng)務(wù)之急,但也沒有放松HPC發(fā)展。20

5、11年1月25日總統(tǒng)國情咨文報(bào)告中,再提到中國擁有了世界上最快的計(jì)算機(jī),美國決不能松勁。 科學(xué)技術(shù)發(fā)展歷來依靠“理論、試驗(yàn)”,而今天“計(jì)算”已是第三手段,而且是越來越 重要的手段。許多科技領(lǐng)域的發(fā)展已離不開“計(jì)算”,許多學(xué)科已與計(jì)算相互復(fù)合。在國家科技、國防、產(chǎn)業(yè)、金融、服務(wù)、生活等方面都占有不可或缺的重要地位。譬如:核物理、核能、核動力、核安全技術(shù);空氣動力學(xué)(航天、航空、航海、高速運(yùn)載器);大氣、 海洋與空間(天氣與災(zāi)害預(yù)報(bào),全球變暖);能源(油氣勘探與開采,新能源);生命科學(xué)、生物工程、新藥研制;新材料;高新制造(汽車、微電子);信息與社會安全(密碼學(xué)、監(jiān)控);數(shù)據(jù)中心與服務(wù)中心等等。

6、中國自1958年開始自主研制計(jì)算機(jī),并用于解決中國國內(nèi)的各種需求,成績卓著。1983年國防科技大學(xué)研制成功中國第一臺HPC機(jī)銀河億次計(jì)算機(jī)YH,使中國成為 繼美、日后國際上少數(shù)能自主研制HPC機(jī)的國家之一。2010年月國防科技大學(xué)為“ 國家超級計(jì)算天津中心”研制成功的天河機(jī)TH1A,其計(jì)算速度在當(dāng)年11月國際TOP500排名中,列世界第一,為國家贏得榮譽(yù),為中國HPC發(fā)展與應(yīng)用作出了新貢獻(xiàn)。 全球HPC機(jī)的研制,美國占絕對優(yōu)勢,全球最快500臺計(jì)算機(jī)中,美國研制的占以上。其次是日本和中國,歐洲研制的極少。但世界各國都高度重視能力的建設(shè)與應(yīng)用,2011年月底世界最高性能,500臺計(jì)算機(jī)的裝備使用

7、情況如下: 美國:256臺,世界絕對第一;中國:62臺,世界第二;歐洲:125臺,其中,德國30臺,英國27臺,法國25臺;亞洲:103臺,其中除中國62臺外,日本26臺,其他國家擁有很少。 2011年6月底世界最快的10臺機(jī)器(運(yùn)算速度均達(dá)每秒1000萬億次以上),美國擁有5臺,中國和日本各臺,法國臺。高性能計(jì)算機(jī)的發(fā)展水平已經(jīng)成為衡量一個(gè)國家高新科技水平和綜合實(shí)力的重要標(biāo)志。高性能計(jì)算機(jī)可以對所研究的對象進(jìn)行數(shù)值模擬和動態(tài)顯示,從而獲得實(shí)驗(yàn)很難甚至無法得到的結(jié)果。它相對于理論科學(xué)和實(shí)驗(yàn)科學(xué),有其獨(dú)特的優(yōu)越性。首先,高性能計(jì)算既免除了真實(shí)實(shí)驗(yàn)的昂貴代價(jià),而且不會對環(huán)境產(chǎn)生任何影響,即所謂無損

8、傷研究。第二,高性能計(jì)算可以實(shí)現(xiàn)全過程全時(shí)空的研究 ,獲取研究對象發(fā)展變化的全部信息。第三,高性能計(jì)算可以低成本地反復(fù)進(jìn)行,獲得各種條件下全面系統(tǒng)的數(shù)據(jù)。事實(shí)證明,有了高性能計(jì)算不再需要進(jìn)行核試驗(yàn),有了高性能計(jì)算可以預(yù)測海嘯和地震的危害,有了高性能計(jì)算可以通曉人類大腦的奧秘和生命的密碼。在我國為滿足國民經(jīng)濟(jì)發(fā)展的需要,高性能計(jì)算的需求正在迅速增長。無論是國家安全、石油氣象等主要領(lǐng)域,還是以生物醫(yī)藥、微觀結(jié)構(gòu)研究為代表的新一代科技,都高度依賴高性能計(jì)算。它們的發(fā)展很大程度上取決于高性能計(jì)算的發(fā)展。尤其是基礎(chǔ)科學(xué)領(lǐng)域,對計(jì)算的需求永無止境,而且越高性能的計(jì)算機(jī)越能產(chǎn)生高精度高時(shí)效的成果。3 高性能

9、計(jì)算的優(yōu)勢3.1 計(jì)算科學(xué)應(yīng)用是高性能計(jì)算技術(shù)發(fā)展的源動力計(jì)算科學(xué)的興起是 20世紀(jì)后半葉最重要的科技進(jìn)步之一,大大豐富了當(dāng)今世界的科學(xué)研究活動。高性能計(jì)算作為計(jì)算的高端,代表計(jì)算機(jī)發(fā)展的方向和應(yīng)用的前沿,更加得到關(guān)注和重視。有關(guān)高性能計(jì)算的突破和發(fā)展都被視為科技的重大進(jìn)步,隨著技術(shù)的下移,對相關(guān)產(chǎn)業(yè)的發(fā)展有廣泛的帶動作用。回顧歷史,任何時(shí)候研制的最高性能的計(jì)算機(jī)總是服務(wù)于當(dāng)時(shí)的科學(xué)計(jì)算需求,主要研究領(lǐng)域包括新型材料、藥物設(shè)計(jì)、氣候模擬、核武器模擬、電磁學(xué)、工業(yè)產(chǎn)品、海量數(shù)據(jù)處理、國防和安全等,或者稱是以科學(xué)計(jì)算為最初應(yīng)用的靶子進(jìn)行設(shè)計(jì)的,如日本地球模擬器系統(tǒng)與IBM藍(lán)色基因系統(tǒng)兩個(gè)項(xiàng)目。而高

10、性能計(jì)算機(jī)技術(shù)逐步向商用領(lǐng)域轉(zhuǎn)移與轉(zhuǎn)化,計(jì)算性能及與其相匹配的存儲容量、互連網(wǎng)絡(luò)帶寬等指標(biāo)成為高性能計(jì)算機(jī)設(shè)計(jì)者追求的持續(xù)關(guān)鍵指標(biāo)。 我國早期的高性能計(jì)算機(jī)依賴于進(jìn)口,極大地限制了應(yīng)用,這也激發(fā)了我國自主研發(fā)高性能計(jì)算機(jī)的決心。隨著自主研制的高性能計(jì)算機(jī)“神威”、“銀河”、“曙光”等的發(fā)展,美國和日本對我國的限制也一步一步放寬,大型計(jì)算機(jī)的價(jià)格也在下跌。各種因素的綜合促進(jìn)了高性能計(jì)算的應(yīng)用。近幾年隨著我國在高性能計(jì)算技術(shù)和應(yīng)用方面的大力支持,我國各個(gè)領(lǐng)域的計(jì)算應(yīng)用開始利用高性能計(jì)算工具,高校紛紛開設(shè)并行計(jì)算相關(guān)課程。隨著社會信息化步伐的加快,高性能計(jì)算應(yīng)用將快速發(fā)展。3.2 高性能計(jì)算機(jī)研制推

11、動應(yīng)用的發(fā)展經(jīng)過近半個(gè)世紀(jì)的發(fā)展,高性能計(jì)算機(jī)從最初的向量計(jì)算機(jī),歷經(jīng)對稱多處理機(jī)(SMP)、大規(guī)模并行處理機(jī)(MPP),一直發(fā)展到機(jī)群系統(tǒng)( cluster )和星群系統(tǒng)(constellation ),實(shí)現(xiàn)了飛速發(fā)展。萬億(Tflops)、百萬億乃至千萬億(Pflops)次的高性能計(jì)算機(jī)將逐漸進(jìn)入人們的視野。近兩年,關(guān)于研制千萬億次高性能計(jì)算機(jī)的討論日漸火熱。美日兩國更是在千萬億次高性能計(jì)算機(jī)的研制上進(jìn)行了激烈的競爭,相繼推出千萬億次機(jī)器的研制計(jì)劃。例如日本 Riken 高性能計(jì)算中心和NEC針對生化領(lǐng)域的MDGRAPE-3,預(yù)計(jì)在2008年安裝在美國能源部橡樹嶺國家實(shí)驗(yàn)室的Cray Ba

12、ker和IBM的藍(lán)色基因P P計(jì)劃等。目前預(yù)計(jì)千萬億次系統(tǒng)將在2009 2011年間集中涌現(xiàn)在我國,千萬億次高性能計(jì)算機(jī)的研制也提上了議事日程。根據(jù)十一五高性能計(jì)算機(jī)研發(fā)計(jì)劃,我國將在2008年完成2臺百萬億次高性能計(jì)算機(jī)系統(tǒng)的研發(fā),并適時(shí)推出千萬億次高性能計(jì)算機(jī)。高性能計(jì)算機(jī)性能的提高必將推動應(yīng)用的發(fā)展。在美國,高性能計(jì)算主要用于核武器研究、國家防御、國家安全、能源與環(huán)境、生物科學(xué)、地球科學(xué)、材料科學(xué)、天文學(xué)、藥物設(shè)計(jì)、物理化學(xué)、電子器件及金融領(lǐng)域。日本的高性能計(jì)算主要為重大的科學(xué)探索和研究服務(wù),如地球模擬器主要用于大氣與海洋模擬、固體地球模擬、多尺度模擬等。歐盟國家投資高性能計(jì)算主要鼓勵生

13、命科學(xué)、信息技術(shù)、納米技術(shù)、天文和空間科學(xué)、食品質(zhì)量和安全、可持續(xù)發(fā)展等項(xiàng)目。我國高性能計(jì)算以經(jīng)濟(jì)發(fā)展為目的,涉及氣象數(shù)值模擬與預(yù)報(bào)、地震預(yù)報(bào)、生物信息、藥物設(shè)計(jì)、環(huán)境科學(xué)、空間科學(xué)、材料科學(xué)、計(jì)算物理、計(jì)算化學(xué)、流體力學(xué)、地震三維成像、油藏?cái)?shù)值模擬、天體星系模擬、金融、制造等眾多領(lǐng)域。3.3 高性能計(jì)算應(yīng)用促進(jìn)科技創(chuàng)新和社會進(jìn)步隨著研究的深入和競爭的加劇,各領(lǐng)域越來越多地使用高性能計(jì)算技術(shù)來解決科研和生產(chǎn)中的實(shí)際問題。高性能計(jì)算應(yīng)用的發(fā)展不但促進(jìn)了科技創(chuàng)新,也促進(jìn)了社會的進(jìn)步。高性能計(jì)算應(yīng)用發(fā)展水平逐漸成為衡量一個(gè)國家綜合國力和國際競爭力的重要指標(biāo)。國外的高性能計(jì)算應(yīng)用已經(jīng)具有相當(dāng)?shù)囊?guī)模,在

14、各個(gè)領(lǐng)域都有比較成熟的應(yīng)用實(shí)例。在物理、化學(xué)、生物等科學(xué)研究領(lǐng)域已廣泛利用高性能計(jì)算手段,在其它領(lǐng)域也廣泛被應(yīng)用。例如在政府部門大量使用高性能計(jì)算機(jī),能有效地提高政府對國民經(jīng)、社會發(fā)展的宏觀監(jiān)控和引導(dǎo)能力,包括打擊走私、增強(qiáng)稅收、進(jìn)行金融監(jiān)控和風(fēng)險(xiǎn)預(yù)警、環(huán)境和資源的監(jiān)控和分析等等。例如在能源領(lǐng)域,世界上石油公司通過高性能計(jì)算機(jī)處理石油勘探數(shù)據(jù),為能源的發(fā)現(xiàn)提供了支撐。在工業(yè)產(chǎn)品設(shè)計(jì)領(lǐng)域,例如美國通用機(jī)械(GM)和通用電氣(GE)等跨國集團(tuán)用網(wǎng)絡(luò)將全球各地設(shè)計(jì)中心的服務(wù)器和貴重設(shè)備連接成一個(gè)整體,以便于工程師和客戶共同設(shè)計(jì)產(chǎn)品,設(shè)計(jì)時(shí)間可縮短100倍。對很多大型企業(yè)來說,采購成本是總成本的重要組

15、成部分,例如福特等集團(tuán)用高性能計(jì)算機(jī)構(gòu)造了一個(gè)網(wǎng)上集市,通過網(wǎng)絡(luò)連到它的3萬多個(gè)供貨商。這種網(wǎng)上采購不僅能降低價(jià)格,減少采購費(fèi)用,還能縮短采購時(shí)間。此外,制造、后勤運(yùn)輸、市場調(diào)查等領(lǐng)域也都是高性能計(jì)算機(jī)大顯身手的領(lǐng)域。隨著“網(wǎng)絡(luò)計(jì)算”和“后PC時(shí)代”的到來,全世界將有數(shù)十億的客戶端設(shè)備,它們需要連到數(shù)百萬臺高性能服務(wù)器上。高性能計(jì)算機(jī)將越來越得到產(chǎn)業(yè)界的認(rèn)同,成為重要的設(shè)計(jì)、生產(chǎn)和管理工具。 高性能計(jì)算應(yīng)用在高性能計(jì)算技術(shù)的支持下為我國的科技創(chuàng)新作出了巨大貢獻(xiàn),并且和高性能計(jì)算技術(shù)在相輔相成中不斷發(fā)展。近年來,我國對大規(guī)??茖W(xué)計(jì)算和高性能計(jì)算都給予了極大的重視和投入。國家973計(jì)劃和863計(jì)劃

16、均有對高性能計(jì)算方面的大量投入,而且包括計(jì)算機(jī)界的許多學(xué)者認(rèn)識到應(yīng)用的重要性,特別是高性能計(jì)算的應(yīng)用,給予了高度的關(guān)注。 在傳統(tǒng)的高性能計(jì)算應(yīng)用領(lǐng)域如國防安全,核爆模擬,石油勘探數(shù)據(jù)處理,天氣預(yù)報(bào),洋流研究等有更大的發(fā)展。在新的應(yīng)用領(lǐng)域,如生物信息,基因,納米材料,微電子,工業(yè)產(chǎn)品設(shè)計(jì)和制造等方面也有很快的發(fā)展。在信息處理領(lǐng)域,政府、金融、流通領(lǐng)域紛紛用高性能計(jì)算資源處理海量數(shù)據(jù)。高性能計(jì)算的應(yīng)用得到各方面的關(guān)注和重視。高性能計(jì)算相對于理論科學(xué)和實(shí)驗(yàn)科學(xué),有其獨(dú)特的優(yōu)越性。首先,高性能計(jì)算既免除了真實(shí)實(shí)驗(yàn)的昂貴代價(jià),而且不會對環(huán)境產(chǎn)生任何影響,即所謂無損傷研究。第二 ,高性能計(jì)算可以實(shí)現(xiàn)全過程

17、全時(shí)空的研究,獲取研究對象發(fā)展變化的全部信息。第三 ,高性能計(jì)算可以低成本地反復(fù)進(jìn)行,獲得各種條件下全面系統(tǒng)的數(shù)據(jù)。事實(shí)證明,有了高性能計(jì)算不再需要進(jìn)行核試驗(yàn),有了高性能計(jì)算可以預(yù)測海嘯和地震的危害,有了高性能計(jì)算可以通曉人類大腦的奧秘和生命的密碼。3.4 網(wǎng)格是高性能計(jì)算應(yīng)用發(fā)展的新趨勢21 世紀(jì)網(wǎng)絡(luò)化是高性能計(jì)算應(yīng)用最重要的趨勢,網(wǎng)格(grid)已經(jīng)成為高性能計(jì)算的一個(gè)新研究熱點(diǎn)。用美國網(wǎng)格計(jì)算領(lǐng)導(dǎo)人Foster的話來說,網(wǎng)格是構(gòu)筑在互聯(lián)網(wǎng)上的一組新興技術(shù),它將高速互聯(lián)網(wǎng)、高性能計(jì)算機(jī)、大型數(shù)據(jù)庫、傳感器、遠(yuǎn)程設(shè)備等融為一體,為科技人員和普通百姓提供更多的資源、功能和交互性,讓人們透明地使

18、用計(jì)算、存儲等其他資源。在網(wǎng)格方面美國大大領(lǐng)先于其他國家,美國當(dāng)前對于網(wǎng)格研究的支持可與其70年代對 Internet研究的支持相比,10 年后可望普及到國民經(jīng)濟(jì)和社會發(fā)展的各個(gè)領(lǐng)域。TeraGrid是由美國國家科學(xué)基金會發(fā)起,由9個(gè)超算中心和國家實(shí)驗(yàn)室針對科學(xué)研究中出現(xiàn)的資源共享、合作研究等問題提出的。T eraGrid利用高性能網(wǎng)絡(luò),將分布在全國的高性能計(jì)算機(jī)、高端科學(xué)儀器、數(shù)據(jù)資源連接在一起,具有超過102Tflops的計(jì)算能力和15PB的存儲能力。其他國際上比較知名的網(wǎng)格還有歐盟的EGEE、英國的 e -Science和環(huán)太平洋網(wǎng)格應(yīng)用與中間件聯(lián)盟PRAGMA等。 我國對網(wǎng)格技術(shù)的研究

19、也給與大力支持,十五、八六三計(jì)劃的高性能計(jì)算專項(xiàng)和軟件專項(xiàng)等重大科研項(xiàng)目都與網(wǎng)格技術(shù)有關(guān)。中國國家網(wǎng)格(China National Grid, CNGrid)就是“八六三計(jì)劃”高性能計(jì)算機(jī)及其核心軟件,重大專項(xiàng)支持建立的網(wǎng)格示范平臺。CNGrid一期項(xiàng)目有8個(gè)計(jì)算結(jié)點(diǎn)遍布全國六大城市,總計(jì)算能力達(dá)到16Tflops,存儲能力達(dá)到200TB,已經(jīng)支持科學(xué)研究、資源環(huán)境、制造業(yè)和服務(wù)業(yè)的11個(gè)行業(yè)應(yīng)用,包括資源環(huán)境網(wǎng)格、航空制造網(wǎng)格、氣象網(wǎng)格、科學(xué)數(shù)據(jù)網(wǎng)格、新藥研發(fā)網(wǎng)格、森林資源與林業(yè)生態(tài)工程網(wǎng)格、生物信息網(wǎng)格、教育網(wǎng)格、城市交通信息服務(wù)網(wǎng)格、仿真應(yīng)用網(wǎng)格和國家地質(zhì)調(diào)查網(wǎng)格。3.5 發(fā)展公共超級

20、計(jì)算中心具有戰(zhàn)略意義超級計(jì)算中心是一個(gè)現(xiàn)代發(fā)達(dá)國家不可缺少的信息基礎(chǔ)設(shè)施。從全球來看,超級計(jì)算中心在主要工業(yè)化國家和第三世界的部分大國都有部署,都得到政府的大力支持,超級計(jì)算中心由政府為主投資進(jìn)行設(shè)備更新和運(yùn)營支持是全球的普遍模式。我國目前為數(shù)不多的超級計(jì)算中心由特定的部門建設(shè)和應(yīng)用,有部分的開放,但很難被外界使用。國家科技部和教育部也曾經(jīng)投資建設(shè)了一些高性能計(jì)算中心,但缺乏長期持續(xù)的支持和發(fā)展。近年來有地方政府建立超級計(jì)算中心,但缺乏國家級的高性能計(jì)算中心,缺乏長遠(yuǎn)的規(guī)劃和目標(biāo)。從我國的國情出發(fā),設(shè)立少數(shù)公共超級計(jì)算中心不僅能滿足我國高性能計(jì)算的強(qiáng)烈需求,同時(shí)能使有限的資源得到最有效的利用。

21、眾所周知,高性能計(jì)算機(jī)的發(fā)展速度快,初始投資和日常維護(hù)都需要大量的資金,如果機(jī)器在生命周期內(nèi)不能最大效益的發(fā)揮作用,必然形成資源浪費(fèi)。一個(gè)部門和機(jī)構(gòu)很難建立大規(guī)模的計(jì)算中心,但峰值的需求又不能得到滿足。超級計(jì)算中心有大量的用戶,各用戶之間對資源的峰值需求有交錯(cuò)性,從而使超級計(jì)算機(jī)保持穩(wěn)定的高利用率。超級計(jì)算中心的初始投資和運(yùn)營維護(hù)費(fèi)用分?jǐn)偟剿杏脩羯希艽罅抗?jié)約社會投資,提高政府資金的效率??蛻裟軌蚴褂玫母咝阅苜Y源超出了自身能夠建設(shè)的范圍,但成本卻大大降低。所以超級計(jì)算中心在美國又被稱作“Cycle Shop”。 超級計(jì)算中心在高性能計(jì)算產(chǎn)業(yè)鏈中扮演著獨(dú)特的承上啟下的重要作用。超級計(jì)算中心直接

22、面對高性能計(jì)算終端用戶,深刻理解用戶的需求、各類應(yīng)用特點(diǎn),其經(jīng)驗(yàn)對于高性能計(jì)算軟硬件廠商非常重要,對高性能計(jì)算用戶的培養(yǎng)和教育對于擴(kuò)大高性能計(jì)算市場極其重要。 同時(shí)目前絕大多數(shù)的超級計(jì)算中心的非盈利特性,使得其沒有把運(yùn)行重點(diǎn)放在直接經(jīng)濟(jì)利益回報(bào)上,從而能夠代表政府去做與產(chǎn)業(yè)集合緊密、合作各方多贏的事情。這都有利于一個(gè)健康、良好、多贏的高性能計(jì)算市場的形成和發(fā)展。超級計(jì)算中心要自覺地、主動地在學(xué)術(shù)和市場間廣泛合作,游刃有余,串接起不同的價(jià)值鏈,讓更多的人力資源、資金、技術(shù)、商譽(yù)更快地流動和轉(zhuǎn)移。 超級計(jì)算中心是各學(xué)科知識聚集融合的場地,遠(yuǎn)遠(yuǎn)有別于一個(gè)單純在計(jì)算機(jī)科學(xué)方面開展研究的IT研究機(jī)構(gòu) ,

23、對于推動高性能計(jì)算應(yīng)用的深度和廣度至關(guān)重要。通過各類基礎(chǔ)科學(xué)、工程科學(xué)的各類科學(xué)家和專業(yè)技術(shù)人員與計(jì)算機(jī)專家、計(jì)算科學(xué)專家的互動,能積累豐富的經(jīng)驗(yàn)、知識和成果。同時(shí),超級計(jì)算中心在多學(xué)科交融的過程中,可以有更多的機(jī)會、更創(chuàng)新的模式為國家知識創(chuàng)新、科技創(chuàng)新提供更有效的支撐。4 現(xiàn)狀與發(fā)展4.1 高性能計(jì)算的現(xiàn)狀與發(fā)展高性能計(jì)算與傳統(tǒng)計(jì)算相比較,其最大特點(diǎn)是速度快、計(jì)算結(jié)果精確。而對高性能計(jì)算的研究也正圍繞著這樣一個(gè)特點(diǎn),主要從兩個(gè)方面進(jìn)行研究:致力于開發(fā)尖端高性能計(jì)算機(jī)。利用現(xiàn)在迅猛發(fā)展的網(wǎng)格技術(shù),實(shí)現(xiàn)高性能計(jì)算。自1946年第一臺計(jì)算機(jī)ENIAC在賓夕法尼亞大學(xué)問世以來,在這短短的50年左右的

24、時(shí)間里,馮、諾依曼體系的高性能計(jì)算機(jī)的迅猛發(fā)展,并且日益走向成熟大體來講,高性能體系結(jié)構(gòu)主要包括:Cra式的向量超級計(jì)算機(jī)集群、可擴(kuò)展的單處理器和多處理器集群。目前集群系統(tǒng)也正從大規(guī)模并行計(jì)算機(jī)和運(yùn)行專用軟件的集群向運(yùn)行標(biāo)準(zhǔn)軟件的專用集群和由商用硬件和軟件自制而成的 Beowulf系統(tǒng)集群系統(tǒng)轉(zhuǎn)變。網(wǎng)格計(jì)算是網(wǎng)絡(luò)技術(shù)發(fā)展的新階段。我們采用網(wǎng)格技術(shù)可以將Internet或者某個(gè)局域網(wǎng)中的所有這些閑置的軟件或者硬件資源都聯(lián)系起來形成一個(gè)潛在的資源池,產(chǎn)生了強(qiáng)大的計(jì)算能力。當(dāng)用戶需要進(jìn)行大規(guī)模計(jì)算時(shí),他可以使用這個(gè)資源池里的資源進(jìn)行計(jì)算,這時(shí)就像家里的用電不需要考慮我們所使用的電源是由哪個(gè)發(fā)電廠生產(chǎn)

25、的一樣,不需要考慮所使用的具體資源所在的位置。這樣的話,不管是何時(shí)何地,我們的計(jì)算機(jī)資源都能得到合理的應(yīng)用,而且能夠得到一個(gè)理想的計(jì)算效果。在未來的高性能計(jì)算的發(fā)展中,尖端的高性能計(jì)算機(jī)是網(wǎng)格計(jì)算中的重要計(jì)算資源,而網(wǎng)格技術(shù)也為未來取得一個(gè)高性能計(jì)算的能力提供了一個(gè)優(yōu)良的環(huán)境。4.2 中國高性能計(jì)算的現(xiàn)狀與發(fā)展由于我國在高性能計(jì)算技術(shù)上起步比較晚,工業(yè)水平及相應(yīng)的經(jīng)濟(jì)發(fā)展程度低,再加上美國等西方國家一直把高性能計(jì)算技術(shù)作為重要的戰(zhàn)略資源,長期以來對我國的實(shí)行全面的封鎖和禁運(yùn),一直以來我國的高性能計(jì)算技術(shù)遠(yuǎn)遠(yuǎn)地落后于世界先進(jìn)水平。20世紀(jì)90年代以來,隨著“神威”、“銀河”、“曙光”、“深騰”等

26、一批知名產(chǎn)品的出現(xiàn),我國成為繼美國、日本之后的第三個(gè)具備高性能計(jì)算機(jī)系統(tǒng)研制能力的國家,被譽(yù)為世界未來高性能計(jì)算市場的“第三股力量”。我國在高性能計(jì)算機(jī)研制方面取得了較好的成績,掌握了研制高性能計(jì)算機(jī)的一些關(guān)鍵技術(shù),參與研制的單位也由科研院發(fā)展到企業(yè)界,有力地推動了高性能計(jì)算的發(fā)展。目前,我國的高性能計(jì)算環(huán)境已得到重大改善,總計(jì)算能力與發(fā)達(dá)國家的差距逐步縮小。 我國的高性能計(jì)算技術(shù)拓寬了我國科學(xué)技術(shù)研究的深度和廣度,提高了我國工業(yè)的生產(chǎn)效率,同時(shí)也節(jié)約了很多生產(chǎn)成本。我國的高性能計(jì)算技術(shù)目前主要在石油行業(yè)、天氣預(yù)報(bào)、核能模擬、生物工程等領(lǐng)域得到了廣泛的應(yīng)用。但是中國高性能計(jì)算的應(yīng)用還不夠廣、不

27、夠深入,應(yīng)用水平和應(yīng)用效率都比較低下。我國對高性能計(jì)算應(yīng)用的投入還遠(yuǎn)遠(yuǎn)不夠,應(yīng)用研發(fā)力量薄弱且分散,缺乏跨學(xué)科的綜合型人才,從事高端應(yīng)用軟件研發(fā)的單位很少,企業(yè)界基本未介入,沒有良好的相互交流的組織渠道等。高性能應(yīng)用軟件的開發(fā)和高效并行算法研究尚不能與高端計(jì)算機(jī)發(fā)展同步,在一定程度上存在為計(jì)算機(jī)“配”軟件的思想。我國高性能計(jì)算應(yīng)用的研究與發(fā)明明顯滯后于高性能計(jì)算機(jī)的發(fā)展。國外品牌還占領(lǐng)著很多關(guān)乎國計(jì)民生的關(guān)鍵領(lǐng)域和行業(yè),國產(chǎn)高性能服務(wù)器的市場份額仍然偏低。4.3 高性能計(jì)算的發(fā)展階段自1946年ENIA誕生以來,人們就沒停止對高性能計(jì)算的追求,總體經(jīng)過以下幾個(gè)階段:4.3.1 PVP20世紀(jì)7

28、0年代出現(xiàn)的向量機(jī)可以看作是第一代的高性能計(jì)算機(jī),以Cray Research公司開發(fā)的 Cray系列計(jì)算機(jī)為代表。當(dāng)時(shí)的并行向量機(jī)( Parallel VectorProcessing,PVP) 通過增加處理器個(gè)數(shù)、擴(kuò)展存儲器的方式不斷提升計(jì)算能力,占領(lǐng)高性能計(jì)算市場達(dá)20年之久。其架構(gòu)如圖 1 所示,不過隨著并行向量機(jī)處理器數(shù)目的增加,使得定制費(fèi)用和維護(hù)費(fèi)用越來越昂貴,性價(jià)比越來越低,已難以滿足高性能計(jì)算機(jī)市場化的要求。這個(gè)類型的計(jì)算機(jī)以 CDC公司的CDC8600和CDC STAR- 100為代表。4.3.2 SMP隨著大規(guī)模集成電路的出現(xiàn),微處理器應(yīng)運(yùn)而生隨著微處理器性能的不斷提高,對

29、稱多處理( Symmetric Multi-Processing,SMP)計(jì)算機(jī)取代了 PVP,直接導(dǎo)致并行向量機(jī)退出了高性能計(jì)算市場。這種技術(shù)在IL-LIAC IV時(shí)代就開始嘗試應(yīng)用了,其架構(gòu)如圖 2 所示:但是SMP計(jì)算機(jī)可擴(kuò)展的處理器數(shù)目有限,加之對I /O和存儲器操作的不便都限制了其發(fā)展。4.3.3 MPP20世紀(jì)90年代初,大規(guī)模并行處理(MassivelyParallel Processing,MPP)成為HPC發(fā)展的方向,并以ILLIAC IV和Cray I為代表,MPP架構(gòu)下多個(gè)節(jié)點(diǎn)間通過網(wǎng)絡(luò)進(jìn)行連接,微處理器之間通過消息傳遞進(jìn)行通訊。如圖3所示,MPP系統(tǒng)使用專門的網(wǎng)絡(luò)和操作

30、系統(tǒng),而與此同時(shí),隨著個(gè)人 PC 的發(fā)展,集群出現(xiàn)了。4.3.4 集群集群是價(jià)格低廉并且方便的高性能計(jì)算方法,通過本地網(wǎng)絡(luò)連接多臺計(jì)算機(jī)來共同完成工作,集群中的計(jì)算機(jī)處于平等地位,通過相互協(xié)作完成計(jì)算。集群以較低的成本獲得計(jì)算能力大幅度的提升,使高性能計(jì)算趨于平民化。集群結(jié)構(gòu)如圖4所示,集群獲得了計(jì)算能力成倍的提高,與之相伴的就是并行與分布式計(jì)算技術(shù)。 并行計(jì)算(Parallel Computing,或并行處理、平行計(jì)算)一般是指許多指令得以同時(shí)進(jìn)行的計(jì)算模式。分布式計(jì)算(Distributed Computing)是一種把需要進(jìn)行大量計(jì)算的工程數(shù)據(jù)分成小塊,由多臺計(jì)算機(jī)分別計(jì)算,上傳運(yùn)算結(jié)果

31、后,將結(jié)果統(tǒng)一合并得出數(shù)據(jù)結(jié)論的計(jì)算模式。目前實(shí)現(xiàn)并行與分布式計(jì)算最常見的技術(shù)是PVM和MPI。MPI已經(jīng)成為并行計(jì)算的標(biāo)準(zhǔn)。集群的擴(kuò)展畢竟是有限的,于是人們想將互聯(lián)網(wǎng)上盡可能多的閑置計(jì)算機(jī)資源納入到集群中來,這樣就產(chǎn)生了網(wǎng)格計(jì)算技術(shù),網(wǎng)格計(jì)算是分布式計(jì)算的1 種。 網(wǎng)格網(wǎng)格(Grid)這個(gè)詞源于電力網(wǎng)格(Power Grid)?!熬W(wǎng)格”與“電力網(wǎng)格”形神相似。一方面, 計(jì)算機(jī)網(wǎng)縱橫交錯(cuò),很像電力網(wǎng)絡(luò);另一方面,電力網(wǎng)格用高壓線路把分散在各地的發(fā)電站連接在一起,向用戶提供源源不斷的電力,用戶只需插上插頭、打開開關(guān)就能用電,不需要知道電能是從哪個(gè)電站送來的,也不需要知道它是水電、火電還是核電。建

32、設(shè)網(wǎng)格的目的也是一樣,其最終目的是希望它能夠把分布在因特網(wǎng)上數(shù)以億計(jì)的計(jì)算機(jī)、存儲器、貴重設(shè)備、 數(shù)據(jù)庫等整合起來,形成一個(gè)虛擬的、空前強(qiáng)大的超級計(jì)算機(jī),以滿足不斷增長的計(jì)算、存儲需求,并使信息世界成為一個(gè)有機(jī)的整體。網(wǎng)格的架構(gòu)如圖 5 所示:網(wǎng)格本質(zhì)上是計(jì)算機(jī)集群,但是與集群有所不同。集群只是將多臺計(jì)算機(jī)通過網(wǎng)絡(luò)連接在一起,通過軟件分工合作,來共同完成任務(wù),然后將結(jié)果反饋集中。對用戶來講,面對的好像不是多臺計(jì)算機(jī)的集群,而是1臺計(jì)算機(jī)。集群要提升計(jì)算能力,只能通過增加服務(wù)器1種途徑。而對于1個(gè)集群來講,能增加的服務(wù)器數(shù)量顯然是有限的,這也就限制了集群計(jì)算能力的進(jìn)一步提升,而且隨著服務(wù)器數(shù)量的

33、增加,集群的性價(jià)比也會不斷地下降。而對于網(wǎng)格來說,它面對的是整個(gè)因特網(wǎng)上的計(jì)算機(jī),理論上具有無限擴(kuò)展的可能,可以虛擬出空前強(qiáng)大的計(jì)算機(jī)。另外,集群在執(zhí)行任務(wù)時(shí)要求集群中的每臺計(jì)算機(jī)都是同構(gòu)的,而網(wǎng)格則不需要。網(wǎng)格可以動態(tài)地獲取限制資源并加以利用,也可以在任務(wù)完成后馬上釋放資源,合理使用負(fù)載,而這一點(diǎn)集群是做不到的。 云計(jì)算隨著高性能計(jì)算技術(shù)的進(jìn)一步發(fā)展,出現(xiàn)了“云計(jì)算”技術(shù),云計(jì)算的核心思想是將大量用網(wǎng)絡(luò)連接的計(jì)算資源虛擬化后進(jìn)行統(tǒng)一管理和調(diào)度,構(gòu)成1個(gè)計(jì)算資源池向用戶按需提供服務(wù)。提供資源的網(wǎng)絡(luò)被稱為“云”,“云”中的資源在使用者看來是可以無限擴(kuò)展的,并且可以隨時(shí)獲取,按需使用,按使用付費(fèi)。

34、云計(jì)算網(wǎng)絡(luò)的架構(gòu)如圖6所示:網(wǎng)格計(jì)算和云計(jì)算看起來比較相似,都是將網(wǎng)絡(luò)上的資源形成1個(gè)資源池,然后按需分配給使用者,很多人甚至將云計(jì)算叫做“網(wǎng)格2.0” ,但實(shí)際上兩者在本質(zhì)上是有所不同的。一般情況下,網(wǎng)格是針對某種具體的需求而開發(fā)出來的,用于完成特定的任務(wù),因此會出現(xiàn)各種各樣的網(wǎng)格,比如生物網(wǎng)格、地理網(wǎng)格、國家教育網(wǎng)格等等。網(wǎng)格的作用是為了獲得更強(qiáng)大的計(jì)算能力,它將1個(gè)需要巨大計(jì)算量的任務(wù)細(xì)化成多個(gè)相互之間不關(guān)聯(lián)的子任務(wù),然后通過網(wǎng)格軟件從納入網(wǎng)格中的所有計(jì)算機(jī)資源中尋找空閑資源,將子任務(wù)分發(fā)給空閑節(jié)點(diǎn)進(jìn)行計(jì)算。子節(jié)點(diǎn)在完成計(jì)算后會將結(jié)果返回進(jìn)行匯總,然后再接收下個(gè)任務(wù)。若子節(jié)點(diǎn)在運(yùn)算過程中

35、發(fā)生崩潰,沒能及時(shí)返回結(jié)果,也不會影響整個(gè)項(xiàng)目的進(jìn)行,其所承擔(dān)的任務(wù)會被調(diào)度系統(tǒng)分配給其他的節(jié)點(diǎn)繼續(xù)完成。從這一方面講,作業(yè)調(diào)度是網(wǎng)格的核心價(jià)值,而云計(jì)算網(wǎng)絡(luò)是通用的,目前還沒有出現(xiàn)以某個(gè)具體應(yīng)用命名的云網(wǎng)絡(luò)。云計(jì)算網(wǎng)絡(luò)的目的不再是單純追求強(qiáng)大的計(jì)算能力,而更像是為了按需分配資源。比如某企業(yè)在云計(jì)算網(wǎng)絡(luò)中租用了1臺虛擬服務(wù)器,當(dāng)某些特定時(shí)刻,計(jì)算量或者網(wǎng)絡(luò)的訪問量激增的時(shí)候,云計(jì)算網(wǎng)絡(luò)會動態(tài)地增加該服務(wù)器的計(jì)算能力和網(wǎng)絡(luò)帶寬,以滿足企業(yè)的需要。當(dāng)需求變小的時(shí)候,云計(jì)算網(wǎng)絡(luò)又會動態(tài)地釋放部分資源,使資源的調(diào)度總是維持在一個(gè)比較合理的水平。企業(yè)只需要按照使用情況付費(fèi),而不需要像以前那樣必須去購買能

36、夠滿足最大需求的物理設(shè)備。 云計(jì)算作為一種新的高性能計(jì)算網(wǎng)絡(luò)目前仍在發(fā)展中,上述幾種高性能計(jì)算方式的優(yōu)缺點(diǎn)總結(jié)如表1所示。4.3.7 GPGPU近幾年,出現(xiàn)了GPGPU( General Purpose GPU 通用計(jì)算圖形處理器),即使用GPU進(jìn)行通用運(yùn)算的技術(shù),并由此產(chǎn)生了CPU + GPU的高性能計(jì)算方式。該方式下CPU專注于串行計(jì)算,而并行計(jì)算部分交由GPU 來完成。GPU 參與并行運(yùn)算后,將計(jì)算機(jī)的運(yùn)算能力提升了幾倍到幾十倍,將 PC 轉(zhuǎn)變成了高性能計(jì)算機(jī)。 目前的GPU并行運(yùn)算技術(shù)有2種,分別為NVIDIA公司的基于Geforce8以上顯卡的 CUDA技術(shù)和AMD公司的基于ATI顯

37、卡的 Stream 技術(shù)。而 Intel公司也在開發(fā)自己的 GPGPU技術(shù)。5 高性能計(jì)算機(jī)的分類依據(jù)市場對HPC機(jī)的應(yīng)用需求,HPC機(jī)可以分為兩大類:(1)服務(wù)型(容量型) )普及計(jì)算型:一般的計(jì)算中心,面向各種各樣用戶算題需求,同時(shí)為多個(gè)用戶算題服務(wù),系統(tǒng)要易得,用得起,一般不特別追求計(jì)算高效高速,也不強(qiáng)調(diào)一 個(gè)用戶獨(dú)霸全系統(tǒng)。 )數(shù)據(jù)型:各種數(shù)據(jù)中心、服務(wù)中心,面向大量或巨量用戶的同時(shí)訪問,要求 響應(yīng)快、服務(wù)好。譬如Google搜索服務(wù),全球有600萬臺服務(wù)器構(gòu)成的HPC系統(tǒng)來支撐服務(wù)。)音視頻型:視頻制作,大片點(diǎn)播中心,網(wǎng)游支持中心等。譬如,“阿凡達(dá)”3D影片制作,用了一臺每秒運(yùn)算20

38、5萬億次的HPC機(jī),是HP公司生產(chǎn)的總共3.5萬核的Cluster機(jī)。這類HPC機(jī)大量需求,市場巨大。它要求便宜易得,用得起,其應(yīng)用特性是同時(shí)為眾多用戶服務(wù),高性能主要表現(xiàn)為巨大的用戶量,故可稱為“容量型HPC機(jī)”, 是一群小雞共同吃一堆谷物的方式。“商用CPU商用互連網(wǎng)絡(luò)開源軟件” 組成的cluster機(jī)非常合適。(2)計(jì)算型(能力型) 該型HPC機(jī)主要應(yīng)用于大規(guī)模的科技工程問題計(jì)算求解,系統(tǒng)可以同時(shí)支持多 個(gè)用戶算題,但特別強(qiáng)調(diào)全系統(tǒng)同時(shí)為一個(gè)用戶題高效便捷求解服務(wù)。機(jī)器能力表現(xiàn)為如同一頭大象,可扛起千斤重?fù)?dān)。這類機(jī)器被稱為“能力型HPC機(jī)”,是高端HPC機(jī),要求其大規(guī)模處理器的訪存快捷、

39、并行協(xié)同計(jì)算好、相互通信高效、 機(jī)器能耗合理、系統(tǒng)可靠可維。無疑這類機(jī)器需要特殊設(shè)計(jì)、制作。 這類HPC機(jī),市場需求不大,但是是高端需求,是技術(shù)制高點(diǎn)。能做這類機(jī)器的單位、公司全球僅少數(shù)幾家。設(shè)計(jì)制作這類機(jī)器的技術(shù)途徑大致有:自己設(shè)計(jì)定制專用CPU; 商用CPU自己設(shè)計(jì)定制的專用高效加速處理器,構(gòu)成異構(gòu)型 機(jī); 自己設(shè)計(jì)定制的高速高效互連網(wǎng)絡(luò)。6 高性能計(jì)算的主要技術(shù)難點(diǎn)和研究方向架構(gòu)HPC機(jī)至今唯一技術(shù)途徑是:由CPU本地存儲器構(gòu)成一個(gè)結(jié)點(diǎn)機(jī),然后把 大量結(jié)點(diǎn)機(jī)互連成系統(tǒng),以大規(guī)模并行計(jì)算來獲得高速、高性能。并行的結(jié)點(diǎn)機(jī)數(shù)或稱“核”(core,可執(zhí)行計(jì)算程序的基礎(chǔ)單元)數(shù),現(xiàn)已高達(dá)幾十萬個(gè)。

40、HPC計(jì)算技術(shù)發(fā)展的難點(diǎn)均由此產(chǎn)生,規(guī)模越大,矛盾越突出,這可能是相伴HP終身的永恒主題。高性能計(jì)算的主要技術(shù)難點(diǎn)是: (1)難用: 如何把一個(gè)計(jì)算問題分解為可并行協(xié)同計(jì)算的幾千、幾萬、幾十萬個(gè) 小問題,即“大規(guī)模的并行算法”,是個(gè)巨大的難題;計(jì)算對象數(shù)據(jù),如何合理放置到幾千、幾萬、幾十萬個(gè)結(jié)點(diǎn)上去,使核的計(jì)算能方便快速得到和交換數(shù)據(jù)(結(jié)點(diǎn)間數(shù)據(jù)交換是很低效的),是相關(guān)的又一大難題,即“數(shù)據(jù)流的組織”問題;人的思維及傳統(tǒng)的程序概念是串行執(zhí)行的,如此大規(guī)模的并行,程序 怎么編,所編程序如何在結(jié)點(diǎn)機(jī)架構(gòu)不同的系統(tǒng)間可移植,都是很困難的,即“可編程、可移植”問題。(2)低效:由于上述的難題難以很好解

41、決,實(shí)際問題的有限并行度與機(jī)器大規(guī)模并行的架構(gòu)不匹配,高速運(yùn)算能力與訪存取數(shù)很慢的不匹配,結(jié)點(diǎn)機(jī)高性能與結(jié)點(diǎn)機(jī)之間的極慢的通信傳輸能力不匹配等等導(dǎo)致HPC機(jī)解算實(shí)際問題時(shí)低效, 全系統(tǒng)的計(jì)算能力實(shí)際能用上的只有幾成,譬如30%就不錯(cuò)了,差的只有。當(dāng)然,對特定問題、針對特定的機(jī)器架構(gòu),由高手精心設(shè)計(jì)程序,也可以獲得很高的可用率,這也是HPC機(jī)的魅力所在。(3)高成本:大規(guī)模,幾百個(gè)大機(jī)柜,成千上萬個(gè)結(jié)點(diǎn)機(jī),機(jī)器價(jià)格很高,千萬億次秒的HPC機(jī)要上億美元,而巨大的功耗(兆瓦級)及相應(yīng)的散熱冷卻, 也代價(jià)高昂,年電費(fèi)需上千萬元,有人戲稱買得起用不起。如此龐大系統(tǒng),如此 高功耗高熱,又會使系統(tǒng)穩(wěn)定可靠性

42、大為降低,有的平均只能穩(wěn)定幾小時(shí),系統(tǒng) 維護(hù)成本也很高。由此10年前就有人提出,高性能計(jì)算要向高效能方向努力,highperformance改為(或強(qiáng)調(diào))highproductivity。高效能就是要解決或緩解上述難題,其含 義是:提高:HPC系統(tǒng)的實(shí)用性能,HPC系統(tǒng)的可編程性,HPC系統(tǒng)的可靠、可信性;同時(shí)降低:HPC系統(tǒng)的開發(fā)與硬件成本,HPC系統(tǒng)的運(yùn)行成本(特別是 功耗),HPC系統(tǒng)的維護(hù)成本。因此,HPC技術(shù)的主要研究方向是:(1)高效能并行計(jì)算機(jī)體系結(jié)構(gòu):首先是處理器的高效架構(gòu),CPU既是高性能的核心動力,也是高性能的核心基礎(chǔ),單片上眾核已是CPU的主流方向,Intel展示過80核

43、的單片CPU;CPU內(nèi)嵌加速處理器(如GPU)也是成功的方向;面向計(jì)算領(lǐng)域的專用新型異構(gòu)眾核體系結(jié)構(gòu),算法與體系結(jié)構(gòu)緊密結(jié)合,可能是有前途的方向。(2)以存儲為中心的體系架構(gòu):訪存速度的提升遠(yuǎn)落后于CPU計(jì)算速度的高速 增長(即“存儲墻”壁壘),如何加速數(shù)據(jù)流的提供是提高HPC計(jì)算效率的核心關(guān)鍵。目前流行的是越來越復(fù)雜的多級Cache(緩存),需要有創(chuàng)新思路和精巧的新設(shè)計(jì)。革命性的舉措是以存儲為中心來設(shè)計(jì)組織系統(tǒng),讓計(jì)算部件從目前的主導(dǎo)地位變?yōu)閺膶俚匚?。但這一思想提出多年難有突破,也許專用機(jī)上有希望。(3)基于光的高可擴(kuò)展互聯(lián)網(wǎng)絡(luò)技術(shù):HPC內(nèi)大量結(jié)點(diǎn)機(jī)之間的互聯(lián)網(wǎng)絡(luò)是數(shù) 據(jù)流組織及機(jī)間通信的

44、渠道,是HPC效率發(fā)揮的關(guān)鍵。機(jī)間訪問比結(jié)點(diǎn)機(jī)內(nèi)部訪問慢幾個(gè)量級,提高互聯(lián)網(wǎng)絡(luò)的性能(帶寬、時(shí)延)可大為提升HPC的效能,是 HPC機(jī)研制的核心技術(shù)。另一方面,光互連比電互連有許多優(yōu)勢,目前HPC機(jī)機(jī)柜之間已普遍采用光互連。下一步是在機(jī)柜內(nèi)實(shí)現(xiàn)光互連,進(jìn)一步在板內(nèi)、以至 芯片內(nèi)采用光互連。這方面的研究在廣泛深入展開,競爭極為激烈。光傳輸中一個(gè)重大技術(shù)壁壘是交換,目前仍借助電。如能突破“全光交換技術(shù)”,將是信息技術(shù)中的一次革命性的發(fā)展。(4)多層次低功耗控制技術(shù):HPC的高功耗是其發(fā)展的主要障礙之一,是影響成本、節(jié)能、系統(tǒng)可靠性的主要因素,降低功耗是一巨大挑戰(zhàn)。目前接近10的頂級機(jī)功耗達(dá)10兆瓦

45、,若無有效技術(shù)創(chuàng)新,1EFLOPS(即1000PFLOPS)的機(jī)功耗達(dá)1000,是無法接受的??刂?、降低功耗要多層次上下功夫,芯片低功耗是基礎(chǔ),是最重要的舉措。需要工藝、體系結(jié)構(gòu)兩方面的創(chuàng)新。此外控制硬件分而治之(不工作的部件降功耗,休閑),軟硬件結(jié)合控制分而治之(編譯給出部件忙閑狀態(tài),操作系統(tǒng)管理硬件資源)也是重要技術(shù)途徑。(5)面向體系結(jié)構(gòu)的編譯與優(yōu)化技術(shù):大規(guī)模并行是編譯和優(yōu)化的大難題,幾十萬、上百萬個(gè)核的并行編程與優(yōu)化是巨大挑戰(zhàn)。面向體系結(jié)構(gòu),算法、體系結(jié)構(gòu)、編譯三結(jié)合來研究,可能是一條有效的技術(shù)途徑。面向新的體系結(jié)構(gòu),創(chuàng)新新的編程語言、編程平臺、編程和優(yōu)化工具,以隱藏復(fù)雜的體系結(jié)構(gòu),

46、方便用戶使用,提高硬件應(yīng)用效率,是推廣機(jī)應(yīng)用的重要工作。(6)系統(tǒng)可靠穩(wěn)定性:巨大的規(guī)模,巨大的功耗,使HPC機(jī)可靠性大為降低, 以至不可接受。后果是大型算題經(jīng)常中途夭折,得不到結(jié)果,大量浪費(fèi)機(jī)器資源和人力資源。如何把故障部件從系統(tǒng)中隔離出去,進(jìn)行維修,修好再加入系統(tǒng),這一全過程中仍保持系統(tǒng)及用戶題計(jì)算持續(xù)有效運(yùn)行是巨大挑戰(zhàn)。有人已提出“連續(xù)故障”(即系統(tǒng)不斷出故障,穩(wěn)定工作時(shí)間很短)的概念,要求此時(shí)全系統(tǒng)不崩潰,仍能讓聯(lián)機(jī)用戶題有效計(jì)算下去。7 高性能計(jì)算的應(yīng)用在國際高科技競爭日益激烈的今天,高性能計(jì)算技術(shù)已成為體現(xiàn)一個(gè)國家綜合實(shí)力的一種標(biāo)志。最早高性能計(jì)算主要面向科學(xué)計(jì)算、數(shù)值計(jì)算等應(yīng)用,

47、例如:天氣預(yù)報(bào)、航天飛行、地震資料處理、基因匹配與拼接研究等。在飛機(jī)制造方面,為了確保飛行的安全,飛機(jī)在飛行前必須經(jīng)過大量的試驗(yàn)。傳統(tǒng)的飛機(jī)設(shè)計(jì)通過風(fēng)洞實(shí)驗(yàn),模擬飛機(jī)在空中飛行的環(huán)境,這需要逾億元的費(fèi)用,目前我們采用了高性能計(jì)算機(jī)來模擬仿真風(fēng)洞實(shí)驗(yàn),從而精確計(jì)算各種指標(biāo)。這樣不僅使飛機(jī)研發(fā)周期縮短了,而且研發(fā)費(fèi)用也大幅下降。目前隨著信息社會的迅猛發(fā)展,越來越多的領(lǐng)域都涉及到處理海量的數(shù)據(jù)。這些需求迫使高性能計(jì)算已經(jīng)不只是局限在科學(xué)計(jì)算、國家高端科技上,在工業(yè)和商業(yè)領(lǐng)域也不斷地體現(xiàn)其價(jià)值。例如:船舶設(shè)計(jì)、汽車制造、證券指數(shù)計(jì)算、電力安全評估、建筑工程抗震性評估、電磁輻射計(jì)算等。在大型建筑和橋梁的

48、設(shè)計(jì)和施工過程中,設(shè)計(jì)者必須考慮到許多因素, 諸如材料承受力、天氣、溫度、共振等方面,而且這些因素之間是互相關(guān)聯(lián),相互作用的。我們要保證建筑和橋梁在竣工后能夠安全可靠地使用,必須充分分析這些所有因素相互作用對建筑和橋梁產(chǎn)生的所有影響,在這個(gè)分析過程中涉及到大量復(fù)雜的計(jì)算。采用高性能計(jì)算機(jī)輔助設(shè)計(jì),在計(jì)算機(jī)中不僅計(jì)算各個(gè)因素所產(chǎn)生的影響,而且能夠有很明顯的視覺效果。這樣不僅大大的提高了效率,減少了研發(fā)成本,而且設(shè)計(jì)出來的建筑、橋梁不但滿足各項(xiàng)安全指標(biāo),而且還美觀。汽車設(shè)計(jì)方面,上海超級計(jì)算中心把基于大規(guī)模并行計(jì)算機(jī)和并行商業(yè)軟件的計(jì)算資源提供給用戶用于汽車碰撞模擬和汽車外形 CFD模擬,同時(shí)和專

49、業(yè)工程咨詢公司聯(lián)合為汽車設(shè)計(jì)和制造廠家提供汽車設(shè)計(jì)的工程咨詢服務(wù)。滿足了不同用戶、不同層次的需求,對推動中國汽車自主研發(fā)起到了重要作用。例如,目前典型的汽車碰撞計(jì)算題目規(guī)模在50萬到80萬有限元單元。用一般的工作站計(jì)算,需要100多小時(shí),而使用“曙光4000A”的32CPU,可以在4小時(shí)內(nèi)完成計(jì)算,對縮短汽車研發(fā)周期具有重大的作用。航空航天是高性能計(jì)算傳統(tǒng)的應(yīng)用領(lǐng)域。飛機(jī)的外形布局、構(gòu)形都需要通過計(jì)算和試驗(yàn)的方式進(jìn)行篩選、優(yōu)化、評定和驗(yàn)證。傳統(tǒng)的風(fēng)洞試驗(yàn)非常昂貴,而計(jì)算機(jī)模擬可以大大減少試驗(yàn)次數(shù),同時(shí)加快研制進(jìn)程。航空航天設(shè)計(jì)中采用了大量的計(jì)算模擬,這些計(jì)算需要大規(guī)模的計(jì)算機(jī)和商業(yè)程序。上海超

50、級計(jì)算中心自2003年6月以來為上海飛機(jī)設(shè)計(jì)研究所提供支線飛機(jī)的空氣動力學(xué)計(jì)算,計(jì)算規(guī)模達(dá)到了600萬單元,至今共完成幾百個(gè)飛行工況的計(jì)算分析,總機(jī)時(shí)超過了40萬個(gè)CPU小時(shí),獲得的有效數(shù)據(jù)量超過800GB,為支線飛機(jī)的研制提供了重大保障。另一方面的應(yīng)用,飛機(jī)大攻角氣動特性分析需要更大規(guī)模的計(jì)算,上海超級計(jì)算中心利用“曙光4000A”對1300萬網(wǎng)格的飛機(jī)CFD課題進(jìn)行了計(jì)算,這也是目前國內(nèi)該領(lǐng)域最大規(guī)模的計(jì)算。物不僅阻礙節(jié)點(diǎn)移動,也限制了信號的無線傳輸,利用現(xiàn)有算法進(jìn)行分簇,簇的數(shù)目將增多。OCA算法通過設(shè)置備用節(jié)點(diǎn)改善了網(wǎng)絡(luò)的連通性,并且對最小ID算法進(jìn)行改進(jìn)來減少簇的數(shù)目,降低簇的更新,

51、從而適應(yīng)了障礙物環(huán)境下的分簇。 模擬結(jié)果表明OCA算法可以在一定程度上改善網(wǎng)絡(luò)性能。材料設(shè)計(jì)是高性能計(jì)算的重要應(yīng)用領(lǐng)域。紅外光電技術(shù)是世界各國政府共同關(guān)注的戰(zhàn)略性高技術(shù),目前國際上對紅外光電功能材料的研究已從一般性常規(guī)的基本科學(xué)問題轉(zhuǎn)向器件應(yīng)用中高準(zhǔn)確度物理模型的建立與相應(yīng)的特定物性的科學(xué)研究。上海技術(shù)物理研究所利用“曙光 4000A”主要研究紅外光電子器件材料中的缺陷、雜質(zhì)和沉積的量子特征體系對電子結(jié)構(gòu)、聲子結(jié)構(gòu)和電導(dǎo)等物理性質(zhì)的影響,計(jì)算的理論方法基于當(dāng)今廣泛采用的密度函數(shù)理論和線性響應(yīng)理論。在長期的研究中得到了很有價(jià)值的成果。地質(zhì)勘探方面,高性能計(jì)算主要用于研究地震波在地下各種復(fù)雜介質(zhì)中

52、的傳播規(guī)律,通過地球內(nèi)部結(jié)構(gòu)的研究,進(jìn)行工業(yè)油氣勘探和開發(fā)。在求解三維波動方程中龐大的計(jì)算量成為實(shí)際模擬面臨的主要難題,而高性能計(jì)算機(jī)是使用維波動方程實(shí)現(xiàn)地震波傳播數(shù)值模擬的重要保障。同濟(jì)大學(xué)地球物理系和上海超級計(jì)算中心合作,實(shí)現(xiàn)了自行開發(fā)的波動方程數(shù)值模擬程序在超級計(jì)算機(jī)上的并行化,并對國外已完成的案例進(jìn)行了對比計(jì)算,結(jié)果優(yōu)于國外,同時(shí)對大慶油田陸相斷陷模型進(jìn)行了實(shí)際計(jì)算,獲得了重要的地層發(fā)現(xiàn)。市政工程方面,目前地震安全性評價(jià)僅限于對工程場地的地震動參數(shù)進(jìn)行評價(jià),并且僅采用一維等效線性模型計(jì)算土層的地震反應(yīng),沒有考慮地面三維形狀的影響和土層與結(jié)構(gòu)的耦合效應(yīng)??紤]地面三維形狀和土層結(jié)構(gòu)耦合效應(yīng)的特大型工程地震安全性評價(jià)的核心是一個(gè)大規(guī)模非線性結(jié)構(gòu)動力學(xué)正問題,采用普通計(jì)算機(jī)根本無法完成,必須采用大規(guī)模的超級計(jì)算機(jī)。上海交通大學(xué),上海超級計(jì)算中心,上海隧道設(shè)計(jì)院,上海地震工程研究所針對特大型工程地震安全性評價(jià)的要求,設(shè)計(jì)并行算法,開發(fā)并行軟件,利用上海超

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論