計算機04-6724關(guān)于異構(gòu)片上網(wǎng)絡(luò)布圖優(yōu)化問題研究_第1頁
計算機04-6724關(guān)于異構(gòu)片上網(wǎng)絡(luò)布圖優(yōu)化問題研究_第2頁
計算機04-6724關(guān)于異構(gòu)片上網(wǎng)絡(luò)布圖優(yōu)化問題研究_第3頁
計算機04-6724關(guān)于異構(gòu)片上網(wǎng)絡(luò)布圖優(yōu)化問題研究_第4頁
計算機04-6724關(guān)于異構(gòu)片上網(wǎng)絡(luò)布圖優(yōu)化問題研究_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

畢業(yè)設(shè)計()開題報告

2015324學計算機學專計算機科學技班計算題關(guān)于異構(gòu)片上網(wǎng)絡(luò)布圖優(yōu)化問題的研指導教一、與本課題有關(guān)的國內(nèi)外研究情況、課題研究的主要內(nèi)容、目的和意義1.片上網(wǎng)絡(luò)NoC(networkonchip)是一種新的系統(tǒng)體系結(jié)構(gòu),其思想是將計算機網(wǎng)過長、連線延遲、功耗開銷等一系列相關(guān)問題。于此同時,3DIC技術(shù)日趨完善,并備受矚目。因此,將上述兩種技術(shù)融合形成的3DNoC技術(shù)應運而生。其充分結(jié)合了上述技術(shù)各自的優(yōu)勢,用三維架構(gòu)實現(xiàn)多核間互連,以獲得更好的性能。國內(nèi)方面,的何鷗,在他的博士[1]中,過將布圖和其他設(shè)計階段相結(jié)合,長優(yōu)化水平相近的情況下,緩沖器的也是提高互連性能的重要。理工大學的,在他的[2],提出現(xiàn)代布圖規(guī)劃問題已經(jīng)從傳統(tǒng)的、簡單的布圖規(guī)劃問題向具有各種*-ree示法。該優(yōu)化算法可以動態(tài)的將隨機產(chǎn)生的解有效、快速的轉(zhuǎn)化為合法解從而大大提高了搜索效率而不是采用懲罰函數(shù)法復旦大學的在她的[3]中,究了傳統(tǒng)的平面布圖規(guī)劃問題,束條件下的平面布圖規(guī)劃問題以及基于平面布圖規(guī)劃的電源布線。在傳統(tǒng)的平面布圖規(guī)劃問題研究中,提出了模擬退火的加速策略。在模擬退火的加速策略研究中,針對領(lǐng)域構(gòu)造對模擬退火算法的影響進行研究分析,并在此基礎(chǔ)上根約束的平面布圖規(guī)劃算法以及考慮模塊電壓降的平面布圖規(guī)劃算法。理工大學的,在他的[4]中,出了基于傳遞規(guī)約無環(huán)圖的三維布圖規(guī)劃技術(shù)3-TR可以根據(jù)特定應用優(yōu)化三維片上網(wǎng)絡(luò)中模塊的布局,從而使功耗更低文中3D-TRG三維布圖規(guī)劃表示法可以表示幾乎所有的布局結(jié)構(gòu),而且具有表達兩兩模他的[5]中,提出了布圖規(guī)劃與多供電網(wǎng)絡(luò)的協(xié)同設(shè)計方法,將電源網(wǎng)絡(luò)電壓降的分析步驟驗結(jié)果表明算法在優(yōu)化面積、線長的基礎(chǔ)上,能有效降低模塊溫度。個在層內(nèi)通信,這樣使的通信性能有了很大的提高。。。vnoc3,有一定的編程基礎(chǔ)及查閱國內(nèi)外相關(guān)領(lǐng)域文獻的能力。意指導教師年月日學院意主管年月日工業(yè)大學畢業(yè)設(shè)計 )成績考核學學院名專業(yè)班題1.畢業(yè)設(shè)計)指導教師評語及成績成績指導教師簽字年月日2.畢業(yè)設(shè)計)答辯評語及成績成績答辯(或組長)簽字年月日3.畢業(yè)設(shè)計)總成績a.b.c.Withtherapiddevelopmentofintegratedcircuitmanufacturingprocesses,problemofpoorsystemscalabilitythatSoC(SystemonChip)faceshas increasinglyprominent.Tosolvetheseproblems,networkonchipNoC(NetworkonChip)emergedasanewkindofon-chipcommunicationmode.Withthedevelopmentofnetworkonchip,itsresearchhasexpandedfromtwo-dimensionaltothree-dimensionalspace.3Dnetworkonchipisacollectionof3Dintegrationtechnologyandnetworkonchip,anditinheritstheiradvantagesandmeetsthedevelopmenttrendofchipfunctionaldiversity.Thisdissertationpresentsanimprovedfloorplanningoptimizationalgorithmbasedonsimulatedannealingalgorithm(ImprovedSimulatedAnnealing,hereinafterreferredtoasISAalgorithm)toreplacetheoriginalfloorplanningoptimizationalgorithmbasedonsimulatedannealingalgorithm(SimulatedAnnealing,hereinafterreferredtoasSAalgorithm)tomakeitmoreapplicabletothethree-dimensionalnetworkonchipsimulation.ThisdissertationdescribestheISAalgorithm’simprovementideasandusesanexisting3Dnetworkonchipsimulatortogetonasimulationtest,theresultsshowthattheproposedISAalgorithmisbetterthantheoriginalSAalgorithmanditismoresuitableforsimulationofthree-dimensionalnetworkonchip.Keywords:SystemonChip;3DNetworkonChip;FloorplanningOptimization;SimulatedAnnealingAlgorithm本章小 第五章結(jié)論和展 結(jié) 展 參考文 附 謝 1.1.2本課題研究的目的和意隨著集成電路制造工藝的飛速發(fā)展,IP核數(shù)目的不斷上升,單個的集成度也越來越大[16]。盡管SoC遇到的可擴展性差、時鐘同步比較、總線結(jié)構(gòu)資源利用率較問題,都已經(jīng)被2DNoC解決,但是信號傳輸產(chǎn)生延遲和失真、面積增大以、功耗開銷以及散熱等難題依然沒有得到有效的解決。隨著3D集成技術(shù)的產(chǎn)生,改進了的平面布局,減小了的面積與功耗開銷。因此,3DNoCNoC3DNoC中,IP核數(shù)目眾多,因此合理的布局IP結(jié)點將具有降低延時、減小面積、減小功三維片上網(wǎng)絡(luò)國內(nèi)外研究現(xiàn)國內(nèi)研究現(xiàn)2003年才開始的,而對三維片上網(wǎng)以看出,最近幾年國家自然科學基金對三維片上網(wǎng)絡(luò)資助的力度越來越,。的何鷗在其博士[18]中,針對片上網(wǎng)絡(luò)傳統(tǒng)總線的互連優(yōu)化,他提出把緩沖器到中,這樣可以提高互連性能。而且他還利用最小度優(yōu)先算法,把布圖的拓撲結(jié)構(gòu)和模塊之間的幾何結(jié)構(gòu)都進行了優(yōu)化。隨著IP核數(shù)量的增加,結(jié)點之間的通信量也逐漸增加,針對總線如何布線才能提高系統(tǒng)互連的問題一個新的算法,在算法中增加擾動函數(shù),對布圖優(yōu)化后產(chǎn)生的結(jié)果進行擾動,從而進一步提高互連性能。復旦大學的,在其碩士[19]中,針對傳統(tǒng)布局規(guī)劃問題、電源布線問題和布局規(guī)劃中新的約束條件,分別提出了模擬退火加速策略、快速分析電源網(wǎng)絡(luò)的計算方法以及SoC約束的平面布圖規(guī)劃算法。理工大學的,在其[20]中針對片上網(wǎng)布局,進一步降低了片上網(wǎng)絡(luò)的總功耗,提升了片上網(wǎng)絡(luò)的吞吐量理工大學的,在其[21]中,針對復雜的、帶有各種約束的布圖規(guī)劃問題,,。。使空間更加的連續(xù)。而且一種新的優(yōu)化算法,可以把通過擾動策略產(chǎn)生的劃分方法被他提出來了。第二階段,為了減輕計算復雜度,他提出轉(zhuǎn)換器和網(wǎng)絡(luò)接口時,分別運用啟發(fā)式方法和最小代價流方法大學的,在其[23]中提出了一個分層基于分布式群集的3DNoC架構(gòu),以提高3DNoC的整體性能。該體系結(jié)構(gòu)包括一個全局網(wǎng)絡(luò)和集群兩部分,使用分組交的,在其[24]中,針對TurnModel模型設(shè)計了無死鎖的確定性的路由算法,實驗表明,該算法由于避免了以前經(jīng)典的XY路由算在一個相同學的,在其博士[25]中,針對片上網(wǎng)絡(luò)拓撲結(jié)構(gòu)和通信方法兩個方向3DNoC3DNoC上的拓撲結(jié)構(gòu),并針對每種架構(gòu)設(shè)計出與之對應的路由算法。。1-13DNoC三維片上網(wǎng)絡(luò)關(guān)鍵設(shè)2015-2018-2015-2018-2014-熱/究2016-基于多級裂變2013-學2016-三維片上網(wǎng)絡(luò)體系結(jié)2012-2015-2012-2014-2012-TSV學2014-2011-學2013-三維片上網(wǎng)絡(luò)(3DNoC)2009-2011-國外研究現(xiàn)由于3DNoC的研究起步較晚,所以有關(guān)3DNoC的第一篇[26]在2005年,由KangminLee、Se-JoongLee等人的。目前在國外,僅僅有十幾個團隊在研究3DNoC。這些團隊主要集中在的一些大學,如加利福尼亞大學、大學、州立大學等。VitordePaulo,CristinelAbabei在其[27]2.5D的片上網(wǎng)絡(luò)結(jié)構(gòu),這種結(jié)構(gòu)可以在異構(gòu)的平面布局VitordePaulo,CristinelAbabei在其另外一篇[28]中,提出了3D片上網(wǎng)絡(luò)結(jié)構(gòu),這種結(jié)構(gòu)可以在一個分離層或者在一個異構(gòu)的平面布局層利用同構(gòu)的規(guī)則的mesh網(wǎng)絡(luò)。Srinivasan.K,Chatha.K.S和Konjevod.G在其[29]中提出了一種混合整數(shù)線NoC架構(gòu),這種技術(shù)的優(yōu)化目的是減小功率消耗,為此提出了一Yuan-LongJeang3DNoC的拓撲結(jié)構(gòu)設(shè)計方面做了很多的貢獻,他出,使結(jié)點之間的通信速度加快了,功耗也減小了[30]。WalidLafi等人針對其他3Dmesh結(jié)構(gòu)下吞吐量較小、延遲較大等問題,在[31]中提出了一種新的路大的提高。K.Somasundaram在研究網(wǎng)絡(luò)拓撲和路由技術(shù)上做出了很大貢獻,在耗和分組延時等方面表明作者兩種架構(gòu)比起現(xiàn)有的經(jīng)典架構(gòu)性能上有顯著的改善。SrinivasanMuraliGiovanniDeMicheli3DNoCNMAP種單個路徑路由和分段路由選擇[33]ParthaPratimPande等人在關(guān)于3DNoC的低功耗編碼方式上做出了很大貢獻,他們在[34]中表明減少能源消耗的最重要一點就是要在系統(tǒng)設(shè)計階段解決地址完整性的問題,于是他們把CAC和MECs聯(lián)系起來提出來一種支持糾錯和能力強的編碼方式與原來的2DNoC相應的方式比較,這種方式很大程度上減小了功耗。主要內(nèi)容與文章結(jié)、隨著超大規(guī)模集成電路的發(fā)展,集成電路的復雜度越來越高,IP核的數(shù)目不斷增加,二維片上網(wǎng)絡(luò)遇到了功耗增大、散熱面積增大等一系列難此三維片上網(wǎng)絡(luò)引起了國內(nèi)外眾多科研機構(gòu)的由于三維片上網(wǎng)絡(luò)的研究起模擬退火算法布局優(yōu)化算法。通過利用NorthDakotaState大學的教授、第三章介紹了改進后的模擬退火算法主要介紹了改進的方案的第二章遺傳算遺傳算法的20世紀60年代末70年代初密歇根大學的JohnH.Holland教授及其學生首次提出了遺傳算法。在《自然與人工系統(tǒng)的自適應性》一書中,Holland系DeJongGoldberg遺傳算法的基本思得適應值最好的作為問題的最優(yōu)解。遺傳算法的具體步驟和流程用來表示種群內(nèi)的每個對生存環(huán)境的適應度也就是說每個都會有一個規(guī)定適應值為非負這是為了能夠直接的將適值函數(shù)與群體內(nèi)的優(yōu)劣性聯(lián)系起來,所以在任何情況下,希望適應值越大越好代之后,得到的適應值最好的對應的解即被認作是問題的最優(yōu)解。2-12-1粒子群優(yōu)化算粒子群優(yōu)化算法的Reynolds和Heppner兩位動物學家在1987年和1990年的中都關(guān)保證了這些同步的行為。后來,KennedyEberhartHepper的模仿鳥群的模粒子群優(yōu)化算法的基本思D維搜索空間中飛行。每個粒子有一個速度值來決定他們的位置(狀態(tài),也粒子群優(yōu)化算法的具體步第五步:根據(jù)公式(2.1)和(2.2)本章小本章第一節(jié)先是介紹了遺傳算法的,它是由JohnH.Holland教授及其學生首次,其次介紹了遺傳算法的基本思想,最好寫出了具體操作的步驟,并給出了流程圖;第二節(jié)先是介紹了粒子群優(yōu)化算法的,其次介紹了粒子群第三 一種改進的基于模擬退火的三維片上網(wǎng)絡(luò)布局算一般的模擬退火算模擬退火算法模擬退火算法(SimulatedAnnealingSA算法)是一種隨機性求解的方法,主要用于尋找組合優(yōu)化問題的最優(yōu)解[35]。SAMetropolis[36]在二十年代,在求解組合最優(yōu)化問題時,Kirkpatrick[37]SA引入到了該問題中,從而SA算法。模擬退火算法的基本思MetropolisSA算法。因此,我SA算法的思想就是通過模仿熱力學中的退火過程,使其與一般優(yōu)化問題結(jié)SAMetropolis準則。MetropolisSAMetropolisTi產(chǎn)生一個擾動,通過狀態(tài)函數(shù)產(chǎn)生一個新的狀jMiMjMi>Mj,就把新狀態(tài)作為當前的狀態(tài),否則的話以一定的概率來判斷是否把新狀態(tài)作為當前的狀態(tài)。SA算法Metropolis準則的抽樣策略,在每個溫SA算法是一種啟發(fā)式的隨機搜索方法[38],在搜索策略上與傳統(tǒng)的隨機搜索方模擬退火算法的具體步驟和流程第一步:通過擾動函數(shù)產(chǎn)生一個初始解x0f(x0),并設(shè)置一個初始控制溫度T0第二步:在可行解空間中再通過擾動函數(shù)次隨機產(chǎn)生一個新解x1,并計算其f(x1),算出△f=f(x0)-f(x1)。SA3-1改進的模擬退火算改進策(1)maxstep(maxstep是一個經(jīng)過多次實驗取得的最(2)(3)改進后的模擬退火算法的具體步驟和流程第一步:通過擾動函數(shù)產(chǎn)生一個初始解x0,通過目標函數(shù)計算它的對應值f(x0)T0。f(x1),算出△f=f(x0)-f(x1),轉(zhuǎn)向第四步。f(x1),然后取前一個溫度找到的最優(yōu)解xbest,算出 =f(xbest)-f(x1)。3-1SA<準則判斷是否接受,若接受,則把x1作為當前解,設(shè)置q=0,f=1,若不接受,則讓x0繼續(xù)作為當前解,且+1,qflag==0,則重ISA3-2本章小本章第一節(jié)介紹了模擬退火算法的和發(fā)展歷程,該算法是由Metropolis首先,然后Kirkpatrick將該算法首次用于實際問題中;其次詳細介紹了3-2ISA第四章仿真實驗設(shè)C仿真系統(tǒng)進行的,其主要原因是以現(xiàn)在的環(huán)境來看,專門設(shè)計一個實際的來驗證算法的優(yōu)劣是不太現(xiàn)實的。特別是隨著集成電路制造工藝技術(shù)的發(fā)展IP核數(shù)量不斷增加3DC架構(gòu)的設(shè)計異常復雜設(shè)計出一個3D所花的時間較長而且設(shè)計的成本較高。因此,本文采用的是由aeCristieli研發(fā)27的仿真器來檢驗本文所ISA算法的優(yōu)劣。vnoc3是一個用來仿真三維片上網(wǎng)絡(luò)架構(gòu)的仿真器。Software.html這個提供了這個仿真器的源程序該仿真器是由CristinelAbabei教授經(jīng)過幾年的努力C++語言在Linux系統(tǒng)下開發(fā)的。它可以在Fedora8中運行,也可以在Windows中運行。CristinelAbabei教授把該仿真器的源代碼放在了個人上,鼓勵其他研究者對其進行修改,期望進一步改進該仿真器。vnoc3的運行環(huán)境配4-1所示。4-1vnoc3使用的平臺的參數(shù)選 參數(shù)CPU配置

(R)Core(TM)2QuadCPUQ9400@ATIRadeonHD4650VMwareWorkstation8Fedoragcc4.6.020110428RedHat4.6.0-6)6個測試用4-2IP核的數(shù)量和直接拓撲結(jié)構(gòu)的大小。CristinelAbabeiMCNC測試用例的啟發(fā),然后構(gòu)造出這六個4-2IP核的比核的比R8vnoc3是通過指令:./sfrafile:(testfile)cycles:(int)warmup:(int)[Options...]4-3中,作者列舉了一些常用令參數(shù)及其含義。4-3vnoc3參 參數(shù)的意義與取值范

160架構(gòu)的選擇,2.5D代表兩層架構(gòu),3D代表三層架構(gòu)disabled調(diào)整注入負載(10%-100%10的倍數(shù)增加),100%在注入負載的范圍(10%-100%)disabled緩存尺寸的范圍(1x5x)disabled實驗結(jié)果分為了驗證本文ISA算法是否比原有的SA算法在性能上更加優(yōu)化作vnoc3CPU運行時間(CPUprocessprtime(s)、平均微片延遲(averageflitlatency(s))和吞吐量(throughput(flit/s))進行了統(tǒng)計,通過比較這面的數(shù)據(jù)變化來衡量算法的優(yōu)劣。對于同一條指令,CPU運行時間越短,平均微片延遲越小,吞擬信道這來觀察兩個算法在上述面性能的情況為了把實驗結(jié)果的誤差降到而且本文所有的實驗都是在循環(huán)1000次之后,才開始收集實驗數(shù)據(jù)的,設(shè)置改變測試用CristinelAbabeivnoc3提供的六個測試用apte,xeroxhpIP核數(shù)量少且拓撲結(jié)構(gòu)較小,因此決apte,xeroxhpIP核數(shù)量較少的網(wǎng)絡(luò)ami25,ami33ami49IP核數(shù)量多且拓撲結(jié)構(gòu)ami25,ami33ami49IP核數(shù)候,應該保證其他參數(shù)不變,這里作者選擇注入負載為50%和100%兩種,虛擬CPU4-1,4-24-1100%4-250%4-14-2IPapte、xerox中,ISASACPU運行時間上沒有太大的變化,基本上趨于IPIP10的時候,本文提ISACPUSAIP核數(shù)量越多,ISACPU運行時間上的優(yōu)勢就越突出。所以作者得出結(jié)CPU運行時間這個性能上,ISASAISA算法IP核數(shù)量多且拓撲結(jié)構(gòu)較大的網(wǎng)絡(luò)架構(gòu)。4-34-44-3100%IP核數(shù)量較少時,即在aptexeroxIP核數(shù)量稍微增加時,hp、ami25中,ISASAIP核數(shù)33ami33ami49中,SAISA4-3100%4-450%IP核數(shù)量稍微增加時,ISASAIP核數(shù)量較少或較多時,即在測試用4-450%xerox、ami33、ami49,SAISA算法。所以得出結(jié)論,在平均微片延遲這個性能上,本文ISA算法比SA算法更適用于IP4-54-64-5100%通過觀察圖4-54-6,可以看出,注入負載為50%的時候IP核數(shù)量較吐量高于SA算法。當IP核數(shù)量大于33個時,兩種算法的吞吐量沒有明顯的變化,趨于穩(wěn)定。注入負載為100%的時候,當IP核數(shù)量較少時,ISA算法的吞吐量略低于SA算法的吞吐量。隨著IP核數(shù)量增加,ISA算法的吞吐量高于SA算IP49個時,兩種算法的吞吐量沒有明顯的變化。SAIP核數(shù)量較少或較多的測試用例中,兩種算法的差距不明顯。由此表明本文ISA算法比原有的SA算法更適用于IP核數(shù)量適4-650%改變虛擬信CPU運行時間、平均微片延遲和吞吐量方面的變化。4-7IPaptexeroxhpIP核數(shù)量較少的一組測試用例隨著虛擬信道CPU4-7ami25、ami33ami49IP核數(shù)量較多的一組測試用例隨著虛擬信道數(shù)的變化,兩種CPU4-8所示。4-8IP4-7aptexerox在仿真時,ISA算法的運SAhp在仿真時,ISA算法的運行時間明顯小SA4-8看出,IPami25、ami33和ISACPUCPU運行時間測試用例aptexerox和hp,即IP核數(shù)量較少的一組測試用例隨著虛擬信道數(shù)的變化,兩種算法平均延遲的變化比較如圖4-9所示。測試用例ami25、ami33ami49IP核數(shù)量較多的一組測試用例隨著虛擬信道數(shù)的變化,兩種算法4-10所示。觀察圖4-9,可以看出,測試用例apte和xerox在仿真時,隨著虛擬信道數(shù)的增加,ISASAhp在4-9IP4-10ami25ISA4-10IP算法的平均延遲略低于SA算法的平均延遲,而測試用例ami33在仿真時,兩種IP核數(shù)量最多的測試SA算法的。測試用例aptexerox和hp,即IP核數(shù)量較少的一組測試用例隨著虛擬信道數(shù)的變化,兩種算法吞吐量的變化比較如圖4-11所示。測試用例ami25、ami33ami49IP核數(shù)量較多的一組測試用例隨著虛擬信道數(shù)的變化,兩種算法4-12所示。4-11IP4-11可以看出,隨著虛擬信道數(shù)的增加,IP核數(shù)量較少的三個測試用apte、xeroxhp的吞吐量在逐漸減小。對于aptexerox這兩個測試用例而言,在每一個虛擬信道上,ISASAhp這個25時,SAISA算法,而在其他虛擬信道,ISA算法在吞吐量方面優(yōu)于SA算法。從圖4-12看出,隨著虛擬漸減小。對于ami25和ami49這兩個測試用例而言,在每一個虛擬信道上,ISASAami3324時,SAISA算法,在其他剩余的虛擬信道上,ISASA算法。4-12IP平均微片延遲和吞吐量這三個方面的性能上,ISASA算法好,特別是在CPU運行時間這個性能上,ISA算法的優(yōu)化效果更加明顯。改變注入負20%100%CPU運行aptexeroxhpIP核數(shù)量較少的一組測試用例隨著注入負載CPU4-13ami25、ami33ami49IP核數(shù)量較多的一組測試用例隨著注入負載量的增加,兩種CPU4-14所示。4-13IP4-134-14可以看出,對于每一個測試用例而言,隨著注入負載的增加,CPU運行時間的變化基本不明顯,趨于平穩(wěn)。ISAapte4-14IPxerox、ami25ami33SAISAami49SAaptexeroxhpIP核數(shù)量較少的一組測試用例隨著注入負載4-15ami25、ami33ami49IP核數(shù)量較多的一組測試用例隨著注入負載量的增加,兩種4-16所示。4-15IP4-154-16,可以看出,注入負載的多少對于算法的平均延遲影響hp在注入負載20%增加到70%的時候,平均延遲緩慢增加,增長率很低,而注入負載達70%hpISAhp的平SA4-16上來看,IP核數(shù)量較多的三個測試用例在20%60%時候,平均延遲增長平緩,且增長率低。當注入負載60%ami49,增長最快。測試用例ami25和ami33在負載超過的平均延遲上,ISA算法的性能略優(yōu)于SA算法。而測試用例ami49在超過的平均延遲上,SA算法ISA算法。所以,從總體來看,ISA算法在改變注入負載影響平均延SA算法。4-16IP4-17ami25、4-17IPami49IP核數(shù)量較少多的一組測試用例隨著注入負載量的增加,兩種算4-18所示.4-18IP4-174-18,可以看出,總體趨勢上,隨著注入負載量的增加,吞吐量呈現(xiàn)逐漸上升的趨勢。觀察圖4-17,可以看出,IP核數(shù)量較少的三個測試ISASA4-18,可以看出,測試用例ami25ISASAami33和ami49,體的趨勢,得出結(jié)論,隨著注入負載量的增加,ISASA算CPU運行時間、平均微片延遲和吞吐量這三個方面的性能上ISA算法比SA算法好特別是在CPU運行時間這個性能上,ISA算法的優(yōu)化效果更加明顯。改變緩存尺測試用例aptexeroxhp隨著緩存尺寸的增加ISA算法和SA關(guān)于平均延遲的變化比較如圖4-19所示。測試用例ami25、ami33ami49隨著緩存尺寸的ISASA4-20所示。4-19IP4-194-204-20IP4-19上來看,IPaptexerox下的兩種算法的平均延遲幾乎是沒有變化的。但是測試用例hp下的ISA算法的平均延遲明顯低于SA算法。從圖4-20來看,測試用例ami25下的ISA算法的平均延遲低于SA算法。測試用例ami33下的兩種算法的平均延遲幾乎是一樣的。而測試用例ami49下的ISA算法的平均延遲略高于SA算法。因此,從總體上來看,ISA算法在IPSA算法。測試用例aptexeroxhp隨著緩存尺寸的增加ISA算法和SA關(guān)于吞吐量ISASA4-22所示。4-21IP4-214-22,可以看出,對于同一個測試用例而言,從總體的趨4-21來看,IP核數(shù)ISASA4-22來看,ami25ISASAami33和ami49下的兩種算法的吞吐量基本保持不變。因此,從總體上來看,ISA算法在SA算法。4-22IP這兩個方面的性能上,ISASA算法好。本章小CPU運行時第五章結(jié)本文利用vnoc3仿真器,對兩種算法進行了仿真實驗,通過收集到的CPU運行時間、平均微片延遲和吞吐量這三個方面展文用到的六個測試用例,最大的IP核數(shù)量是49個,而現(xiàn)在的IP核數(shù)量已經(jīng)達到了數(shù)億個,為了使實驗得出的結(jié)論更加具有說服力,增加測試用例的IP總而言之,集成電路制造工藝的迅速發(fā)展,IP核數(shù)量的不斷增加,使得芯3DNoC技術(shù)也會得到越來越快的發(fā)展。參考文 .3D片上網(wǎng)絡(luò)拓撲與路由的研究[D].西安電子科技大學, .SoC技術(shù)簡述[J].水利水電學院學報,2006, 夏國宏,.SoC技術(shù)及其相關(guān)問題的探討[J].黃石理工學院學報,2012,28(3):6-:: .片上網(wǎng)絡(luò)及路由器研究[D].華東師范大學,YeTT,BeniniL,DeMicheliG.PacketizedOn-ChipInterconnectCommunicationysisForMpsoc[J].Proc.DesignAutomationandTestinEurope,2003:10344.WingardD.MicroNetwork-BasedIntegrationforSOCs[J].ProceedingsofDesignAutomationConference,2001:673--677.FurberS,BainbridgeJ.FuturetrendsinSoCinterconnect[C]//VLSIDesign,AutomationandTest,2005.(VLSI-TSA-DAT).2005IEEEVLSI-TSAInternationalSymposiumon.IEEE,2005:183-186.BeniniL,MicheliGD.NetworksonChips:aneradigmforcomponent-basedMPSoCdesign[J].ProcMpsoc,2004.DallyWJ,TowlesB.RoutePackets,NotWires:On-ChipInterconnectionNetworks[C]//DesignAutomationConference,Proceedings.IEEE,2001:684-689..3D-Mesh片上網(wǎng)絡(luò)服務(wù)質(zhì)量保證機制研究[D].電子科技大學LeeHHS,ChakrabartyK.TestChallengesfor3DIntegratedCircuits[J].Design&TestofComputersIEEE,2009,26(5):26-35.LiuCC,ChenJH,ManoharR,etal.Mapsystem-on-chipdesignsfrom2-Dto3-DICs[C]//CircuitsandSystems,2005.ISCAS2005.IEEEInternationalSymposiumon.IEEE,2005:2939-2942Vol.3..低功耗3DNoC綜合設(shè)計優(yōu)化算法研究[D].理工大學,李磊.片上網(wǎng)絡(luò)NoC的通信研究[D].浙江大學電氣,.三維片上網(wǎng)絡(luò)拓撲結(jié)構(gòu)與容錯機制研究[D].航空航天大學,何鷗.互連驅(qū)動的片上系統(tǒng)布圖規(guī)劃算法的研究[D].,SoC平面布圖規(guī)劃算法的若干研究[D].復旦大學.基于布圖規(guī)劃的三維片上網(wǎng)絡(luò)功耗優(yōu)化與仿真[D].理工大學,.帶約束的VLSI布圖規(guī)劃算法的研究[D].理工大學,宋斌杰.基于劃分的低功耗NoC設(shè)計算法[D].理工大學,.3DNoC研究[D].大學,.NoC路由算法及仿真模型的設(shè)計與研究[D].合肥工業(yè)大學,2009.::.面向?qū)崟r復雜系統(tǒng)的片上網(wǎng)絡(luò)架構(gòu)及技術(shù)研究[D].電子科技大學,LeeK,LeeSJ,KimD,etal.Networks-on-chipandNetworks-in-PackageforHigh-PerformanceSoCPlatforms[C]//AsianSolid-StateCircuitsConference,2005.IEEE,2005:485-488.PauloVD,AbabeiC.AFrameworkfor2.5DNoCExplorationUsingHomogeneousNetworksoverHeterogeneousFloorplans[C]ReconfigurableComputingandFPGAs,InternationalConferenceon.IEEE,2009:267-272.PauloVD,AbabeiC.3DNetwork-on-ChipArchitecturesUsingHomogeneousMeshesandHeterogeneousFloorplans[J].InternationalJournalofReconfigurableComputing,2010,SrinivasanK,ChathaKS,KonjevodG.Linear-programming-basedtechniquesforsynthesisofnetwork-on-chiparchitectures[J].IEEETransactionsonVeryLargeScaleIntegrationSystems,2006,14(4):407-420.JeangYL,WeyTS,WangHY,etal.Mesh-TreeArchitectureforNetwork-on-ChipDesign[C]ProceedingsoftheSecondInternationalConferenceonInnovativeComputing,InformatioandControl.IEEEComputerSociety,2007:262.LafiW,LattardD,JerrayaA.Anefficienthierarchicalrouterforlarge3DNoCs[C]RapidSystemPrototy(RSP),201021stIEEEInternationalSymposiumon.IEEE,2010:1-ViswanathanN,ParamasivamK,SomasundaramK.Performanceysisofclusterbased3DroutingalgorithmsforNoC[C]RecentAdvancesinInligentComputationalSystems(RAICS),2011IEEE.IEEE,2011:157-162. MuraliS,DeMicheliG.Bandwidth-constrainedmapofcoresontoNoCarchitectures[C]Design,AutomationandTestinEuropeConferenceandExhibition,2004.Proceedings.IEEE,2004:896-901Vol.2.PandePP,GangulA,FeeroB,etal.ApplicabilityofEnergyEfficientCodingMethodologytoAddressSignalIntegrityin3DNoCFabrics[C]Proceedingsofthe13thIEEEInternationalOn-LineTestingSymposium.IEEEComputerSociety,2007:161-166.MetropolisN,RosenbluthAW,Rosenbluth.MN,lerAH,lerE:Equationofstatecalculationsbyfastcomputingmachines[J].JournalofChemicalPhysics,1953,KirkpatrickS,JrGC,Mp.V.OptimizationbySimulatedAnnealing[J].Science,1983,.模擬退火算法在Web服務(wù)中的應用[J].計算機技術(shù)與發(fā)展,2006,ZeineldinRA.Animprovedsimulatedannealingapproachforsolvingtheconstrainedoptimizationproblems[C]//InformaticsandSystems(INFOS),20128thInternationalConferenceon.IEEE,2012:BIO-27-BIO-31.,.一種改進的模擬退火算法[J].計算機技術(shù)與發(fā)展,2009,19(6):32-::.基于3D-MESH的CMP片上網(wǎng)絡(luò)方法研究[D].工業(yè)大學,附錄畢設(shè)期間參與科研項目和研究成參與科研項 參與縱向課題國家自然科學(基于多級裂變模型的3DNoC拓撲結(jié)構(gòu)的研究,61272006畢設(shè)期間研究成 基于改進模擬退火算法異構(gòu)三維片上網(wǎng)絡(luò)的布圖優(yōu)化。理論計算機科附錄Ⅱ文獻翻英文原Withtherapiddevelopmentofintegratedcircuitmanufacturingprocess,thenumberofIPcoreofeachchiphasreachedbillionsandhasbeengrowing,two-dimensionalnetworkonchipsolvesaseriesofproblemsthatsystemonchipfacesthesynchronousglobalandsoon,buttwo-dimensionalnetworkonchip’slayoutisconfinedbyflat,hampersthepromotionofsystemperformanceandscale,andcannotavoidpoweroverhead、wiringdelayandotherrelatedissues.Becausethree-dimensionalnetworkonchip’sstructureisvertical,itsadvantagescan challengesfacingtwo-dimensionalnetworkonchip,three-dimensionalnetworkonchiphasadvantagesofanti-jammingcapability、lowerlatency、reducingpowerconsumption,、reducingtheumpathlengthandsoon.Asaresultofbiggeradvantages,three-dimensionalnetworkonchipquicklyattractestheattentionofdomesticandforeignresearchinstitutions.Abroad,VitordePaulo,CristinelAbabeiVitorproposedanew2.5DNoCarchitecturethatusesahomogeneousnetworkononelayerontopofaheterogeneousfloorplanninglayer.Thepurposeofthisapproachistoexploitthebenefitsofcompactheterogeneousfloorplansandregularmeshnetworksthroughanautomateddesignspaceexplorationprocedure.Andinanotherpaper,VitordePaulo,CristinelAbabeiVitorproposednew3D2-layerand3-layerNoCarchitecturesthatutilizehomogeneousregularmeshnetworksonaseparatelayerandoneortwoheterogeneousfloorplanninglayers.Srinivasan.K,Chatha.K.SandKonjevod.GpresentednovelmixedintegerlinearprogrammingformulationsforsynthesisofcustomNoCarchitectures.Theoptimizationobjectiveofthetechniquesistominimizethepowerconsumptionsubjecttotheperformanceconstraints.Theypresentedatwo-stageapproachforsolvingthecustomNoCsynthesisproblem.Inthestage,theyaddressedthefloorplanningproblemthatdeterminesthelocationsofthevariouscoresandtherouters.Inthesecondstage,theyutilizedthefloorplanfromthestagetogeneratetopologyoftheNoCandtheroutesforthevarioustrafficDomestically,HeOu,whoisastudentofTsinghuaUnversity,inhisdoctoralpaper,withrespecttointerconnectiontooptimizethenetworkoftraditionalnetworkonchipbus,presentedcorrespondingoptimizationalgorithms.Againstthetraditionallineofnetworkoptimizationproblems,hewasinspiredbythoughtofsolutionoftheequation.Anewsetboundariesfloorplanningalgorithmshavebeenproposed.Forcasessimilarlinelengthoptimizationlevel,heproposedtheinsertionbuffer,whichcouldimproveinterconnectperformance.ChenShanshan,whoisastudentofFudanUnversity,inhermaster’spaper,accordingtotraditionalfloorplanningproblem,powercablingproblemsandfloorplanninginthenewconstraintsissues,proposedtoacceleratethestrategysimulatedannealing,rapidysisandcalculationmethodofthesupplynetworkandfloorplanningalgorithmconstrainedSoC.ZhengFei,whoisastudentofWuhanUniversityofTechnology,inhismaster’spaper,accordingtonetworkonchip’sspecificapplication,proposedthree-dimensionalfloorplanning’stechniques,therebyreducingpowerconsumption.Thispointofview,althoughthecountryhasbeguntostudythree-dimensionalnetworkonchip’sfloorplanning,thisissuestartedlate,lessresearch,whichshowsthree-dimensionalnetworkofchip’sfloorplanninghasalotofresearchspacetobeexcavated.Therefore,onthebasisoftheexistingsimulatedannealing,thispaperimprovesthethreeaspects.Thesesolutionsaretoincreasecomparisonoftheoptimalsolution,setthresholdsandwarmed.Thusimprovedoptimizationalgorithmbasedonsimulatedannealingfloorplanningreplacedtheoriginaloptimizationalgorithmbasedonsimulatedannealingfloorplanning.Thepartdescribesthetraditionalsimulatedannealingalgorithm,thesecondpartintroducestheimprovedmethod,thethirdpartconcludesbysimulation,thefourthpartistheconclusion.Simulatedannealingalgorithmisacommonrandomsearchalgorithmandisanextensionofthelocalsearchalgorithm.SAispresentedbyMetropolisin1953,andin1983,SAisappliedincombinatorialoptimizationproblemsbyKirkpatrick,whichreallycreatedthemodernSAalgorithm.ThebasicideaofSAalgorithmderivedfromthermodynamicsannealingprocess. Thermodynamicsannealingprocessisdividedintoheating,isothermalandcooling.Heatingprocessisheatingthesolid.Afteritreachesacertaintemperature,allmoleculeswillmoveinthestatespace.Distributionofmoleculesisfromtheorderedstateintoastateofdisorder,sothatsubsequentcoolingprocessstartswithacertainequilibrium.Isothermalprocessistoensurethatthesystemineachofthetemperaturereachesequilibrium,andreachessolidgroundstateeventually.Thecoolingprocessgraduallydecreasesfromasolidhightolowtemperature,finalcoolingprocess.Inthisprocess,thesystem’senergygraduallydecreases,molecularmovementgraduallyesordered,moleculesareinalignedstatearrangemen,solidreachesastableSAalgorithm’sthoughtisimitatinghermodynamicsannealingprocess,sothatitisgenerallyformedbycombiningtheoptimizationproblem.BeforeintroducingSAalgorithm’sconcretesteps,IwillintroduceMetropoliscriterionly.In1953,MetropoliscriterionisproposedbyMetropolis,itisaimportancesamplingmethod,andisbasedontheprobabilityofacceptingthenewstate.Specifically,attemperatureT,currentstateigeneratesnewstatej,theirenergyareEiandEj.IfEi>Ej,acceptthenewstate,otherwiseacceptthenewstatejbycertainprobability.ThebasicideaofSAalgorithmisgivenaninitialhightemperature,SAsearchesrandomlyinthesolutionspacebyusingMetropoliscriterionsamplingstrategy.Withthetemperaturedropped,SArepeatessamplingprocess.Finally,SAfindsglobaloptimalsolutions.ThuswecanknowSAalgorithmisaheuristicrandomsearethod.SAalgorithmfollowsspecificThestep:selectaninitialsolutionx0infeasiblesolutionspace,computeitsobjectivefunction’svaluef(x0),andselecttheinitialcontroltemperatureT0.Thesecondstep:generaterandomlyanewsolutionx1infeasiblesolutionspace,andcalculatethecorrespondingobjectivefunction’svaluef(x1),calculate△f=Thethirdstep:If△f>0,thenacceptthenewsolutions,if△f<0,accordingtoMetropoliscriteriondeterminewhethertoacceptnewsolutionx1,ifaccepted,currentsolutionisx1,ifnotaccepted,currentsolutionisx0.Thefouthstep:accordingtoaconvergencecriterion,determinewhetherornotofthesamplingprocess,ifcompleted,turntothefifthstep,otherwiserepeatthesecondandthreestep.Thefifthstep:reducethecontroltemperatureTbythepresettemperatureofthecoolingscheme,ifthetemperaturereachesagivenminimumtemperature,SAwillstopsearching,otherwiseturntothesecondstep.Thepaperwasinspiredbyliterature,thenpresentedanimprovedsimulatedannealingalgorithm,sothatitcanbemoresuitableforlarge-scaleinfrastructurefloorplanning.Specificimprovementstrategiesaresettingthreshold,warmimgandincreasingtheoptimalvalue’scomparison.ISAalgorithmfollowsspecificThestep:selectaninitialsolutionx0infeasiblesolutionspace,computeitsobjectivefunction’svaluef(x0),andselecttheinitialcontroltemperatureT0.Thesecondstep:generaterandomlyanewsolutionx1infeasiblesolutionandcalcul

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論