嵌入式程序中的指令數(shù)據(jù)存儲及讀取設(shè)計_第1頁
嵌入式程序中的指令數(shù)據(jù)存儲及讀取設(shè)計_第2頁
嵌入式程序中的指令數(shù)據(jù)存儲及讀取設(shè)計_第3頁
嵌入式程序中的指令數(shù)據(jù)存儲及讀取設(shè)計_第4頁
嵌入式程序中的指令數(shù)據(jù)存儲及讀取設(shè)計_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

【W(wǎng)ord版本下載可任意編輯】嵌入式程序中的指令數(shù)據(jù)存儲及讀取設(shè)計在當(dāng)今的嵌入式多媒體應(yīng)用中,系統(tǒng)控制(通常的MCU作用)和信號處理(通常的DSP作用)之間的交互性不斷增強。現(xiàn)在推出的一種嵌入式媒體處理器能夠同時處理MCU和DSP的任務(wù),從而將那些熟悉用MCU方式開展應(yīng)用開發(fā)的C程式師帶入一個新的領(lǐng)域,其中對代碼和資料流程的智慧管理會顯著提高系統(tǒng)的性能。這對于采用“已經(jīng)掌握”的編程方法和簡單的使用指令高速緩沖記憶體(cache,簡稱快取記憶體)和資料快取記憶體來管理這些資料流程的程式師很有吸引力。然而,對媒體處理器的高性能直接記憶體訪問(DMA)能力應(yīng)認(rèn)真地考慮。因爲(wèi)懂得在這些應(yīng)用中對使用快取記憶體和DMA開展權(quán)衡將有助于更好地理解如何編程來優(yōu)化系統(tǒng)。

記憶體構(gòu)造——對記憶體管理的要求

當(dāng)今的媒體處理器具有分級的記憶體構(gòu)造,用來平衡幾種不同容量和性能等級的記憶體。通常,離處理器近的記憶體(稱爲(wèi)“1級”或“L1”記憶體)以全時鐘速率工作,通常支援單時鐘周期指令的運行了高效地利用記憶體匯流排的帶寬,L1記憶體一般分爲(wèi)指令段和資料段。通常,該記憶體被配置成SRAM或快取記憶體。對于那些許可權(quán)的應(yīng)用,在一個單時鐘周期內(nèi)就能夠訪問片內(nèi)SRAM。對于要求較長代碼的系統(tǒng),則可以提供附加的片內(nèi)和片外記憶體——同時增加了等待時間。

這種層次構(gòu)造本身作用有限了適應(yīng)僅配合低速外部記憶體的大部分應(yīng)用,當(dāng)今的高速處理器卻以很低的速度降級使用了提高性能,程式師可以人工地選擇將關(guān)鍵代碼移入或移出內(nèi)部SRAM。另外,將資料快取記憶體和指令快取記憶體參加這種構(gòu)造使程式師能夠更方便地人工管理外部記憶體??烊∮洃涹w減少了將指令和資料流程送入處理器內(nèi)核的人工管理傳送。這樣程式師無需考慮如何把資料和指令流送入處理器內(nèi)核,從而極大地簡化了編程模式。

指令記憶體管理——快取記憶體還是DMA?

對嵌入式媒體處理器市場的快速調(diào)查說明,處理器的速度大于或等于600MHz。盡管這種性能可以開辟許多新應(yīng)用,但只有在從內(nèi)部L1記憶體中讀取代碼時才能到達(dá)這種速度。當(dāng)然,理想嵌入式處理器可以具有無限容量的L1記憶體,但這不切實際。因此,程式師在爲(wèi)其實際系統(tǒng)優(yōu)化記憶體和資料流程時,必須考慮幾種可選方案以充分利用置于處理器內(nèi)的L1記憶體。讓我們來考慮一下其中的一些方案。

種方案同時也是直接的方案,目標(biāo)應(yīng)用代碼可以完全放入L1指令記憶體。對于這種情況,程式師只需將應(yīng)用代碼直接映射到該記憶體空間,無需特殊操作。這就是爲(wèi)什麼包含MCU和DSP兩種功能的媒體處理器必然在這種體系架構(gòu)支援的代碼密度方面具有獨特優(yōu)勢的原因。

第二種方案,采用一種快取記憶體機構(gòu)允許程式師訪問更大容量、較低成本的外部記憶體。根據(jù)需要,這種快取記憶體可以作爲(wèi)一種將代碼自動送入L1指令記憶體的方法。這種方法的主要優(yōu)點是程式師無需管理代碼移入和移出快取記憶體。當(dāng)執(zhí)行線性代碼時,這種方法到達(dá)的效果。當(dāng)執(zhí)行非線性代碼時,快取記憶體線可能會被替換得太頻繁,以致于不能提高即時性能。

指令快取記憶體實際上具有兩個作用。,它以更有效率的方式從外部記憶體中預(yù)取指令。第二,由于快取記憶體一般使用某種“近使用的指令”的演算法,所以那些用得頻繁的指令往往就被保持在快取記憶體中。這樣做很有好處,因爲(wèi)存在L1快取記憶體中的指令能夠在一個單時鐘周期內(nèi)完成,就像指令在L1SRAM中一樣。也就是說,如果該代碼一旦被取走,并且還沒有被覆蓋,即準(zhǔn)備在下一個指令周期執(zhí)行該代碼。

大多數(shù)嚴(yán)格的即時程式師一般不相信這種快取記憶體能帶來的系統(tǒng)性能。他們的理由是如果一系列指令在需要執(zhí)行的時候卻沒有在快取記憶體內(nèi),將導(dǎo)致影響性能。采用快取記憶體鎖定機構(gòu)能彌補這個問題。一旦將關(guān)鍵的指令裝入快取記憶體,快取記憶體線就被鎖住,因此指令不會被覆蓋。這樣,程式師就能夠在快取記憶體中保持他們所需指令,并且使該快取記憶體機構(gòu)管理次要指令。

一種方案,通過使用一個獨立于處理器內(nèi)核的DMA通道將代碼移入或移出L1記憶體。當(dāng)該處理器內(nèi)核在記憶體的一個存儲塊運行時,該DMA將代碼送入下一個存儲塊去執(zhí)行。這種方案通常被稱爲(wèi)一種覆蓋技術(shù)。

雖然通過DMA將覆蓋代碼送入L1指令記憶體可以比快取記憶體方式提供更多的關(guān)鍵指令,但其代價是要增加程式師的工作量。換句話,程式師需要預(yù)先安排一種覆蓋代碼的方法和恰當(dāng)?shù)嘏渲肈MA通道。對于一種能夠做有價值的額外管理程式的詳細(xì)計劃,這種性能仍然會提高。

資料記憶體管理

嵌入式媒體處理器的資料記憶體構(gòu)造對于整個系統(tǒng)性能的重要性等同于指令時鐘速度的重要性。因爲(wèi)在多媒體應(yīng)用中的任一時間經(jīng)常會有多個資料傳送任務(wù)同時開展,所以其匯流排構(gòu)造必須支援內(nèi)核和DMA對所有外部和內(nèi)部記憶體塊的訪問。對DMA控制器和內(nèi)核之間的沖突開展自動處理是非常關(guān)鍵的,否則性能將大大降低。首先要求在內(nèi)核與DMA之間的建立DMA控制器,然后當(dāng)要開展處理的資料已經(jīng)準(zhǔn)備時再應(yīng)該回應(yīng)中斷。

處理器通常作爲(wèi)其一項基本功能執(zhí)行資料讀取操作。雖然這通常是傳送資料效率的機構(gòu),但它是簡單的編程方式。小容量、快速方便的記憶體有時可以用來作爲(wèi)L1資料記憶體的一部分,但對于較大容量、片外緩沖器,如果內(nèi)核要從外部記憶體讀取所有資料,那麼訪問時間就長得難以忍受。內(nèi)核不僅要花掉多個時鐘周期去取資料,而且它要花很多時間忙于讀取資料。在多媒體和其他大量資料操作應(yīng)用中,要不斷地將大量資料存儲移入或移出SDRAM,內(nèi)核的讀取資料操作是無法應(yīng)付這種情況的。雖然內(nèi)核的讀取資料操作總是需要的,但爲(wèi)了維持性能,一定要使用DMA或快取記憶體傳送大量的資料。

使用DMA管理資料

為了在多媒體系統(tǒng)中有效地利用DMA,應(yīng)該有足夠多的DMA通道以充分支援處理器的周邊電路,即可以同時傳送一對以上的記憶體與DMA之間的資料流程。這一點很重要,因爲(wèi)考慮到在外部記憶體和L1記憶體之間傳送用于內(nèi)核處理的資料塊的同時,必然有一個原始的多媒體資料也會進(jìn)入外部記憶體(通過高速周邊設(shè)備)。進(jìn)一步地,DMA引擎允許周邊電路與外部記憶體之間的直接資料傳送,而無需在L1記憶體內(nèi)有一個“中間停留”,因此在大量資料演算法中可以節(jié)省外部資料傳送。

隨著資料傳輸速率和性能要求的提高,設(shè)計工程師能隨意對“系統(tǒng)性能調(diào)節(jié)”控制就變得非常關(guān)鍵。例如,優(yōu)化DMA控制器以使每個時鐘周期都可傳送一個資料字。當(dāng)向同一方向同時傳送多個資料流程時(例如,從內(nèi)部記憶體向外部記憶體傳送全部資料),這通常是有效的操縱控制器的方式,因爲(wèi)這種方法可以防止DMA匯流排有空閑時間。

但是當(dāng)傳送多個雙向視頻和音頻資料流程時,必須使用“業(yè)務(wù)量控制”,以防止一個資料流程獨占匯流排。例如,如果DMA控制器總是把DMA匯流排連接到任何一個準(zhǔn)備每次傳送一個資料字的周邊電路(例如,連接到一個SDRAM),一個,那麼總的資料吞吐率會降低。在這種情況中,幾乎每一個時鐘周期資料傳送都改變方向,因此在SDRAM匯流排上與來回切換時間相關(guān)的等待時間將顯著降低吞吐率。這樣,具有一個通道可編程傳送資料字長度的DMA控制器比那種具有固定傳送長度的控制器有明顯的優(yōu)點。因爲(wèi)每個DMA通道都可以將一個周邊設(shè)備與外部或內(nèi)部記憶體相連,所以它還具有的一個重要優(yōu)點是它能自動地連接到一個能發(fā)出緊急匯流排請求的周邊設(shè)備。

另一個特性即二維DMA性能,具有幾種系統(tǒng)級優(yōu)點。,它允許以一種比較直觀的處理順序?qū)①Y料放入記憶體。例如,亮度和色度資料從一個圖像感測器相繼傳來,但可將它們自動存入各自的記憶體緩沖塊。二維DMA的交錯和去交錯功能在處理視頻和圖像資料之前節(jié)省了多余的記憶體匯流排傳送。另外,通過有選擇性地開展傳送,即只選擇需要的輸入圖像資料塊而不是全部圖像資料,二維DMA也能夠使系統(tǒng)的資料帶寬。

其他的重要DMA特性包括爲(wèi)滿足當(dāng)前的周邊設(shè)備任務(wù)請求區(qū)分DMA通道優(yōu)先等級的能力,以及爲(wèi)匹配這些優(yōu)先順序設(shè)置相應(yīng)的DMA中斷的能力。這些功能有助于確保資料緩沖器不會因DMA忙于其他周邊設(shè)備而溢出,并且它們還使程式設(shè)計工程師在每個DMA通道的資料流程通根底上優(yōu)化整個系統(tǒng)性能時具有更大的自由度。

因爲(wèi)內(nèi)部記憶體通常分爲(wèi)幾個子存儲塊,所以DMA控制器和內(nèi)核同時存取向不同子存儲塊存放資料的操作均可在一個單時鐘周期內(nèi)完成。例如,當(dāng)內(nèi)核對一個子存儲塊的資料開展操作時,DMA可以向另一個子存儲塊存放新資料。在某些條件下,甚至可以同時訪問同一個子存儲塊。當(dāng)訪問外部記憶體時,通常只有一個物理匯流排可用,該物理匯流排經(jīng)常被同步和非同步記憶體所復(fù)用。

關(guān)于資料快取記憶體

當(dāng)前的DMA控制器的靈活性是一把雙刃劍。當(dāng)在兩個處理器之間讀取一個大的C/C++應(yīng)用程式時,程式師有時不愿意將DMA功能整合到已經(jīng)存在的工作代碼中。這時,資料快取記憶體就很有用了。通常,資料通過快取記憶體送入L1記憶體以便快處理。這種資料快取記憶體非常吸引人,因爲(wèi)它象一個小DMA一樣工作,但涉及到程式師的工作量。

因爲(wèi)典型的快取記憶體線填充特性,所以當(dāng)處理器對外部記憶體內(nèi)的連續(xù)資料存放塊開展操作時,資料快取記憶體就非常有用。這是因爲(wèi)該快取記憶體不只存儲當(dāng)前正在被處理的立即資料,此外它還向與當(dāng)前相鄰的資料塊內(nèi)予取資料。換句話說,該快取記憶體機構(gòu)假設(shè)當(dāng)前處理的資料字是即將被處理的一個相鄰資料塊的一部分的可能性極大。對于多媒體圖像、音頻和視頻流,這是一個合理的假設(shè)。

由于資料緩沖器通常來自周邊電路,所以對資料快取記憶體的操作并不總象對指令快取記憶體的操作那樣容易。這是由

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論