C和匯編代碼結(jié)合 是實現(xiàn)DSP軟件設(shè)計的方式_第1頁
C和匯編代碼結(jié)合 是實現(xiàn)DSP軟件設(shè)計的方式_第2頁
C和匯編代碼結(jié)合 是實現(xiàn)DSP軟件設(shè)計的方式_第3頁
C和匯編代碼結(jié)合 是實現(xiàn)DSP軟件設(shè)計的方式_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、【W(wǎng)ord版本下載可任意編輯】 C和匯編代碼結(jié)合 是實現(xiàn)DSP軟件設(shè)計的方式眾所周知,匯編語言具有更高的性能優(yōu)勢,而用C語言編碼則能更容易和快速地實現(xiàn)。DSP處理器功能的不斷增強(qiáng)以及編譯器優(yōu)化技術(shù)的提高,使得傳統(tǒng)的用匯編語言編寫DSP應(yīng)用程序的做法逐漸被淘汰?,F(xiàn)在的DSP應(yīng)用程序幾乎都是由C代碼和匯編代碼混合組成的。在那些對性能起決定性作用的關(guān)鍵功能中,DSP工程師將繼續(xù)使用高度優(yōu)化的匯編代碼,同時轉(zhuǎn)用C語言編寫那些不太關(guān)鍵的功能,這將有利于代碼維護(hù)和移植。而C和匯編代碼的這種結(jié)合要求DSP工程師具備專門的工具和方法。 C和匯編代碼結(jié)合 是實現(xiàn)DSP軟件設(shè)計的方式 圖4:ETSI的mult_r

2、(乘法和取整)基本操作的C代碼實現(xiàn)(左)和對應(yīng)的由CEVA-TeakLite-III編譯器生成的匯編代碼(右)。 匯編內(nèi)部函數(shù):是將匯編代碼內(nèi)聯(lián)進(jìn)C代碼的一種先進(jìn)方法,下文將有詳細(xì)介紹。 把匯編指令當(dāng)作C語句一樣來編寫 內(nèi)聯(lián)匯編功能具有顯著的缺點(diǎn)。它會破壞各種編譯器優(yōu)化操作,因為編譯器不了解內(nèi)聯(lián)代碼的內(nèi)容,會使用壞假設(shè);以及它可能迫使編程人員處理底層問題,如存放器分配和指令調(diào)度。 匯編內(nèi)部函數(shù)可以幫助編程人員實現(xiàn)內(nèi)聯(lián)匯編代碼,并且不存在這些缺點(diǎn)。從編程人員的角度看,匯編內(nèi)部函數(shù)就像是C語言宏或函數(shù)。它們接收C語言變量,返回C語言輸出結(jié)果,同時表現(xiàn)為單個匯編指令。由于涉及該功能的所有代碼都在C語

3、言等級,因此編程人員不必?fù)?dān)心存放器分配、指令調(diào)度和其它底層問題。匯編內(nèi)部函數(shù)不僅不會阻礙編譯器優(yōu)化操作,還會參與優(yōu)化過程,就像它們是編譯器正常產(chǎn)生的匯編指令一樣。這些特征使得匯編內(nèi)部函數(shù)的功能非常強(qiáng)大。 利用匯編內(nèi)部函數(shù),編程人員可以從編譯器不可能產(chǎn)生的獨(dú)特匯編指令中受益。例如,CEVA-X1641的bitrev(位反向)指令就是為FFT等算法定制的。由于編譯器不太可能把一個程序看作一個FFT并使用bitrev指令,因此編程人員可以完全把bitrev匯編內(nèi)部功能嵌入到C代碼中。結(jié)合對應(yīng)用的透徹了解,編程人員還可以使用C應(yīng)用程序的性能決定段里的序列匯編內(nèi)部函數(shù),從而能夠確保編譯器生成的代碼效率就

4、像手工編寫的一樣高。 圖5是CEVA-X1641編譯器與匯編內(nèi)部函數(shù)一起使用的例子。匯編內(nèi)部函數(shù)還受益于由CEVA-X1641編譯器處理的問題所決定的機(jī)器,如存放器分配、指令調(diào)度和硬件單元分配。 C和匯編代碼結(jié)合 是實現(xiàn)DSP軟件設(shè)計的方式 圖5:CEVA-X1641編譯器支持的匯編內(nèi)部函數(shù)的使用。 調(diào)試混合代碼的應(yīng)用程序 匯編代碼的調(diào)試需要對延遲和存儲器對齊限制等架構(gòu)和機(jī)器級問題有深入的了解。只是簡單地把C代碼和匯編代碼放在一起會使事情更麻煩,因為編程人員現(xiàn)在還必須調(diào)試C代碼和匯編代碼之間的連接。 調(diào)試混合代碼應(yīng)用程序的步就是分隔問題。假設(shè)保持匯編代碼的C語言實現(xiàn)不變以及C語言實現(xiàn)方案工作正

5、常,那么將匯編函數(shù)轉(zhuǎn)換成C語言實現(xiàn)并重新測試應(yīng)用程序就相比照較容易。為了迅速檢測出問題,編程人員可以在每一步把受懷疑函數(shù)的一半轉(zhuǎn)換為相應(yīng)的C語言實現(xiàn)方案。 一旦有問題的匯編函數(shù)被確定,它就應(yīng)該同時作為獨(dú)立的匯編問題和C與匯編的連接問題加以分析。調(diào)試獨(dú)立的匯編問題對匯編編程人員來說十分簡單明了,但C與匯編的連接問題就有點(diǎn)麻煩。在考慮匯編函數(shù)本身時,C與匯編的連接問題是不可見的,這與獨(dú)立的匯編問題有所不同。為了找出這些問題,編程人員必須檢查編譯器的約定,比方調(diào)用約定和存放器使用約定。 編程人員還必須檢查編譯器假設(shè),比方匯編指令的行蹤。為了節(jié)省調(diào)試時間,編程人員應(yīng)該在次實現(xiàn)匯編函數(shù)時驗證是否遵循所有

6、的編譯器約定和假設(shè)。 研究:H.264視頻編碼器和AMR-NB 本文討論的技術(shù)和方法已被CEVA公司用于各種各樣的應(yīng)用,包括視頻編解碼器、音頻編解碼器、聲音合成器和設(shè)備驅(qū)動器。而本文所述的功能在這些應(yīng)用中都可以顯著提高性能。H.264視頻編碼器是一個很好的研究。它在處理能力及其它資源方面要求非常嚴(yán)格,尤其是相比語音編解碼器等其它類型的編解碼器而言。 CEVA公司的CEVA-X16xx高端DSP內(nèi)核系列及其MM2000多媒體平臺可以為這種編碼器提供所需的處理能力。先用跟蹤技術(shù)確定這種編碼器的關(guān)鍵函數(shù),然后逐步對之開展優(yōu)化。首先,利用匯編內(nèi)部函數(shù)在C語言級對這些函數(shù)開展全面優(yōu)化。然后,在匯編語言級

7、對編譯器提供的匯編代碼作進(jìn)一步優(yōu)化。 圖6展示了通過對這種編碼器的關(guān)鍵函數(shù)開展全面優(yōu)化所獲得的性能提高。只有一個優(yōu)化階段涉及到純匯編編程,所有其它階段都基于帶有匯編內(nèi)部函數(shù)的C代碼。這些匯編內(nèi)部函數(shù)主要用于SIMD操作,如avg_acW_acX_acZ_4b。這條指令對8個輸入字節(jié)取平均,產(chǎn)生4字節(jié)結(jié)果。這種SIMD操作對執(zhí)行大量字節(jié)級計算的視頻編解碼器非常有用。 C和匯編代碼結(jié)合 是實現(xiàn)DSP軟件設(shè)計的方式 圖6:對H.264編碼器的關(guān)鍵函數(shù)開展優(yōu)化以提升性能。AMR-NB(自適應(yīng)多速率-窄帶)是廣泛用于無線通信應(yīng)用的語音編解碼器。通常都是采用純匯編來實現(xiàn)聲音合成器,但C語言實現(xiàn)與CEVA-X1620編譯器利用本文討論的各種功能可以獲得與匯編實現(xiàn)媲美的結(jié)果。圖7顯示了整個AMR-NB應(yīng)用經(jīng)過全面優(yōu)化而取得的以MCPS(每秒百萬周期)計的性能提高幅度。只有的優(yōu)化階段涉及到了純匯編編程,所有其它階段都基于帶有ETSI內(nèi)部函數(shù)和匯編內(nèi)部函

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論