用于網(wǎng)上音樂商店的多音音頻管理系統(tǒng)_第1頁
用于網(wǎng)上音樂商店的多音音頻管理系統(tǒng)_第2頁
用于網(wǎng)上音樂商店的多音音頻管理系統(tǒng)_第3頁
用于網(wǎng)上音樂商店的多音音頻管理系統(tǒng)_第4頁
用于網(wǎng)上音樂商店的多音音頻管理系統(tǒng)_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、用于網(wǎng)上音樂商店的多比特率音頻管理系統(tǒng)Te Li, Yeow S'ng Liew, Susanto Rahardja信息通信研究學院,愛仕達,新加坡lite,ysnliew,.sg摘要 如今的音樂商城,市面上大多數(shù)的在線音樂商店,在同一支音樂中只能向用戶提供單種碼率的音樂文件。所以在這種情況下,他們的客戶在音樂下載文件上的選擇是很有限的,尤其對于音樂愛好者和音樂發(fā)燒友來說,一種碼率是遠遠不能夠滿足需求的。本篇論文將會提出針對這個問題的一個有效解決方案通過開發(fā)出多種比特率的音頻管理系統(tǒng),在為服務(wù)器端提供方便的音樂維護的同時,也能提供給客戶不同碼

2、率的不同質(zhì)量的音樂,來滿足用戶們的不同需求。本管理系統(tǒng)的SDK是基于MPEG-4可擴展無損編碼(SLS)的音頻編解碼器,目前,該技術(shù)已經(jīng)被亞洲最大的在線移動音樂公司Soundbuzz采用。1. 介紹 自從2003四月的初次面世以來,蘋果的iTunes(蘋果在線音樂商城)已經(jīng)成功向社會證明了,替代傳統(tǒng)唱片,在網(wǎng)上音樂商店向用戶銷售音樂的可行性。在蘋果在線音悅商城中,線上銷售的音樂用MPEG-4編碼成先進的音頻編碼(AAC)格式,其碼率為128Kbps,而每首歌的售價為0.99美元。截止2007七月,蘋果商店已經(jīng)售出了約30億首歌曲。 然而,大多數(shù)網(wǎng)上的現(xiàn)有銷售歌曲的壓縮比率是固定的、有損的。隨著

3、大帶寬寬帶接入的普及,以及存儲設(shè)備的降價,音樂文件的下載速度和文件大小不再受到硬件設(shè)備的限制,越來越多的音樂愛好者們希望能買到最高質(zhì)量的音樂,甚至是在音樂質(zhì)量上等同于或者超越CD格式的音樂。而另一方面,還有一些用戶可能更喜歡購買便宜、且相對音樂質(zhì)量較低的音樂。對這部分用戶來說,比特率的高低的差異難以被感知,或者并不重要,尤其是用于移動設(shè)備上的音樂,前端設(shè)備并不能出色地表現(xiàn)高質(zhì)量音樂,且由于內(nèi)存有限,不得不放棄高比特率的音樂文件。 為了滿足一些客戶們對多種比特率音樂的需求,網(wǎng)絡(luò)在線音樂商店需要在他們的服務(wù)器上儲存同一首歌的不同比特率的版本。當歌曲足夠多以后,這種方式對于服務(wù)器端無疑是一個不小的負

4、擔,它將導致服務(wù)器端的數(shù)據(jù)庫過于復雜,隨之而來的問題是,對它的存儲空間的管理也將更加復雜和困難。另一種方法音樂商店可能更樂意看到,那便是在所要求的比特率編碼的歌曲中,只會有一種比特率編碼的版本納入到采購訂單,但是這對于客戶和服務(wù)器來說,又導致了時間消耗大大增加,與此同時計算也變得更加復雜。此外,有些客戶希望升級已有的歌曲,他們并不在意文件的大小,他們想要購買更高質(zhì)量的音樂,通過專業(yè)的高保真HIFI設(shè)備欣賞音樂。在這種情況下,采用上述方法的唯一的選擇是,購買和下載整首歌曲,但是這樣整個系統(tǒng)過大,而且他們必須保持不同比特率的相同歌曲,將會非常不便。因此,不論對客戶還是音樂商店,想要提供多種品質(zhì)的歌

5、曲,采用傳統(tǒng)的固定碼率音頻是幾乎是不可能的。 在本文中,我們開發(fā)的用于網(wǎng)上音樂商店的多比特率音頻管理系統(tǒng),采用MPEG-4可擴展的無損編碼(SLS)作為開發(fā)基礎(chǔ)。有了這個系統(tǒng),由網(wǎng)絡(luò)商店維持的服務(wù)器端將能夠提供任何比特率的歌曲,并且同一首歌的各種比特率的版本只需要一個文件就能容納。該系統(tǒng)對于音樂文件的處理速度,較傳統(tǒng)方式提高了數(shù)百倍。用戶也可以方便有效地通過“點卡充值”的方式來提高已購買的本地音樂的質(zhì)量,在不產(chǎn)生多個音樂文件副本的情況下輕松升級音樂文件。 本文的其余部分組織如下:首先論文將對SLS的技術(shù)進行簡單介紹,接下來是對SLS技術(shù)的詳細說明,然后論文會闡述系統(tǒng)結(jié)構(gòu),以及各種情況下使用音樂

6、服務(wù)器和客戶端的管理系統(tǒng)的枚舉。論文的結(jié)尾將測試評估此管理系統(tǒng)的性能。2.MPEG-4可擴展無損音頻編碼 SLS作為一個標準的音頻編碼工具,于2006六月發(fā)布。它擴大了編碼的表示范圍,例如用AAC和一個中等比特率來表示無損編碼。 SLS的編解碼器的簡化框結(jié)構(gòu)功能示意圖如圖1所示。圖一:SLS的編碼器和解碼器的結(jié)構(gòu) 在SLS編碼器中,整數(shù)的PCM格式的音頻輸入,是由無損編碼轉(zhuǎn)換成改進型離散余弦變換的頻域(IntMDCT)編碼方式。而由此產(chǎn)生的MDCT系數(shù)將會再一次傳遞到AAC編碼器,并在其中產(chǎn)生核心層的AAC 比特流。在AAC編碼器中的過程如下,轉(zhuǎn)換將首先用比例因子頻帶進行量化和非均勻量化計算。

7、為了有效地利用已經(jīng)存儲在核心層比特流編碼的頻譜數(shù)據(jù)信息,我們用了一個差錯定位程序,用從原始光譜減去AAC量化頻譜的方法,來產(chǎn)生在無損增強編碼中殘余的頻譜,我們稱之為LLE。接下來,殘余頻譜(LLE)用位平面Golomb編碼的方式,或者用上下文編碼生成的可擴展的LLE層比特流進行編碼計算。在編碼器的最后一步,LLE的碼流輸出用核心AAC比特流來產(chǎn)生最終的SLS的比特流。整套SLS編碼就此完成。 對于SLS結(jié)構(gòu),進一步的更多詳細介紹請看下文。3.多比特率音頻管理系統(tǒng) 我們所提出的在線音樂商城的多比特率音樂管理系統(tǒng),分別包括了音樂存儲服務(wù)器和客戶端兩個子系統(tǒng)。在這一部分中,我們將分別對兩個子系統(tǒng)的結(jié)

8、構(gòu)和功能進行描述。3.1.存儲服務(wù)器的音樂管理器 如下圖2所示,音樂管理器的服務(wù)器,包含了一個“編碼/增強單元”和一個“自動文件處理單元”。而進一步地,在自動文件處理單元中,其本身又具有兩個功能模塊,即截位和提取器。3.1.1.編碼器/增強器 采用的多種編碼器的基本結(jié)構(gòu)是相同的,如上圖1所示。與SLS /MPEG相關(guān)參考軟件相比,本系統(tǒng)采用的編碼器更加先進,它優(yōu)化了編碼速度,優(yōu)化了實際執(zhí)行流程。通過它編碼輸入的PCM文件,輸入的AAC文件廣泛適用于各種AAC編解碼器,可以方便地進行編碼,在這一點上與傳統(tǒng)文件相比不存在任何區(qū)別。增強器輸出的是無損壓縮的音頻文件,并且以輸入的AAC為核心算法。圖2

9、. 多質(zhì)量音樂管理器存儲服務(wù)器3.1.2.自動文件處理器自動文件處理器是系統(tǒng)中不可或缺的一部分,該處理器將根據(jù)輸入的要求,自動地處理無損編碼文件,處理過程包括截斷和提取兩個部分。其中,截位的處理結(jié)構(gòu)和處理過程如圖3所示,圖3.自動文件處理器的截位.自動文件處理器的基本功能截位,具體操作是將LLE層截斷為N個音軌,其中N不能小于1,N1。音軌1由比特率為B1的LLE中提取的數(shù)據(jù)組成。接下來的每一個編號為n(n1)的音軌將分別包含(bn-bn-1)比特率的數(shù)據(jù)。輸入的截位依次是B1,B2,bn-1。提取器將根據(jù)用戶的請求來分別提取相應(yīng)的比特率音頻文件需要用到的音軌。具體來說,在自動文件處理器中的提

10、取操作有兩種操作模式,即單層提取模式和基層提取模式。在輸入?yún)?shù)的單層提取模式下,則只有提取出的音軌作為輸出音軌,組成最終的音頻文件。而基底層提取模式,是用參數(shù)n來提取相應(yīng)音軌和隨后的音軌。特別情況下,應(yīng)該指出的是,每一個音軌,包括0號音軌,在沒有比其更低的層的情況下是絕對不可解的(如軌道2要求軌道1、0出現(xiàn))。這個機制是由系統(tǒng)的優(yōu)先級檢查來控制的。3.2. 客戶端音樂播放器 不同于傳統(tǒng)的音樂播放器,本論文提供的應(yīng)用于客戶端的多比特率音樂播放器,是為系統(tǒng)定制了多音質(zhì)功能的播放器,它將會為用戶提供更多支持的功能,例如解碼,補充音軌(提升音質(zhì))和提取音軌(降低音質(zhì))(如圖4所示),相較于傳統(tǒng)播放器,

11、功能更全面,效率更高。圖4.多優(yōu)質(zhì)音樂播放器的客戶端 系統(tǒng)中用于自動文件處理器的底層提取模式,可以由一個標準的SLS解碼器直接解碼。 當客戶購買了某個音軌(從基本音軌到n級音軌)之后,他們可以“補充”這些音軌來獲得更高的音質(zhì)。這種方式相較于傳統(tǒng)下載方式來說非常方便,節(jié)省內(nèi)存,客戶只需下載n以上的音軌,補充到他們的現(xiàn)有音軌上(如現(xiàn)有64Kbps)+補充(192Kbps)=新的軌道(256Kbps)。這種方式對于傳統(tǒng)方法的改進不但在與其便利性的大大提升,更在于節(jié)省內(nèi)存和簡化管理流程,減輕服務(wù)器負擔等多種優(yōu)點。在補充程序完成之后,選擇升級音頻文件的用戶將只擁有一個音頻文件,而不是兩個不同音軌的文件。

12、 這種播放器的提取方式,也同樣讓用戶可以輕松地抽取音軌,來達到降低音質(zhì),減小內(nèi)存的目的。較低比特率的音頻文件體量更小,對于移動端用戶來說無疑比高質(zhì)量音樂文件更加的適合,這些音樂可以方便地轉(zhuǎn)移到手機等具有較低存儲容量的設(shè)備。3.3. 音樂存儲操作場景 本節(jié)將介紹采用了多比特率上架并銷售的在線音樂商店的一種經(jīng)營方案。如下圖5所示,圖5.在當前應(yīng)用程序設(shè)置中,SLS音樂管理器的音頻格式 第一個版本是總比特率為256kbps的SLS高質(zhì)量有損文件,其中包含了64kbps的AAC格式的核心部分:增強LLE音軌。這種高質(zhì)量的有損文件,根據(jù)上節(jié)的方法所示,可以提取出比特率為64kbps的低質(zhì)量有損音頻文件,

13、它與AAC格式相似,可用于存儲容量有限的移動設(shè)備。在此基礎(chǔ)上,系統(tǒng)仍然能夠進一步的“縮減”或“升級”軌道。例如,我們將原有音頻升級到500KBPS的無損音軌,就可以得到高質(zhì)量的有損格式音頻文件,這種高質(zhì)量音頻可以以更高的價格單獨出售。如果客戶需要最高質(zhì)量的音頻文件而不在意存儲大小,無損格式的音樂將會是用戶最好的選擇。除了用上述升級軌道的方式得到無損壓縮的音樂之外,無損格式也可作為一個整體售賣,與高質(zhì)量的有損格式相比,無損格式將可以賣更高的價格。 接下來是操作/功能支持的音樂管理器工作流程的具體說明介紹,服務(wù)器示意圖如上圖2。 以下為用戶購買音樂時,服務(wù)器端在幾種實際使用情況下的枚舉說明:l 原

14、波的音樂格式(CD格式)的編碼,在使用SLS編碼器之后,產(chǎn)生的兩種無損壓縮格式是由核心層的AAC(64Kbps)和所有其他音軌組成的。l 然后音頻文件的歸檔格式為3個音軌,分別由AAC的軌道和普通軌道以及兩層增強層組成。其中,兩層增強層中的第一層的壓縮比特率為192kbps。除了無損格式的音頻文件,所有的音頻文件都可以存儲在服務(wù)器端上。如果客戶想購買最高質(zhì)量的無損壓縮音頻,我們的系統(tǒng)將為他們提供兩個可用的下載文件分別為單獨的無損壓縮音頻文件,和由原文件升級得到的無損壓縮音頻文件,后者最終將覆蓋原有文件。l 相反地,如果客戶想要購買低質(zhì)量的有損版本的音頻文件,可以在無損格式的文件中提取出壓縮比率

15、為256Kbps的有損格式音樂文件。l 如果客戶已經(jīng)購買了有損版本的音樂,又進一步?jīng)Q定升級無損版本的音樂,系統(tǒng)提供了點卡充值的方式,允許用戶方便地購買升級版本的音頻文件,其原理是使用提取器從高質(zhì)量音頻文件中提取和發(fā)送無損格式的補充音軌到客戶端,以供下載。 接下來,對于客戶端這一邊來說,我們有以下幾種方式:l 如果客戶已經(jīng)購買了有損或無損版本,這些版本的音樂文件是可以用播放器直接解碼播放的。l 如果客戶已經(jīng)買了有損版本,并希望升級到無損壓縮的音樂,他/她只需要下載已有音軌之上比特率的音軌。在已有音軌之上的所有音軌可以打包在一起,成為一個補丁文件系統(tǒng)將實現(xiàn)無損音頻格式的有損補丁。l 如果客戶希望將

16、音樂下載到移動設(shè)備等通常存儲較小的設(shè)備,需要更小的文件大小,不介意較低的音樂質(zhì)量,AAC的核心程序可以從已經(jīng)下載的音樂中使用音樂播放器中的提取器提取出所需要比特率的音軌以及以下比特率的音軌。 4. 成果評估 我們將該音樂管理器用iTunes音樂編碼方式處理,以獲取其處理速度。我們選擇iTunes編碼方式的原因,如之前在引言部分中提到的,是為了展示我們系統(tǒng)的處理速度和工作效率。在評估系統(tǒng)性能時,我們希望盡量減少編碼器部分的變量干擾,因此我們選擇使用當前全球最先進的音樂編碼器,來測試出客觀真實的有損/無損壓縮音樂的處理速度。 我們的評估是使用IBM兼容的PC運行的,系統(tǒng)版本為Windows XP

17、SP2,(CPU 3GHz,內(nèi)存1GB)。在AAC文件編碼中: 用CD格式的文件作為測試對象,使用iTunes 7和SLS編碼器獲得高質(zhì)量的有損(64 + 192Kbps)音樂文件。使用無損格式的自動提取文件處理器對其進行處理。 處理速度方面的性能總結(jié)如下:iTunes 7和自動文件處理器之間的速度對比(AFP)如下表1所示。 表格中的數(shù)據(jù)“ N ×”表示,對于一首長度為M秒的歌曲,對他的處理速度為M/N秒。這充分說明了,要獲得有損版本的音頻文件,自動文件處理器提取音軌的效率遠遠超過傳統(tǒng)的編碼方法。表1 iTunes 7和自動文件處理器之間的速度對比(AFP)5. 結(jié)論 多比特率的在

18、線音樂商城管理系統(tǒng)的提出是基于MPEG-4 SLS壓縮技術(shù)的。通過使用該系統(tǒng),音樂商店可以根據(jù)不同的客戶需求,方便地以多種品質(zhì)和價格銷售音樂產(chǎn)品。實現(xiàn)了服務(wù)器和客戶端的每一首歌曲只有一個單一的文件檔案,從而簡單,高效地處理和管理音樂文件。除此之外,該系統(tǒng)還使客戶有了更廣泛的選擇,在選擇音樂的同時,平衡與之相適應(yīng)的品質(zhì)和價格。此外,用戶將已下載的歌曲升級成無損品質(zhì)也是可以方便地實現(xiàn)的。下載文件的縮小,也大大地吸引了那些窄帶互聯(lián)網(wǎng)的用戶??傊?,本系統(tǒng)用簡單的操作方式,不但實現(xiàn)了高超的工作效率,而且與傳統(tǒng)文件同樣的廣泛的兼容性,使其并不受編碼和文件的兼容性問題的困擾。 目前該系統(tǒng)的軟件開發(fā)包已經(jīng)被在線音樂商店公司Soundbuzz投入并應(yīng)用于在線音樂銷售系統(tǒng)中。 6.參考文獻1 “ISO/IEC 14496-3, information Technology - coding of audiovisual objects, part 3: audio”, 1998. 2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論