版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第六屆數(shù)學(xué)中國(guó)數(shù)學(xué)建模網(wǎng)絡(luò) 多模態(tài)分析在流行音樂(lè)風(fēng)格分類中的應(yīng)關(guān)鍵 多模 語(yǔ)義LDASVMs分形維數(shù)流行音樂(lè)分 要模型一是基于的流行音樂(lè)風(fēng)格分類模型。隨著Web2.0日益健全完善,數(shù)據(jù)日益豐富且趨于穩(wěn),所表的語(yǔ)義信要比描述文檔中的更接近描述事物的特性,資源在音樂(lè)風(fēng)格分類領(lǐng)域有著廣闊的應(yīng)用。模型通過(guò)LDA分析器對(duì)抽取的其風(fēng)格,同時(shí)也能彌補(bǔ)某些類別不夠準(zhǔn)確、沒(méi)有得到公認(rèn)的缺點(diǎn)。模型三是基于LDA和多類SVM[1]的流行音樂(lè)風(fēng)格分類模型一和模型二都是在所選題 第六屆數(shù)學(xué)中國(guó)數(shù)學(xué)建模網(wǎng)絡(luò) 英要(選填( 總分的Thedevelopmentofsocialculture,popmusicstylediversification,integrationdevelopmentstyle,causecategoryclutter,ishardtoclassify,inappropriateclassificationofthedeficienciesofexisting.Inthispaper,usingthestep-by-step,complementaryadvantagesofthemodelclassificationmethodoflayerbylayerysismethodisgivenforthepopularstyle. Modeloneispopmusicstyleclassificationmodelbasedontags.WiththeWeb2isperfect,thetagdataincreasinglyrichandtendstobestable,semanticinformationlabelexpressiontogetclosertonatureofthingsdescribedthandescription tagresources,hasbroadapplicationinthefieldofmusicstyleclassification.ModelofcorpusmodelingthroughLDAyzerontheselectedtagresources.Toachievethepurposeofmusicstyleclassification. Modeltwoisthepopmusicstyleclassificationmodelbasedonsemantic.TheInternethasamasstextresources,whenwecrawlinthenetworkdata,ifapopmusicalwaysappeartogetherwithaparticularstyleofpopularmusic,sowethinkthepopmusichasaverycloserelationshipwiththisstyle,thuswecaninferitsstyle,alsocanmakeupforsomeoftheclasslabelisnotaccurateenough,notrecognized. ModelthreeisthepopmusicstyleclassificationmodelbasedonLDAandSVM.Modeloneandtwoarewithhighclassificationaccuracypremisewithalargenumberofrelateddatainthemusicfile,notforthelabel,lessdataoforiginalsongs,reflectsitslimitation,thistimeneedtoextractacousticfeaturesoftheunderlyingclassification.Thisisalsothecurrentaudioclassificationmethodiswidelyusedandmature,wasimprovedthroughthefeatureextractionandclassificationofthemainstreamalgorithm,notonlycanachievethebestclassificationaccuracy,butalsocanachievethebesttimecomplexity. Modelfouristhepopmusicstyleclassificationmodelbasedonfractaldimension.Thetraditionalclassificationmethodsbasedonacousticfeaturescomplexity,hugedata,highcost,doesnothavethedepthexpansionpotential,howtomakethenecessarytrade-offsbetweenaccuracyandoverhead.Thefractaldimensionoftheadvantageofusingonlyaone-dimensionalfeaturecandistinguishdifferenttypesoffractalcharacterizationofmusicistheinherentcharacteristicsofmusic--Basedonthesimilaritybetweenthepartandthewhole.Themethodhassimpleapplication,classificationaccuracy,theadvantagesoffaster. Nomodelcandealwithallcases,onlytheexpansionofitsadvantages,solve,complementaryeffectofclassificationtoachievetheideal,inthispaper,avarietyofoptimizationmodelisputforwardcomprehensive,multimodemusicstyleclassificationmethod,theclassificationismorenatural,reasonable,accurate.一、問(wèn)題的重 問(wèn)題背 問(wèn)題重 二、問(wèn)題分 基于數(shù)據(jù)的分類方 基于語(yǔ)義的分類方 基于聲學(xué)特征的分類方 基于分形的分類方 三、符號(hào)說(shuō)明和問(wèn)題假 四、基于的流行音樂(lè)風(fēng)格分類模 抽取測(cè)試音樂(lè)的標(biāo)題和音樂(lè)家的..........................................................................獲取測(cè)試音樂(lè)的.....................................................................................................基于LDA框架對(duì)進(jìn)行分 數(shù)據(jù)分析和結(jié) 五、基于互聯(lián)網(wǎng)語(yǔ)義的流行音樂(lè)風(fēng)格分類模 原始................................................................................................................互聯(lián)網(wǎng)語(yǔ)義關(guān)系特征向量的表 多個(gè)音樂(lè)風(fēng)格同時(shí)存在的判 數(shù)據(jù)分析和結(jié) 六、基于LDA和多類SVM的流行音樂(lè)風(fēng)格分類模 音樂(lè)特征分 語(yǔ)音信號(hào)預(yù)處 音樂(lè)特征提 使用LDA對(duì)特征向量進(jìn)行降 使用多類SVM對(duì)特征向量進(jìn)行分 數(shù)據(jù)分析和結(jié) 七、基于分形維數(shù)的流行音樂(lè)風(fēng)格分類模 音樂(lè)與1/f噪 關(guān)于1/f噪聲的分形性 音樂(lè)的分形維數(shù)計(jì) 基于分形維數(shù)的音樂(lè)分類方 數(shù)據(jù)分析和結(jié) 八、模型評(píng)價(jià)及優(yōu) 九、模型的推 十、參考文 一、問(wèn)題的重述問(wèn)題背景傳統(tǒng)的基于關(guān)鍵字的分類技術(shù)需要獲得音頻數(shù)據(jù)的信息,而當(dāng)數(shù)據(jù)的信息不明確時(shí),就有必要采用基于內(nèi)容的方法來(lái)實(shí)現(xiàn)自動(dòng)分類的需求。面對(duì)海量的多媒問(wèn)題重述二、問(wèn)題分析如藍(lán)調(diào)(Blues)、搖滾(Rock)等就是經(jīng)常被用戶使用的檢索詞。目前,很多音樂(lè)例如Last.fm,等都相繼推出了基于風(fēng)格的音樂(lè)檢索系統(tǒng)。因此,音樂(lè)風(fēng)格的準(zhǔn)音樂(lè)風(fēng)格分類歷經(jīng)了人工化和自動(dòng)化兩個(gè)階段。早期,絕大多數(shù)的音樂(lè)都是對(duì) 所進(jìn)行的“音樂(lè)工程(musicgenomeproject)”。雖然人工地對(duì)音樂(lè)進(jìn)行風(fēng)格標(biāo)注取得了一定的成功,但是這樣做消耗了大量的人力成本、時(shí)間成本和成本;而更基于數(shù)據(jù)的分類方Web2.0Web2.0對(duì)其感的資源進(jìn)行個(gè)性化標(biāo)注,這其中自然也包括音樂(lè)資源,文獻(xiàn)[3]通過(guò)實(shí)驗(yàn)證明了互聯(lián)網(wǎng)中的數(shù)據(jù)的分布服從無(wú)標(biāo)度網(wǎng)絡(luò)的特征,在若干時(shí)間間隔后會(huì)趨于穩(wěn)定,而且所表達(dá)的語(yǔ)義信息要比描述文檔中的更接近被描述事物的特性;文獻(xiàn)[4]通過(guò)大量的實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證了用戶對(duì)歌曲進(jìn)行標(biāo)注時(shí)使用的與音樂(lè)專家基于語(yǔ)義的分類方法基于聲學(xué)特征的分類方法模型一和模型二都是在音樂(lè)文件具有大量相關(guān)數(shù)據(jù)的前提下具有較高分類準(zhǔn)確率的,當(dāng)音樂(lè)文最初發(fā)時(shí),其相數(shù)據(jù)相而言較少,基和義的方法再用。此時(shí)需要提取音樂(lè)自身的聲學(xué)特征,然后根據(jù)這些特征對(duì)音樂(lè)進(jìn)行風(fēng)格分類?;诜中蔚姆诸惙椒壳敖^大多數(shù)音頻分類算法集中在兩方面——音頻的特征提取以及根據(jù)音頻特征帶寬等,還有基于聽(tīng)覺(jué)感受的MFCC(Mel-frequencycepstralcoefficients)倒頻譜系數(shù)等。另一方面,分類算法可利用模式識(shí)別和模式分類中已知算法,如CMM(Gaussianmixturemodel)高斯混合模型、NN(NeuralNetwork)神經(jīng)網(wǎng)絡(luò)、HMMHiddenMarkovModel)隱馬爾可夫模型等。這些方法都存在著算法復(fù)雜,數(shù)據(jù)1,三、符號(hào)說(shuō)明和問(wèn)題假設(shè)i的歌曲名():的集合 ): t:音樂(lè)包含的的數(shù)目 |):每 P:兩個(gè)詞語(yǔ)同時(shí)出現(xiàn)在一個(gè)網(wǎng)頁(yè)中的概率 SC:頻譜質(zhì)心SB:頻譜帶寬SF:頻譜通量????:總體離????:類間離散度矩????:類內(nèi)離散度矩F:盒維數(shù)?????????DIMB()2nPop(Dream-Pop,ClassicalPop,Britpop,SynthR&B節(jié)奏Hip-Hop(Trip-Hop,Brit-Rap(Gangsta 四、基于的流行音樂(lè)風(fēng)格分類模的框架如圖4.1所示。抽取測(cè)試音樂(lè)的標(biāo)題和音樂(lè)家的本模型的研究更關(guān)注于實(shí)際應(yīng)用,所以選取整首流行音樂(lè)作為分類對(duì)象。數(shù)據(jù)集共新世紀(jì)音樂(lè)(NewAge)、說(shuō)唱音樂(lè)(Rap)。其中每個(gè)風(fēng)格由10mp3格式的音樂(lè)組成。這些音樂(lè)是根據(jù)Last.fm列出的每個(gè)風(fēng)格的經(jīng)典專輯和經(jīng)典曲目列表在、,首先使用jAudioTaggerLibrary從音樂(lè)文件包含的ID3中抽取音樂(lè)的標(biāo)題獲取測(cè)試音樂(lè)的根據(jù)所獲得的音樂(lè)標(biāo)題和音樂(lè)家以此作為輸入利用Last.fm提供的API接口(Track.GetTopTags)和音樂(lè)對(duì)應(yīng)的。Last.fm是一個(gè)廣受歡迎的音樂(lè)網(wǎng)4.2:APITrack.GetTopTagsThreeO’clock的文 規(guī)定每首歌曲的數(shù)量范圍在到100之間,而且除了以外還可 被使用的頻率。圖4.2展示了通過(guò)API接口(Track.GetTopTags)上 數(shù)據(jù)的原始數(shù)據(jù)。圖4.3是展示了歌曲“ThreeO’clockBlues”的。以序號(hào)為1的歌曲為例,歌曲的標(biāo)題和藝術(shù)家的分別是ThreeO’clockBlues和B.B.King。歷史上(時(shí)間2013年4月13日止)共有25個(gè)被用來(lái)標(biāo)注這首歌曲,其中使用次數(shù)最多的就是blues,其頻率為100次。我們通過(guò)API接口(Track.GetTopTags)提取的是用戶根據(jù)自己的理解對(duì)于音樂(lè)進(jìn)行的標(biāo)注,具有很大的隨意性,而且其中的很多是與音樂(lè)風(fēng)格信息無(wú)關(guān)的,因此我們需要對(duì)特征進(jìn)行去噪、分離等處理。還是以歌曲ThreeO’clockBlues為例,我們需要將與風(fēng)格無(wú)關(guān)的bbking等去掉;對(duì)于bluesrock我們需要從中分離出音樂(lè)風(fēng)格Blues和rock并分別計(jì)數(shù);而對(duì)于bluesguitar我們需要將blues提取出來(lái)并累積相加。圖4.3中的特征經(jīng)過(guò)上述操作以后就會(huì)得到如圖4.4的結(jié)4.4:ThreeO’clock4.3:描述歌曲“ThreeO’clockBlues”基于LDA框架對(duì)進(jìn)行分LDA是一種生成模型(generativemodel),也就是說(shuō),與直接根據(jù)觀察到的文檔來(lái)進(jìn)行預(yù)測(cè)不同,LDA首先假設(shè)了產(chǎn)生文檔的一個(gè)過(guò)程,然后根據(jù)觀察到文檔,來(lái)預(yù)測(cè)背后的產(chǎn)生過(guò)程是怎樣的LDA假設(shè)所有的文檔存在K個(gè)其實(shí)就是詞的分布),要在基于的音樂(lè)風(fēng)格分類方法中,將用到LDA方法對(duì)由音樂(lè)組成的語(yǔ)料庫(kù)進(jìn)行建模。根據(jù)文獻(xiàn)[5],在本文的方法中將類比于文檔中的詞,而將每首歌曲對(duì)應(yīng)的假設(shè)K維向量α是的先驗(yàn)分布的參數(shù),K×V的矩陣是中詞的分布的參數(shù)(V),即()i個(gè)中出現(xiàn)詞的概率,那么生成一個(gè)文檔的分布、再生成N個(gè)、進(jìn)而得到這篇文檔的N個(gè)詞的概率可以表示為: )∏ ) ∫ )(∏∑ ) ∏∫( )(∏∑( )( LDA的訓(xùn)練過(guò)程就是求使得(D 就可以對(duì)一篇文檔的分布,以及每個(gè)詞所屬的進(jìn)行預(yù)測(cè),即求: LDALDA是說(shuō)訓(xùn)練集中的數(shù)據(jù)實(shí)際上就構(gòu)成了由多個(gè)文檔所組成的語(yǔ)料庫(kù),通過(guò)Gibbssampling算法的不斷迭代,可以求得矩陣β,也就可以得到每個(gè)屬于某個(gè)風(fēng)格的概率,用(|)來(lái)表示。此時(shí),定義基于的音樂(lè)風(fēng)格分類方法如下: +為歌曲的集合,對(duì)于每首歌曲而言均有與之對(duì)應(yīng)的集合()。定義集合 +為音樂(lè)的風(fēng)格, () 。基于的音樂(lè)風(fēng)格分類就是要求得函數(shù)F從而建立由 F可由下面的定義: | )表示被用來(lái)標(biāo)注音樂(lè)的次數(shù),t表示音樂(lè)包含的的數(shù)據(jù)分析和結(jié)論總的平均準(zhǔn)確率趨近一個(gè)固定的值,大概為84%。五、基于互聯(lián)網(wǎng)語(yǔ)義的流行音樂(lè)風(fēng)格分類模我們基于互聯(lián)網(wǎng)語(yǔ)義關(guān)系來(lái)對(duì)流行音樂(lè)風(fēng)格進(jìn)行分類是借鑒了C.McKay等人在文章[6]中音樂(lè)的文化特征和甑超等人在文章[7]中語(yǔ)義特征這一系列對(duì)音樂(lè)的評(píng)章等等。當(dāng)我們?cè)诰W(wǎng)絡(luò)上抓取數(shù)據(jù)的時(shí)候,如果一段流行音樂(lè)總與某個(gè)原始在我們的實(shí)驗(yàn)中對(duì)于每一首歌曲我們都要通過(guò)搜索網(wǎng)絡(luò)資源計(jì)算歌曲名稱與各個(gè)是們過(guò)在一個(gè)網(wǎng)頁(yè)中的概率而得到,計(jì)算的是:P= 5.1其中,M(a,b)代表a和b同時(shí)出現(xiàn)的網(wǎng)頁(yè)的個(gè)數(shù),C(a)代表只有a出現(xiàn)的網(wǎng)頁(yè)的””AND(”R&B”O(jiān)R“節(jié)奏 “其中音樂(lè)與音樂(lè)家的對(duì)應(yīng)關(guān)系如表5.1所示。RollingInTheCallMeCarlyRaeRB=(”R&B”O(jiān)R”節(jié)奏”);Pop=(”Pop”);HH=(”嘻哈”O(jiān)R“HIP-CM=(”O(jiān)RBL=(”O(jiān)R“Blues”);JA=(”爵士”O(jiān)R“Jazz”);SO=(””O(jiān)R“Soul”);RO=(”搖滾”O(jiān)R“Rock”NA=(”NewAge”O(jiān)RRP=(”Rap”O(jiān)R“說(shuō)唱”) TheDeep逝去的溫柔CallMeRollingInThe 文 互聯(lián)網(wǎng)語(yǔ)義關(guān)系特征向量的表示向量X表示,其音樂(lè)家與流行音樂(lè)風(fēng)格的聯(lián)系緊密度用向量Y表示。那么流行音樂(lè)的互聯(lián) 多個(gè)音樂(lè)風(fēng)格同時(shí)存在的判斷假定T(i)5.1數(shù)據(jù)分析和結(jié)論m=0.25,n=0.75的風(fēng)格分類的準(zhǔn)確性最高,可以達(dá)到83.2%。說(shuō)明音樂(lè)家和流行音樂(lè)風(fēng)格的緊密度Y的權(quán)間有限,本此次只是提出這個(gè)模型,實(shí)驗(yàn)結(jié)果雖然較好,但是不能以一概全,需要六、基于LDA和多類SVM的流行音樂(lè)風(fēng)格分類模型傳統(tǒng)的基于聲學(xué)特征的音樂(lè)風(fēng)格分類方法最早由GeorgeTzanetakis如圖6.1所示,首先隨機(jī)地選定訓(xùn)練樣本集合測(cè)試樣本集,其中的樣本都依次通過(guò)信號(hào)預(yù)處理、音樂(lè)特征提取和LDA降維這3個(gè)步驟,然后使用訓(xùn)練樣本集中的特征向量對(duì)分音樂(lè)特征分析頻譜質(zhì)心(Spectral頻譜質(zhì)心又稱為頻譜亮度(Brightness),其定義為FFT能量譜中經(jīng)能量的其中和表示FFTk個(gè)分量所對(duì)應(yīng)的頻率值及其能量,KFFT變換長(zhǎng)度和采樣率決定的FFT譜中頻率分量的數(shù)目。頻譜質(zhì)心可以看做頻譜能量分布和樂(lè)器腔的特性密切相關(guān)。例如,作為低音樂(lè)器的長(zhǎng)號(hào)由于銅管的效應(yīng)頻譜帶寬(Spectral頻譜帶寬的定義為FFT譜中所有頻率分量與頻譜質(zhì)心之間的距離的平方經(jīng)能量加頻譜滾降度(Spectral其 為低頻累積能量占總能量的比例,對(duì)于音樂(lè)信 的取值可以設(shè)置在s頻譜通量(Spectral其中()ikNFFT分為若干子帶,對(duì)每一個(gè)子帶中的能量的分布進(jìn)行了更為細(xì)致的統(tǒng)計(jì)分析。由前文的分析知,當(dāng)外界激勵(lì)經(jīng)過(guò)樂(lè)器腔時(shí),受到效應(yīng)的影響不同頻率能量重新分配,設(shè)第s子帶所包含的頻率在FFT ,為該子帶中頻率分量的個(gè)數(shù),它們對(duì)應(yīng)的能量 將頻譜分量的能量按降序排列得到能量有序序列 },其中(依據(jù)經(jīng)驗(yàn)設(shè)置為20%左右)的頻率分量的平均能量,即:前文討論了在單音音樂(lè)中如何結(jié)合參考樂(lè)譜提取音符的起始點(diǎn)并進(jìn)而分析出音樂(lè)0敲擊強(qiáng)度曲線(Onsetcurve)6.2為了去信號(hào)波形中存在的毛刺,利用升余弦窗(RaisedCosineWindow)的敲擊強(qiáng)度曲線O()(其中 ,L為敲擊強(qiáng)度曲線的長(zhǎng)度)中的峰值指示信號(hào)O()。如果音頻中周期性的出現(xiàn)敲擊點(diǎn),則在敲擊點(diǎn)周期及其整數(shù)倍的位置自相關(guān)函小波變換系數(shù)直方圖(WaveletCoefficients與變換通過(guò)平移固定寬度的滑動(dòng)窗口分析得到固定時(shí)域和頻域分辨率的思變換同類別音樂(lè)之間的可區(qū)分性。5-108(8-orderDaubechiesWavelet,Db8)濾波器組對(duì)信號(hào)進(jìn)行7級(jí)分解得到8個(gè)子帶的小波變換系數(shù)。1(均值)、2(方差)3(偏語(yǔ)音信號(hào)預(yù)處理wave11.025kHz,16bit/sample。在特征提取之前,要對(duì)每一段音樂(lè)進(jìn)行預(yù)處理。首先對(duì)信號(hào)進(jìn)行預(yù)加重(參數(shù)為0.96),以提升高頻部分的能量;然后對(duì)每一首音樂(lè)進(jìn)行分幀,幀長(zhǎng)256點(diǎn)(約23ms),相鄰幀之間有128點(diǎn)(50%)的低于一閾值(10,音樂(lè)特征提取感知特征(Perc), 幀能量:該特征用每幀信號(hào)總能量的對(duì)數(shù)來(lái)表示,其中,()表示頻率處的譜密度, 子帶能量:信號(hào)的頻譜被分為4個(gè)子帶,[( ?)],[( ?)( ?)], ?)( ?)] ?) () ( (帶寬:信號(hào)頻譜成分與譜質(zhì)心之差以能量進(jìn)行的均值 ( (基音頻率特征。第法[6]采用Yule-Walker法估計(jì)經(jīng)低通濾波后信號(hào)的AR譜,然后在一定范圍內(nèi)(50~500Hz)進(jìn)行峰值檢測(cè),當(dāng)峰值超過(guò)一定門限時(shí),記錄峰值位置為基音頻率;第二種方法[7]對(duì)經(jīng)低通濾波后信號(hào)進(jìn)行中心削波,然后計(jì)算削波后信號(hào)的歸一化自相關(guān)函數(shù),并對(duì)自相關(guān)函數(shù)在一定范圍內(nèi)(50~500Hz)進(jìn)行峰值檢測(cè),計(jì)算基Mel(Mel-FrequencyCepstralCoefficient,MFCC):MFCCMel(1kHz1kHzkx(k),MFCC(L為MFCC的維數(shù))使用LDA對(duì)特征向量進(jìn)行降維復(fù)雜度太高或空間需求太大的問(wèn)題,而且還可能會(huì)遇到維數(shù)冗余(excessivedimensionality)的。針對(duì)這些問(wèn)題,一般有兩種可行的解決方法:一是重新設(shè)計(jì)因?yàn)樗坏子谟?jì)算而且易于分析"實(shí)際上,線性方法將高的矢量投影到較低維一個(gè)n維向量,????????-??了進(jìn)行降維,變換為低維向量,???? ????-??????Yx主成分分析(PrincipalComponent 線性判別分析(LinearDiscriminative 主成分分析PCA方法也稱為Karhunen-Loeve方法選擇一個(gè)降低維數(shù)的線性投影,使得所有投mm<n。則新的樣本向量{????????????}可以表示為: 其中W????稱為變換矩陣,W的所有列之間都是正交的。總體離散度矩陣(totalscattematrix)????:定義為: ????是所有樣本的均值對(duì)原樣本向量實(shí)施線性變換??????得到變換后向量伽,*??? ??????????PCA????????的選擇是使得投影后向量總體離散度矩陣的行列式最大的矩陣W,即: 線性判別分析LoAFLo(FISherLinearoiscriminative)[8情況下,類內(nèi)的變化都存在特征空間的一個(gè)子空間中,因此各類是凸起并線性可分的,可以在使用線性投影的方法實(shí)現(xiàn)降維的同時(shí)保持類間的線性可分性。這就是人們喜歡在模式分類中使用線性方法進(jìn)行降維的一個(gè)很重要的原因。LDA影方向,使得投影后的子空間中不同類間樣本的分離度盡可能大一些,而類內(nèi)樣本盡量LDA定義類間離散度矩陣????定義類內(nèi)離散度矩陣????其中????是類????中特征向量的均值,????是類????中的特征數(shù)。若????是非奇異的,則最佳投大的W,即: ??的廣義特征向量,它們分別對(duì)應(yīng)于所有廣義特征值中m個(gè)最大 c1數(shù)上限是c-1,c是待分類的類別數(shù)。3-12是一個(gè)兩維分類的例子,其對(duì)比PCALDA在投影方向上的不同,圖中N=20,n=2,m=1由圖中可見(jiàn),PCALDA特征點(diǎn)從兩維投影到一維,具體比較兩者的不同,發(fā)現(xiàn)PCA雖然使得點(diǎn)與點(diǎn)之間的距離變大,但實(shí)際上是把兩類點(diǎn)了在一起,導(dǎo)致不能用線性的方法將它們分開(kāi);而LDAF(LD)不但保留了類別間的可分性,而且取得了向量投影到一較低(N-c維,使得在該空間中類內(nèi)離散矩陣????為非奇異的,這可以通PCA來(lái)實(shí)現(xiàn);然后再通過(guò)LDA將所得特征向量降維c-1維。具體 圖6.6LDA用于音樂(lè)特nc,nc,cn維向量進(jìn)入分類器進(jìn)行音樂(lè)分類。由于投影后的c維子空間中不同類間樣本的分離度較大,使用SVM對(duì)特征向量進(jìn)行分類XF后變?yōu)榫€性可分。不同的非線性變化?()對(duì)應(yīng)著下式中不同的核函數(shù)K(??),目前經(jīng)常用于模式分類 類別,對(duì)于每一個(gè)非葉節(jié)點(diǎn),在它的兩個(gè)子節(jié)點(diǎn)之間使用SVM進(jìn)行兩類分類,勝利者被具體過(guò)程如下圖6.8所示數(shù)據(jù)分析和結(jié)論 s其中??為每幀信號(hào)中的第n個(gè)采樣值,而 其中漢明窗 s(π )著可以在該段音樂(lè)中提取N8維的感知特征向量NLMFCC特征向量,針感知特征:計(jì)算每一段音樂(lè)8維感知特征向量的均值和標(biāo)準(zhǔn)差,并將它們級(jí)聯(lián)到一個(gè)8X2=16維的特征向量,再加上比率特征(檢測(cè)出有基音的幀數(shù)/總幀數(shù))就得到了代表感知特征的17維特征向量。接著,在整個(gè)訓(xùn)練集中對(duì)每一維特征進(jìn)其中????是感知特征向量中的第i個(gè)元素,????是訓(xùn)練集中所有感知特征向量的第i個(gè)元素的均值,????i得到了最終的感知特征向量集(17維。MFCC1中的步驟計(jì)算每一段音樂(lè)信號(hào)L維MFCC系數(shù)的均值和標(biāo)準(zhǔn)差,但是并不進(jìn)行歸一化處理,這樣就得到了2LMFCC特征向量。對(duì)感知特征進(jìn)行歸一化而MFCCMFCCMFCC題就是如何將它們按照一定的權(quán)重級(jí)聯(lián)成一個(gè)長(zhǎng)的向量來(lái)代表它們所對(duì)應(yīng)的那一段音樂(lè)。具體的級(jí)聯(lián)過(guò)程如下:其標(biāo)準(zhǔn)差之和為s1=17x1,而MFCC特征 σ,/s24400作品。每種音樂(lè)類型100首。數(shù)據(jù)庫(kù)來(lái)自CD、mp3、數(shù)據(jù)庫(kù)和無(wú)線電廣播。每 七、基于分形維數(shù)的流行音樂(lè)風(fēng)格分類模型音樂(lè)與1/f變換相當(dāng)于隨機(jī)自仿射變換,這樣就構(gòu)造出了某種程度的自相似性。VossR.F.發(fā)現(xiàn)幾乎所有的音樂(lè)都在模仿???噪聲(其中f為噪聲的頻率)[9-10]。20Hz???噪聲的特點(diǎn)。分析在七個(gè)不同風(fēng)格的流行音樂(lè)(classic,hip-hop,newage,jazz,rock,rapandpop)???噪聲。為了便于分析,我們用了20首不同風(fēng)格的音樂(lè),記錄格式為[1],噪聲有三種不同的類型,如??????。DNA的結(jié)構(gòu)特性。Voss等的了1/f性在Vss的發(fā)表后,已經(jīng)有一些關(guān)于??意味著,有一e????分析更加重要。此20Hz是否能區(qū)分不同文化和風(fēng)格的音樂(lè)。白噪聲是其相關(guān)處處為0。這意味著,在白噪聲,其不包含任何信息。它在整個(gè)頻??噪聲由運(yùn)動(dòng)產(chǎn)生,是小顆粒在液體中的運(yùn)動(dòng)。有時(shí)它被稱為紅色的噪???,這意味著,這將非常強(qiáng)烈依賴與它的過(guò)去狀態(tài)。粉紅噪聲(為了便于分析,我們用了20首不同風(fēng)格的音樂(lè),記錄格式為16KHz,16位和單聲道件的功率譜的變換。了???低頻區(qū)域的結(jié)構(gòu)特性,一些沒(méi)有。 明了在低頻區(qū)的???結(jié)構(gòu)特性
7.2rap圖7.3和圖7.4為pop和rock風(fēng)格的音樂(lè)顯示的功率譜。它清楚地表明,pop顯示???結(jié)構(gòu)特性在低頻區(qū)相對(duì)較好,但rock???結(jié)構(gòu)特性。圖7.3pop的功率 圖7.4classic的功率格音樂(lè),評(píng)估出???在每首音樂(lè)中低于20Hz區(qū)域的結(jié)構(gòu)特性。圖7.5顯示了七個(gè)不同風(fēng)格的音樂(lè)低20Hz區(qū)域???的結(jié)構(gòu)特性(垂直軸表示的程度(),橫軸的歌曲數(shù)量。正如預(yù)期的那樣,classic較好的顯示了???結(jié)構(gòu)特性。由表7.1中所示的關(guān)于不同風(fēng)格音樂(lè)在低于20Hz區(qū)域???結(jié)構(gòu)特性的平均值,可以看到,classic表現(xiàn)了最好的???噪聲分析,pop表現(xiàn)第二,rap表現(xiàn)。這意味著,在低于20Hz區(qū)域的???噪聲可能不會(huì)顯示音樂(lè)的文化特點(diǎn),但可以明顯的區(qū)分音 度123456Hip-7我們分析了在七個(gè)不同風(fēng)格的流行音樂(lè)(classic,hip-hop,newage,jazz,rock,通過(guò)分析低于20Hz???噪聲的特點(diǎn)來(lái)區(qū)分音樂(lè)的風(fēng)格。關(guān)于1/f噪聲的分形性質(zhì)機(jī)自仿射變換,這樣就構(gòu)造出了某種程度的自相似性。VossR.F.發(fā)現(xiàn)幾乎所有的聲是具有分形性質(zhì)的,因樂(lè)也應(yīng)該具有分形性質(zhì),這便為我們從分形的角度研音樂(lè)的分形維數(shù)計(jì)算分形維數(shù)實(shí)質(zhì)上是Hausdorff豪維數(shù),但由于Hausdorff豪維數(shù)極FRnNδ(F)δ,F(xiàn)少個(gè)數(shù),則F的上、下盒維數(shù)定義為???I?????? Nδ( 和DIM( Nδ( FFDIM( Nδ( 選取合適的網(wǎng)格的最大邊長(zhǎng)一般為2n(n為正整數(shù)對(duì)輸入的數(shù)據(jù)進(jìn)行重采樣使采樣過(guò)后的數(shù)據(jù)點(diǎn)數(shù)等于網(wǎng)格的最大邊長(zhǎng)加1把網(wǎng)格大小e分別設(shè)為2,4,8,?數(shù)N(e)。n+1率就是盒維數(shù)D。N(D(?log(k/e)基于分形維數(shù)的音樂(lè)分類方法據(jù)采用單聲道、采樣率為44.1kHz、精度為8位格式。所選音樂(lè)要求是各類音30296classical,100country,10696classic40它的為另一部分?,F(xiàn)只對(duì)第一部分40首左右的classic音樂(lè)進(jìn)行如程處理:隨機(jī)選取4首音樂(lè)作為第一小組。1列。對(duì)上步中的最大值與最小值做差,得出差值。如表1中的第四列。1:0.142、3、4小于0.1則第一組的相對(duì)差值默認(rèn)為0。0.1154復(fù)上面2到4步??v坐標(biāo)為相對(duì)差值(如圖1。0(7.6)才完成此類音樂(lè)的訓(xùn)練,得出此類音樂(lè)的維數(shù)范圍。如(7.2)中最后一行第二列,第三列即為此類音樂(lè)的408...............0classic7.7,1.67151.7296。第三類Hip-hop音樂(lè),維數(shù)范圍的確定與classic音樂(lè)方法相同。7.8,維數(shù)范圍是1.7302~1.8233仍以classic音樂(lè)為例。其它兩類的測(cè)試過(guò)程與classic音樂(lè)相同。把這96首音樂(lè)作為測(cè)試集進(jìn)試,測(cè)試過(guò)程如下:用程序計(jì)算所有96首classic音樂(lè)的維數(shù),用上面測(cè)試集算出的classic音樂(lè)維
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年蘇科新版九年級(jí)生物下冊(cè)月考試卷含答案
- 2025年魯科版七年級(jí)物理下冊(cè)階段測(cè)試試卷
- 二零二五版美容美發(fā)行業(yè)員工勞動(dòng)合同終止補(bǔ)償合同4篇
- 二零二五年度農(nóng)業(yè)病蟲(chóng)害防治設(shè)備租賃合同4篇
- 二零二五版鎳氫電池產(chǎn)品供應(yīng)鏈管理合同4篇
- 二零二五年度門窗行業(yè)供應(yīng)鏈管理服務(wù)合同7篇
- 二零二五年度IT行業(yè)IT支持服務(wù)合同2篇
- 2025年度文化創(chuàng)意產(chǎn)業(yè)園區(qū)開(kāi)發(fā)合同協(xié)議范本4篇
- 2025版農(nóng)機(jī)零部件供應(yīng)合同協(xié)議范本4篇
- 二零二五年度沐足行業(yè)員工薪酬福利合同范本4篇
- 2024年公證遺產(chǎn)繼承分配協(xié)議書(shū)模板
- 燃?xì)饨?jīng)營(yíng)安全重大隱患判定標(biāo)準(zhǔn)課件
- JB-T 8532-2023 脈沖噴吹類袋式除塵器
- 深圳小學(xué)英語(yǔ)單詞表(中英文)
- 護(hù)理質(zhì)量反饋內(nèi)容
- 山東省濟(jì)寧市2023年中考數(shù)學(xué)試題(附真題答案)
- 抖音搜索用戶分析報(bào)告
- 鉆孔灌注樁技術(shù)規(guī)范
- 2023-2024學(xué)年北師大版必修二unit 5 humans and nature lesson 3 Race to the pole 教學(xué)設(shè)計(jì)
- 供貨進(jìn)度計(jì)劃
- 彌漫大B細(xì)胞淋巴瘤護(hù)理查房
評(píng)論
0/150
提交評(píng)論