版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘中聚類算法的綜述3胡慶林葉念渝朱明富(華中科技大學(xué)控制科學(xué)與工程系武漢430074摘要聚類算法是數(shù)據(jù)挖掘領(lǐng)域中非常重要的技術(shù)。本綜述按照聚類算法的分類,對每一類中具有代表性的算法進(jìn)行了介紹,分析和評價(jià)。最后從發(fā)現(xiàn)聚類形狀、所適用的數(shù)據(jù)庫和輸入數(shù)據(jù)順序的敏感性等方面進(jìn)行了算法推薦,供大家在選擇聚類算法時(shí)參考。關(guān)鍵詞數(shù)據(jù)挖掘聚類分析聚類算法中圖分類號(hào)TP301.61引言數(shù)據(jù)挖掘(Data M ining:是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用信息和知識(shí)的過程。當(dāng)人們使用數(shù)據(jù)挖掘工具對數(shù)據(jù)中的模型和關(guān)系進(jìn)行辨識(shí)的時(shí)候,通常第一
2、個(gè)步驟就是聚類。因此根據(jù)實(shí)際科研情況,選擇一個(gè)好的聚類算法對后續(xù)的研究工作是非常關(guān)鍵的。聚類的定義:聚類是將數(shù)據(jù)劃分成群組的過程。通過確定數(shù)據(jù)之間在預(yù)先制定的屬性上的相似性來完成聚類任務(wù),這樣最相似的數(shù)據(jù)就聚集成簇。聚類與分類的不同點(diǎn):聚類的類別取決于數(shù)據(jù)本身;而分類的類別是由數(shù)據(jù)分析人員預(yù)先定義好的。聚類算法的分類:一般可分為基于層次的,基于劃分的,基于密度的,基于網(wǎng)格的和基于模型的五種。2基于層次的聚類算法層次的聚類算法對給定數(shù)據(jù)對象進(jìn)行層次上的分解。根據(jù)層次分解的順序是自下向上的還是自上向下的,可分為凝聚算法(自下向上的和分裂算法(自上向下。2.1凝聚算法思想該算法的主要思想是發(fā)現(xiàn)最大連
3、通子圖,如果至少存在一條連接兩個(gè)簇的邊,并且兩點(diǎn)之間的最短距離小于或等于給定的閥值,則合并這兩個(gè)簇。該算法尋找的是一個(gè)團(tuán),而不是連通的分量,一個(gè)團(tuán)是一個(gè)最大的圖,其中任意兩個(gè)頂點(diǎn)之間都存在一個(gè)條邊。如果兩個(gè)簇中的點(diǎn)之間的距離小于距離閥值,則合并這兩個(gè)簇。如果在兩個(gè)目標(biāo)簇中,一個(gè)簇中的所有成員與另一個(gè)簇中的所有成員之間的平均距離小于距離閥值,則合并這兩個(gè)簇。評論:以上三個(gè)算法的復(fù)雜度都是O(n2, (其中n是數(shù)據(jù)成員的個(gè)數(shù),因此他們的效率不高。而且在單連接算法中存在鏈?zhǔn)叫?yīng)(chain effect,影響了凝聚算法的實(shí)際應(yīng)用。鏈?zhǔn)叫?yīng)是指:當(dāng)兩個(gè)簇中只要存在兩個(gè)相近的點(diǎn),這兩個(gè)簇就合并了,完全不
4、管這兩個(gè)簇中還可能存在其他相距很遠(yuǎn)的點(diǎn)。因此合并后的簇中可能存在一些根本就互不相關(guān)點(diǎn)。Clustering using H ierarchies算法B I RCH是一個(gè)綜合性的層次聚類方法。它用聚類特征和聚類特征樹(CF來描述聚類過程。CF樹是一個(gè)平衡樹,它有兩個(gè)參數(shù):分支因子和閾值,它存儲(chǔ)了層次聚類的聚類特征。分支因子定義為每個(gè)非葉節(jié)點(diǎn)孩子的最大數(shù)目,而閾值是指71第35卷(2007第2期計(jì)算機(jī)與數(shù)字工程3收到本文時(shí)間:2006年4月7日作者簡介:胡慶林,男,在讀碩士,主要研究方向:數(shù)據(jù)挖掘,電子商務(wù)。葉念瑜,女,教授,主要研究方向:計(jì)算機(jī)控制與管理一體化。朱明富,男,副教授。主要研究方向:
5、決策支持系統(tǒng),企業(yè)信息工程、控制管理一體化。存儲(chǔ)在樹的葉子節(jié)點(diǎn)中的子聚類的最大直徑。一個(gè)數(shù)據(jù)項(xiàng)總是被插入到最近的葉子條目(子聚類中。如果在插入后,使得該葉子節(jié)點(diǎn)中的子聚類的直徑大于閾值,則該葉子節(jié)點(diǎn)或其他節(jié)點(diǎn)很有可能被分裂。在新數(shù)據(jù)插入后,關(guān)于該數(shù)據(jù)的信息會(huì)向樹根傳遞。我們可以通過改變閾值來修改CF樹的大小,從而控制其占內(nèi)存容量;另外,CF樹可以動(dòng)態(tài)地構(gòu)造,因此不要求所有的數(shù)據(jù)一次性地讀入內(nèi)存,故存儲(chǔ)在外存上的數(shù)據(jù)項(xiàng)可以逐個(gè)地被讀入。B I RCH算法通過一次掃描就可以進(jìn)行較好的聚類,該算法的計(jì)算復(fù)雜度是O(n,其中n是對象的數(shù)目。評論:優(yōu)點(diǎn):B I RCH算法通過聚類特征可以方便地進(jìn)行中心、
6、半徑、直徑及類內(nèi)、類間距離的運(yùn)算。算法具有對象數(shù)目的線性易伸縮性,及良好的聚類質(zhì)量。缺點(diǎn):由于受CF樹節(jié)點(diǎn)大小的限制, CF樹節(jié)點(diǎn)并不總是與用戶所認(rèn)為的自然聚類相對應(yīng)。而且,如果簇不是球形,B I RCH算法則不能很好地工作。2.2分裂算法思想初始的時(shí)候,所有的數(shù)據(jù)成員都包含在一個(gè)簇中,是一個(gè)簇,然后將上層的簇重復(fù)地分裂為兩個(gè)下層簇,直到每一個(gè)成員都組成一個(gè)單獨(dú)的簇為止。代表算法:基于單連接算法MST。其分裂過程為:將最小生成樹的邊從最長到最短依次進(jìn)行剪切。該算法將產(chǎn)生與凝聚方法完全相同的簇集,只是產(chǎn)生過程的次序完全相反。層次的聚類算法評論:層次聚類方法的前提條件是假設(shè)數(shù)據(jù)是一次性提供的,因此
7、都不是增量算法。其缺陷在于,一旦一個(gè)步驟(合并或分裂完成,它就不能被撤消,因而不能更正錯(cuò)誤的決定。改進(jìn)層次方法的聚類質(zhì)量的一個(gè)有希望的方向是將層次聚類和其他聚類技術(shù)進(jìn)行集成,例如上面的B I RCH算法。3劃分的聚類算法將一個(gè)有N個(gè)樣本的數(shù)據(jù)庫,分為K個(gè)劃分(KN,每個(gè)劃分表示一個(gè)簇,并同時(shí)滿足以下兩個(gè)條件的過程,稱為劃分算法。(1每個(gè)簇至少包含一個(gè)樣本;(2每個(gè)樣本必須屬于且僅屬于一個(gè)簇。其具體代表算法有:P AM算法,CLARA算法, CLARANS算法等等。3.1P AM(Partiti oning A r ound Medoids算法該算法也稱作K-中心點(diǎn)算法,是指用中心點(diǎn)來代表一個(gè)簇
8、。利用中心點(diǎn)這個(gè)概念能夠很好地處理異常點(diǎn)。初始時(shí),將N個(gè)成員中的K個(gè)隨機(jī)成員設(shè)置為中心點(diǎn)集合,然后在每一步中,對輸入數(shù)據(jù)集中目前還不是中心點(diǎn)的成員進(jìn)行逐個(gè)檢驗(yàn),看是否可成為中心點(diǎn)。評論:該算法將判定是否存在一個(gè)成員,可以取代已存在的一個(gè)中心點(diǎn)。通過檢驗(yàn)所有的中心點(diǎn)與非中心點(diǎn)組成的對,PAM算法將選擇最能提高聚類效果的對。該方法的聚類效果的度量是簇中的非中心點(diǎn)到簇的中心點(diǎn)的所有距離之和。由于在每次迭代過程中需要確定出K (N-K個(gè)交換對,在每個(gè)交換對中又要計(jì)算N -K個(gè)非中心點(diǎn)到簇的中心點(diǎn)距離之和的變化,故每次迭代的總的復(fù)雜度是O(K(N-K2。所以該算法的復(fù)雜性太高。但其算法邏輯較簡單,適合小
9、型的數(shù)據(jù)庫。3.2CLARA(Clustering LARge App licati ons算法通過數(shù)據(jù)庫抽樣,改進(jìn)了P AM的時(shí)間復(fù)雜性。其基本思想是首先對數(shù)據(jù)庫進(jìn)行抽樣,然后將利用P AM算法在抽樣后的數(shù)據(jù)上進(jìn)行聚類,得到的中心點(diǎn)就是整個(gè)數(shù)據(jù)庫的中心點(diǎn),最后將數(shù)據(jù)庫中所有成員分配到離自身距離最近的中心點(diǎn)所代表的簇中。評論:為了提高CLARA的精度,可以分別進(jìn)行幾組抽樣,然后在每組抽樣上都應(yīng)用P AM算法,最后將最好的聚類結(jié)果作為最終的聚類結(jié)果。由于使用了抽樣技術(shù),對于大型數(shù)據(jù)庫而言,CLARA比P AM更有效率,但其效果則取決于樣本規(guī)模。有研究結(jié)果2表明,樣本規(guī)模為40+2K的數(shù)據(jù)庫,進(jìn)行
10、5次抽樣會(huì)得到較好的結(jié)果。3.3CLARANS(Clustering Large App licati ons basedupon Random ized Search算法CLARANS通過利用多次不同抽樣來改進(jìn)CLARA。除了需要與P AM一樣的輸入外,CLAR2 ANS還需要輸入兩個(gè)參數(shù):maxneighbor和num l o2 cal。maxneighbor表示一個(gè)節(jié)點(diǎn)可以與任意特定節(jié)點(diǎn)(鄰居進(jìn)行比較的數(shù)目。隨著maxneighbor的增長,CLARANS與P AM更加相近,這是由于所有節(jié)點(diǎn)都可能被檢驗(yàn)。Num l ocal表示抽樣次數(shù)。評論:由于在每個(gè)樣本上都要進(jìn)行新的聚類,所以nu
11、m l ocal也表示需要進(jìn)行聚類的次數(shù)。研究結(jié)果3表明當(dāng)nu m l ocal=2和maxneighbor=max (0.01253K(N-K,250時(shí),聚類效果較好。對于任意規(guī)模的數(shù)據(jù)集,CLARANS比CLARA和P AM效率要高。3.4CURE(Clustering U sing REp resentatives算法81胡慶林等:數(shù)據(jù)挖掘中聚類算法的綜述第35卷CURE算法中即有層次部分,也有劃分部分,所以CURE是一個(gè)綜合性的聚類算法。CURE算法過程,首先從每個(gè)簇中選擇c(常數(shù)個(gè)點(diǎn),然后通過應(yīng)用收縮因子a,這些分散的點(diǎn)將向簇的質(zhì)心方向收縮。當(dāng)a為1的時(shí)候,所有點(diǎn)都收縮成一點(diǎn),即質(zhì)心
12、。由這些點(diǎn)代表的簇,要比單個(gè)點(diǎn)更具有代表性。通過多個(gè)有代表性的點(diǎn),簇的形狀可以更好地被表示出來。這一步完成后,再使用層次聚類算法中的凝聚算法。在凝聚算法中的每一步,距離最近的代表性點(diǎn)所對應(yīng)的簇將被合并。它們之間的距離被定義為兩個(gè)簇中代表性點(diǎn)之間距離的最小值。評價(jià):該算法優(yōu)點(diǎn):它回避用所有點(diǎn)或單個(gè)質(zhì)心來表示一個(gè)簇的傳統(tǒng)方法,將一個(gè)簇用多個(gè)具有代表性的點(diǎn)來表示,使C URE可以適應(yīng)非球形的幾何形狀。另外,收縮因子降底了噪音對聚類的影響,從而使CURE對孤立點(diǎn)的處理更加健壯,而且能識(shí)別非球形和大小變化比較大的簇。對于大型數(shù)據(jù)庫具有良好的伸縮性。缺點(diǎn):參數(shù)設(shè)置對聚類結(jié)果有很大的影響,CURE算法不能處
13、理分類屬性。C URE的復(fù)雜度是O(n,其中n是對象的數(shù)目。劃分的聚類算法評論:劃分聚類方法對在中小規(guī)模的數(shù)據(jù)庫中發(fā)現(xiàn)球狀簇很適用。為了對大規(guī)模的數(shù)據(jù)集進(jìn)行聚類,以及處理復(fù)雜形狀的聚類,基于劃分的方法有待進(jìn)一步的擴(kuò)展。4基于密度的算法提出基于密度的聚類方法是為了發(fā)現(xiàn)任意形狀的聚類結(jié)果。其主要思想是:只要臨近區(qū)域的密度超過某個(gè)閾值,就繼續(xù)聚類。這樣的方法可以用來過濾“噪聲”孤立點(diǎn)數(shù)據(jù),發(fā)現(xiàn)任意形狀的簇。代表算法:DBSCAN(Density-Based Spatial Cluste2 ring with Noise。4.1DBSCAN算法可以將足夠高密度的區(qū)域劃分為簇,并可以在帶有“噪聲”的空間
14、數(shù)據(jù)庫中發(fā)現(xiàn)任意形狀的聚類。該算法定義簇為密度相連的點(diǎn)的最大集合。DBSCAN通過檢查數(shù)據(jù)庫中每個(gè)點(diǎn)的鄰域來尋找聚類。如果一個(gè)點(diǎn)p的鄰域中包含數(shù)據(jù)項(xiàng)的個(gè)數(shù)多于最小閥值,則創(chuàng)建一個(gè)以p作為核心對象的新簇。然后反復(fù)地尋找從這些核心對象直接密度可達(dá)的對象,當(dāng)沒有新的點(diǎn)可以被添加到任何簇時(shí),該過程結(jié)束。不被包含在任何簇中的對象被認(rèn)為是“噪聲”。如果采用空間索引,DBSCAN的計(jì)算復(fù)雜度是O(n l og n,這里n是數(shù)據(jù)庫中對象數(shù)目。否則,計(jì)算復(fù)雜度是O(n2。評價(jià):DBSCAN算法具有很多優(yōu)點(diǎn):能夠發(fā)現(xiàn)空間數(shù)據(jù)庫中任意形狀的密度連通集;在給定合適的參數(shù)條件下,能很好地處理噪聲點(diǎn);對用戶領(lǐng)域知識(shí)要求較
15、少;對數(shù)據(jù)的輸入順序不太敏感;適用于大型數(shù)據(jù)庫。其缺點(diǎn):DBSCAN算法要求事先指定領(lǐng)域和閾值;具體使用的參數(shù)依賴于應(yīng)用的目的。5基于網(wǎng)格的算法這種算法首先將數(shù)據(jù)空間劃分成為有限個(gè)單元的網(wǎng)格結(jié)構(gòu),所有的處理都是以單個(gè)的單元為對象的。處理速度通常與目標(biāo)數(shù)據(jù)庫中記錄的個(gè)數(shù)無關(guān),它只與單元的個(gè)數(shù)有關(guān),故這種算法的一個(gè)突出優(yōu)點(diǎn)就是處理速度很快。代表算法有:STI N G (Statistical I nf or mati on Grid based method算法。STI N G算法將空間區(qū)域劃分為矩形單元。針對不同級別的分辨率,通常存在多個(gè)級別的矩形單元,這些單元形成了一個(gè)層次結(jié)構(gòu):高層的每個(gè)單元
16、被劃分為多個(gè)低一層的單元。高層單元的統(tǒng)計(jì)參數(shù)可以很容易地從低層單元的計(jì)算得到。這些參數(shù)包括:屬性無關(guān)的參數(shù)count;屬性相關(guān)的參數(shù)m(平均值,s(標(biāo)準(zhǔn)偏差,m in(最小值,max(最大值,以及該單元中屬性值遵循的分布(distribu2 ti on類型。STI N G掃描數(shù)據(jù)庫一次來計(jì)算單元的統(tǒng)計(jì)信息,因此產(chǎn)生聚類的時(shí)間復(fù)雜度是O(n,其中n是對象的數(shù)目。在層次結(jié)構(gòu)建立后,查詢處理時(shí)間是O(g,g是最低層風(fēng)格單元的數(shù)目,通常遠(yuǎn)遠(yuǎn)小于n。評價(jià):優(yōu)點(diǎn)是:效率高,且利于并行處理和增量更新。缺點(diǎn):STI N G算法中,如果數(shù)據(jù)粒度比較細(xì),處理的代價(jià)會(huì)明顯增加;而且該算法沒有考慮子單元和其他相鄰單元
17、之間的關(guān)系。盡管該算法處理速度較快,但是可能會(huì)降低簇的質(zhì)量和精確性。6基于模型的算法基于模型的方法為每個(gè)簇都假定了一個(gè)模型,并尋找數(shù)據(jù)對給定模型的最佳擬合。該算法通過構(gòu)建反映數(shù)據(jù)點(diǎn)空間分布的密度函數(shù)來實(shí)現(xiàn)聚類。這種聚類方法試圖優(yōu)化給定的數(shù)據(jù)和某些數(shù)學(xué)模型之間的適應(yīng)性。其代表算法:COBW EB算法。COBW EB算法以一個(gè)分類樹的形式創(chuàng)建層次聚類,它的輸入對象用“分類屬性”-“值”對來描述。其工作流程是:在給定一個(gè)新的對象后,COB2 W E B沿一條適當(dāng)?shù)穆窂较蛳?修改計(jì)數(shù),以尋找可91第35卷(2007第2期計(jì)算機(jī)與數(shù)字工程以分類該對象的最好節(jié)點(diǎn)。該判定基于將對象臨時(shí)置于每個(gè)節(jié)點(diǎn),并計(jì)算結(jié)
18、果劃分的分類效用。產(chǎn)生最高分類效用的位置應(yīng)當(dāng)是對象節(jié)點(diǎn)的一個(gè)好的選擇。給定一個(gè)新的對象,COBW EB沿一條適當(dāng)?shù)穆窂较蛳?修改計(jì)數(shù),尋找可以分類該對象的最好節(jié)點(diǎn)。在該過程中,將對象臨時(shí)置于每個(gè)節(jié)點(diǎn)上,并計(jì)算劃分的分類效用結(jié)果。產(chǎn)生最高分類效用的位置是對象節(jié)點(diǎn)的一個(gè)好的選擇。評價(jià):優(yōu)點(diǎn):COBW EB可以自動(dòng)修正劃分中類的數(shù)目;不需要用戶提供輸入?yún)?shù)。缺點(diǎn):COB2 W EB基于這樣一個(gè)假設(shè):在每個(gè)屬性上的概率分布是彼此獨(dú)立的。但這個(gè)假設(shè)并不總是成立。分類樹對于偏斜的輸入數(shù)據(jù)不是高度平衡的,它可能導(dǎo)致時(shí)間和空間復(fù)雜性的劇烈變化。COBW E B不適用于聚類大型數(shù)據(jù)庫的數(shù)據(jù)。7綜合結(jié)論通過以上的
19、分析得知,沒有一種算法是十全十美的,建議使用者根據(jù)實(shí)際情況(例如發(fā)現(xiàn)聚類的形狀、數(shù)據(jù)輸入順序是否敏感、適用數(shù)據(jù)庫的大小或者算法效率來選擇聚類算法。一般情況下有以下結(jié)論:目標(biāo)數(shù)據(jù)庫如果比較大,建議使用綜合性的聚類算法,如:B I RCH、CURE、DBSCAN和STI N G 等,以提高算法效率。如果聚類的形狀是球形或者凸形,B I RCH和CLARANS比較適合。一般而言,聚類算法對數(shù)據(jù)輸入的順序都比較敏感。如果希望不敏感,可以選用基于網(wǎng)格的STI N G算法。將不同類型的聚類算法相互結(jié)合(例如B I RCH算法和CURE算法,綜合各自的優(yōu)點(diǎn),以滿足不同的聚類要求。是今后聚類算法的一個(gè)重要發(fā)展
20、方向。參考文獻(xiàn)1M argaret H.Dunha m著,郭崇慧等譯.數(shù)據(jù)挖掘教程M.清華大學(xué)出版社,20052L.Kauf man and P.J Rousseeu w.Finding Gr oup s in Data:An I ntr oducti on t o Cluster AnalysisM.Ne w York:John W iley&Sons,19903Ray mond T.Ng and J ia wei Han.Efficient and effectiveclustering methods f or s patial data m iningR.Pr oceed2 ings
21、of the internati onal Very Large Databases Conference, 1994:1441554湯效琴,戴汝源.數(shù)據(jù)挖掘中聚類分析的技術(shù)方法S.微計(jì)算機(jī)信息,20035范明,孟小峰譯.數(shù)據(jù)挖掘:概念與技術(shù)聚類分析M.北京:機(jī)械工業(yè)出版社,2001:2232586錢鋒等.知識(shí)發(fā)現(xiàn)中的聚類分析及其應(yīng)用J.杭州師范學(xué)院學(xué)報(bào),2001(2:3437(上接第10頁文件和相連接的三角網(wǎng)文件,整個(gè)三角網(wǎng)不管是哪部分都將按需要以文件地址標(biāo)號(hào)形式存入RAM 中,這將大大減少占用存儲(chǔ)空間。6結(jié)束語本文提出了一種快速、有效的散亂點(diǎn)集Dealu2 any三角剖分算法,算法適用于大
22、數(shù)量點(diǎn)集的Delaunay三角剖分,已對數(shù)百萬個(gè)點(diǎn)進(jìn)行了三角網(wǎng)的構(gòu)建,實(shí)際應(yīng)用的效果很好。而且格子劃分靈活,大小隨點(diǎn)云情況而定,網(wǎng)格的寬度適應(yīng)點(diǎn)的疏密變化;點(diǎn)及三角網(wǎng)的文件管理較方便。本算法具有簡便實(shí)用,生成速度快,點(diǎn)集劃分和三角網(wǎng)格構(gòu)建時(shí)間復(fù)雜度與點(diǎn)數(shù)目成近優(yōu)線性關(guān)系,可靠性高等特點(diǎn)。該算法具有很大的實(shí)用價(jià)值和應(yīng)用前景。參考文獻(xiàn)1杜立彬,高曉輝,王昊等.逆向工程各關(guān)鍵技術(shù)的研究進(jìn)展J.機(jī)械制造,2004,(6:41452曲利巖,吳建華,陳永校.有限元網(wǎng)格的自動(dòng)生成及快速實(shí)現(xiàn)J.電機(jī)與控制學(xué)報(bào),2002,6(1:34383武曉波,王世新,肖春生.Delaunay三角網(wǎng)的生成算法研究J.測繪學(xué)報(bào)
23、,1999,28(1:28354Sap idis N,Perucchi o R.Delaunay triangulati on of arbitrarilyshaped p lanar domainsJ.CAG D,1991,(8:421437 5Bor ouchaki H,Lo S H.Fast Delaunay triangulati on in thethree di m ensi onsJ.Computer M ethods App l.M ech.En2 grg,1995,128(2:1531676周培德.計(jì)算幾何2算法分析與設(shè)計(jì)M.北京:清華大學(xué)出版社,20017T.M idtbi
24、.Spatial Modeling by Delaunay Net w orks of T woand Three D i m ensi onsM.Doct oral Thesis,University of Tr ondhei m,199302數(shù)據(jù)挖掘中聚類算法的綜述第35卷Key wordshe l m e t-m o un te d d isp l ays,SU SAN,cu rve fitti ng,sub-p i xe l(Page:14Survey of C luster Ana lysis i n Da t a M i n i n g byHu Q inglinAbstractC
25、 l u ste r a rithm e ti c is a ve ry i m po rtan t techno l o2 gy i n the a rea o f da ta m i n i ng.The rep re se n ted c l u s te r a2 rithm e ti c is i n tr o duced and ana l yzed i n th is a rti c l e.Fo r yo u r re fe re nce,som e sugge s ti o n s a re lis te d a t the e nd. Key wordsda ta m i
26、n i ng,c l u s te r ana l ysis,c l u ste r a rithm e2 ti c(Page:17O pti m i za ti on Stra tegy for Aud i o Processi n g Ar ith m eti c Used i n M PEG-1Layer3Ba sed on T M S320C6000Ch i pbyD ai D andanAbstractTh is p ap e r dea ls w ith the op ti m i za ti o n o f the key a l go rithm s i n the M PEG
27、-1l aye r3s tanda rdpo l y2 p ha se filte r bank,m o d i fi ed and d isc re te co s i ne Tran s2 fo r m,quan ti za ti o n,p hycho aco u sti c m o de l and b it o r no ise a ll o ca ti o n.O p ti m i za ti o n ba sed o n the T M S320C6000D SP p l a tfo r m w ith C6711c ited is a lso d is2 cu s sed.Th
28、e e xe cu ti o n o f l aye r3deco de r p r o g ram is g rea tl y acce l e ra te d th r o ugh the se m e tho d s.La s tl y,the p ap e r co nc l ude s and p u ts fo r w a rd ne ed no ti c i ng p r o b2 l em s.Key wordspo l yp ha se filte r bank,m o d i fi ed d isc re te co2 s i ne tran sfo r m,p e rce
29、p tua l co d i ng,p hycho aco u s ti c m o d2 e l,quan ti za ti o n(Page:21D esi gn and Ana lysis of Eff i c i ency for the Recursi on A lgo2 r ith m byYuan J insongAbstractThe recu rs i o n a l go rithm is a ki nd o f p r o g ram de s i gn m e tho d,w h i ch is p rac ti ca l and u se d fre quen tl
30、y.I ts effi c i e ncy que s ti o n is w o rth s tudyi ng.Th is a rti c l e p re se n ts the gene ra lity m e tho d to ana l yze re cu rs i o n a l go2 rithm:the re cu rsi ve e xp re s s i o n com p u ta ti o n m e tho d and the recu rs i o n tran sfe r tre e m e tho d,and p e rfo r m s them th r o u
31、gh e xam p l e s.Key wordsrecu rsi o n,com p li cacy o f ti m e,re cu rs i ve e xp re s s i o n(Page:25Research on Da t a I n tegra ti on Ba sed on X ML and W eb Serv i ce byCui W eiAbstractD ue to the ub i qu ity o f i nfo r m a ti o n is l and s and the he te r o ge neo u s system s am o ng en te
32、r p rise,da ta comm un i ca ti o n and da ta sha ri ng i n and be t w e en en te r2 p rise a re b l o cked.Fr om the vi ew po i n t o f s l o vi ng da ta i n2 te g ra ti o n fo r en te r p rise,th is a rti c l e s i m p l y sum s up and ana l yse s the p re se n t techno l o g i e s fo r da ta i n t
33、e g ra ti o n, and g i ve s a schem e w h i ch is ba se d o n X M L and W e b se rvi ce fo r bu il d i ng a h i gh effi c i e n t and un i fo r m e n te r p rise da ta i n te g ra ti o n.Key wordsX M L,W eb se rvi ce,da ta i n te g ra ti o n(Page:27 On tology Ba sed A ssoc i a ti on RulesM i n i n g
34、 byChen X iaAbstractTh is p ap e r p re sen ts an o n to l o gy-ba sed a s so2 c i a ti o n ru l e s m i n i ng m e tho d.It is to bu il d o n to l o gy o n som e dom a i n and the n ba se it to l e ad the m i n i ng p r o ce ss w h i ch w ill fa sten the p r o ce s s and i m p r o ve the effi c i e
35、ncy and qua lity.A lso it i nc l ude s the va l ue m e a su rem en ts o f a sso c i a ti o n ru l e s.Key wordso n to l o gy,a s so c i a ti o n ru l e s,da ta m i n i ng,se2 m an ti c W e b(Page:32Research on V isua li za ti on i n Lake D redg i n g Up Ba sed on O penGL byKang L ingAbstractThe re s
36、ea rch ba sed o n O p e nGL m ake s the p r o ce s s o f l ake d re dg i ng up vis i b l e.Th r o ugh B ezi e r su r2 face fitti ng,it rep re se n ts su rface o f unde r w a te r silt by sam p li ng po i n ts.Acco rd i ng to sam p li ng po i n ts,it co n2 s truc ts the cu rve abo u t th i ckne s s o f s ilt hvo l um e Q by l e a s t squa re m e tho d.I t adop ts o f O p enG L
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版特許經(jīng)營權(quán)授予協(xié)議
- 買賣協(xié)議書匯編六篇
- 2024年度砸墻工程設(shè)計(jì)與施工監(jiān)理合同3篇
- 2024年生產(chǎn)協(xié)作合同3篇
- 2024年版食堂廚房管理服務(wù)合同3篇
- 活動(dòng)計(jì)劃模板集錦五篇
- 大學(xué)生學(xué)習(xí)計(jì)劃15篇
- 收購合同匯編10篇
- 對甲氧基苯甲醛項(xiàng)目商業(yè)計(jì)劃書
- 學(xué)校后勤干事崗位職責(zé)總結(jié)
- 2022年西藏自治區(qū)中考英語真題卷(含答案與解析)
- 醫(yī)院輸血質(zhì)量管理考核標(biāo)準(zhǔn)
- 七年級語文上冊:15、《古代詩歌四首》教案
- 氣道評估與處理課件
- 腦血管病的介入診療課件
- RCS-9626CN電動(dòng)機(jī)保護(hù)測控裝置
- 苗木供貨服務(wù)計(jì)劃方案
- 回轉(zhuǎn)支承實(shí)驗(yàn)臺(tái)測試系統(tǒng)設(shè)計(jì)畢業(yè)設(shè)計(jì)論文
- 全員安全生產(chǎn)責(zé)任考核表
- 董事長調(diào)研方案
- 危險(xiǎn)化學(xué)品MSDS(次氯酸鈉溶液)
評論
0/150
提交評論