第三章-云模型簡介_第1頁
第三章-云模型簡介_第2頁
第三章-云模型簡介_第3頁
第三章-云模型簡介_第4頁
第三章-云模型簡介_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第三章 云模型簡介在人類認知以及進行決策過程中,語言文字是一種強有力的思維工具,它是人類智能和其他生物智能的根本區(qū)別。人腦進行思維不是純粹地應(yīng)用數(shù)學(xué)知識,而是靠自然語言特別是客觀事物在人腦中的反映而形成的概念。以概念為基礎(chǔ)的語言、理論、模型是人類描述和理解世界的方法。自然語言中,常常通過語言值,也就是詞來表示概念。而語言值、詞或概念與數(shù)學(xué)和物理的符號的最大區(qū)別就是其中包含太多的不確定性。在人工智能領(lǐng)域,不確定性的研究方法有很多,主要有概率理論,模糊理論,證據(jù)理論和粗糙集理論;對于確定性系統(tǒng)的不確定性的研究還有混沌和分形的方法。這些方法從不同的視角研究了不確定性,優(yōu)點是:有切入點明確、邊界條件約

2、束清楚、能夠?qū)栴}進行深入研究等,但是在研究中常常將不確定性分成模糊性和隨機性分開進行研究,然而兩者之間有很強的關(guān)聯(lián)性,往往不能完全的分開。隨機性是指有明確定義但是不一定出現(xiàn)的事件中所包含的不確定性。例如在投擲硬幣試驗中,硬幣落地時要么有國徽的一面向上,要么標有分值的一面向上,結(jié)果是明確的可以預(yù)知的,但是每次試驗結(jié)果是隨機的。概率論和數(shù)理統(tǒng)計是研究和揭示這種隨機現(xiàn)象的一門學(xué)科,至今已有幾百年的研究歷史模糊性是另一種不確定性,是已經(jīng)出現(xiàn)的但是很難精確定義的事件中所包含的不確定性。在日常工作和生活中存在著許多模糊概念,如“胖子”“年輕人”“收入較高”等。為處理這些模糊概念,引入了模糊集的概念41,

3、使用隸屬度來刻畫模糊事物彼此間的程度。隸屬度函數(shù)常用的確定方法有模糊統(tǒng)計法、例證法專家經(jīng)驗法等,這些方法確定隸屬度函數(shù)的過程是確定的,本質(zhì)上說是客觀的,但每個人對于同一個模糊概念的認識理解存在差異,因此有很強的主觀性,而且一旦隸屬度函數(shù)確定之后,得到的概念、定理等包含著嚴密的數(shù)學(xué)思維,其不具有任何模糊性。針對上述問題李德毅院士在傳統(tǒng)的概率統(tǒng)計理論和模糊理論的基礎(chǔ)上提出了定性定量不確定性轉(zhuǎn)換模型云模型,實現(xiàn)定性概念和定量值之間的不確定性轉(zhuǎn)換。在此工作上,一些學(xué)者對云模型做了深入系統(tǒng)的研究,使其日趨成熟,并將它成功地應(yīng)用于不確定性推理、關(guān)聯(lián)規(guī)則挖掘,空間數(shù)據(jù)的挖掘,智能控制及時間序列預(yù)測等領(lǐng)域。云

4、模型能模擬人類思維靈活劃分屬性空間,在較高的概念層上泛化屬性值,完成定量數(shù)值到定性概念間的轉(zhuǎn)換,同時允許相鄰屬性值或語言之間有重疊,這種劃分使發(fā)現(xiàn)的知識具有穩(wěn)健性。 而由于計算機系統(tǒng)的行為存在隨機性和不確定性,云模型能夠很好地處理具有隨機性和不確定性的數(shù)據(jù),所以可將云模型引入到入侵檢測中來,通過云模型建立的入侵檢測系統(tǒng)具有較準確的檢測能力和適應(yīng)能力。3.1 云模型的引入云模型能夠?qū)崿F(xiàn)定性概念與定量值之間的不確定性轉(zhuǎn)換。同時數(shù)據(jù)挖掘是基于不同認知層次的“數(shù)據(jù)-概念-知識”視圖,“數(shù)據(jù)”中包含大量的不確定性知識,而云模型能夠更準確地將數(shù)據(jù)表達為概念,進而發(fā)現(xiàn)準確、完整的知識。因此將云模型應(yīng)用于數(shù)據(jù)

5、挖掘中可以提高數(shù)據(jù)挖掘的準確度。下面簡單介紹云模型的一些概念和數(shù)字特征,重點介紹云的概念、正態(tài)云發(fā)生器及正態(tài)云的數(shù)學(xué)性質(zhì)。3.1.1 云和云滴定義3.142 設(shè)是一個精確數(shù)值表示的定量論域,是上的定性概念,若定量值,且是定性概念的一次隨機實現(xiàn),對的確定度是有穩(wěn)定傾向的隨機數(shù) (3.1)則在論域上的分布稱為云(Cloud),每一個稱為一個云滴42。云具有以下性質(zhì)42 42:(1)論域可以是一維的,也可以是或多維的。;(2)定義中所提及的隨機實現(xiàn),是概率意義下的實現(xiàn);定義中所提及提到的確定度,是模糊集意義下的隸屬度,同時又具有概率意義下的分布。;(3)對于任意一個,到區(qū)間0,1上的映射是一對多的變

6、換,對的確定度不是一個固定的數(shù)值,而是一個概率分布。;(4)云由云滴組成,云滴之間無次序性,一個云滴是定性概念在數(shù)量上的一次實現(xiàn),云滴越多,越能反映這個定性概念的整體特征。;(5)云滴出現(xiàn)的概率大,云滴的確定度大,則云滴對概念的貢獻大。3.1.2 云的數(shù)字特征云的數(shù)字特征能夠反映概念的整體性和定性知識的定量特性,其它對定性概念的理解定性概念的內(nèi)涵和外延有著極其重要有很重要的意義。云一般用期望(Expected value)、熵(Entropy)和超熵這(Hyper entropy)三個數(shù)字特征來整體表征一個概念43,如圖3-1所示。圖3-1 云的數(shù)字特征Fig.3-1 Digital Char

7、acteristics of the Cloud 期望:云滴在論域空間分布的期望,是概念在論域中的中心點,其最能夠它是最可以代表定性概念的值點43。熵:定性概念的不確定性度量,由概念的隨機性和模糊性共同決定。一方面熵是定性概念隨機性的度量,反映了能代表這個定性概念的云滴的離散程度;另一方面又是定性概念模糊度的度量,反映了論域空間中可被概念接受的云滴的取值范圍,此外熵還能反映隨機性和模糊性之間的關(guān)聯(lián)性43。超熵:是熵的不確定性的度量,即熵的熵,由熵的隨機性和模糊性共同決定,反映了云滴的離散程度,超熵的大小間接地反映云的厚度,超熵越大,云的厚度越大43。3.1.3 云模型的類型云模型是云的具體實現(xiàn)

8、方法,是云運算、云推理、云控制、云聚類等方法的基礎(chǔ)。由定性概念到定量表示的過程,也即由云的數(shù)字特征產(chǎn)生云滴的過程,稱為正向云發(fā)生器。由定量表示到定性概念的過程,也即由云滴群得到云的數(shù)字特征的過程,稱為逆向云發(fā)生器。云有很多種實現(xiàn)方法,可構(gòu)成不同類型的云,如半云模型、對稱云模型、組合云模型等,還可以擴展到多維云模型。3.2 正態(tài)云正態(tài)分布是概率理論中重要分布之一,通常用均值和方差兩個數(shù)字特征表示;鐘形隸屬度函數(shù)是模糊理論中使用最多的隸屬函數(shù),通常用來表示。正態(tài)云正是在二者基礎(chǔ)上發(fā)展起來的全新模型。定義3.243 設(shè)是一個精確數(shù)值表示的定量論域,是上的定性概念,若定量值,且是定性概念的一次隨機實現(xiàn)

9、,若滿足:,其中,且對的確定度滿足: (3.2)則在論域上的分布稱為正態(tài)云43。3.2.1 正態(tài)云發(fā)生器正態(tài)云發(fā)生器44是指用計算機實現(xiàn)的一種特定算法,其可以用集成的微電子器件來實現(xiàn),包括正向云發(fā)生器和逆向云發(fā)生器。(1) 正向云發(fā)生器正向云發(fā)生器是實現(xiàn)定性概念到定量值的轉(zhuǎn)換模型,其由云的數(shù)字特征()產(chǎn)生云滴,如圖3-2所示。 圖3-2 正向云發(fā)生器Fig.3-2 Forward Cloud Generator(2) 逆向云發(fā)生器逆向云發(fā)生器44是實現(xiàn)定量值到定性概念的轉(zhuǎn)換模型,它可以將一定數(shù)量的精確數(shù)據(jù)轉(zhuǎn)換為以數(shù)字特征()表示的定性概念,如圖3-3所示。圖3-3 逆向云發(fā)生器Fig.3-3

10、Backward Cloud Generator逆向正態(tài)云發(fā)生器的算法基于統(tǒng)計原理思想,基本算法有兩種:一是無需確定度信息的逆向云發(fā)生器算法;二是需要確定度信息的逆向云發(fā)生器算法44。3.2.2 云滴對概念的貢獻在正向正態(tài)云模型中,云滴群對概念的貢獻是不同的。本文以一維正向正態(tài)云為例來說明云滴群對概念的貢獻程度。定義3.3 在一維論域中,中任一小區(qū)間上的云滴群對定性概念的貢獻43為 (3.3)易得,論域()上所有元素對概念的總貢獻為 (3.4)同理,可得論域上所有元素對概念的總貢獻為:= (3.5)因此論域中對定性概念有所貢獻的云滴,主要落在區(qū)間區(qū)間中,常常通常可以忽略區(qū)間區(qū)間之外的云滴對定性

11、概念所做的貢獻,這這就即是為正向正態(tài)云的“規(guī)則”44。同理位于區(qū)間區(qū)間內(nèi)的云滴,占全部所有定量值的22.33%,對定性概念的貢獻它的貢獻占總貢獻的50,這部分的這部分云滴被稱為“骨干元素”;位于區(qū)間區(qū)間內(nèi)的云滴,占全部所有定量值的33.33,對定性概念這部分的貢獻占總貢獻的68.26,這部分元素被稱為“基本元素”;位于區(qū)間區(qū)間和區(qū)間區(qū)間內(nèi)的云滴,占全部所有定量值的33.33,它們對定性概念的貢獻占總貢獻的27.18,這該部分元素被稱為元素為“外圍元素”;位于區(qū)間區(qū)間和區(qū)間區(qū)間內(nèi)的云滴,占全部定量值的33.33,它們對定性概念的貢獻占總貢獻的4.3,這部分云滴被稱為“弱外圍元素”44。不同的區(qū)域

12、內(nèi)的云滴群對定性概念所做的的貢獻不同,如圖3-4所示。圖3-4 云滴群對定性概念的貢獻 這圖能不能小點兒Fig.3-4 Cloud Droplets Contribute to Qualitative Concept3.3 正態(tài)云的數(shù)學(xué)性質(zhì)3.3.1 云滴分布的統(tǒng)計分析根據(jù)正態(tài)云發(fā)生器算法,所有云滴的集合構(gòu)成隨機變量,服從以為期望、為方差的正態(tài)分布,所以的概率密度函數(shù)44為 (3.6)如果為定值時,服從以為期望、為方差的正態(tài)分布,此時的概率密度函數(shù)44為 (3.7)由于是隨機變量,由條件概率密度公式可知的概率密度函數(shù)為 (3.8)這是式(3.8)是一個概率密度函數(shù),它沒有不具備解析形式的概率密

13、度函數(shù),對于任意的變量,可以通過數(shù)值積分計算可以得到與之相應(yīng)的函數(shù)值。對于當云滴個數(shù)為個云滴的情況時,可以采利用Parzen窗的方法可以估計估算出的概率密度函數(shù)44。特殊地特別地,當時,的概率密度函數(shù)為 (3.9)因為所有的云滴均都來自于期望為的正態(tài)隨機變量,所以期望,方差。由此可得由此可知,由正態(tài)云發(fā)生器所產(chǎn)生的云滴,是一個期望為、方差為的一個隨機變量44。3.3.2 云滴確定度的統(tǒng)計分析根據(jù)正態(tài)云發(fā)生器算法,隨機變量由所有云滴的確定度構(gòu)成隨機變量,每一個確定度可以看作是由隨機變量 (3.10)產(chǎn)生的一個樣本可以作為一個云滴的確定度。經(jīng)過計算可知,無論取何什么值,隨機變量的概率密度函數(shù)都均保持不變,即所有的也就是全部的確定度都來自一個密度為 (3.11)的隨機變量。故所以,隨機變量的概率密度函數(shù)就是即為隨機變量的概率密度函數(shù),由此可以看出看到,確定度的概率密度函數(shù)同與正態(tài)云的三個數(shù)字特征無關(guān)沒有關(guān)系43。對于論域空間中的,還可以研究聯(lián)合分布的概率密度函數(shù)。當論域空間是一維時,是一個二維的隨機變量,可以計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論