基于熵最優(yōu)化的工程項目風險預警方法_第1頁
基于熵最優(yōu)化的工程項目風險預警方法_第2頁
基于熵最優(yōu)化的工程項目風險預警方法_第3頁
基于熵最優(yōu)化的工程項目風險預警方法_第4頁
基于熵最優(yōu)化的工程項目風險預警方法_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

基于熵最優(yōu)化的工程項目風險預警方法

項目風險預警系統(tǒng)是根據(jù)項目的實際特點,在不同的建設階段研究和評估風險因素,確定風險等級,建立預警系統(tǒng),采取風險防范和控制措施,降低風險損失,確保項目順利進行。然而,由于項目的復雜性,在風險評估過程中,人們無法全面、正確地識別項目的真實狀態(tài),只能依靠一些指標(特征)來評估其所屬類別。顯然,這些指標的選擇非常重要,這也將嚴重影響分類器的設計和性能。然而,當前項目指標的選擇和評價主要集中在對專家的咨詢和評估上。因此,解決資源選擇問題是項目風險預算模型設計的一項重要課題。本工作使用最小干擾閾值和專家評估的方法,完成了評價模型中的資源選擇。在風險分類中,基于極云原理,設計了公共簇中的公共熵函數(shù)。然后,利用優(yōu)化理論,提出了一種新的集群聚類算法。這是c-平均值算法的推廣。1項目風險評價模型的設計1.1判別熵概率分布描述工程項目經(jīng)營管理狀況的指標涉及到技術開發(fā)風險、生產(chǎn)風險、市場風險、資金風險、金融風險、技術管理風險、社會環(huán)境風險等各個方面.特征選取基本任務是從許多特征中找出那些最有效的特征.作為不確定性的一種度量的表達式shannon熵,這樣一種概念也可以用來作為某個概率分布密度p(xi)偏離給定標準分布ω(xi)的程度的度量,把它叫做相對熵,即V(p,ω)=-∑p(xi)log[p(xi)/ω(xi)]≤0(1)求和應在該特征所有可能的取值上進行.相對熵越小,這兩類概率分布的差別就越大,但兩類概率分布完全相同時,相對熵達最大值(等于零).根據(jù)相對熵的特點,可以定義判別熵W(p,q)來表征兩類分布p(xi)和q(xi)的差別大小.w(p,q)=V(p,q)+V(q,p)=-∑p(xi)logp(xi)-∑q(xi)logq(xi)+∑p(xi)logq(xi)+∑q(xi)logp(xi)≤0(2)在多種情況下,可以用∑i∑jW(p(i),q(j))來表示各類分布之間的分離程度.i,j代表類別號.對于特征提取來說,在給定維數(shù)d的條件下,應該求得這樣d個指標,它使上述判別熵最小.為了計算方便起見,可以用下列函數(shù)U(p,q)=-∑i(pi-qi)2≤0(3)來代替W(p,q),而不影響選取d個最優(yōu)指標的結果.在不對概率分布作估計的情況下,可以用經(jīng)過歸一化處理的樣本指標值來代替上式中的概率分布:p(1)i=1Ν1Ν1∑k=1(x(1)ki)2D∑i=1(x(1)ki)2=1}(4)式中,k是第一類樣本集中的樣本號;N1是第一類的樣本總數(shù);i是特征號.由于D∑i=1pi=1,所以這樣做是合理的.同理計算qi.1.2極大熵聚類算法若按判別熵最小原則,即依據(jù)式(3),式(4),在n個項目樣本組成的樣本集中,選定樣本的k個指標,指標矩陣可表示為X=[x11x12?x1nx21x22?x2n???xk1xk2?xkn](5)式中,xij為樣本j指標i的指標值,i=1,2,…,k,j=1,2,…,n.亦可將X表示成一個指標向量集X={x1,x2,…,xk}?Rn.若將項目風險狀態(tài)等級總數(shù)記為c,即c個評語等級,考慮某種相似性度量,則可將X聚合成c個分離開的子集X1,X2,…,Xc.每個子集表示一類,分別包括n1,n2,…,nc個指標向量,設Xj={x(j)1,x(j)2,…,x(j)nj}.為了衡量聚類的質量,常采用誤差平方和J為目標函數(shù),即J(X,V)=c∑j=1∑xk∈Xjp(xk)∥xk-vj∥2(6)式中,p(xk)是抽樣概率;V={v1,v2,…,vc}?Rn是碼本;而vj(j=1,2,…,c)稱為碼向量;它被定義為第j類Xj的均值,即vj=1njn∑k=1x(j)k;指標向量xk∈Xj由最近鄰原理定義,即當∥xk-vj∥2=minl∥xk-vl∥2,xk∈Xj.C-均值算法就是由最近鄰原理和vj=1njn∑k=1x(j)k定義的,但它是一個啟發(fā)過程,而不是一個最優(yōu)化過程,這是由于函數(shù)J是不可微的,于是無約束最優(yōu)化的梯度方法不能夠直接應用.這類算法最大的問題是算法訓練沒有一個終止準則,算法最后結果嚴重依賴碼向量的初始值.從最優(yōu)化理論的角度看,求式(6)的最小問題其實是個不可微優(yōu)化問題.人們常用一簇可微函數(shù)逼近目標函數(shù)來處理該問題.比如,文獻借助極大熵原理構造了一致逼近目標函數(shù)的熵函數(shù),本文根據(jù)這一思想,研究了一種極大熵聚類算法進行分類.對于指標向量x,定義函數(shù)fx:Rcn→Rc,fx(V)=fx(v1,v2,…,vc)=(-‖x-v1‖2,-‖x-v2‖2,…,-‖x-vc‖2)T,則∥fx(V)∥∞=maxj(-∥x-vi∥2)=-minj(∥x-vj∥)2.于是式(6)可以改寫為J(X?V)=Κ∑k=1p(xk)(-∥fxk(V)∥∞)(7)下面引入一種新的衡量聚類質量的目標函數(shù),Jc=Jc(X,V)=c∑j=1∑xk∈Xjp(xk)p(vj|xk)∥xk-vj∥2=c∑i=1∑xk∈Xjp(xk,vj)∥xk-vj∥2=Κ∑k=1p(xk)Jc(V|xk)(8)式中,p(xk,vj)是xk和vj的聯(lián)合概率;p(vj,xk)是條件概率;Jc(V|xk)定義為Jc(V|xk)=Jc(v1,v2,?,vc|xk)=c∑j=kp(vj|xk)∥xk-vj∥2(9)當完全分配一個指標向量給與之最近的碼向量,即條件概率由下式定義時,p(vj|xk)={1,xk∈Xj0,其他(10)式(8)退化為式(6).此時關于自由參數(shù){vj,p(vj|xk)}(k=1,2,…,K;j=1,2,…,c)求式(8)定義的Jc最小,立即可以產(chǎn)生一個硬聚類解.然而可以把這個最優(yōu)化問題考慮為去尋找一個分布,在滿足一定程度隨機性下它最小化目標函數(shù)Jc.自然,隨機程度可以用X和V的Shannon聯(lián)合熵來度量,即Η(X,V)=-Κ∑k=1c∑j=1p(xk,vj)lnp(xk,vj)(11)于是這個最優(yōu)化問題可以簡單地變?yōu)長agrange最小化問題:L(X,V)=Jc(X,V)-ΤΗ(X,V)(12)T是Lagrange乘子.很明顯,對大的T,主要是試圖最大熵,隨著T的降低,以熵換取失真的減少,當T趨于零,最小Jc直接獲得一個非隨機解.進一步分析由式(12)定義的Lagrange函數(shù)L,首先注意到可以分解聯(lián)合熵:Η(X,V)=-Κ∑k=1c∑j=1p(xk,vj)lnp(xk,vj)=-Κ∑k=1c∑j=1p(xk)p(vj|xk)ln(p(xk)p(vj|xk))=-Κ∑k=1c∑j=1p(xk)p(vj|xk)(lnp(xk)+lnp(vj|xk))=-Κ∑k=1p(xk)lnp(xk)-Κ∑k=1p(xk)c∑j=1p(vj|xk)lnp(vj|xk)=Η(X)+Κ∑k=1p(xk)Η(V|xk)=Η(X)+Η(V|X)(13)其中Η(X)=-Κ∑k=1p(xk)lnp(xk)(14)Η(V|xk)=Η(v1,v2,?,vc|xk)=-c∑j=1p(vj|xk)lnp(vj|xk)(15)Η(V|X)=-Κ∑k=1p(xk)c∑j=1p(vj|xk)lnp(vj|xk)=Κ∑k=1p(xk)Η(V|xk)(16)由于H(X)是信源熵,它獨立于聚類,因而可以從函數(shù)L中抽取常數(shù)H(X),而主要集中于條件熵H(V|X).另一方面,由式(6)定義的目標函數(shù)J總是非負的,自然也希望逼近它的函數(shù)L同樣非負,但由于-H(V|X)是負的,因而這個條件不能夠得到保證.然而知道H(V|X)=Κ∑k=1p(xk)?H(V|xk)≤Κ∑k=1p(xk)lnC=lnC,并且min(-H(V|X))同min(lnC-H(V|X))是等價的.于是可以把最小化問題式(12)變?yōu)閙in{LΤ(X,V)=Jc(X,V)+Τ(lnC-Η(V|X))=Κ∑k=1p(xk)LΤ(V|xk)}(17)LΤ(V|xk)=Jc(V|xk)+Τ(lnC-Η(V|xk))(18)關于p(vj,xk)直接最小化LT(X,V),可以得到p(vj|xk)滿足Gibbs分布,即p(vj|xk)=exp[-∥xk-vj∥2/Τ]Ζxk(19)正則參數(shù)Zxk為Ζxk=C∑j=1exp[-∥xk-vj∥2/Τ](20)把式(19)代入到式(17),就可以獲得函數(shù)LT(X,V)相應的最小形式L*T(X,V):LΤ*(X,V)=minp(vj|xk)LΤ(X,V)=Τ∑k=1Κp(xk)?[lnC-ln∑t=1cexp[-∥xk-vj∥2/Τ]]=∑k=1Κp(xk)LΤ*(V|xk)(21)其中,L*T(X,V)稱為熵函數(shù)(或凝聚函數(shù)).LΤ*(V|xk)=-Τln∑j=1Cexp[-∥xk-vj∥2Τ]+ΤlnC(22)關于碼向量vj最小化L*T(X,V),設置它的梯度為零,經(jīng)過簡單計算得到:∑k=1Κp(xk)p(vj|xk)(xk-vj)=0(23)或∑k=1Κp(xk,vj)(xk-vj)=0(24)所以vj=∑k=1Κp(xk,vj)xk∑k=1Κp(xk|vj)=∑k=1Κp(vj)p(xk|vj)xkp(vj)=∑k=1Κp(xk|vj)xkj=1,2,?,c(25)在實際應用中,一般都假設X={x1,x2,…,xk}?RN中的指標向量是相互獨立的,即p(xk)=1/K時,此時由式(23)可得vj=∑k=1Κp(vj|xk)xk∑k=1Κp(vj|xk)j=1,2,?,c(26)綜上所述,由于該聚類算法起源于極大熵函數(shù),稱之為極大熵聚類算法.可以看出,當T→0時極大熵聚類算法就是C-均值算法,由此可以說極大熵聚類算法是C-均值算法的一種推廣格式;而當T→∞時,由于所有的碼向量的值相等,因而實際上是把所有的指標向量聚成一類.由式(25)或式(26)可知,算法對于任一指標向量是以概率為比例分配給所有碼向量,而不是僅僅只完全分配給與之最近的碼向量,它在一定程度上能克服標準C-聚類對初始碼向量選取敏感的問題.而且算法對具有噪聲干擾的指標向量進行聚類時具有較強的魯棒性.2案例研究以某高速公路路面結構設計和道路工程質量檢驗為例,對公路工程質量進行風險預警.2.1特征提取指標根據(jù)公路工程質量評定國家標準,將評定要素取為特征集,利用專家評價法從中選擇10個特征,對每一個要評判的具體工程,其評定結果可分為2類:優(yōu),劣.通過德爾斐法選擇12條優(yōu)質和12條劣質高速公路的數(shù)據(jù)作為訓練樣本.現(xiàn)要將10個指標值通過特征提取后得到4個指標,用pi表示第1類(劣質)樣本的第i個指標值的概率分布,qi表示第2類(優(yōu)質)樣本的第i個指標值的概率分布,通過式(6)計算得出pi和qi的值.為保證式(5)成立,只需找出使-(pi-qi)2最小的4個指標即可.從而得到特征提取后的4個指標為:路基路面,安全舒適,橋梁涵洞,排水防護.2.2確定初始值迭代規(guī)則將某高速公路路面結構設計和道路工程質量檢驗作為測試樣本,取出其4個指標值.根據(jù)極大熵聚類算法的步驟:定義危機等級c=2,Lagrange乘子

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論