版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
ATM交易狀態(tài)的特征分析與異常檢測的數(shù)學(xué)模型摘要本文針對(duì)ATM交易狀態(tài)進(jìn)行了指標(biāo)的分析和異常檢測,基于1~4月份的交易特征量數(shù)據(jù),應(yīng)用不同的理論建立不同的模型,使交易系統(tǒng)在異常情況下及時(shí)作出警報(bào)。針對(duì)問題一,我們先對(duì)三個(gè)指標(biāo)進(jìn)行了相關(guān)性分析并對(duì)圖像進(jìn)行直觀判斷發(fā)現(xiàn)三個(gè)特征量之間并不存在明顯的相關(guān)性,只有交易量與日期和時(shí)間存在著相關(guān)性,再對(duì)三個(gè)指標(biāo)提取和分析處理特征量,將大量數(shù)據(jù)用SPSS繪制成圖形,發(fā)現(xiàn)易量在1-2月之間相較其他時(shí)間有顯著的波動(dòng),我們推測是春節(jié)因素的影響,因此分析時(shí)將其分段處理。結(jié)合每日交易量圖,工作日和非工作日的日總交易量和每日交易量散點(diǎn)圖并沒有明顯區(qū)別。排除春節(jié)影響的日總交易量平穩(wěn)時(shí)間段,將每小時(shí)交易量作為個(gè)體,發(fā)現(xiàn)其符合正態(tài)分布特征,取其平均值和方差作為特征參數(shù)。對(duì)于成功率指標(biāo),通過散點(diǎn)圖發(fā)現(xiàn)其在交易量少的時(shí)間段波動(dòng)范圍較大,因此使用一個(gè)模型將交易量累加到一定值的平均成功率來替代,處理后提取其平均值和方差作為特征參數(shù)。對(duì)于響應(yīng)時(shí)間,通過對(duì)其圖像的觀察,得到數(shù)據(jù)點(diǎn)分布的特征,同樣提取其方差和平均值作為其特征參數(shù)。針對(duì)問題二,我們從三個(gè)指標(biāo)下手,運(yùn)用K-Means聚類分析來得到三個(gè)指標(biāo)數(shù)據(jù)的正常值和異常值的劃分,在1~4月份的數(shù)據(jù)中隨機(jī)挑選一個(gè)月數(shù)據(jù)進(jìn)行分析,通過MATLAB編程得到了交易量,響應(yīng)時(shí)間的聚類圖,并通過得到的數(shù)據(jù)和圖像上的聚類點(diǎn),初步分析得到交易量,響應(yīng)時(shí)間,成功率的異常數(shù)據(jù)的范圍,為了提高異常檢測的準(zhǔn)確性和減少誤報(bào)率,我們又在一個(gè)月的指標(biāo)數(shù)據(jù)內(nèi)隨機(jī)抽取三天相互獨(dú)立的數(shù)據(jù)進(jìn)行聚類分析,進(jìn)一步更改了異常值的范圍,增加了異常檢測數(shù)據(jù)的準(zhǔn)確性。與此同時(shí),我們還構(gòu)建了BP神經(jīng)網(wǎng)絡(luò)模型,通過對(duì)正常值和異常值的訓(xùn)練后,可以對(duì)成功率和交易時(shí)間進(jìn)行直接分類,更好地達(dá)到異常檢測的目的。針對(duì)問題三,面對(duì)前面模型建立后的不足和對(duì)異常檢測發(fā)現(xiàn)的問題,我們提出了系統(tǒng)應(yīng)用進(jìn)程異常值這一指標(biāo),用于分辨故障二三與故障四。同時(shí)我們拓展了網(wǎng)絡(luò)負(fù)載率的相關(guān)數(shù)據(jù)達(dá)到對(duì)異常交易檢測的準(zhǔn)確性。關(guān)鍵詞:散點(diǎn)圖、方差分析法、聚類分析、神經(jīng)網(wǎng)絡(luò)、特征參數(shù)、異常檢測問題重述近年來隨著ATM機(jī)的覆蓋日趨變廣,且其具有無人監(jiān)管、交易量大的特性,對(duì)ATM機(jī)交易狀態(tài)的特征分析和異常檢測就變得尤為重要,研究ATM機(jī)異常故障及時(shí)報(bào)警的問題具有一定的現(xiàn)實(shí)意義。根據(jù)題目要求,需要解決以下幾個(gè)問題:1.對(duì)具體的ATM機(jī)交易統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析,選擇并提取特征參數(shù)。2.建立交易狀態(tài)異常檢測方案,根據(jù)題目中給出的四種故障情形:故障一:分行側(cè)網(wǎng)絡(luò)傳輸節(jié)點(diǎn)故障,前端交易無法上送請(qǐng)求,導(dǎo)致業(yè)務(wù)量陡降;故障二:分行側(cè)參數(shù)數(shù)據(jù)變更或者配置錯(cuò)誤,數(shù)據(jù)中心后端處理失敗率增加,影響交易成功率指標(biāo);故障三:數(shù)據(jù)中心后端處理系統(tǒng)異常(如操作系統(tǒng)CPU負(fù)荷過大)引起交易處理緩慢,影響交易響應(yīng)時(shí)間指標(biāo);故障四:數(shù)據(jù)中心后端處理系統(tǒng)應(yīng)用進(jìn)程異常,導(dǎo)致交易失敗或響應(yīng)緩慢。滿足及時(shí)分類報(bào)警并減少虛警誤報(bào)的要求。3.如何通過更多的相關(guān)資料擴(kuò)展數(shù)據(jù)更好的完成上述兩問所達(dá)目標(biāo)。問題分析問題一是一個(gè)特征分析的問題。首先我們應(yīng)該建立起對(duì)特征參數(shù)這一概念的理解,然后再著手分析。考慮先對(duì)所給的四種指標(biāo)值做相關(guān)性分析,看其之間有何聯(lián)系。繼而對(duì)各個(gè)變量單獨(dú)檢驗(yàn),觀察其特征。提取相對(duì)具有代表性的特征參數(shù)。由于這是一個(gè)實(shí)際問題,所以還需要對(duì)諸如春節(jié)、節(jié)假日、高低谷特殊時(shí)段進(jìn)行考慮研究。問題二是一個(gè)異常檢測的問題。異常檢測涉及到拒真和采偽的問題,即原本數(shù)據(jù)是正常的卻被認(rèn)為異常,發(fā)生誤報(bào)和原本數(shù)據(jù)是異常值卻被認(rèn)為正常,沒有發(fā)出警報(bào),造成損失。由于兩種錯(cuò)誤造成的影響均不容小覷,所以我們應(yīng)該選用合理的模型并做二次檢驗(yàn)使兩種錯(cuò)誤盡可能的降低。經(jīng)過比較,我們選擇了K-Means聚類分析模型和BP神經(jīng)網(wǎng)絡(luò)模型來對(duì)ATM的交易進(jìn)行異常檢測。K-Means算法具有簡單快速的特點(diǎn),能起到及時(shí)分析及時(shí)報(bào)警的作用,而BP神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性映射能力和柔性的網(wǎng)絡(luò)結(jié)構(gòu),得到的結(jié)果較為精確,可以有效的減少虛警誤報(bào)現(xiàn)象的發(fā)生,二者結(jié)合便可較好的達(dá)到我們所需要的目標(biāo)。由于異常檢測問題包括異常狀態(tài)的監(jiān)測和異常類型的判斷兩個(gè)部分,我們還需要對(duì)異常狀況進(jìn)行故障分類上報(bào),以便于故障處理人員的故障解決。問題三是一個(gè)開放性問題。對(duì)于ATM機(jī)的異常檢測,除了題目給出的交易量、成功率、響應(yīng)時(shí)間三個(gè)指標(biāo)外,我們提出了系統(tǒng)應(yīng)用進(jìn)程異常值這一指標(biāo)來解決問題二中部分故障不能很好分類的問題。除此之外,我們考慮增加網(wǎng)絡(luò)負(fù)載率作為擴(kuò)展數(shù)據(jù)來進(jìn)一步減少誤報(bào)并進(jìn)行更好的分析。模型假設(shè)假設(shè)非正常因素不會(huì)對(duì)數(shù)據(jù)造成影響。假設(shè)銀行的經(jīng)營情況不會(huì)對(duì)交易量造成影響。假設(shè)交易的成功與否只與ATM操作系統(tǒng)有關(guān)而與用戶的操作無關(guān)。假設(shè)附錄給出的數(shù)據(jù)不具有特殊性,可以代表其他月份的數(shù)據(jù)變化趨勢。假設(shè)題目中給出的故障種類占所有故障的絕大部分,其他特殊故障占比極少。符號(hào)及變量說明符號(hào)說明符號(hào)說明JJ(處理后)交易量均值JF(處理后)交易量方差CJ(處理后)成功率均值CF(處理后)成功率方差XJ(處理后)響應(yīng)時(shí)間均值XF(處理后)響應(yīng)時(shí)間方差聚類中心向量激活函數(shù)權(quán)值輸出單元狀態(tài)隱單元狀態(tài)輸入單元狀態(tài)模型的建立與求解1.問題一特征參數(shù)的選擇、提取、分析特征參數(shù)即用于表征物質(zhì)或現(xiàn)象特性的參數(shù)信息,在實(shí)際應(yīng)用中,最常用的基本統(tǒng)計(jì)量分為兩類:反映集中趨勢和反映離散趨勢的統(tǒng)計(jì)量。在處理ATM交易狀態(tài)的數(shù)據(jù)中,這兩種統(tǒng)計(jì)量依然是我們提取路面特征的主要參數(shù)。為此,我們做了以下分析。1.1三個(gè)指標(biāo)量與日期時(shí)間的相關(guān)性分析首先,我們將附件四個(gè)月的數(shù)據(jù)合并,用spss軟件求出其相關(guān)性矩陣如圖1-1所示。圖1-1日期、時(shí)間、交易量、成功率、響應(yīng)時(shí)間的相關(guān)性矩陣根據(jù)所求出的相關(guān)性矩陣可以得出:交易量和時(shí)間存在正相關(guān)性,成功率和響應(yīng)時(shí)間存在負(fù)相關(guān)性。但是經(jīng)過我們對(duì)各個(gè)指標(biāo)分別進(jìn)行處理(主要是通過繪制散點(diǎn)圖)時(shí)初步分析發(fā)現(xiàn),成功率與響應(yīng)時(shí)間并沒有明顯相關(guān)性(如圖1-2)。圖1-2成功率-響應(yīng)時(shí)間的散點(diǎn)圖1.2對(duì)交易量的分析處理首先,我們利用MATLAB軟件繪制了日總交易量-日期的折線圖(如圖1-3)。圖1-3日總交易量-時(shí)間的折線圖我們對(duì)這幅圖進(jìn)行初步分析后得出以下幾個(gè)結(jié)果:(1)1月23日至2月1日的圖像有非常明顯的波動(dòng),而之后的日總交易量曲線波動(dòng)較小且維持在一定的區(qū)間。從實(shí)際因素考慮,我們推測是因?yàn)橹袊汗?jié)的這個(gè)因素造成的。(2)題目中提示:工作日和非工作日的交易量存在差別,但是通過對(duì)圖1-3的分析,我們沒有發(fā)現(xiàn)工作日和非工作日的交易量以及與日期有關(guān)的明顯周期性變化。而觀察圖1-4后我們確定工作日和非工作日的單日交易量不存在明顯區(qū)別。圖1-4工作日(紅)和非工作日(藍(lán))交易量-時(shí)間散點(diǎn)圖并且對(duì)上圖分析我們可以得到以下結(jié)果:(1)交易量與時(shí)間的確存在明顯的相關(guān)性,曲線呈M型,且從圖中可以看出不同日期的曲線形狀相似度很高,既排除春節(jié)期間,交易量均值JJ十分接近。(2)交易量在凌晨2-7點(diǎn)時(shí)極低,考慮晚上人流量少的實(shí)際因素,因此為正常情況。根據(jù)結(jié)果一我們進(jìn)一步分析,猜想不同日期相同時(shí)間(分鐘)的交易量符合正態(tài)分布,并通過作出的圖像驗(yàn)證了我們的猜想。圖1-5部分相同時(shí)間(小時(shí))的交易量根據(jù)該數(shù)據(jù)正態(tài)分布特征,我們利用MATLAB編程提取不同日期相同時(shí)間(分鐘)的交易量的平均值和方差作為交易量的特征參數(shù),以下圖1-6為部分結(jié)果。交易量相同分鐘均值圖1-6交易量相同分鐘方差1.3對(duì)成功率的分析處理首先,我們繪制了成功率-時(shí)間散點(diǎn)圖1-7。圖1-7成功率-時(shí)間散點(diǎn)圖對(duì)上圖分析我們可以得出以下結(jié)果:(1)成功率-時(shí)間圖的散點(diǎn)分布較為集中且不隨時(shí)間變化,驗(yàn)證了之前相關(guān)性分析的結(jié)論。(2)在交易量低的2-7點(diǎn),成功率散點(diǎn)的分布離散程度比交易量高的時(shí)間段大。我們認(rèn)為,交易量低正是造成成功率離散程度高的原因,與異常和故障并無直接關(guān)系,因此使用編程設(shè)計(jì)了一個(gè)模型,來消除這個(gè)無關(guān)因素的影響。模型處理過程如下:對(duì)交易量不足設(shè)定值K的時(shí)間進(jìn)行連續(xù)累加——>當(dāng)累加值超過K時(shí)計(jì)算一次成功率——>以這個(gè)成功率來代表這段時(shí)間的成功率。模型流程圖如下:考慮到后續(xù)及時(shí)報(bào)警因素的考慮,經(jīng)過多次嘗試,K值定為50時(shí)效果明顯,且最長累加時(shí)間為10分鐘,符合及時(shí)報(bào)警的考慮因素。下圖1-8為處理后的成功率-時(shí)間散點(diǎn)圖:圖1-8處理后的成功率-時(shí)間散點(diǎn)圖從處理后的散點(diǎn)圖可以看出該模型符合預(yù)期設(shè)定的目標(biāo)。并且我們發(fā)現(xiàn)成功率值都集中在較高的區(qū)域,因此我們決定使用方差分析法來處理數(shù)據(jù)[1]。方差分析法作為一種數(shù)理統(tǒng)計(jì)方法廣泛應(yīng)用于氣象、水文、地震等行業(yè)數(shù)據(jù)的科學(xué)統(tǒng)計(jì)與分析??蓱?yīng)用方差分析法計(jì)算最新采集數(shù)據(jù)與其均值的離散程度。主要思路是:成功率的數(shù)據(jù)分布集中在一定范圍內(nèi),當(dāng)數(shù)據(jù)變化的絕對(duì)值超過N倍標(biāo)準(zhǔn)均方差變化閥值的數(shù)據(jù)個(gè)數(shù)達(dá)到一定標(biāo)準(zhǔn)時(shí)通常說明數(shù)據(jù)存在異常。利用方差分析數(shù)據(jù)異常,N的取值采用兩種方法來實(shí)現(xiàn):(1)單次N值比較法,通常情況下N值默認(rèn)為3,即數(shù)據(jù)變化超過3倍標(biāo)準(zhǔn)方差即認(rèn)為該點(diǎn)數(shù)據(jù)不正常,當(dāng)這種不正常的數(shù)據(jù)點(diǎn)個(gè)數(shù)超過用戶設(shè)定的某個(gè)數(shù)值時(shí)即認(rèn)為數(shù)據(jù)存在異常,N的取值和不正常數(shù)據(jù)點(diǎn)個(gè)數(shù)可由用戶根據(jù)測項(xiàng)類型與長期統(tǒng)計(jì)結(jié)果具體設(shè)定,通過該方法可檢測出數(shù)據(jù)超出3倍均方差的數(shù)據(jù)異常。(2)雙次N值比較法,利用第1次N值比較去除干擾,即認(rèn)為數(shù)據(jù)變化超過N次標(biāo)準(zhǔn)方差的數(shù)據(jù)點(diǎn)為干擾點(diǎn),去掉干擾點(diǎn)后進(jìn)行第2次N值比較,通常取N為2,即去掉干擾后,數(shù)據(jù)變化超過2倍方差的數(shù)據(jù)個(gè)數(shù)超過用戶設(shè)定的某個(gè)數(shù)值時(shí)即認(rèn)為數(shù)據(jù)存在異常。分析成功率的數(shù)據(jù),發(fā)現(xiàn)成功率存在極大偏離值,使用雙次N值比較法更為合理,我們先進(jìn)行第一次N值比較處理,去除極端異常值之后求出成功率的平均值和方差作為其特征參數(shù),并用MATLAB實(shí)現(xiàn)了這一過程,得到的部分結(jié)果如圖1-9所示。成功率相同分鐘均值圖1-9成功率相同分鐘方差1.4對(duì)響應(yīng)時(shí)間的分析處理首先,我們繪制了響應(yīng)時(shí)間-時(shí)間散點(diǎn)圖1-10。圖1-10響應(yīng)時(shí)間-時(shí)間散點(diǎn)圖對(duì)上圖分析我們可以得出以下結(jié)果:(1)在交易量較大的時(shí)間段響應(yīng)時(shí)間稍有下降,我們推測是由于白天交易量大,銀行開設(shè)的服務(wù)器及處理器較多,因此降低了響應(yīng)時(shí)間。(2)響應(yīng)時(shí)間數(shù)據(jù)集中在一個(gè)較窄的區(qū)間,數(shù)據(jù)點(diǎn)的離散程度較低。同樣的使用雙次N值比較法,求出響應(yīng)時(shí)間的平均值和方差作為其特征參數(shù),部分結(jié)果如下圖1-11。響應(yīng)時(shí)間相同分鐘均值圖1-11響應(yīng)時(shí)間相同分鐘方差問題二基于K-Means聚類分析的異常檢測模型2.1算法背景分析異常檢測在交通事件、網(wǎng)絡(luò)入侵和工業(yè)機(jī)械故障檢測等領(lǐng)域的應(yīng)用研究開始較早,技術(shù)發(fā)展也比較成熟。而基于聚類的入侵檢測應(yīng)用研究也有成果出現(xiàn)。其主要原理是對(duì)源數(shù)據(jù)聚類,數(shù)據(jù)依據(jù)相關(guān)性分為多個(gè)不同的類別,并按要求把各類數(shù)據(jù)歸為異常類與正常類?;诰垲惖漠惓z測算法相對(duì)于傳統(tǒng)檢測算法無須訓(xùn)練樣本集就能自動(dòng)完成異常檢測,且具有無監(jiān)督檢測的優(yōu)點(diǎn)[2]。聚類指的是把各種抽象的數(shù)據(jù)對(duì)象集根據(jù)彼此的相似性劃分為不同類別的過程,其目的是相似性越大的數(shù)據(jù)歸為一類,相似性越小的數(shù)據(jù)歸為不同類。如果類內(nèi)數(shù)據(jù)相似性越大,則類間數(shù)據(jù)相差就越大,劃分聚類的效果就越好。K-means算法是硬聚類算法,是典型的基于原型的目標(biāo)函數(shù)聚類方法的代表,它是數(shù)據(jù)點(diǎn)到原型的某種距離作為優(yōu)化的目標(biāo)函數(shù),利用函數(shù)求極值的方法得到迭代運(yùn)算的調(diào)整規(guī)則。K-means算法以歐式距離作為相似度測度,它是求對(duì)應(yīng)某一初始聚類中心向量V最優(yōu)分類,使得評(píng)價(jià)指標(biāo)J最小。算法采用誤差平方和準(zhǔn)則函數(shù)作為聚類準(zhǔn)則函數(shù)。問題二需要建立檢測ATM交易狀態(tài)異常的綜合評(píng)價(jià)模型,我們采用了K-Means模型,對(duì)ATM眾多數(shù)據(jù)進(jìn)行聚類分析,得到數(shù)據(jù)的異常值。2.2模型的準(zhǔn)備K-MEANS算法包括輸入和輸出兩個(gè)部分。輸入:聚類個(gè)數(shù)k,以及包含n個(gè)數(shù)據(jù)對(duì)象的數(shù)據(jù)庫。輸出:滿足方差最小標(biāo)準(zhǔn)的k個(gè)聚類。圖2-1我們要利用聚類分析區(qū)分正常值和異常值,所以我們選擇K=2。2.3模型的建立從N個(gè)數(shù)據(jù)對(duì)象任意選取K個(gè)對(duì)象作為初始聚類中心。循環(huán)(3)到(4)直到每個(gè)聚類不再發(fā)生變化為止。(3)根據(jù)每個(gè)聚類對(duì)象的均值(中心對(duì)象),計(jì)算每個(gè)對(duì)象與這些中心對(duì)象的距離,并根據(jù)最小距離重新對(duì)相應(yīng)對(duì)象進(jìn)行劃分。(4)重新計(jì)算每個(gè)聚類的均值(中心對(duì)象),直到聚類中心不再發(fā)生變化。劃分使得下式最小[3]:\o"公式"2.4模型的求解因?yàn)閿?shù)據(jù)較多,我們從中選取了2月份的數(shù)據(jù)做分析。2.4.1響應(yīng)時(shí)間的聚類分析圖2-22月時(shí)間-響應(yīng)時(shí)間K均值法分類圖圖2-32月時(shí)間-響應(yīng)時(shí)間K均值法分類圖對(duì)比圖圖2-42月1日時(shí)間-響應(yīng)時(shí)間K均值法分類圖從圖中看出大量數(shù)據(jù)聚類后集中分布在0-160內(nèi),有個(gè)別點(diǎn)分散在160以上甚至7000以上,但為了精確我們的模型,我么還將2月1號(hào)的響應(yīng)時(shí)間做了聚類分析,發(fā)現(xiàn)當(dāng)天會(huì)出現(xiàn)少數(shù)點(diǎn)響應(yīng)時(shí)間分布在140以上,大部分?jǐn)?shù)據(jù)集中在90-130內(nèi),因此為了加強(qiáng)異常點(diǎn)的檢測精準(zhǔn)性,提高報(bào)警的準(zhǔn)確性,我們選取響應(yīng)時(shí)間異常點(diǎn)為140以上,這些點(diǎn)可以看成異常點(diǎn),即檢測到的異常值,所以當(dāng)響應(yīng)時(shí)間到達(dá)160以上時(shí),可以認(rèn)為出現(xiàn)了故障三或故障四。2.4.2交易量的聚類分析圖2-52月時(shí)間-交易量K均值法分類圖圖2-6時(shí)間-交易量2月1日K均值法分類圖圖2-7時(shí)間-交易量2月10日K均值法分類圖圖2-8時(shí)間-交易量2月20日K均值法分類圖由上面的圖發(fā)現(xiàn)交易量在600-700之間會(huì)發(fā)生陡降,我們分別做了2月1號(hào),2月10號(hào),2月20號(hào)的交易量聚類分析圖后發(fā)現(xiàn)這三天內(nèi)按每一分鐘的交易量變化為異常檢驗(yàn)數(shù)據(jù)的時(shí)候,每分鐘之間交易量差別最大為204,所以我們可以按每分鐘交易量差若超過300為故障處理,此時(shí)可認(rèn)為出現(xiàn)了故障一。2.4.3成功率的聚類分析對(duì)于成功率這一數(shù)據(jù),我們采用K-均值聚類算法對(duì)二月份的成功率數(shù)據(jù)進(jìn)行處理后得到了如下表格:每個(gè)聚類中的案例數(shù)聚類11827.000238493.000有效40320.000缺失.000最終聚類中心聚類12成功率89%97%表2-1表2-2我們發(fā)現(xiàn),在總共40320個(gè)數(shù)據(jù)中,最終的1類聚類結(jié)果有1827個(gè),2類聚類結(jié)果有38493個(gè)。因此我們確定低于89%的數(shù)據(jù)為異常數(shù)據(jù),認(rèn)為出現(xiàn)了故障二或故障四。問題二基于BP神經(jīng)網(wǎng)絡(luò)的異常檢測模型3.1算法背景分析人工神經(jīng)網(wǎng)絡(luò)是基于現(xiàn)代神經(jīng)科學(xué)研究基礎(chǔ)之上建立的一種數(shù)學(xué)模型,它的原理與大腦的工作原理相似,也有和大腦類似的特征,人們對(duì)BP神經(jīng)網(wǎng)絡(luò)算法的理論認(rèn)識(shí)相對(duì)完善,利用BP神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)非線性模型、函數(shù)逼近、模式分類的技術(shù)已經(jīng)相對(duì)成熟。因此,我們考慮使用BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行正常值和異常值的分類[4]。3.2模型的建立我們考慮一個(gè)其結(jié)構(gòu)如下圖所示的人工神經(jīng)網(wǎng)絡(luò):圖3-1激活函數(shù)由來決定。圖中最下面單元,即由·所示的一層稱為輸入層,用以輸入已知測量值。在我們的例子中,它只需包括兩個(gè)單元,一個(gè)用以輸入響應(yīng)時(shí)間,一個(gè)用以輸入成功率。中間一層稱為處理層或隱單元層,單元個(gè)數(shù)適當(dāng)選取,我們選擇取三個(gè)。最上面一層稱為輸出層,在我們的例子中只包含二個(gè)單元,用以輸出與每一組輸入數(shù)據(jù)相對(duì)應(yīng)的分類信息。任何一個(gè)中間層單元接受所有輸入單元傳來的信號(hào),并把處理后的結(jié)果傳向每一個(gè)輸出單元,供輸出層再次加工,同層的神經(jīng)元彼此不相聯(lián)接,輸入與輸出單元之間也沒有直接聯(lián)接。這樣,除了神經(jīng)元的形式定義外,我們又給出了網(wǎng)絡(luò)結(jié)構(gòu)[5]。為了敘述上的方便,此處引人如下記號(hào)上的約定:令s表示一個(gè)確定時(shí)刻的序號(hào),由于數(shù)據(jù)過于龐大,我們選擇了學(xué)習(xí)樣本中的15個(gè)樣品,s=1,2,…,15。當(dāng)將第s個(gè)樣品的原始數(shù)據(jù)輸入網(wǎng)絡(luò)時(shí),相應(yīng)的輸出單元狀態(tài)記為,隱單元狀態(tài)記為,輸入單元取值記為。此處下標(biāo)i,j,k分別對(duì)應(yīng)于輸出層、中間層及輸入層。在這一約定下,從中間層到輸出層的權(quán)記為,從輸入層到中間層的權(quán)記為,如果,均已給定,那么對(duì)應(yīng)于任何一組確定的輸入,網(wǎng)絡(luò)中所有單元的取值不難確定[6]。如果我們能夠選定一組適當(dāng)?shù)臋?quán)值,使得對(duì)應(yīng)于學(xué)習(xí)樣本中任何一組正常樣品的輸入,輸出,對(duì)應(yīng)于異常的輸入數(shù)據(jù),輸出為,那么故障檢測問題實(shí)際上就解決了。因?yàn)椋瑢?duì)于任何一個(gè)時(shí)刻,只要將其成功率及響應(yīng)時(shí)間數(shù)據(jù)輸入網(wǎng)絡(luò),視其輸出模式靠近(1,0)亦或(0,1),就可以判斷其歸屬。對(duì)于權(quán)值的選擇,我們采用了向后傳播算法[7]。3.3模型的求解我們選取了(響應(yīng)時(shí)間,成功率)的9組正常值和6組異常值進(jìn)行訓(xùn)練。得到結(jié)果如下:圖3-2然后對(duì)于三組輸入值,判斷結(jié)果如下:圖3-3顯然可以看出,1、3組數(shù)據(jù)為正常值,第二組數(shù)據(jù)為異常值。問題三擴(kuò)展數(shù)據(jù)的選取4.1系統(tǒng)應(yīng)用異常值新指標(biāo)的提出通過題目中給出的故障分類我們發(fā)現(xiàn),故障二為成功率下降,故障三為響應(yīng)時(shí)間增長,而故障四的表現(xiàn)為成功率下降或響應(yīng)時(shí)間增長。這使得故障二三與故障四之間難以分辨,考慮到故障四的成因?yàn)閿?shù)據(jù)中心后端處理系統(tǒng)應(yīng)用進(jìn)程異常,我們提出增加系統(tǒng)應(yīng)用進(jìn)程異常值這個(gè)新指標(biāo),該值用軟件在數(shù)據(jù)中心后端處理系統(tǒng)中實(shí)時(shí)監(jiān)測,進(jìn)程異常時(shí)值為1,正常時(shí)值為0,當(dāng)發(fā)生成功率下降或相應(yīng)時(shí)間增長時(shí),返回該值結(jié)果,若為1則為故障四,若為0則為故障二三。4.2網(wǎng)絡(luò)負(fù)載率若檢測到網(wǎng)絡(luò)負(fù)載率達(dá)到較大值或者滿載值,響應(yīng)時(shí)間較大,成功率較低或交易量驟減就很可能不是前端或后端的故障問題導(dǎo)致,而是數(shù)據(jù)傳輸過程出現(xiàn)阻塞導(dǎo)致,此數(shù)據(jù)的采集也能一定程度上減少誤報(bào)率。六、模型的檢驗(yàn)、靈敏度分析1.模型的檢驗(yàn)從數(shù)天00:00-23:59的每天1440分鐘的數(shù)據(jù)中,我們隨機(jī)選取了5000組數(shù)據(jù)對(duì)模型的異常檢測和報(bào)警能力進(jìn)行了檢測。在這5000組數(shù)據(jù)中,共有156組數(shù)據(jù)的ATM工作
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 餐廳經(jīng)理個(gè)人工作計(jì)劃
- 個(gè)人計(jì)劃幼兒園目標(biāo)
- 關(guān)愛殘疾兒童工作計(jì)劃殘疾兒童幫扶計(jì)劃
- 出納下月工作計(jì)劃范文
- 2025~年第二學(xué)期高二化學(xué)備課組計(jì)劃
- 年小學(xué)安全教育工作計(jì)劃
- 高一美術(shù)教學(xué)工作計(jì)劃
- 有出納崗位工作計(jì)劃
- 4年終綜合管理崗位個(gè)人工作計(jì)劃范文
- 《氧氣吸入法》課件
- 韋尼克腦病病因介紹
- 死亡醫(yī)學(xué)證明管理規(guī)定(3篇)
- 2024-2030年中國三氧化二砷行業(yè)運(yùn)行狀況及發(fā)展可行性分析報(bào)告
- 2024年制造業(yè)代工生產(chǎn)保密協(xié)議樣本版
- 醫(yī)院維修維保工程合同范文
- 2024年度學(xué)校工作總結(jié)校長匯報(bào):六大支柱筑夢教育新征程
- 《奇效的敷臍療法》課件
- GB/T 19413-2024數(shù)據(jù)中心和通信機(jī)房用空氣調(diào)節(jié)機(jī)組
- 公路冬季施工安全培訓(xùn)
- 中華人民共和國文物保護(hù)法
- DB13T 5936-2024 高粱-大豆帶狀復(fù)合種植技術(shù)規(guī)程
評(píng)論
0/150
提交評(píng)論