




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、BP(BackPropagation)網(wǎng)絡是1986年由Rinehart和“TV.McClelland為首的科學家小組提出,是一種按誤差逆?zhèn)鞑ニ阋?XSSgb一法訓練的多層前饋網(wǎng)絡,是目前應用最廣泛的神經(jīng)網(wǎng)絡模型二浮于歲二Z之一。BP網(wǎng)絡能學習和存貯大量的輸入-輸出模式映射關系,-一而無需事前揭示描述這種映射關系的數(shù)學方程。它的學習規(guī)則是使用最速下降法,通過反向傳播來不斷調(diào)整網(wǎng)絡的權值輸入層障層輸出層和閾值,使網(wǎng)絡的誤差平方和最小。BP神經(jīng)網(wǎng)絡模型拓撲結圖5,BP神經(jīng)網(wǎng)絡結構不意圖構包括輸入層(input)、隱層(hidelayer)和輸出層(outputlayer)(如圖5.2所示)。5.4
2、.1 BP神經(jīng)元圖5.3給出了第j個基本BP神經(jīng)元(節(jié)點),它只模仿了生物神經(jīng)元所具有的三個最基本也是最重要的功能:加權、求和與轉(zhuǎn)移。其中X1、X2XiXn分別代表來自神經(jīng)元1、2in的輸入;W1、W2wr-Wn則分別表示神經(jīng)元1、27與第j個神經(jīng)元的連接強度,即權值;bj為閾值;f()為傳遞函數(shù);yj為第j個神經(jīng)元的輸出。第j個神經(jīng)元的凈輸入值為為:8產(chǎn)工叫r舊+為=郎/+/u(5.12)其中:才再三小工丁巴嗎一界嗎.,%.若視=1,嗎。=可,即令及%包括近及嗎。,則于是節(jié)點j的凈輸入與可表示為:2=工3東/=%Xi-A凈輸入邑通過傳遞函數(shù)(TransferFunction)f()后,便得到
3、第j個神經(jīng)元的輸出刀:M(5.14)式中f()是單調(diào)上升函數(shù),而且必須是有界函數(shù),因為細胞傳遞的信號不可能無限增加,必有一最大值。5.4.2 BP網(wǎng)絡BP算法由數(shù)據(jù)流的前向計算(正向傳播)和誤差信號的反向傳播兩個過程構成。正向傳播時,傳播方向為輸入層一隱層一輸出層,每層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元。若在輸出層得不到期望的輸出,則轉(zhuǎn)向誤差信號的反向傳播流程。通過這兩個過程的交替進行,在權向量空間執(zhí)行誤差函數(shù)梯度下降策略,動態(tài)迭代搜索一組權向量,使網(wǎng)絡誤差函數(shù)達到最小值,從而完成信息提取和記憶過程。設BP網(wǎng)絡的輸入層有n個節(jié)點,隱層有q個節(jié)點,輸出層有m個節(jié)點,輸入層與隱層之間的權值為期幻,隱層
4、與輸出層之間的權值為嗎鼠如圖5.4所示。隱層的傳遞函數(shù)為f1(),輸出層的傳遞函數(shù)為f2(),則隱層節(jié)點的輸出為(將閾值寫入求和項中):輸出層節(jié)點的輸出為:1-0k=1,2,(5.15)口qm圖5.4三層神經(jīng)網(wǎng)揩的拓撲結構至此B-P網(wǎng)絡就完成了n維空間向量對m維空間的近似映射。1)定義誤差函數(shù)輸入尸個學習樣本,用xL/來表示。第戶個樣本輸入到網(wǎng)絡后得到輸出V;(j=1,2,項。采用平方型誤差函數(shù),于是得到第p個樣本的誤差日:-I冊%=5工解 7 了、(5.17)式中:4為期望輸出。對于F個樣本,全局誤差為:1PMP=彳110-居)=斗,、。蜀丁。蜀(5.18)2)輸出層權值的變化采用累計誤差B
5、P算法調(diào)整叫A,使全局誤差百變小,即式中:即一學習率定義誤差信號為:3_嗎_而了嗎好一一碣一年7百其中第一項:=-7?=-V-=元士)(5.19)(5.20)于是輸出層各神經(jīng)元的權值調(diào)整公式為:颯叫 T)為品)力丁.(5.(24)(5.(25)3)隱層權值的變化砥df$曲,.=刃嬴=刃甌%AgF 藐)(5.(26)定義誤差信號為:弟=-竺L=一歲三斷風風(5.(27)其中第一項:(5.(28)是輸出層傳遞函數(shù)的偏微分。于是:4嚕即由鏈定理得:曲,必,網(wǎng)r第二項:2(5.21)(5.22)(5.23)是隱層傳遞函數(shù)的偏微分。于是:“鏟一)由鏈定理得:依鏈定理有:叫叫叫面二兩國,叫上(5.(29)
6、第二項:(5.(30)(5.31)制rr從而得到隱層各神經(jīng)元的權值調(diào)整公式為:手*ft%=?蜉一切)力 3,嗎區(qū)陽j-i(5.32)(5.33)5.4.3BP算法的改進BP算法理論具有依據(jù)可靠、推導過程嚴謹、精度較高、通用性較好等優(yōu)點,但下缺點:收斂速度緩慢;容易陷入局部極小值;難以確定隱層數(shù)和隱層節(jié)點個數(shù)。BP算法很難勝任,因此出現(xiàn)了很多改進算法。標準BP算法存在以在實際應用中,1)利用動量法改進BP算法標準BP算法實質(zhì)上是一種簡單的最速下降靜態(tài)尋優(yōu)方法,在修正W(K)W,只按照第K步的負梯度方向進行修正,而沒有考慮到以前積累的經(jīng)驗,即以前時刻的梯度方向,從而常常使學習過程發(fā)生振蕩,收斂緩慢
7、。動量法權值調(diào)整算法的具體做法是:將上一次權值調(diào)整量的一部分迭加到按本次誤差計算所得的權值調(diào)整量上,作為本次的實際權值調(diào)整量,即:標準BP算法收斂速度緩慢的一個重要原因是學習率選擇不當,學習率選得太小,收斂太慢;學習率選得太大,則有可能修正過頭,導致振蕩甚至發(fā)散??刹捎脠D5.5所示的自適應方法調(diào)整學習率。調(diào)整的基本指導思想是:在學習收斂的情況下,增大T,以縮短學習時間;當7偏大致使不能收斂時,要及時減小7,直到收斂為止。3)動量-自適應學習速率調(diào)整算法采用動量法時,BP算法可以找到更優(yōu)的解;采用自適應學習速率法時,BP算法可以縮短訓練時間。將以上兩種方法結合起來,就得到動量-自適應學習速率調(diào)整
8、算法。4)L-M學習規(guī)則L-M(Levenberg-Marquardt)算法比前述幾種使用梯度下降法的BP算法要快得多,但對于復雜問題,這種方法需要相當大的存儲空間。L-M(Levenberg-Marquardt)優(yōu)化方法的權值調(diào)整率選為:(5.35)其中:e一誤差向量;J網(wǎng)絡誤差對權值導數(shù)的雅可比(Jacobian)矩陣;以一標量,當以很大時上式接近于梯度法,當小很小時上式變成了Gauss-Newton法,在這種方法中,小也是自適應調(diào)整的。綜合考慮,擬采用L-M學習規(guī)則和動量法分別作為神經(jīng)網(wǎng)絡的訓練函數(shù)和學習函數(shù)。5.5BP神經(jīng)網(wǎng)絡的訓練策略及結果本文借助于MATLA腫經(jīng)網(wǎng)絡工具箱來實現(xiàn)多層
9、前饋BP網(wǎng)絡(Multi-layerfeed-forwardbackpropagationnetwork)的顏色空間轉(zhuǎn)換,免去了許多編寫計算機程序的煩惱。神經(jīng)網(wǎng)絡的實際輸出值與輸入值以及各權值和閾值有關,為了使實際輸出值與網(wǎng)絡期望輸出值相吻合,可用含有一定數(shù)量學習樣本的樣本集和相應期望輸出值的集合來訓練網(wǎng)絡。訓練時仍然使用本章5.2節(jié)中所述的實測樣本數(shù)據(jù)。&印 5)=-3月0)+處用5-1)(5.34)圖5.5自適應學習于誤差曲面局部細節(jié)的敏感性,其中:a為動量系數(shù),通常0a1(5.38)其中:/一輸出節(jié)點的個數(shù),聲一訓練樣本數(shù)目,,如一網(wǎng)絡期望輸出值,的一網(wǎng)絡實際輸出值。均方誤差克服
10、了上述兩種算法的缺點,所以選用均方誤差算法較合理。5.5.3訓練結果訓練一個單隱層的三層BP網(wǎng)絡,根據(jù)如下經(jīng)驗公式選擇隱層節(jié)點數(shù)125:/二歷荷+(5.39)式中:n為輸入節(jié)點個數(shù),m為輸出節(jié)點個數(shù),a為1到10之間的常數(shù)。針對本論文ni取值范圍為313。訓練結果如表5.1所示。表5.1隱層節(jié)點數(shù)與誤差的關系隱層神經(jīng)元個數(shù)訓練誤差測試誤差31.256611.127540.7977460.823250.6318490.727860.5702140.670770.5528730.689580.4451180.657590.3855780.6497100.2596240.4555110.185749
11、0.6644120.1838780.48130.1685870.6671由上表可以看出:增加隱層節(jié)點數(shù)可以減少訓練誤差,但超過10以后測試誤差產(chǎn)生波動,即泛化能力發(fā)生變化。綜合比較隱層節(jié)點數(shù)為10與12的訓練誤差和測試誤差,決定隱層節(jié)點數(shù)選用12。訓練誤差和測試誤差都很大,而且收斂速度極慢(訓練過程如圖5.7所示),這個問題可以通過對輸出量進行歸一化來解決。根據(jù)Sigmoid型傳遞函數(shù)輸入和輸出的范圍,對輸入變量不進行歸一化處理,只對輸出變量進行歸一化,這是因為在輸出數(shù)據(jù)要求歸一化的同時,對輸入數(shù)據(jù)也進行歸一化的話,權值的可解釋性就更差了。目標值按下式進行變化:三乂0,9+???4噸一4血(5
12、.40)使目標值落在0.050.95之間,這樣靠近數(shù)據(jù)變化區(qū)間端點的網(wǎng)絡輸出值就有一波動范圍,網(wǎng)絡的性能較好。用新生成的訓練樣本與測試樣本對隱層節(jié)點數(shù)為12的網(wǎng)絡進行訓練,得到的訓練誤差為9.89028X10-5,測試誤差為1.9899X10-4,達到了預定的目標(訓練過程如圖5.8所示)。5.6最終訓練后的神經(jīng)網(wǎng)絡結構采用三層BP網(wǎng)絡實現(xiàn)攝像機輸出RG的色空間與CIEXYZfe空間轉(zhuǎn)換, 其中隱層含有12個節(jié)點, 傳遞函數(shù)采用tansig函數(shù);輸出層傳遞函數(shù)選用purelin函數(shù)。經(jīng)過測試后結果滿意,可以認為該神經(jīng)網(wǎng)絡可以用來實現(xiàn)這個關系映射。網(wǎng)絡的結構如圖5.9所示:得到的BP神經(jīng)網(wǎng)絡的權值和閾值為:5.7本章小結1)定量地分析了用線性關系轉(zhuǎn)換攝像機RG琛問到CIE-XYZ空間數(shù)據(jù)后產(chǎn)生的均方誤差,表明CCEM像機與標準觀察者之間有比較明顯的差別,也就是說RGBfCIE-XYZ間的轉(zhuǎn)換是非線性的。2)采用MATLAB神經(jīng)網(wǎng)絡工具箱實現(xiàn)多層前饋BP網(wǎng)絡的RG醐CIEXY初色空間轉(zhuǎn)換, 用經(jīng)過歸一化的訓練樣本與測試樣本對隱層節(jié)點數(shù)為12的三層網(wǎng)絡進
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版九年級下冊英語教學計劃(及進度表)
- 2025年黨政領導干部黨章黨規(guī)黨紀黨史知識培訓考試題庫及答案(共210題)
- 銷售試用期工作表現(xiàn)評語
- 劇本編劇合作協(xié)議
- 《移動網(wǎng)絡規(guī)劃和優(yōu)化》課件-第二章
- 地鐵站裝修資助協(xié)議
- 新建鐵路M剛構連續(xù)梁 投標方案(技術方案)
- 農(nóng)業(yè)科技項目實施效果評估方案
- 雨水收集的系統(tǒng)
- 公司員工培訓資料
- 《認識搜索引擎》課件
- 安全漏洞挖掘與漏洞修復項目市場競爭分析
- 管理學基礎與實務課件
- LY/T 3355-2023油茶
- 陽光分級閱讀初一上 A Magician's House課件
- 部編人教版一年級語文下冊《操場上》說課
- 新聞傳播法規(guī)的基礎知識
- 感染性休克患者的護理-蕾
- 世界各國區(qū)號大全
- 九小場所安全培訓
- 牛肉酥餅制作
評論
0/150
提交評論