![論文基于BP神經(jīng)網(wǎng)絡(luò)的上證股票指數(shù)預(yù)測(cè)_第1頁(yè)](http://file4.renrendoc.com/view/ad8f90bbb0c41011c5b2293607c59b24/ad8f90bbb0c41011c5b2293607c59b241.gif)
![論文基于BP神經(jīng)網(wǎng)絡(luò)的上證股票指數(shù)預(yù)測(cè)_第2頁(yè)](http://file4.renrendoc.com/view/ad8f90bbb0c41011c5b2293607c59b24/ad8f90bbb0c41011c5b2293607c59b242.gif)
![論文基于BP神經(jīng)網(wǎng)絡(luò)的上證股票指數(shù)預(yù)測(cè)_第3頁(yè)](http://file4.renrendoc.com/view/ad8f90bbb0c41011c5b2293607c59b24/ad8f90bbb0c41011c5b2293607c59b243.gif)
![論文基于BP神經(jīng)網(wǎng)絡(luò)的上證股票指數(shù)預(yù)測(cè)_第4頁(yè)](http://file4.renrendoc.com/view/ad8f90bbb0c41011c5b2293607c59b24/ad8f90bbb0c41011c5b2293607c59b244.gif)
![論文基于BP神經(jīng)網(wǎng)絡(luò)的上證股票指數(shù)預(yù)測(cè)_第5頁(yè)](http://file4.renrendoc.com/view/ad8f90bbb0c41011c5b2293607c59b24/ad8f90bbb0c41011c5b2293607c59b245.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于BP神經(jīng)網(wǎng)絡(luò)的上證股票指數(shù)預(yù)測(cè)
ShanghaiStockIndexPrediction
withNeuralNetworks
內(nèi)容提要
證券市場(chǎng)作為高風(fēng)險(xiǎn)高收益的投資領(lǐng)域一直倍受投資者的關(guān)注,如何能夠準(zhǔn)確分析和預(yù)測(cè)股票價(jià)格以便獲取豐厚的收益一直受到人們的關(guān)注。于是各種股票價(jià)格分析預(yù)測(cè)和方法應(yīng)運(yùn)而生,如何建立一個(gè)成功率比較高的預(yù)測(cè)理論和模型是多年來(lái)許多學(xué)者一直研究的內(nèi)容。
隨著證券市場(chǎng)混沌和分形理論的逐步確立,人們開(kāi)始利用神經(jīng)網(wǎng)絡(luò)對(duì)證券市場(chǎng)的變動(dòng)加以預(yù)測(cè)。神經(jīng)網(wǎng)絡(luò)是一種重要的人工智能技術(shù),它的研究開(kāi)始于20世紀(jì)40年代,近年來(lái),神經(jīng)網(wǎng)絡(luò)任意連續(xù)映射的逼近能力學(xué)習(xí)理論以及動(dòng)態(tài)網(wǎng)絡(luò)的穩(wěn)定性分析都已取得了豐碩的成果;在應(yīng)用上也迅速擴(kuò)展到許多重要的領(lǐng)域涉及模式識(shí)別與圖象處理、控制與優(yōu)化、ATM網(wǎng)絡(luò)中呼叫接納的識(shí)別與控制、導(dǎo)航多媒體處理系統(tǒng)等等。神經(jīng)網(wǎng)絡(luò)的自適應(yīng)學(xué)習(xí)非線性映射強(qiáng)的特點(diǎn)非常適合應(yīng)用于經(jīng)濟(jì)領(lǐng)域的信息處理以及分析時(shí)間序列。
BP(BackPropagation)網(wǎng)絡(luò)是一種被廣泛運(yùn)用的神經(jīng)網(wǎng)絡(luò)。它的核心是BP算法,一種對(duì)于多基本子系統(tǒng)構(gòu)成的大系統(tǒng)進(jìn)行微商計(jì)算的嚴(yán)格而有效的方法,結(jié)構(gòu)簡(jiǎn)單,算法成熟。與傳統(tǒng)統(tǒng)計(jì)回歸方法相比,神經(jīng)網(wǎng)絡(luò)不僅能夠?qū)W習(xí)訓(xùn)練集的例子,且能從訓(xùn)練集中提煉出某種一般性原理、規(guī)律,具有很強(qiáng)的非線性函數(shù)擬合特性,這對(duì)于預(yù)測(cè)短周期內(nèi)股指波動(dòng)有較強(qiáng)的適用性。
本文嘗試?yán)没贐P算法的三層向前神經(jīng)網(wǎng)絡(luò)對(duì)上海交易所上證指數(shù)進(jìn)行了預(yù)測(cè),并針對(duì)BP網(wǎng)絡(luò)原形的一些缺點(diǎn)和不足,對(duì)原有的預(yù)測(cè)方法作出了一些改進(jìn)。在實(shí)際預(yù)測(cè)中取得了良好的效果。
關(guān)鍵詞:指數(shù)預(yù)測(cè);神經(jīng)網(wǎng)絡(luò);BP算法
Abstract
Tobeaninvestmentregionofhighriskandhighprofit,Stockmarketattractsmanyinvestors’attentionsallalong.Howtoobtainprofitthroughanalyzingandforecastingthesharepriceaccuratelyisattractingthepeople’sattentions.
WiththedevelopingofFractalMarketHypothesis(FMH)theory,peoplehavetriedtoforecastthechangeoftheStockmarket.TheneuralnetworkisanimportanttechnologyinthefiledofAI,whichwasdevelopedin1940’s.Inrecentyears,thetheoryabouttheapproximationofrandomcontinuousmapsbyneuralnetworkandtheanalyzingofthestabilityofadynamicnetworkhavebeenusedinmanyfieldsandgainedgreatachievement.
BP(BackPropagation)isaneuralnetworkwhichisadoptedwidely.ThecoreistheBParithmetic,astrictandeffectivemethodtoderivativeproblemforsystembasedonmulti-subsystem,whichhassimpleconfigurationandmaturearithmetic.Tocomparewiththetraditionalstatisticalregressmethod,BPnetworkcannotonlystudytheexampleoftrainingset,butalsoabstractsomegeneraltheoryandrule.Ithasstrongcharacteristicofapproximationofnon-linearfunctions,whichismuchfitforstockindexanalyzedandpredictedinashort-term.
ThisarticletriestouseaneuralnetworkonthebaseofBParithmetictoforecasttheshareindexofShanghaistockexchange.MeanwhileitmakessomeimprovementtotheoriginalforecastmethodaccordingtothelimitationanddisadvantageoftheBPnetworkoriginalshape.
Keywords:StockIndexForecasting;NeuralNetworks;BParithmetic
目錄
前言1
第一章股票市場(chǎng)的分形特征及其指數(shù)的預(yù)測(cè)方法2
第一節(jié):股票市場(chǎng)的分形特征2
1.傳統(tǒng)的有效市場(chǎng)假說(shuō)2
2.分形市場(chǎng)的假說(shuō)(FMH)3
第二節(jié)分形市場(chǎng)的判斷5
1.分形市場(chǎng)的常用判斷方法5
2.使用R/S法計(jì)算Hurst指數(shù)5
3.R/S計(jì)算的結(jié)果分析10
第二章利用神經(jīng)網(wǎng)絡(luò)對(duì)具有分形特征的時(shí)間數(shù)列進(jìn)行預(yù)測(cè).10
第一節(jié)常用的混沌時(shí)間序列分析預(yù)測(cè)方法10
第二節(jié)神經(jīng)網(wǎng)絡(luò)的基本原理10
1.人工神經(jīng)網(wǎng)絡(luò)的歷史11
2.神經(jīng)網(wǎng)絡(luò)的特點(diǎn)12
3.神經(jīng)網(wǎng)絡(luò)的基本原理13
第三節(jié)基于BP算法的三層向前的神經(jīng)網(wǎng)絡(luò)15
1.多層次的神經(jīng)網(wǎng)絡(luò)15
2.BP網(wǎng)絡(luò)的基本原理16
第三章對(duì)BP神經(jīng)網(wǎng)絡(luò)的改進(jìn)17
第一節(jié)BP網(wǎng)絡(luò)的缺陷17
第二節(jié)與BP算法相結(jié)合的遺傳算法18
1.遺傳算法簡(jiǎn)介18
2.遺傳算法的基本原理19
3.遺傳算法與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的結(jié)合20
第三節(jié)在樣本輸入中添加隨機(jī)噪聲21
第四節(jié)多個(gè)神經(jīng)網(wǎng)絡(luò)集成預(yù)測(cè)22
第四章實(shí)證結(jié)果及其分析24
第一節(jié)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)24
第二節(jié)利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)上證指數(shù)的流程26
第三節(jié)實(shí)際預(yù)測(cè)結(jié)果28
第四節(jié)對(duì)預(yù)測(cè)結(jié)果的分析和思考34
第五節(jié)總結(jié)35
前言
從股市誕生一百多年以來(lái),不斷有人用各種方式研究股市運(yùn)行的規(guī)律,人們希望能從復(fù)雜多變的股市中找到一個(gè)規(guī)律來(lái)預(yù)測(cè)股市未來(lái)的發(fā)展,從而通過(guò)證券交易獲得最大的投資凈效用。另一方面,隨著證券市場(chǎng)的飛速發(fā)展,證券市場(chǎng)與經(jīng)濟(jì)發(fā)展的關(guān)系越來(lái)越密切,證券市場(chǎng)在成為世界公認(rèn)的經(jīng)濟(jì)晴雨表的同時(shí),也對(duì)經(jīng)濟(jì)的發(fā)展產(chǎn)生著發(fā)作用。因此預(yù)測(cè)股票市場(chǎng)的變化趨勢(shì)更對(duì)經(jīng)濟(jì)發(fā)展的管理和調(diào)控有著重要的參考作用。
如何能夠準(zhǔn)確分析和預(yù)測(cè)股票價(jià)格?各種股票價(jià)格分析預(yù)測(cè)和方法應(yīng)運(yùn)而生,如何建立一個(gè)成功率比較高的預(yù)測(cè)理論和模型是多年來(lái)許多學(xué)者一直研究的內(nèi)容。國(guó)外的研究者先后提出了一系列的定價(jià)理論和投資組合模型如馬柯威茨的投資組合理論夏普等人的CAPM以及羅斯的APT然而投資者們發(fā)現(xiàn)雖然這些理論極大地開(kāi)闊和提高了投資者的思想理念及其對(duì)風(fēng)險(xiǎn)和收益的辨證理解但對(duì)實(shí)際操作卻缺乏明確的指導(dǎo)作用。
隨著近年來(lái)人工智能方法研究的發(fā)展以及證券市場(chǎng)一些特性逐漸被人所揭示,一些新的預(yù)測(cè)方式開(kāi)始浮出水面。神經(jīng)網(wǎng)絡(luò)由于其在分析和預(yù)測(cè)時(shí)間序列方面的獨(dú)到優(yōu)勢(shì),逐漸成為構(gòu)建證券預(yù)測(cè)模型的有力工具。
我國(guó)證券市場(chǎng)自90年代初期成立以來(lái),雖然經(jīng)歷的時(shí)間只有短短15年。經(jīng)過(guò)15年的努力,中國(guó)證券市場(chǎng)取得了巨大的成就,當(dāng)前深圳、上海兩家證券交易所總市值達(dá)到4萬(wàn)多億元,已經(jīng)有1300多家的上市公司,7000多萬(wàn)名投資者。對(duì)我國(guó)證券市場(chǎng)走勢(shì)的預(yù)測(cè)同樣有著重要的意思。
上海證券交易所編制的上證綜合指數(shù),該指數(shù)以1990年12月19日為基日,以該日所有股票的市價(jià)總值為基期,基期指數(shù)定為100點(diǎn),自1991年7月15日起正式發(fā)布。上證指數(shù)將上海交易所流通股票的總市值的變動(dòng)以指數(shù)的形式表示出來(lái),易于計(jì)算。上證指數(shù)的變化情況準(zhǔn)確的反映著證券市場(chǎng)的波動(dòng)情況。對(duì)于上證指數(shù)的預(yù)測(cè)工作不但能夠幫助資本市場(chǎng)的投資者對(duì)后市發(fā)展進(jìn)行分析獲取收益,對(duì)分析和微調(diào)我國(guó)經(jīng)濟(jì)發(fā)展方向也有著重要的參考價(jià)值。
本文在意在研究股票市場(chǎng)的一些基本的特點(diǎn),通過(guò)嘗試?yán)蒙窠?jīng)網(wǎng)絡(luò)對(duì)上證指數(shù)的變化趨勢(shì)進(jìn)行了預(yù)測(cè),探索為預(yù)測(cè)我國(guó)證券市場(chǎng)指數(shù)的變動(dòng)提供了一種具有一定準(zhǔn)確性與可操作性的實(shí)用方法。
第一章股票市場(chǎng)的分形特征及其指數(shù)的預(yù)測(cè)方法
第一節(jié):股票市場(chǎng)的分形特征
傳統(tǒng)的有效市場(chǎng)假說(shuō)
美國(guó)經(jīng)濟(jì)學(xué)家Fama1965年在其經(jīng)典文獻(xiàn)中提出了有效市場(chǎng)假說(shuō)(EfficientMarketHypothesis,EMH),他認(rèn)為投資者對(duì)市場(chǎng)信息會(huì)作出合理的反應(yīng),應(yīng)該將市場(chǎng)信息與股票價(jià)格相結(jié)合。在EMH假說(shuō)里,市場(chǎng)是一個(gè)鞅,或“公平博弈”,即信息不能被用來(lái)在市場(chǎng)上獲利。即“如果在一個(gè)證券市場(chǎng)中,價(jià)格完全反映了所有可獲得的信息,那么就稱這樣的市場(chǎng)為有效市場(chǎng)”。
經(jīng)濟(jì)學(xué)家Roberts根據(jù)信息集的不同內(nèi)涵,區(qū)別了三個(gè)層次的市場(chǎng)效率,即弱型效率、半強(qiáng)型效率、強(qiáng)型效率。這種分類法被Fama確定而成為經(jīng)典。
這三種信息集分別為:(1)歷史價(jià)格信息,通常指證券過(guò)去的價(jià)格和成交量;(2)所有可公開(kāi)得到的信息,包括盈利報(bào)告、年度財(cái)務(wù)報(bào)告、財(cái)務(wù)分析人員公布的盈利預(yù)測(cè)和公司發(fā)布的新聞、公告等;(3)所有可知的信息,包括不為投資大眾所了解的內(nèi)幕信息。與這三類信息相對(duì)應(yīng),有效率的市場(chǎng)可分為弱型效率、半強(qiáng)型效率、強(qiáng)型效率。
弱型效率(Weak-FormEfficiency)認(rèn)為價(jià)格反映了包含在歷史價(jià)格序列中的所有信息,投資者不能通過(guò)分析歷史價(jià)格獲得超常收益,這意味著技術(shù)分析無(wú)效。弱型效率是證券市場(chǎng)效率的最低程度。
半強(qiáng)型效率(Semistrong-FormEfficiency)認(rèn)為如果市場(chǎng)達(dá)到半強(qiáng)型有效,則分析資產(chǎn)負(fù)債表、損益表、宣布股利的變化或股票拆細(xì)和其它任何有關(guān)公司的公開(kāi)信息不能獲得超常收益,這意味著基礎(chǔ)分析無(wú)效。半強(qiáng)型效率是證券市場(chǎng)效率的中間狀態(tài),證券價(jià)格已充分、及時(shí)地反映了公開(kāi)信息。
強(qiáng)型效率(Strong-FormEfficiency)認(rèn)為市場(chǎng)參與者知道的有關(guān)公司所有的信息都已充分反映在股價(jià)當(dāng)中,即使那些擁有優(yōu)越信息的人也無(wú)法獲得超常收益。強(qiáng)型效率是市場(chǎng)效率的最高程度,它包含了弱型效率和半強(qiáng)型效率。
如果市場(chǎng)是有效的,意味著即使是專業(yè)投資人也無(wú)法敗市場(chǎng),那么實(shí)際上就否定了積極管理的投資理念。相反,如果市場(chǎng)無(wú)效,那么投資者和投資機(jī)構(gòu)就可以通過(guò)構(gòu)造組合,創(chuàng)造超過(guò)市場(chǎng)的收益。
市場(chǎng)有效性假說(shuō)是理性預(yù)期學(xué)派理論的重要基礎(chǔ),它是數(shù)量話資本市場(chǎng)理論的基礎(chǔ),現(xiàn)代經(jīng)典的資本市場(chǎng)理論以及證券技術(shù)分析方法很多都是從EMH假說(shuō)上發(fā)展起來(lái)的。
進(jìn)入上世紀(jì)80年代,在探尋一般均衡定價(jià)模型進(jìn)展不大的情況下,人們開(kāi)始將定價(jià)理論的研究方向轉(zhuǎn)向注重市場(chǎng)信息的考察。經(jīng)過(guò)實(shí)證檢驗(yàn),邦德特和塞勒(BondtandTheler,1985)發(fā)現(xiàn)股市存在投資者有時(shí)對(duì)某些消息反應(yīng)過(guò)度(overreact),而杰格蒂什(Jegadeesh,1990)、萊曼(Lehmann,1990)等則發(fā)現(xiàn)了股價(jià)短期滯后反應(yīng)現(xiàn)象,由此,杰格蒂什和迪特曼(Titman,1993)認(rèn)為投資者對(duì)有關(guān)公司長(zhǎng)遠(yuǎn)發(fā)展的消息往往有過(guò)度的反應(yīng),而對(duì)只影響短期收益的消息則反應(yīng)不足,關(guān)于這一點(diǎn)仍然存在著爭(zhēng)論,盡管如此,信息與股價(jià)之間應(yīng)存在著某種關(guān)系得到了經(jīng)濟(jì)學(xué)家們的認(rèn)同,并且,弗倫奇和羅爾(Roll)的實(shí)證研究證明了股價(jià)波動(dòng)幅度與可獲得信息量之間存在著良好的正相關(guān)關(guān)系。
然而,EMH假說(shuō)同樣存在著明顯的缺陷:一是對(duì)信息的反應(yīng),并非以因果關(guān)系的形式呈現(xiàn),由于信息的分布是狹峰態(tài)的,因而價(jià)格變化的分布也應(yīng)該是狹峰態(tài)的,從而人們對(duì)信息的作出的反應(yīng)是非線形的,一旦信息水平達(dá)到了某個(gè)臨界值,人們才會(huì)對(duì)所忽略的信息作出反應(yīng),并直接達(dá)到臨界值。二是EMH假說(shuō)沒(méi)有涉及到市場(chǎng)的流動(dòng)性問(wèn)題。一個(gè)穩(wěn)定的市場(chǎng)有EMH描述的有效市場(chǎng)并不相同,一個(gè)穩(wěn)定的市場(chǎng)是一個(gè)富有流動(dòng)性的市場(chǎng)。如果市場(chǎng)富有流動(dòng)性,那么可以認(rèn)為價(jià)格是接近公平的,然而市場(chǎng)不是一直富有流動(dòng)性的。三是市場(chǎng)的有效性并不一定意味著隨即游走,但隨即游走的確意味著是市場(chǎng)是有效的。四是市場(chǎng)的有效性檢驗(yàn),對(duì)市場(chǎng)的有效性檢驗(yàn)仍然停留在最初的隨即游走模型上,然而滿足隨機(jī)游走模型只能看作是市場(chǎng)有效性的充分條件而不是必要條件。不滿足隨機(jī)游走模型的市場(chǎng)不一定就是無(wú)效的。五是有關(guān)效應(yīng)的問(wèn)題,股票收益的季節(jié)性,大小效應(yīng)等都不利于EMH假說(shuō)。①
上世紀(jì)80年代以來(lái)的許多相關(guān)的統(tǒng)計(jì)檢驗(yàn)也出現(xiàn)了與有效市場(chǎng)理論假設(shè)相沖突的股價(jià)異常現(xiàn)象,即證券市場(chǎng)異象。出現(xiàn)了任何一種股票或其組合的平均超常收益率不為零的證券市場(chǎng)異象,并且諸如價(jià)值異象、時(shí)間效應(yīng)、規(guī)模效應(yīng)、公告效應(yīng)、處置效應(yīng)等異?,F(xiàn)象在金融市場(chǎng)上頻繁出現(xiàn),運(yùn)用EMH理論卻很難解釋。
以Manddlborot為代表的一些學(xué)者對(duì)EMH理論提出了質(zhì)疑,他們認(rèn)為資本市場(chǎng)的收益率并不服從正態(tài)分布,其分布具有尖峰、厚尾等特征,實(shí)際上服從穩(wěn)定帕累托分布。在這類分布中,方差是無(wú)定義或者無(wú)限的,在一定的條件下它對(duì)應(yīng)與分?jǐn)?shù)布郎運(yùn)動(dòng),具有自相似、長(zhǎng)期相關(guān)、統(tǒng)計(jì)相關(guān)等特性。因此傳統(tǒng)的的資本市場(chǎng)方法無(wú)法準(zhǔn)確的反映市場(chǎng)的。①
1.1.2分形市場(chǎng)的假說(shuō)(FMH)
面對(duì)EMH理論的種種不足,金融學(xué)家們開(kāi)始嘗試?yán)梅蔷€性方法與混沌思想來(lái)理解股票市場(chǎng)行為,并開(kāi)始探索的描述市場(chǎng)特性的假說(shuō)。20世紀(jì)80年代初,美國(guó)經(jīng)濟(jì)學(xué)家Stutzer最先將新興的混沌理論和方法用于分析宏觀經(jīng)濟(jì)中非規(guī)則增長(zhǎng)和經(jīng)濟(jì)增長(zhǎng)中顯現(xiàn)的混沌等問(wèn)題。之后不久,國(guó)外經(jīng)濟(jì)學(xué)家們便開(kāi)始運(yùn)用混沌理論,研究和探討包報(bào)財(cái)政、金融在內(nèi)的經(jīng)濟(jì)和管理方面的問(wèn)題,特別是有關(guān)證券市場(chǎng)股價(jià)指數(shù)、匯率變化方面的研究格外引入注目,金融證券市場(chǎng)越來(lái)越多的混沌特征被逐步揭示了出來(lái)。
分形原理作為混沌研究的重要組成,近年來(lái)取得了很大進(jìn)展。1996年EdgarE.Peters在《ChaosandOrderintheCapitalMarkets》一書(shū)里提出了分形市場(chǎng)的假說(shuō)(FractalMarketHypothesis,FMH),將分形理論用于資本市場(chǎng),并且成功的建立了標(biāo)準(zhǔn)普而500家公司股票日周月年之間的收益曲線的自相似性。
分形是20世紀(jì)70年代后發(fā)展起來(lái)的一門新興的復(fù)雜科學(xué),它研究的是一種特
__________________________________
①伍恒煜,林詳“金融市場(chǎng)非線形:混沌與分形”,?商業(yè)研究?,2003年第7期
殊的復(fù)雜系統(tǒng)——“自相似”系統(tǒng),即在不同標(biāo)度下存在相同或相似特征的系統(tǒng)。分形的一個(gè)奇怪性質(zhì)是,它們不具有通常情況下用于測(cè)量的特征標(biāo)度,并且具有特殊的特征量:介于整數(shù)維之間的分?jǐn)?shù)維。著名的海岸線測(cè)量就是分形的一個(gè)例子。人們發(fā)現(xiàn)在測(cè)量海岸線長(zhǎng)度時(shí),所測(cè)長(zhǎng)度取決于用來(lái)測(cè)量的尺子長(zhǎng)度,尺子越短,所測(cè)的實(shí)際長(zhǎng)度就越長(zhǎng)。其原因是所用的尺子越短,系統(tǒng)內(nèi)部相似的細(xì)微結(jié)構(gòu)就越多地被揭示出來(lái)。
在金融市場(chǎng)上,我們也觀察到類似的分形結(jié)構(gòu)。價(jià)格序列在日、周、月的軌跡具有相似性,我們無(wú)法確切地將它們分辨開(kāi)來(lái)。基于這一觀察,以及金融市場(chǎng)分形性質(zhì)的不斷發(fā)現(xiàn),Peters提出的分形市場(chǎng)假說(shuō),即金融市場(chǎng)本質(zhì)上是一個(gè)復(fù)雜系統(tǒng),而分形是刻劃這一系統(tǒng)的有力工具。依據(jù)最近的研究進(jìn)展,我們對(duì)這一假說(shuō)提出部分修正:即金融市場(chǎng)事實(shí)上是有界的分形系統(tǒng)。有界分形指的是市場(chǎng)的分形性質(zhì)是有界的,金融市場(chǎng)上并不存在無(wú)限尺度上的自相似特征。
分形市場(chǎng)是指市場(chǎng)是內(nèi)在波動(dòng)的,不存在一個(gè)靜態(tài)的均衡。同時(shí)向投資者提供了一個(gè)穩(wěn)定性和流動(dòng)性的環(huán)境。這里的穩(wěn)定不是均衡,而是相對(duì)市場(chǎng)的崩潰而言的。不同于有效市場(chǎng)假說(shuō),分形市場(chǎng)理論認(rèn)為,信息依照投資者的投資偏好而被評(píng)讀。因?yàn)榫哂胁煌耐顿Y偏好的投資人對(duì)信息的評(píng)估是不同的,所以信息的傳播也是不均衡的。市場(chǎng)價(jià)格不可能每一次都反映出所有相關(guān)的信息,而只是反映出投資人偏好的那部分信息。這樣的結(jié)果就是市場(chǎng)的強(qiáng)烈波動(dòng)被吸收而呈現(xiàn)出穩(wěn)定發(fā)展的形態(tài)。FHM理論認(rèn)為市場(chǎng)價(jià)格是保持流動(dòng)和穩(wěn)定性的結(jié)果,而不是EMH認(rèn)為的博奕結(jié)果,價(jià)格不能線形的反映出所有的信息,價(jià)格的變化不是相互獨(dú)立的。在分形市場(chǎng)上是不存在理性人的假設(shè),投資人的決策依賴于歷史的經(jīng)驗(yàn),證券價(jià)格具有一定周期的長(zhǎng)期記憶性。只有在市場(chǎng)面臨突發(fā)的重大事件,大部分投資者對(duì)信息的觀點(diǎn)相同的時(shí)候,才會(huì)破壞這樣的穩(wěn)定性,造成突然的暴漲和暴跌行情。
分形市場(chǎng)假說(shuō)主要考察金融市場(chǎng)上存在的長(zhǎng)程相關(guān)(Long-rangedependence或Longmemory)和標(biāo)度行為(Scalingbehavior)。通過(guò)全新的觀念和工具,它為揭示金融市場(chǎng)可能存在的內(nèi)在結(jié)構(gòu)提供了新的洞察力。
分形市場(chǎng)假說(shuō)強(qiáng)調(diào)了流動(dòng)性的影響已經(jīng)基于投資者行為之上的投資偏好。分形市場(chǎng)假說(shuō)的目的是給研究者一個(gè)符合實(shí)際觀測(cè)到的投資人行為和市場(chǎng)價(jià)格運(yùn)動(dòng)的模型。
FMH的主要內(nèi)容包含了以下5個(gè)方面:
(1).市場(chǎng)由眾多投資者組成,他們具有不同的投資時(shí)間尺度,如長(zhǎng)線的或者短線的,這使他們有著不同的投資行為。
(2).信息對(duì)于投資時(shí)間尺度不同的投資人的影響是不同的,短線的投資者主要是投資行為主要是頻繁的加交易,因此他們比較關(guān)注技術(shù)分析信息,而基本面的信息經(jīng)常被忽略。長(zhǎng)線的投資者則認(rèn)為技術(shù)面的分析的信息不能用于長(zhǎng)期的的投資決策,只有對(duì)證券的內(nèi)在價(jià)值進(jìn)行評(píng)估才能獲得長(zhǎng)期的投資收益。
(3).市場(chǎng)的穩(wěn)定在于市場(chǎng)的流動(dòng)性的保持,而要作到這點(diǎn)需要大量的具有不同的時(shí)間投資尺度的投資人的存在。在證券市場(chǎng)上,正是因?yàn)榫哂写罅坎煌顿Y時(shí)間尺度的投資者的存在,才使得市場(chǎng)穩(wěn)定而具有活力。當(dāng)所有投資人的尺度如果趨向一致的時(shí)候,市場(chǎng)的穩(wěn)定必然被破壞。
(4).基于以上特點(diǎn),證券市場(chǎng)的價(jià)格是長(zhǎng)線基本面分析和短線技術(shù)分析共同作用的結(jié)果。一般來(lái)說(shuō)短期的價(jià)格比長(zhǎng)期的價(jià)格變化更具有易變性。市場(chǎng)發(fā)展的內(nèi)在趨勢(shì)反映了投資者期望收益的變化,并受到整個(gè)經(jīng)濟(jì)大環(huán)境的影響。短期交易行為更多的是從眾行為的結(jié)果,因此,市場(chǎng)的短期傾向與市場(chǎng)的長(zhǎng)期趨勢(shì)并無(wú)內(nèi)在的一致性。
(5).如果證券與經(jīng)濟(jì)循環(huán)沒(méi)有關(guān)系,那么就不存在長(zhǎng)期的趨勢(shì)。交易、流動(dòng)性和短期信息將在市場(chǎng)里起到?jīng)Q定性的作用。①
FMH和EMH理論的不同在于,分形市場(chǎng)假說(shuō)認(rèn)為資產(chǎn)的價(jià)格并非純粹的隨機(jī)運(yùn)動(dòng),而是服從一定的規(guī)律分布,是由價(jià)格決定系統(tǒng)的混沌性質(zhì)所引起的。FMH理論強(qiáng)調(diào)信息對(duì)不同投資時(shí)間尺度的投資者所產(chǎn)生的影響是不同的,信息傳播是不均衡的,價(jià)格變化不是獨(dú)立的。
第二節(jié)分形市場(chǎng)的判斷
1.2.1分形市場(chǎng)的常用判斷方法
那么怎么判斷一個(gè)市場(chǎng)是不是存在分型特征呢,要描述一個(gè)系統(tǒng)的分形特征,經(jīng)常被采用的方法包括:
(1).相關(guān)維。相關(guān)維指標(biāo)的作用在于用來(lái)判斷對(duì)象系統(tǒng)的行為是否混沌的,說(shuō)明了為描述該系統(tǒng)所需要的最多獨(dú)立變量數(shù),獨(dú)立變量的個(gè)數(shù)某種程度上反映了系統(tǒng)方程的復(fù)雜程度,但不能完全反映系統(tǒng)結(jié)果的復(fù)雜程度。
(2)、李雅普諾夫指數(shù)。利用李雅普諾夫指數(shù)可以判斷對(duì)象系統(tǒng)的行為是否混沌的;該指數(shù)還說(shuō)明了該系統(tǒng)的動(dòng)力行為在某個(gè)方向上是指數(shù)發(fā)散或收斂的。李雅普諾夫定量地給出了系統(tǒng)在某個(gè)方向上發(fā)散的速度,因此從最大李雅普諾夫指數(shù)我們可以知道系統(tǒng)包含的信息損失的最大速度,最大李雅普諾夫指數(shù)的倒數(shù)就給出了對(duì)象系統(tǒng)的最大可預(yù)報(bào)時(shí)間。
(3).Kolmogrov嫡。到目前為止,Kolmogrov墑僅用于判斷數(shù)據(jù)結(jié)構(gòu)中的混沌性質(zhì)。
(4).Hurst指數(shù)。Hurst指數(shù)說(shuō)明了時(shí)間序列的持續(xù)性行為。大于0.5的Hurst指數(shù)表明序列是持續(xù)性的;小于0.5則序列是反持續(xù)性的。Hurst指數(shù)還反映出時(shí)間序列的分形特征,從時(shí)間尺度上看,Hurst指數(shù)越是靠近0.5,序列的結(jié)構(gòu)越復(fù)雜,其時(shí)間曲線越是曲折。②
1.2.2使用R/S法計(jì)算Hurst指數(shù)
用R/S分析法計(jì)算Hurst指數(shù)的方法是一種常用的,用來(lái)檢驗(yàn)系統(tǒng)是否具有分形特征的辦法,具有簡(jiǎn)單易行的特點(diǎn)。
__________________________________
陳永忠“分形市場(chǎng)假說(shuō)下的風(fēng)險(xiǎn)度量“,《經(jīng)濟(jì)師》2004年第8期
PetersE.E"FractalMarketAnalysis:ApplyingChaosTheorytoInvestmentandEconomics"
[M].JohnWiley&Sons.IncNewyork1994
這種方法是Hurst長(zhǎng)期研究尼羅河的流量變化后提出的。在多年的水文數(shù)據(jù)中,他發(fā)現(xiàn)數(shù)據(jù)不服從布朗運(yùn)動(dòng)及正態(tài)分布的特性。為了合理控制水庫(kù)的泄水量使其保持不枯不溢的理想狀態(tài),Hurst測(cè)算了水庫(kù)蓄水量隨時(shí)間在平均水平附近波動(dòng)的范圍。Hurst用這個(gè)變動(dòng)范圍除以觀察值的標(biāo)準(zhǔn)差得到一個(gè)無(wú)量綱的量,使不同的序列具有可比性。這種分析稱為重標(biāo)極差法(rescaledrange),也稱R/S法。是一個(gè)時(shí)間序列中n個(gè)數(shù)據(jù)偏離其均值的累加值的極差,稱為n個(gè)數(shù)據(jù)的極差,表示時(shí)間序列最大的變化范圍;是時(shí)間序列的標(biāo)準(zhǔn)差,表示偏離均值的程度,是分散程度的測(cè)度。表示極差的大小重新用來(lái)衡量,這就是重標(biāo)極差法的名字的由來(lái)。
R/S法可以用于統(tǒng)計(jì)分析可用來(lái)研究一大類問(wèn)題,對(duì)于方差發(fā)散或有長(zhǎng)期記作用的隨機(jī)過(guò)程都適用。下面是R/S分析的具體過(guò)程。
考慮一個(gè)收益率序列,,…,。偏離均值的累積和為:
(1)
其中,是n期的累積偏差,是n期的平均值。
n個(gè)數(shù)據(jù)的極差就是式(1)最大和最小值之差:
={}-{}(2)
其中,是X的極差。
為了比較不同類型的時(shí)間序列,用極差除以標(biāo)準(zhǔn)差(即重標(biāo)極差)得到:
=(3)
其中,
重標(biāo)極差應(yīng)該隨時(shí)間而增加。
Hurst建立了以下關(guān)系:
R/S=a*(4)
其中,a為常數(shù)。
如果序列是一個(gè)隨機(jī)序列,H應(yīng)該等于0.5,即累積離差的極差應(yīng)該隨時(shí)間的平方根增加。一般地,H不等于0.5,可這樣求出:
對(duì)式(4)兩邊先取對(duì)數(shù)得:
ln(R/S)=Hlnn+lna(5)
因此可畫(huà)出ln(R/S)和lnn的雙對(duì)數(shù)圖,做二元回歸擬合。
直線的斜率就給出了Hurst指數(shù)的一個(gè)估計(jì),截距就是ln(a)的一個(gè)估計(jì)
其中H即是Hurst指數(shù),a為相關(guān)系數(shù)。
當(dāng)H=0.5時(shí),過(guò)去和未來(lái)增量間的相關(guān)系數(shù)為0,表明現(xiàn)在不影響未來(lái),這說(shuō)明增量過(guò)程是一個(gè)獨(dú)立的隨機(jī)過(guò)程,布朗運(yùn)動(dòng)是其特殊情況。
當(dāng)H≠0.5時(shí),為分?jǐn)?shù)布朗運(yùn)動(dòng)。此時(shí),增量之間不再相互獨(dú)立。但是這個(gè)過(guò)程與馬爾科夫過(guò)程所具有的短期記憶行為不同,分?jǐn)?shù)布朗運(yùn)動(dòng)的記憶作用是長(zhǎng)期的。(而且長(zhǎng)期記憶只與Hurst指數(shù)的大小有關(guān),沒(méi)有標(biāo)度性,因此它具有分形的特征)H值指示了這種長(zhǎng)期記憶作用的特性。
①0.5<H<1,有持久性效應(yīng)。表明過(guò)去一直增長(zhǎng)意味著未來(lái)這種趨勢(shì)將繼續(xù)下去,而且對(duì)任意大的時(shí)間t都是如此。反之,過(guò)去的減少趨勢(shì)就平均而言,意味著未來(lái)的連續(xù)減少。H越接近1,趨勢(shì)越明顯;H越接近0.5,逐漸趨于隨機(jī)性。這種長(zhǎng)期記憶作用使得隨機(jī)過(guò)程呈現(xiàn)一定的趨勢(shì),增量間有一定的正相關(guān)性,。絕大多數(shù)資本市場(chǎng)都符合持久性時(shí)間序列特征。
②0<H<0.5,增量間是負(fù)相關(guān)的,稱為反持久性效應(yīng)(antipersistent)。如果過(guò)去是增長(zhǎng)的,則下一時(shí)刻下降的可能性更大;反之,過(guò)去是下降的,則下一時(shí)刻上升的可能性更大。反持久性效應(yīng)的強(qiáng)度取決于H接近0的程度。H越接近0,則C越接近-0.5,負(fù)相關(guān)性越強(qiáng)。
我們知道,證券的指數(shù)、價(jià)格等都是一個(gè)時(shí)間序列,可以用以上辦法計(jì)算出Hurst值,如果Hurst值大于0.5,說(shuō)明系統(tǒng)存在分形的特征。
1.2.3上證指數(shù)序列的Hurst值的計(jì)算
我們使用R/S法對(duì)我國(guó)上海交易所1997年5月以來(lái)的上證指數(shù)的分形特征。選取的時(shí)間區(qū)間1997.5.14到2005.8.23日作為研究的時(shí)間段,在這段時(shí)間內(nèi)共有正好2000個(gè)交易日數(shù)據(jù)。
R/S分析步驟
首先對(duì)2000個(gè)收盤數(shù)據(jù)序列進(jìn)行處理,設(shè)t日的收盤數(shù)據(jù)為,計(jì)算的對(duì)數(shù)收益率
=ln()-ln()(5)
為了去掉對(duì)數(shù)收益率的線性相關(guān)性,我們對(duì)進(jìn)行AR(1)的自回歸得到其殘差序列:
=-(a+b)(6)
其中,a和b是回歸模型AR(1)的系數(shù),{}為殘差序列,經(jīng)過(guò)回歸計(jì)算,有:
a=-0.0147,b=0.0001
選取時(shí)間增量n。對(duì)于確定的n和1999個(gè)值的{}序列,我們可以得到[1999/n]個(gè)時(shí)間段,在每個(gè)時(shí)間段我們都可以計(jì)算出對(duì)應(yīng)的R與R/S,為此可以得到[1999/n]個(gè)的R/S,求這些R/S值求平均值作為在時(shí)間增量為n時(shí)的R/S估計(jì)值。我們這里將n的起始取值定為5,即1個(gè)交易周;
對(duì)所得到的結(jié)果,既n=5,6…1000的取值區(qū)域分別做ln對(duì)ln(n)的回歸,取ln(n)的參數(shù)估計(jì)作為H的估計(jì);
結(jié)果如下圖1:
圖1
計(jì)Vn=/,VN統(tǒng)計(jì)量同樣也可以用來(lái)很好地估計(jì)非線性系統(tǒng)長(zhǎng)期記憶過(guò)程的長(zhǎng)度。觀察序列如圖2所示,在n=308時(shí)出現(xiàn)明顯從上升轉(zhuǎn)為下降,的現(xiàn)象,可以知道n=308是一序列長(zhǎng)期記憶的消失點(diǎn)。對(duì)5<n<308的這個(gè)區(qū)域做一次回歸,計(jì)算Hurst指數(shù),得到H=0.608
圖2
1.2.3R/S計(jì)算的結(jié)果分析
通過(guò)上面的計(jì)算,我們得到H=0.608,由于計(jì)算所跨越的時(shí)間長(zhǎng)度比較長(zhǎng),所以這個(gè)H值稍微小于國(guó)外的一些證券市場(chǎng)利用R/S法計(jì)算出的Hurst指數(shù)值,并不說(shuō)明我國(guó)的市場(chǎng)成熟度比國(guó)外市場(chǎng)來(lái)的更佳。一般的,系統(tǒng)的分形維數(shù)為2H,可見(jiàn)上海指數(shù)從1997年5月14日以來(lái)的指數(shù)序列是具有分形特征和持續(xù)性的,上證指數(shù)的時(shí)間序列的確存在著混沌現(xiàn)象。因此,我們知道上證指數(shù)不是隨機(jī)變化的,而是一個(gè)有偏的隨機(jī)游走,不完全屬于EMH理論分析的有效市場(chǎng),而是在一定時(shí)期內(nèi)相關(guān)的。
既然上證指數(shù)具有分形市場(chǎng)的特點(diǎn),那么我們是否能夠在此基礎(chǔ)上對(duì)其走勢(shì)進(jìn)行分析和預(yù)測(cè)呢。
第二章利用神經(jīng)網(wǎng)絡(luò)對(duì)具有分形特征的時(shí)間數(shù)列進(jìn)行預(yù)測(cè)
第一節(jié)常用的混沌時(shí)間序列分析預(yù)測(cè)方法
由于混沌時(shí)間序列不是完全的隨機(jī)游走,而是有偏的,所以我們可以利用
這個(gè)特點(diǎn)對(duì)混沌時(shí)間序列進(jìn)行預(yù)測(cè)。
通常的做法是根據(jù)實(shí)際問(wèn)題正確地建立描述系統(tǒng)的動(dòng)態(tài)數(shù)學(xué)模型,然后求解
這個(gè)數(shù)學(xué)模型,最后反過(guò)來(lái)根據(jù)計(jì)算結(jié)果進(jìn)行預(yù)測(cè),傳統(tǒng)的預(yù)測(cè)方法主要有動(dòng)力學(xué)方法和數(shù)理統(tǒng)計(jì)方法,這些方法的共同特點(diǎn)是先建立數(shù)據(jù)序列的主觀模型,然后根據(jù)主觀模型進(jìn)行計(jì)算和預(yù)測(cè)。常用的建立模型的方法主要有兩種:一是時(shí)間序列關(guān)系模型,在這類的模型中被預(yù)測(cè)的對(duì)象的演變過(guò)程為一時(shí)間的函數(shù);另一種是結(jié)構(gòu)關(guān)系模型這類模型的特點(diǎn)是被預(yù)測(cè)的事物與其影響因素之間在一定的時(shí)間內(nèi)保持著某種固定的函數(shù)結(jié)構(gòu)關(guān)系。
混沌時(shí)間序列預(yù)測(cè)的常用方法:全域法、局域法、加權(quán)零階局域法、加權(quán)一階局域法、基本李雅普諾夫指數(shù)的時(shí)間序列預(yù)測(cè)方法等。
時(shí)間序列關(guān)系模型與結(jié)構(gòu)關(guān)系模型一般對(duì)被預(yù)測(cè)對(duì)象都有具體而且嚴(yán)格的要求這就要求我們?cè)谧鲱A(yù)測(cè)之前必須對(duì)被預(yù)測(cè)對(duì)象做深入系統(tǒng)的分析只有在確認(rèn)某類預(yù)測(cè)模型的前提條件得到滿足的情況下才可以使用該模型進(jìn)行預(yù)測(cè)否則預(yù)測(cè)結(jié)果是不可靠的股票市場(chǎng)作為現(xiàn)實(shí)經(jīng)濟(jì)運(yùn)行狀況的直接體現(xiàn)其影響因素如GDP增長(zhǎng)率匯率及國(guó)內(nèi)外政治形勢(shì)等時(shí)常發(fā)生較大的變動(dòng)所以要確定和修改模型的結(jié)構(gòu)確非易事。另一方面一般計(jì)量統(tǒng)計(jì)的時(shí)間序列模型很難處理高度非線性的問(wèn)題而實(shí)際上股票市場(chǎng)與其影響因素之間存在著復(fù)雜的非線性關(guān)系已有大量的實(shí)際數(shù)據(jù)表明股票市場(chǎng)是一個(gè)具有混沌現(xiàn)象的非線性動(dòng)力系統(tǒng)
隨著混沌科學(xué)的發(fā)展,使得可以不必事先建立主觀模型,而直接根據(jù)數(shù)據(jù)序列本身所計(jì)算出來(lái)的客觀規(guī)律(如李雅普諾夫指數(shù)等)進(jìn)行預(yù)測(cè),這樣可以避免預(yù)測(cè)的人為主觀性,提高頂測(cè)的精度和可信度。
近年來(lái),由于計(jì)算機(jī)與人工智能技術(shù)的飛速發(fā)展,為股票市場(chǎng)建模預(yù)測(cè)中新技術(shù)新方法的應(yīng)用提供了有利的條件。人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks,簡(jiǎn)稱ANN)是由大量簡(jiǎn)單的處理單元——神經(jīng)元按照某種方式聯(lián)結(jié)而成的自適應(yīng)的非線性系統(tǒng)。它的每一個(gè)神經(jīng)元的結(jié)構(gòu)和功能都很簡(jiǎn)單,其工作是“集體”進(jìn)行的,它沒(méi)有運(yùn)算器、存儲(chǔ)器、控制器,其信息是存儲(chǔ)在神經(jīng)元之間的聯(lián)結(jié)上的,它是一種模仿人腦的神經(jīng)系統(tǒng)結(jié)構(gòu)和功能的物理可實(shí)現(xiàn)系統(tǒng)。
因?yàn)槿斯ど窠?jīng)網(wǎng)絡(luò)廣泛的適應(yīng)能力、學(xué)習(xí)能力和映射能力,在多變量非線性系統(tǒng)的建模方面取得了驚人的成就,成為新興的預(yù)測(cè)時(shí)間序列的方法。人工神經(jīng)網(wǎng)絡(luò)模型具有巨量并行性,存儲(chǔ)分布性,結(jié)構(gòu)可變性,高度非線性,自學(xué)習(xí)性和自組織等特點(diǎn),而且可以逼近任何連續(xù)函數(shù),目前廣泛應(yīng)用神經(jīng)網(wǎng)絡(luò)作為非線性函數(shù)逼近模型。ANN的最大優(yōu)點(diǎn)是不需依賴于模型,所以非常適合用于股票市場(chǎng)的預(yù)測(cè),因?yàn)楣善惫墒械慕Ec預(yù)測(cè)所處理的信息量往往十分龐大,對(duì)算法有很高的要求.它的非線性動(dòng)力學(xué)特性非常復(fù)雜,所以一般傳統(tǒng)的方法對(duì)于股市的預(yù)測(cè)往往難如人意。
因此,我們選取了人工神經(jīng)網(wǎng)絡(luò)作為預(yù)測(cè)上證指數(shù)的工具。
第二節(jié)神經(jīng)網(wǎng)絡(luò)的基本原理
2.2.1人工神經(jīng)網(wǎng)絡(luò)的歷史
20世紀(jì)50年代末F.Rosenblatt提出了著名的感知機(jī)Perceptron模型這是第一個(gè)完整的神經(jīng)網(wǎng)絡(luò)這個(gè)模型由閾值單元構(gòu)成初步具備了諸如并行處理分布存儲(chǔ)和學(xué)習(xí)等神經(jīng)網(wǎng)絡(luò)的一些基本特征從而確立了從系統(tǒng)的角度研究神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)。1960年B.Windrow和M.E.Hoff提出了自適應(yīng)線性單元Adaline網(wǎng)絡(luò)它可用于自適應(yīng)濾波預(yù)測(cè)和模式識(shí)別從20世紀(jì)50年代末到60年代初神經(jīng)網(wǎng)絡(luò)的研究受到人們的重視研究工作進(jìn)入了一個(gè)高潮。芬蘭學(xué)者T.Kohonen提出的自組織影射理論、美國(guó)S.A.Grossberg提出的自適應(yīng)共振理論、日本學(xué)者福島邦彥K.Fukushima提出了認(rèn)知機(jī)Neocognitron模型等研究成果對(duì)以后神經(jīng)網(wǎng)絡(luò)的研究和發(fā)展都產(chǎn)生了重要影響。
進(jìn)入20世紀(jì)90年代神經(jīng)網(wǎng)絡(luò)的研究又引起了眾多學(xué)科領(lǐng)域?qū)W者的關(guān)注并很快形成了熱潮其主要原因是以邏輯推理為基礎(chǔ)的人工智能理論和Von.Neumann計(jì)算機(jī)在處理諸如視覺(jué)聽(tīng)覺(jué)形象思維聯(lián)想記憶和運(yùn)動(dòng)控制等智能信息處理問(wèn)題上受到了挫折具有并行和分布機(jī)制的神經(jīng)網(wǎng)絡(luò)本身的研究成果以及腦科學(xué)和神經(jīng)科學(xué)研究成果的推動(dòng)作用以及VLSI技術(shù)和光電技術(shù)的發(fā)展為神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)提供了物質(zhì)基礎(chǔ)由于以上原因使人們產(chǎn)生了一個(gè)共識(shí)即神經(jīng)網(wǎng)絡(luò)可能成為未來(lái)智能機(jī)良好的模式。
1982年美國(guó)加州理工學(xué)院生物物理學(xué)家J.J.Hopfield提出了一個(gè)新的神經(jīng)網(wǎng)絡(luò)模型Hopfield網(wǎng)絡(luò)模型首次引入了網(wǎng)絡(luò)能量函數(shù)的概念并給出了網(wǎng)絡(luò)穩(wěn)定的判據(jù)1984年他又提出了實(shí)現(xiàn)網(wǎng)絡(luò)模型的電子電路為神經(jīng)網(wǎng)絡(luò)的工程實(shí)現(xiàn)指明了方向Hopfield的研究成果開(kāi)拓了神經(jīng)網(wǎng)絡(luò)用于聯(lián)想記憶和優(yōu)化計(jì)算的新途徑引發(fā)了神經(jīng)網(wǎng)絡(luò)研究的又一次熱潮并為神經(jīng)計(jì)算機(jī)的研究奠定了基礎(chǔ)1984年Hinton等人將模擬退火算法引入到神經(jīng)網(wǎng)絡(luò)中提出了Boltzmann機(jī)(BM)模型網(wǎng)絡(luò)BM網(wǎng)絡(luò)算法為神經(jīng)網(wǎng)絡(luò)優(yōu)化計(jì)算跳出局部極小提供了一個(gè)有效的方法。①
迄今為止的神經(jīng)網(wǎng)絡(luò)研究大體上可分為三個(gè)大的方向
(1)探求人腦神經(jīng)系統(tǒng)的生物結(jié)構(gòu)和機(jī)制這實(shí)際上是神經(jīng)網(wǎng)絡(luò)理論的初衷
(2)用微電子學(xué)或光學(xué)器件形成特殊功能網(wǎng)絡(luò)這主要是新一代計(jì)算機(jī)制造領(lǐng)域所關(guān)注的問(wèn)題
(3)將神經(jīng)網(wǎng)絡(luò)理論作為一種解決傳統(tǒng)方法無(wú)法或難以解決的某些問(wèn)題的手段和方法
人工神經(jīng)網(wǎng)絡(luò)是由大量簡(jiǎn)單的處理單元——神經(jīng)元按照某種方式聯(lián)結(jié)而成的自適應(yīng)的非線性系統(tǒng)。它的每一個(gè)神經(jīng)元的結(jié)構(gòu)和功能都很簡(jiǎn)單,其工作是“集體”進(jìn)行的,它沒(méi)有運(yùn)算器、存儲(chǔ)器、控制器,其信息是存儲(chǔ)在神經(jīng)元之間的聯(lián)結(jié)上的,它是一種模仿人腦的神經(jīng)系統(tǒng)結(jié)構(gòu)和功能的物理可實(shí)現(xiàn)系統(tǒng)。
鑒于神經(jīng)網(wǎng)絡(luò)的并行處理及強(qiáng)大的非線性映射能力,即它可以把許多非線性信號(hào)的處理方法及工具集成起來(lái),對(duì)于未知的動(dòng)力系統(tǒng),可以通過(guò)它來(lái)學(xué)習(xí)很池時(shí)間序列,然后進(jìn)行預(yù)測(cè)和控制。由于混純時(shí)間序列在內(nèi)部有著確定的規(guī)律性,這種規(guī)律性產(chǎn)生于非線性,它表現(xiàn)出時(shí)間序列在時(shí)間延遲狀態(tài)空間中的相關(guān)性,這種特性使得系統(tǒng)似乎有著某種記憶能力,同時(shí)又難于用通常的解析方法把這種規(guī)律表達(dá)出__________________________________
①1焦李成,《神經(jīng)網(wǎng)絡(luò)系統(tǒng)理論》西安電子科技大學(xué)出版社1990年
來(lái)。而這種信息處理方式正好是神經(jīng)網(wǎng)絡(luò)所具備的。
2.2.2神經(jīng)網(wǎng)絡(luò)的特點(diǎn)
神經(jīng)網(wǎng)絡(luò)在信息處理的很多方面具有比傳統(tǒng)的方法更明確的優(yōu)勢(shì)主要表現(xiàn)在以下幾個(gè)方面
(1).可避免數(shù)據(jù)的分析工作和建模工作
通過(guò)觀測(cè)樣本神經(jīng)網(wǎng)絡(luò)完全能夠發(fā)現(xiàn)其隱含的信息,經(jīng)過(guò)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)建立一個(gè)規(guī)則。該規(guī)則最小程度地受到人為的支配這樣就避免了或大大減少了常用的數(shù)據(jù)分析工作和建模工作,而且在沒(méi)有關(guān)于信號(hào)結(jié)構(gòu)先驗(yàn)知識(shí)的前提下取得優(yōu)良的性能,例如神經(jīng)網(wǎng)絡(luò)在語(yǔ)音圖象處理編碼壓縮聲納手寫(xiě)識(shí)別等領(lǐng)域的應(yīng)用已取得了甚至超過(guò)了傳統(tǒng)方法經(jīng)過(guò)幾十年研究所取得的成果。
(2)信息的并行結(jié)構(gòu)和并行處理
神經(jīng)網(wǎng)絡(luò)與人的大腦類似不但結(jié)構(gòu)上是并行的,它的處理順序也是并行的。在同一層內(nèi)的處理單元都是同時(shí)操作的,即神經(jīng)網(wǎng)絡(luò)的計(jì)算功能分布在多個(gè)處理單元上。而一般計(jì)算機(jī)通常只有一個(gè)處理單元其處理順序是串行的。目前的神經(jīng)網(wǎng)絡(luò)功能常常用一般的串行工作方式來(lái)模擬它的并行處理方式。所以顯得很慢而真正的神經(jīng)網(wǎng)絡(luò)將會(huì)大大提高處理速度并能實(shí)現(xiàn)實(shí)時(shí)處理方。.
(3)自適應(yīng)的信息處理方式
人類具有很強(qiáng)的適應(yīng)外部環(huán)境的能力,神經(jīng)網(wǎng)絡(luò)也可以通過(guò)學(xué)習(xí)具備這種能力。這種自適應(yīng)一般包括四個(gè)方面學(xué)習(xí)性、自組織性、推理能力和可訓(xùn)練性。
(4)完成復(fù)雜的輸入/輸出的非線性映射
信息處理的大部分問(wèn)題可歸結(jié)為數(shù)學(xué)影射,給定一個(gè)輸入矢量X經(jīng)過(guò)信息處理系統(tǒng)可得到一個(gè)所要求的輸出矢量Y,Y=f(X)。函數(shù)可以解析表達(dá)也可以是非解析的。Kolmogrov定理保證了任一連續(xù)函數(shù)或映射可由一個(gè)三層神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)此神經(jīng)網(wǎng)絡(luò)的輸入層包含N個(gè)神經(jīng)元隱含層具有2N+1個(gè)神經(jīng)元,輸出層M個(gè)神經(jīng)元即可實(shí)現(xiàn)該函數(shù)。根據(jù)Kolmogrov神經(jīng)網(wǎng)絡(luò)映射存在定理,通過(guò)選擇一定的非線性和連接強(qiáng)度調(diào)節(jié)規(guī)律,我們就可解決任何一個(gè)信息處理問(wèn)題。
5.信息存儲(chǔ)與處理合而為一
與傳統(tǒng)的信息處理方式不同,神經(jīng)信息處理系統(tǒng)運(yùn)行時(shí),存儲(chǔ)與處理是兼而有之的,而不是絕對(duì)分離的。經(jīng)過(guò)處理信息的隱含特征和規(guī)則分布與神經(jīng)元之間的連接強(qiáng)度上通常有冗余性,這樣當(dāng)不完全信息或含噪聲信息輸入時(shí)神經(jīng)網(wǎng)絡(luò)就可以根據(jù)這些分布式的記憶對(duì)輸入信息進(jìn)行處理,恢復(fù)全部信息。同時(shí)這種合二為一的方式從本質(zhì)上消除了軟件和算法的瓶頸效應(yīng)提供了實(shí)現(xiàn)高速信號(hào)處理的手段。
由于神經(jīng)網(wǎng)絡(luò)具有以上描述的幾個(gè)特點(diǎn),并且已經(jīng)被開(kāi)始運(yùn)用于各個(gè)行業(yè)的時(shí)間序列預(yù)測(cè)之中,所以本文試圖利用遺傳神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法,以混沌動(dòng)力學(xué)的相空間重構(gòu)技術(shù)為思想基礎(chǔ),以上證指數(shù)收盤價(jià)序列為主體,通過(guò)使用此時(shí)間序列重構(gòu)股票指數(shù)的相空間保存股票指數(shù)混沌吸引子的性質(zhì),并且利用遺傳神經(jīng)網(wǎng)絡(luò)的非線性函數(shù)逼近特性來(lái)求出股票指數(shù)的非線性方程,利用神經(jīng)網(wǎng)絡(luò)模型對(duì)股票未來(lái)指數(shù)趨勢(shì)進(jìn)行預(yù)測(cè)?;煦鐣r(shí)間序列分析的基礎(chǔ)是重構(gòu)相空間,混沌時(shí)間序列的預(yù)測(cè)問(wèn)題可以理解成動(dòng)力系統(tǒng)研究的“逆問(wèn)題”。通過(guò)股票價(jià)格時(shí)間序列重構(gòu)股票市場(chǎng)非線性動(dòng)力系統(tǒng),給定相空間中的一串迭代序列,構(gòu)造一個(gè)非線性映射來(lái)表示這一動(dòng)力系統(tǒng),此非線性映射就可作為預(yù)測(cè)模型。
逼近此非線性映射可采用局部線性模型,全局多項(xiàng)式模型,前饋神經(jīng)網(wǎng)絡(luò)模型(BP),徑向基函數(shù)模型(RBF),小波神經(jīng)網(wǎng)絡(luò)等。
2.2.3神經(jīng)網(wǎng)絡(luò)的基本原理
1.人工神經(jīng)元模型
圖3
圖3所表示的是一個(gè)基本的人工神經(jīng)元的結(jié)構(gòu)模型,它有下列幾個(gè)基本要素
(1)組連接對(duì)應(yīng)于生物神經(jīng)元的突觸連接強(qiáng)度由連接線上的權(quán)值給出權(quán)值為正的表示激活為負(fù)的表示抑制
(2)一個(gè)求和單元用于求取n個(gè)輸入信號(hào)的加權(quán)和線性組合
(3)一個(gè)非線性變換函數(shù)起非線形映射作用并將神經(jīng)元輸出幅度限制在一定范圍之內(nèi)一般限制在[0,1]或[-1,1]之間
(4)一個(gè)閾值
以上可分別用數(shù)學(xué)公式表示出來(lái)
式中為輸入信號(hào);為神經(jīng)元i的權(quán)值;為線性組合結(jié)果;為閾值;為變換函數(shù);為神經(jīng)元i的輸出
變換函數(shù)可以有幾種形式,如閾值函數(shù)、分段線性函數(shù)、sigmoid函數(shù)等。最常見(jiàn)的sigmoid函數(shù)形式是:
其中參數(shù)a控制其斜率.
2.神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
從連接方式來(lái)看NN主要分為下列兩種:
(1)前饋型網(wǎng)絡(luò)
各神經(jīng)元接受前一層的輸入并輸出給下一層沒(méi)有反饋,連接點(diǎn)分為兩類即輸入單元和計(jì)算單元。每一計(jì)算單元可有任意個(gè)輸入但只有一個(gè)輸出,它可耦合到任意多個(gè)其它結(jié)點(diǎn)作為輸入。通常前饋網(wǎng)絡(luò)分為不同的層,第i層的輸入只與第i-1層的輸出相連,輸入和輸出結(jié)點(diǎn)與外界相連,而其它中間層則稱為隱層。
(2)反饋網(wǎng)絡(luò)
所有結(jié)點(diǎn)都是計(jì)算單元同時(shí)也可接受輸入,并向外界輸出。這種網(wǎng)絡(luò)可以畫(huà)成一個(gè)無(wú)向圖,其中每條連接線都是雙向的。
其中前饋網(wǎng)絡(luò)最典型,前饋網(wǎng)絡(luò)方法NN的工作過(guò)程主要分為兩個(gè)階段:第一個(gè)階段是學(xué)習(xí)期,此時(shí)每個(gè)計(jì)算單元的狀態(tài)不變而各條連接線上的權(quán)值可通過(guò)學(xué)習(xí)來(lái)修改。第二階段是工作期,此時(shí)n個(gè)連接權(quán)固定而計(jì)算單元的狀態(tài)發(fā)生變化以達(dá)到某種穩(wěn)定狀態(tài)。
從作用效果來(lái)看,前饋網(wǎng)絡(luò)主要是函數(shù)映射,可用于模式識(shí)別和函數(shù)逼近;反饋網(wǎng)絡(luò)則主要用于求解最優(yōu)化問(wèn)題。
3.神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)
通過(guò)向環(huán)境學(xué)習(xí)以獲取知識(shí)并改進(jìn)自身性能是NN的一個(gè)重要特點(diǎn)。
在一般情況下性能的改善是在某種預(yù)定的度量標(biāo)準(zhǔn)下,通過(guò)逐步調(diào)節(jié)自身參數(shù)如權(quán)值而達(dá)到的。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)主要含括兩部分內(nèi)容,即學(xué)習(xí)方式與學(xué)習(xí)算法。
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方式有下列三種
監(jiān)督學(xué)習(xí)有教師學(xué)習(xí)
非監(jiān)督學(xué)習(xí)無(wú)教師學(xué)習(xí)
在勵(lì)學(xué)習(xí)或強(qiáng)化學(xué)習(xí)
其中監(jiān)督學(xué)習(xí)的方式需要外界存在一位教師,他對(duì)一組給定的輸入提供應(yīng)有的輸出結(jié)果正確答案。這組已知的輸入輸出數(shù)據(jù)就是訓(xùn)練樣本集。學(xué)習(xí)系統(tǒng)NN可以根據(jù)已知輸出與實(shí)際輸出之間的差值誤差信號(hào)來(lái)調(diào)節(jié)系統(tǒng)參數(shù)。
神經(jīng)網(wǎng)絡(luò)最常用的學(xué)習(xí)算法是誤差糾正算法,下面是其算法過(guò)程。
令表示輸入x(n)時(shí)神經(jīng)元在i時(shí)刻n的實(shí)際輸出;表示相應(yīng)的應(yīng)有輸出(由訓(xùn)練樣本給出)則誤差信號(hào)可寫(xiě)成:
=-
誤差糾正學(xué)習(xí)的目的是使某一基于的目標(biāo)函數(shù)達(dá)到最小,使得網(wǎng)絡(luò)中每一輸出單元的實(shí)際輸出在某種統(tǒng)計(jì)意義上最佳逼近于應(yīng)有輸出。一旦選定了目標(biāo)函數(shù)的形式誤差糾正學(xué)習(xí)就成為一個(gè)典型的最優(yōu)化問(wèn)題最常用的目標(biāo)函數(shù)是均方誤差判據(jù)可定義為:
其中E是求期望算子。將上式直接作為目標(biāo)函數(shù)時(shí),需要知道整個(gè)過(guò)程的統(tǒng)計(jì)特性。為克服這一困難,通常用J在時(shí)刻n的瞬時(shí)值代替J,即:
=1/2
這樣問(wèn)題就變?yōu)楹瘮?shù)對(duì)權(quán)值向量(為自變量) 求最小值。具體計(jì)算可用梯度下降法。若在第n步迭代中當(dāng)前的權(quán)值向量為w(n),函數(shù)的梯度?是在w(n)處的一階導(dǎo)數(shù)矩陣,則沿負(fù)梯度方向即??方向,是減少最快的方向因此第n+1步的權(quán)值迭代公式為:
其中為學(xué)習(xí)步長(zhǎng)。
第三節(jié)基于BP算法的三層向前的神經(jīng)網(wǎng)絡(luò)
由于在我們選取了基于BP算法的神經(jīng)網(wǎng)絡(luò)作為預(yù)測(cè)指數(shù)的模型,在這里必須對(duì)該模型做一個(gè)了解。
2.3.1多層次的神經(jīng)網(wǎng)絡(luò)
多層前饋網(wǎng)絡(luò)結(jié)構(gòu)含一個(gè)輸入層一個(gè)輸出層以及若干個(gè)隱含層隱含層的變換函數(shù)一般為非線性函數(shù)輸出層的變換函數(shù)可以是非線性的也可以是線性的在這里隱含層和輸出層的變換函數(shù)都采用函數(shù)形式sigmoid將影響股指的各因素輸入至輸入層并傳至后面的隱含層最后通過(guò)連接權(quán)輸出到輸出層。
多層前饋網(wǎng)絡(luò)的典型結(jié)構(gòu)如下圖所示
圖4多層神經(jīng)網(wǎng)絡(luò)模型圖
2.3.2BP網(wǎng)絡(luò)的基本原理
圖5BP網(wǎng)絡(luò)模型結(jié)構(gòu)圖
基于BP算法的三層向前神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),一般是一3層或者3層以上的的神經(jīng)網(wǎng)絡(luò),包括輸入層,中間層(隱層)和輸出層。上下層之間實(shí)現(xiàn)全連接,而每層單元之間無(wú)連接,。當(dāng)一學(xué)習(xí)樣本提供給網(wǎng)絡(luò)之后,神經(jīng)元的激活值從輸入層經(jīng)中間層想輸出層傳播,在輸出層的各個(gè)神經(jīng)原獲得網(wǎng)絡(luò)的餓輸入響應(yīng)。節(jié)下來(lái),按照減小目標(biāo)輸出與實(shí)際誤差的方向,從輸出層經(jīng)過(guò)中間層逐層修正各連接權(quán)值,最后回到輸入層。這個(gè)算法就是所謂“逆無(wú)償傳播算法”,也就是BP算法。隨著這種逆誤差的傳播修正不斷進(jìn)行,網(wǎng)絡(luò)輸入模式響應(yīng)的正確率也不斷上升。
BP網(wǎng)絡(luò)的傳遞函數(shù)要求是可微的,所以不能使用二值函數(shù),常用的有sigmoid型對(duì)數(shù),正切函數(shù)或者線形函數(shù)。由于傳遞函數(shù)是處處可微的,所以對(duì)于一個(gè)BP網(wǎng)絡(luò)來(lái)說(shuō),一方面,所劃分的區(qū)域不再是一個(gè)線形劃分,而是一個(gè)非線形的超平面組成的區(qū)域。它是比較平滑的曲面,所以它的分類比線形劃分更加精確,容錯(cuò)性也比線形劃分更好,另一方面,網(wǎng)絡(luò)可以嚴(yán)格采取剃度下降的學(xué)習(xí)方法,權(quán)值修正的解析式十分明確。
Funahashi證明,當(dāng)隱層節(jié)點(diǎn)函數(shù)為單調(diào)遞增連續(xù)函數(shù)時(shí),三層前向網(wǎng)絡(luò)具有以任意精度逼近定義在緊致子集上的任意非線性函數(shù)的能力,Hornik進(jìn)一步證明隱層節(jié)點(diǎn)函數(shù)有界是必要的,單調(diào)遞增的條件是非必要。這說(shuō)明采用三層BP網(wǎng)絡(luò),隱節(jié)點(diǎn)函數(shù)為Sigmoid函數(shù),輸出節(jié)點(diǎn)函數(shù)采用線性函數(shù),完全可以達(dá)到網(wǎng)絡(luò)逼近的要求。也就是說(shuō),單隱層的的BP網(wǎng)絡(luò)可以逼近任意的非線形映射,只要隱層神經(jīng)單元的個(gè)數(shù)是可以隨意調(diào)節(jié)的。①
因此,我們?cè)囼?yàn)用單隱層的BP網(wǎng)絡(luò)來(lái)逼近上證指數(shù)走勢(shì)曲線的方式來(lái)預(yù)測(cè)上證指數(shù)未來(lái)的變化,同時(shí)對(duì)原始的神經(jīng)網(wǎng)絡(luò)模型做一些改進(jìn)。
第三章對(duì)BP神經(jīng)網(wǎng)絡(luò)的改進(jìn)
第一節(jié)BP網(wǎng)絡(luò)的缺陷
在神經(jīng)網(wǎng)絡(luò)的應(yīng)用過(guò)程中,由于被逼近樣本的性質(zhì)不能精確知道,因此即使在網(wǎng)絡(luò)誤差為零的條件下,也未必能保證達(dá)到要求。往往會(huì)出現(xiàn)非常小,而卻無(wú)法滿足要求。這就是所謂的“過(guò)擬合”現(xiàn)象,“過(guò)擬合”現(xiàn)象直接影響網(wǎng)絡(luò)的泛化能力,使得網(wǎng)絡(luò)最終失去實(shí)用價(jià)值。
網(wǎng)絡(luò)的泛化能力由以下幾個(gè)因素影響:
1.取決樣本的特性,只有當(dāng)訓(xùn)練樣本足以表征所研究問(wèn)題的一些主要的或基本性時(shí),網(wǎng)絡(luò)通過(guò)合理的學(xué)習(xí)機(jī)制可以使其具有泛化能力,合理的采樣結(jié)構(gòu)是網(wǎng)具有泛化能力的必要條件。
2.網(wǎng)絡(luò)自身的因素影響,如網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)初始權(quán)值的設(shè)定和網(wǎng)絡(luò)的學(xué)習(xí)算法等。網(wǎng)絡(luò)的結(jié)構(gòu)主要包括:網(wǎng)絡(luò)的隱層數(shù)、各隱層節(jié)點(diǎn)的個(gè)數(shù)和隱節(jié)點(diǎn)激活函數(shù)的特性,以下從這幾個(gè)方面說(shuō)明原因:
①.采用三層BP網(wǎng)絡(luò),隱節(jié)點(diǎn)函數(shù)為Sigmoid函數(shù),輸出節(jié)點(diǎn)函數(shù)采用線性函數(shù),完全可以達(dá)到網(wǎng)絡(luò)逼近的要求?!斑^(guò)擬合”現(xiàn)象是網(wǎng)絡(luò)隱節(jié)點(diǎn)過(guò)多的必然結(jié)果,它的出現(xiàn)影響了網(wǎng)絡(luò)的泛化能力,在滿足精度的要求下,逼近函數(shù)的階數(shù)__________________________________
①魏海坤,《神經(jīng)網(wǎng)絡(luò)機(jī)構(gòu)設(shè)計(jì)的理論和方法》國(guó)防工業(yè)出版社2005年
越少越好,低階逼近可以有效防止“過(guò)擬合”現(xiàn)象,從而提高網(wǎng)絡(luò)的預(yù)測(cè)能力,反映到多層前向神經(jīng)網(wǎng)絡(luò)中,就是在精度滿足的要求下,網(wǎng)絡(luò)的隱節(jié)點(diǎn)數(shù)越少越好。但是在實(shí)際應(yīng)用中,還沒(méi)有一套成熟的理論方法來(lái)確定網(wǎng)絡(luò)的隱節(jié)點(diǎn),隱節(jié)點(diǎn)的確定基本上依賴經(jīng)驗(yàn),主要式采用遞增或遞減的試探方法來(lái)確定的網(wǎng)絡(luò)隱節(jié)點(diǎn)。
②.網(wǎng)絡(luò)的初始權(quán)值的選擇缺乏依據(jù),具有很大的隨機(jī)性,這也在很大程度上影響網(wǎng)絡(luò)的泛化能力。神經(jīng)網(wǎng)絡(luò)連接權(quán)值的整體分布包含著神經(jīng)網(wǎng)絡(luò)系統(tǒng)的全部知識(shí),傳統(tǒng)的權(quán)值獲取方法都是隨機(jī)給定一組初始的權(quán)值,然后是采用某個(gè)確定的變化規(guī)則,在訓(xùn)練中逐步調(diào)整,最終得到一個(gè)較好權(quán)值分布。由于BP算法是基于梯度下降方法,不同的初始權(quán)值可能會(huì)導(dǎo)致完全不同的結(jié)果。一旦取值不當(dāng),就會(huì)引起網(wǎng)絡(luò)振蕩或不收斂,即使收斂也會(huì)導(dǎo)致訓(xùn)練時(shí)間增長(zhǎng),再加之實(shí)際問(wèn)題往往是極其復(fù)雜的多維曲面,存在多個(gè)局部極值點(diǎn),使得BP算法極易陷入局部極值點(diǎn)。這些導(dǎo)致BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間過(guò)長(zhǎng)而最終得不到適當(dāng)?shù)臋?quán)值分布,從而影響網(wǎng)絡(luò)的泛化能力,極大的限制了神經(jīng)網(wǎng)絡(luò)在實(shí)際預(yù)報(bào)中的應(yīng)用。
③.BP神經(jīng)網(wǎng)絡(luò)算法收斂慢,即使一個(gè)相當(dāng)簡(jiǎn)單的問(wèn)題求解,其訓(xùn)練次數(shù)也要幾百或幾千次迭代。而且網(wǎng)絡(luò)對(duì)各種參數(shù)(包括初始權(quán)值、學(xué)習(xí)速率、動(dòng)量參數(shù))極為敏感,稍小的變動(dòng)就會(huì)引起擬合和泛化能力的振蕩,在反復(fù)實(shí)驗(yàn)中確定各種參數(shù),這樣的過(guò)度訓(xùn)練會(huì)提高網(wǎng)絡(luò)的擬合能力,同時(shí)也擬合了訓(xùn)練數(shù)據(jù)中的噪聲和訓(xùn)練樣本中沒(méi)有代表行的特征,最終導(dǎo)致過(guò)擬合現(xiàn)象,從而影響網(wǎng)絡(luò)的擬合能力。
進(jìn)一步的研究很快發(fā)現(xiàn)誤差反傳算法BP算法存在著缺陷由于該算法采用誤差導(dǎo)數(shù)指導(dǎo)學(xué)習(xí)過(guò)程從本質(zhì)上來(lái)說(shuō)是屬于局部尋優(yōu)法在存在較多局部極小點(diǎn)的情況下容易陷入局部極小點(diǎn)且不可避免地存在著學(xué)習(xí)速度與精度之間的矛盾當(dāng)學(xué)習(xí)速度較快時(shí)學(xué)習(xí)過(guò)程容易產(chǎn)生振蕩難以得到精確的結(jié)果而當(dāng)學(xué)習(xí)速度較慢時(shí)雖然結(jié)果可以得到較高的精度但學(xué)習(xí)周期太長(zhǎng)也不實(shí)用。
為了改進(jìn)BP算法的這些缺陷,本人試用了一些輔助方法,希望通過(guò)這些辦法提高單純BP神經(jīng)網(wǎng)絡(luò)的泛化能力,提高預(yù)測(cè)的長(zhǎng)度和精度。具體方法如下文。
第二節(jié)與BP算法相結(jié)合的遺傳算法
3.2.1遺傳算法簡(jiǎn)介
1975,Michigan大學(xué)Holland教授根據(jù)自然界“適者生存,優(yōu)勝劣汰”的規(guī)律年首次提出了遺傳算法(GA),其基本思想是力求充分模仿這一自然尋優(yōu)過(guò)程的隨機(jī)性、魯棒性和全局性,以然選擇和遺傳理論為基礎(chǔ),將生物進(jìn)化過(guò)程中適者生存規(guī)則與群體內(nèi)部染色體的隨機(jī)信息交換機(jī)制相結(jié)合的搜索算法。這是一種新型的全局優(yōu)化搜索算法,因?yàn)槠渲苯訉?duì)結(jié)構(gòu)對(duì)象進(jìn)行操作,不存在求導(dǎo)和函數(shù)連續(xù)性的限定,魯棒性強(qiáng)、隨機(jī)性、全局性以及適于并行處理,已廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)、計(jì)算機(jī)科學(xué)、優(yōu)化調(diào)度、運(yùn)輸問(wèn)題、組合優(yōu)化、機(jī)器學(xué)習(xí)、信號(hào)處理、自適應(yīng)控制和人工生命等領(lǐng)域,并且遺傳算法在實(shí)際應(yīng)用中也取得了巨大成功。
從搜索角度來(lái)看,遺傳算法具有許多獨(dú)特的優(yōu)點(diǎn):
1.遺傳算法從問(wèn)題解的中集開(kāi)始嫂索,而不是從單個(gè)解開(kāi)始。這是遺傳算法與傳統(tǒng)優(yōu)化算法的極大區(qū)別。傳統(tǒng)優(yōu)化算法是從單個(gè)初始值迭代求最優(yōu)解的;容易誤入局部最優(yōu)解。遺傳算法從串集開(kāi)始搜索,復(fù)蓋面大,利于全局擇優(yōu)。
2.遺傳算法求解時(shí)使用特定問(wèn)題的信息極少,容易形成通用算法程序。由于遺傳算法使用適應(yīng)值這一信息進(jìn)行搜索,并不需要問(wèn)題導(dǎo)數(shù)等與問(wèn)題直接相關(guān)的信息。遺傳算法只需適應(yīng)值和串編碼等通用信息,故幾乎可處理任何問(wèn)題。
3.遺傳算法有極強(qiáng)的容錯(cuò)能力遺傳算法的初始串集本身就帶有大量與最優(yōu)解甚遠(yuǎn)的信息;通過(guò)選擇、交叉、變異操作能迅速排除與最優(yōu)解相差極大的串;這是一個(gè)強(qiáng)烈的濾波過(guò)程;并且是一個(gè)并行濾波機(jī)制。故而,遺傳算法有很高的容錯(cuò)能力。
4.遺傳算法中的選擇、交叉和變異都是隨機(jī)操作,而不是確定的精確規(guī)則。這說(shuō)明遺傳算法是采用隨機(jī)方法進(jìn)行最優(yōu)解搜索,選擇體現(xiàn)了向最優(yōu)解迫近,交叉體現(xiàn)了最優(yōu)解的產(chǎn)生,變異體現(xiàn)了全局最優(yōu)解的復(fù)蓋。
5.遺傳算法具有隱含的并行性
3.2.2遺傳算法的基本原理
GA以生物進(jìn)化過(guò)程為背景,模擬生物進(jìn)化的步驟,將繁殖、雜交、變異、競(jìng)爭(zhēng)和選擇等概念引入到算法中,通過(guò)維持一組可行解,并通過(guò)對(duì)可行解的重新組合,改進(jìn)可行解在多維空間內(nèi)的移動(dòng)軌跡或趨向,最終走向最優(yōu)解。它克服了傳統(tǒng)優(yōu)化方法容易陷入局部極值的缺點(diǎn),是一種全局優(yōu)化算法。遺傳算法的步驟如下:
(1)定義一個(gè)目標(biāo)函數(shù)
(2)將可行解群體在一定的約束條件下初始化,每一個(gè)可行解用一個(gè)向量x來(lái)編碼,稱為一條染色體,向量的分量代表基因,它對(duì)應(yīng)可行解的某一決策變量;
(3)計(jì)算群體中每條染色體(i=1,2,…,n)所對(duì)應(yīng)的目標(biāo)函數(shù)值,并以此計(jì)算適應(yīng)值,按的大小來(lái)評(píng)價(jià)該可行解的好壞;
(4)以優(yōu)勝劣汰的機(jī)制,將適應(yīng)值差的染色體淘汰掉,對(duì)幸存的染色體根據(jù)其適應(yīng)值的好壞,按概率隨機(jī)選擇,進(jìn)行繁殖,形成新的群體;
(5)通過(guò)雜交和變異的操作,產(chǎn)生子代。雜交是隨機(jī)選擇兩條染色體(雙親),將某一點(diǎn)或多點(diǎn)的基因互換而產(chǎn)生兩個(gè)新個(gè)體,變異是基因中的某一點(diǎn)或多點(diǎn)發(fā)生突變;
(6)對(duì)子代群體重復(fù)步驟(3)~(5)的操作,進(jìn)行新一輪遺傳進(jìn)化過(guò)程,直到迭代收斂(適應(yīng)值趨穩(wěn)定)即找到了最優(yōu)解或準(zhǔn)最優(yōu)解。
GA中最常用的算子有如下幾種:
(1)選擇算子(selection/reproduction):選擇算子從群體中按某一概率成對(duì)選擇個(gè)體,某個(gè)體xi被選擇的概率Pi與其適應(yīng)度值成正比。最通常的實(shí)現(xiàn)方法是輪盤賭(roulettewheel)模型。
(2)交叉算子(Crossover):交叉算子將被選中的兩個(gè)個(gè)體的基因鏈按概率pc進(jìn)行交叉,生成兩個(gè)新的個(gè)體,交叉位置是隨機(jī)的。其中Pc是一個(gè)系統(tǒng)參數(shù)。
(3)變異算子(Mutation):變異算子將新個(gè)體的基因鏈的各位按概率pm進(jìn)行變異,對(duì)二值基因鏈(0,1編碼)來(lái)說(shuō)即是取反。
上述各種算子的實(shí)現(xiàn)是多種多樣的,而且許多新的算子正在不斷地提出,以改進(jìn)GA的某些性能。系統(tǒng)參數(shù)(個(gè)體數(shù)n,基因鏈長(zhǎng)度l,交叉概率Pc,變異概率Pm等)對(duì)算法的收斂速度及結(jié)果有很大的影響,應(yīng)視具體問(wèn)題選取不同的值。①
3.2.3遺傳算法與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的結(jié)合
遺傳算法在神經(jīng)網(wǎng)絡(luò)中的應(yīng)用主要反映在3個(gè)方面:網(wǎng)絡(luò)的學(xué)習(xí),網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì),網(wǎng)絡(luò)的分析。
其中,遺傳算法可以用于神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)的學(xué)習(xí)里。這時(shí),它在兩個(gè)方面起作用:
(1)學(xué)習(xí)規(guī)則的優(yōu)化
用遺傳算法對(duì)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)規(guī)則實(shí)現(xiàn)自動(dòng)優(yōu)化,從而提高學(xué)習(xí)速率。
(2)網(wǎng)絡(luò)權(quán)系數(shù)的優(yōu)化
用遺傳算法的全局優(yōu)化及隱含并行性的特點(diǎn)提高權(quán)系數(shù)優(yōu)化速度。
我們知道GA算法優(yōu)異于BP算法的地方在于,它不容易陷于局部極小值,尤其在誤差函數(shù)不可微或完全沒(méi)有梯度信息的條件下。但是遺傳算法也存在著不足,當(dāng)遺傳搜索迅速找到最優(yōu)解附近時(shí),無(wú)法精確地確定最優(yōu)解的位置.也就是說(shuō).它在局部搜索空間不具備微調(diào)能力。而且,如何選取遺傳算法的參數(shù),才能帶到最優(yōu)的效果并不容易確定。而B(niǎo)P算法具有簡(jiǎn)單和可塑的優(yōu)點(diǎn),但是BP算法是基于梯度的方法,這種方法的收斂速度慢,且常受局部極小點(diǎn)的困擾。
因此,我們可以充分發(fā)揮遺傳算法和BP算法的處.將兩者相結(jié)合,用于來(lái)訓(xùn)練
神經(jīng)網(wǎng)絡(luò)的的權(quán)值的權(quán)重和學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的拓樸結(jié)構(gòu),而最主要的是學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的權(quán)重。在計(jì)算機(jī)技術(shù)高速發(fā)展的今天,這個(gè)方法已經(jīng)成為可行。
本文設(shè)計(jì)的利用GA算法優(yōu)化BP算法權(quán)值的GA-BP算法如下:
設(shè)有三層BP網(wǎng)絡(luò)。
隨機(jī)產(chǎn)生N組在不同實(shí)數(shù)區(qū)間內(nèi)取值的初試網(wǎng)絡(luò)權(quán)值。
(2)用BP算法對(duì)這N組初試權(quán)值分別進(jìn)行預(yù)訓(xùn)練,若經(jīng)過(guò)訓(xùn)練后這N組權(quán)值中至少已有一組滿足精度要求,則算法結(jié)束;否則轉(zhuǎn)入步驟(3)。
(3)分別依據(jù)經(jīng)過(guò)上述N組權(quán)值所對(duì)應(yīng)的上下限確定取值區(qū)間,在區(qū)間內(nèi)__________________________________
①魏海坤,《神經(jīng)網(wǎng)絡(luò)機(jī)構(gòu)設(shè)計(jì)的理論和方法》國(guó)防工業(yè)出版社2005年
隨機(jī)生成r×N組新的權(quán)值,連同經(jīng)過(guò)訓(xùn)練的N組權(quán)值一起,構(gòu)成完整的基因群體,共(r+1)×N組權(quán)值。
(4)對(duì)于這(r+1)×N組權(quán)值進(jìn)行選擇、交叉、變異等遺傳操作。
(5)如果經(jīng)過(guò)步驟(4)的操作已至少得到一組滿足精度要求的權(quán)值,則算法結(jié)束;否則從經(jīng)過(guò)遺傳操作的這(r+1)×N組權(quán)值中選出N組較好的,回復(fù)到步驟(2)。
第三節(jié)在樣本輸入中添加隨機(jī)噪聲
在樣本輸入里添加隨機(jī)噪聲的目的是為了防止神經(jīng)網(wǎng)絡(luò)訓(xùn)練造成的過(guò)擬合現(xiàn)象,改善神經(jīng)網(wǎng)絡(luò)的泛化能力。當(dāng)噪聲的標(biāo)準(zhǔn)差比較小的時(shí)候,樣本輸入噪聲的方法類似神經(jīng)網(wǎng)絡(luò)的正則化設(shè)計(jì),正則化系數(shù)與噪聲的標(biāo)準(zhǔn)差相關(guān)。樣本輸入里添加隨機(jī)噪聲的方法可以用于BP,RBF等神經(jīng)網(wǎng)絡(luò)里。
在BP學(xué)習(xí)算法里中樣本輸入插入噪聲的方法如下:
從N個(gè)訓(xùn)練樣本里隨機(jī)選擇一個(gè)樣本=(,)
根據(jù)密度函數(shù)ρ(ξμ)得到樣本輸入的噪聲矢量
令Z=(Xμ+ξμ,Yμ)
對(duì)于批處理的學(xué)習(xí)方式,每一輪次的訓(xùn)練時(shí),所有樣本輸入均應(yīng)按上述方式加入隨機(jī)噪聲。輸入噪聲的密度函數(shù)ρ(ξμ)通??梢赃x擇均值為零的高斯分布或者均勻分布。
在輸入樣本中添加噪聲后,在輸入噪聲的作用下,訓(xùn)練誤差不會(huì)象不輸入噪聲那樣單調(diào)下降,事實(shí)上,當(dāng)馴良的數(shù)據(jù)被循環(huán)作為網(wǎng)絡(luò)的輸入時(shí),由于每次添加的噪聲值不同,迫使神經(jīng)網(wǎng)絡(luò)無(wú)法精確的擬合訓(xùn)練數(shù)據(jù),防止了過(guò)擬合,從而使噪聲起到平滑作用。
由于每次加入的噪聲不同,訓(xùn)練的結(jié)果可能與目標(biāo)函數(shù)存在比較大的誤差,可以采用多次訓(xùn)練,對(duì)其結(jié)果取平均值的方法來(lái)得到最小的測(cè)試標(biāo)準(zhǔn)差,多次訓(xùn)練的方法在一定程度也減小了神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的不確定性。
我們以用神經(jīng)網(wǎng)絡(luò)訓(xùn)練目標(biāo)函數(shù)為y(x)=sin(3(x+0.8))為例說(shuō)明添加噪聲的效果,訓(xùn)練樣本和測(cè)試樣本的產(chǎn)生方式如下:訓(xùn)練樣本數(shù)15個(gè),輸入?yún)^(qū)間為{-1,1}內(nèi)的等間隔點(diǎn)。添加噪聲,噪聲服從均值為0,標(biāo)準(zhǔn)差為0.1的正態(tài)分布,測(cè)試樣本數(shù)為201個(gè),其輸入的也為[-1,1]內(nèi)的等間隔點(diǎn),泛化誤差定義為訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)對(duì)所有測(cè)試樣本的誤差平方和。
為了全面比較和說(shuō)明添加噪聲和不添加噪聲馴良的性能差別,我們將良種方法均進(jìn)行100次測(cè)試,測(cè)試中除了添加噪聲與否外,其他所有條件完全相同(包括網(wǎng)絡(luò)結(jié)構(gòu),數(shù)據(jù)中心,權(quán)參數(shù)初始值等。記錄兩種方法得到的神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差和測(cè)試誤差的均值和標(biāo)準(zhǔn)差,如下表所列:
無(wú)輸入噪聲
添加輸入噪聲
平均訓(xùn)練誤差
0.2412
3.1552
訓(xùn)練誤差標(biāo)準(zhǔn)差
0.3857
1.3569
平均測(cè)試誤差
25.4992
17.9888
測(cè)試誤差標(biāo)準(zhǔn)差
9.6339
8.4818
表1
從訓(xùn)練結(jié)果上觀察,添加噪聲后得到的神經(jīng)網(wǎng)絡(luò)的泛化誤差比不添加噪聲
所訓(xùn)練出的神經(jīng)網(wǎng)絡(luò)泛化誤差小的多,可見(jiàn)添加噪聲的訓(xùn)練方法對(duì)改善神經(jīng)網(wǎng)絡(luò)的泛化能力的效果還是很明顯的。而且經(jīng)過(guò)實(shí)驗(yàn)證明,一定次數(shù)的訓(xùn)練后,神經(jīng)網(wǎng)絡(luò)輸出的平均值將收斂。
第四節(jié)多個(gè)神經(jīng)網(wǎng)絡(luò)集成預(yù)測(cè)
一般常見(jiàn)的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)中,都是只采用一個(gè)單個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和學(xué)習(xí),訓(xùn)練樣本一般也選取在距離測(cè)試樣本比較接近的區(qū)間。本文作者在初步研究了利用神經(jīng)網(wǎng)絡(luò)對(duì)證券指數(shù)進(jìn)行分析的基本原理后有了不同的想法。從分形市場(chǎng)的的基本理論里我們看到,分形市場(chǎng)理論認(rèn)為投資人的決策是有以來(lái)歷史經(jīng)驗(yàn)的,價(jià)格具有一定記憶性;信息的傳播是非均衡的,市場(chǎng)價(jià)格反映出的是投資人偏好的信息。市場(chǎng)由眾多投資者組成,他們具有不同的投資時(shí)間尺度,如長(zhǎng)線的或者短線的,這使他們有著不同的投資行為。
因此,對(duì)于某一時(shí)期證券指數(shù)的變化以及其他市場(chǎng)信息的評(píng)估,不同的投資人將有各不相同的的結(jié)果,對(duì)于各個(gè)投資人多依賴的歷史經(jīng)驗(yàn)也是不同。比如說(shuō)一個(gè)在90年代初入市的投資人,可能會(huì)因?yàn)閷?duì)上證指數(shù)94年下探到325點(diǎn)的行情具有深刻的印象而容易對(duì)市場(chǎng)的未來(lái)走勢(shì)做出相對(duì)謹(jǐn)慎的判斷;而一個(gè)剛剛?cè)胧芯徒?jīng)歷了“5.19”行情的投資人卻可能對(duì)未來(lái)的市場(chǎng)保持樂(lè)觀的看法。而只使用一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)擬合指數(shù)變動(dòng)的曲線,就隱含的認(rèn)為所有投資人都是按照訓(xùn)練樣本所在時(shí)間段的經(jīng)驗(yàn)進(jìn)行判斷的,所有的投資人用同一個(gè)投資時(shí)間尺度來(lái)進(jìn)行各自的投資行為,這是并不是一個(gè)符合分形市場(chǎng)的行為。
因此,如果我們使用多個(gè)神經(jīng)網(wǎng)絡(luò)同時(shí)進(jìn)行預(yù)測(cè),每一個(gè)預(yù)測(cè)模型都可能提供某些別的模型不能提供的信息,幾種模型結(jié)合起來(lái)所得的預(yù)測(cè)結(jié)果所包含的信息將比某一個(gè)模型預(yù)測(cè)結(jié)果包含的信息更多,所以預(yù)測(cè)結(jié)果也會(huì)相對(duì)更準(zhǔn)確。
為了改進(jìn)這個(gè)缺陷,本文作者嘗試采用了訓(xùn)練多個(gè)不同訓(xùn)練樣本的神經(jīng)網(wǎng)絡(luò)進(jìn)行同一測(cè)試樣本的預(yù)測(cè)。我們可以在長(zhǎng)期的時(shí)間序列里,選取n個(gè)等長(zhǎng)的時(shí)間序列,將每個(gè)序列(i=1..n)作為訓(xùn)練樣本進(jìn)行訓(xùn)練,得到n個(gè)不同的神經(jīng)網(wǎng)絡(luò)。將測(cè)試的樣本同時(shí)輸入這n個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行模擬,我們可以得到n個(gè)結(jié)果(i=1..n).
1993年,Perrone和Cooper證明,在將神經(jīng)網(wǎng)絡(luò)集成用于回歸估計(jì)時(shí),如果采用簡(jiǎn)單平均,且各網(wǎng)絡(luò)的誤差是期望為0且互相獨(dú)立的隨機(jī)變量,則集成的泛化誤差為各網(wǎng)絡(luò)泛化誤差平均值的1/N,其中N為集成中網(wǎng)絡(luò)的數(shù)目;如果采用加權(quán)平均,通過(guò)適當(dāng)選取各網(wǎng)絡(luò)的權(quán)值,能夠得到比采用簡(jiǎn)單平均法更好的泛化能力①
所以,本文也采用了對(duì)按一定的權(quán)值進(jìn)行加權(quán)平均的辦法,得到最后的預(yù)測(cè)結(jié)果。這樣我們就能將測(cè)試樣本擬合到不同時(shí)期的時(shí)間序列曲線上,模擬不同人群對(duì)不同歷史時(shí)期經(jīng)驗(yàn)的倚重。
1995年,Krogh和Vedelsby給出了神經(jīng)網(wǎng)絡(luò)集成泛化誤差計(jì)算公式。②假設(shè)學(xué)習(xí)任務(wù)是利用N個(gè)神經(jīng)網(wǎng)絡(luò)組成的集成對(duì)f:RnR進(jìn)行近似,集成采用加權(quán)平均,各網(wǎng)絡(luò)分別被賦以權(quán)值w,并滿足式11和式12:
(11) (12)
再假設(shè)訓(xùn)練集按分布p(x)隨機(jī)抽取,網(wǎng)絡(luò)對(duì)輸入X的輸出為V(X),則神經(jīng)網(wǎng)絡(luò)集成的輸出為:
(13)
神經(jīng)網(wǎng)絡(luò)的泛化誤差E和神經(jīng)網(wǎng)絡(luò)集成的泛化誤差E分別為:
(14)
(15)
各網(wǎng)絡(luò)泛化誤差的加權(quán)平均為:
(16)
神經(jīng)網(wǎng)絡(luò)的差異度A和神經(jīng)網(wǎng)絡(luò)集成的差異度分別為:
_________________________________
PerroneMP,CooplerLN.“WhenNetworksDisagree:EnsembleMethodforNeuralNetworks.”MammoneRJed.ArtificialNeuralNetworksforSpeechandVision,London:Chapman-Hall,1993,126~142.
②KroghA,VedelsbyJ.NeuralNetworkEnsembles,CrossValidation,AndActiveLearning.In:TesauroG,TouretzkyD,LeenTeds.AdvancesinNeuralInformationProcessingSystems(Volume7),1995,231~238.
(17)
(18)
則神經(jīng)網(wǎng)絡(luò)集成的泛化誤差為:
E= - (19)
式19中的度量了神經(jīng)網(wǎng)絡(luò)集成中各網(wǎng)絡(luò)的相關(guān)程度。若集成是高度偏向(biased)的,即對(duì)于相同的輸入,集成中所有網(wǎng)絡(luò)都給出相同或相近的輸出,此時(shí)集成的差異度接近于0,其泛化誤差接近于各網(wǎng)絡(luò)泛化誤差的加權(quán)平均。反之,若集成中各網(wǎng)絡(luò)是相互獨(dú)立的,則集成的差異度較大,其泛化誤差將遠(yuǎn)小于各網(wǎng)絡(luò)泛化誤差的加權(quán)平均。因此,要增強(qiáng)神經(jīng)網(wǎng)絡(luò)集成的泛化能力,就應(yīng)該盡可能地使集成中各網(wǎng)絡(luò)的誤差互不相關(guān)。
但是從我們計(jì)算上證指數(shù)的分形特征所得到的序列上看到,在n=308的時(shí)候發(fā)生顯著的下降,說(shuō)明上證指數(shù)的一個(gè)長(zhǎng)期記憶過(guò)程大約是308個(gè)交易日,所以想得到多個(gè)互相誤差互不相關(guān)的神經(jīng)網(wǎng)絡(luò)需要大量的交易數(shù)據(jù)。
多個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行加權(quán)預(yù)測(cè)的具體效果將在下文中得到體現(xiàn)。
第四章實(shí)證結(jié)果及其分析
第一節(jié)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
(1)信息的表達(dá)方式
實(shí)際應(yīng)用中需要將領(lǐng)域問(wèn)題及其相應(yīng)的領(lǐng)域知識(shí)轉(zhuǎn)化為網(wǎng)絡(luò)所能表達(dá)并能處理的形式即將領(lǐng)域問(wèn)題提煉成適合網(wǎng)絡(luò)求解所能接受的某種數(shù)據(jù)形式。我們將連續(xù)N日的上證收盤指數(shù)直接作為訓(xùn)練數(shù)據(jù)。某些研究認(rèn)為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)需要進(jìn)行歸一化處理,但是通過(guò)本人的實(shí)際比較,歸一化處理的數(shù)據(jù)不能提供更好的泛化能力,反而增加了計(jì)算量,因此,輸入樣本直接為上證收盤指數(shù)。
(2)網(wǎng)絡(luò)模型選擇
主要包括確定激活函數(shù)聯(lián)接方式各神經(jīng)元的相互作用等。這里我們采用了BP多層前饋網(wǎng)絡(luò)。在BP網(wǎng)絡(luò)上,各個(gè)神經(jīng)元之間的傳遞函數(shù)有S型對(duì)數(shù)函數(shù)、雙曲正切S型傳遞函數(shù),線性傳遞函數(shù)等。本人選取了線性傳遞函數(shù)作為神經(jīng)元之間的傳遞函數(shù),雖然線形函數(shù)的泛化能力比非線形函數(shù)相比較弱,但是卻具有相對(duì)比較快的訓(xùn)練速度。
(3)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練算法
BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法有梯度下降學(xué)習(xí)算法、梯度下降動(dòng)量學(xué)習(xí)算法等。本文采用了Levenberg-Marguardt的BP訓(xùn)練函數(shù)。該方法與傳統(tǒng)方法比較,需要占用較大的內(nèi)存空間,但是訓(xùn)練次數(shù)一般只為梯度下降算法的1%,訓(xùn)練速度較快。
(4)網(wǎng)絡(luò)參數(shù)選擇
確定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),包括多層網(wǎng)的層數(shù)、隱層神經(jīng)元數(shù)目和輸入輸出單元的數(shù)目等。
①多層網(wǎng)絡(luò)的層數(shù)
由Kosmogorov定理可知一個(gè)具有三層的前向網(wǎng)絡(luò)能實(shí)現(xiàn)任意給定的映射,因此在大多數(shù)的涉及函數(shù)逼近的研究與應(yīng)用中一般都選用結(jié)構(gòu)比較簡(jiǎn)單的三層前向網(wǎng)絡(luò),本文也同樣選擇了3層的向前網(wǎng)絡(luò)。
②輸出層單元數(shù)目
輸出單元的數(shù)目一般依需要預(yù)測(cè)的結(jié)果而定。比如需要預(yù)測(cè)連續(xù)N天的上證指數(shù),我們就可以取輸出單元數(shù)為N.這里,由于我們要預(yù)測(cè)的是某段n個(gè)連續(xù)上證指數(shù)序列后一天的上證指數(shù),所以輸出單元數(shù)為1,即第n+1個(gè)上證指數(shù)。
③輸入層單元數(shù)目
輸入層單元的數(shù)目就是每次輸入的訓(xùn)練矢量的秩。在神經(jīng)網(wǎng)絡(luò)應(yīng)用中,模型的選取尤其是輸入變量個(gè)數(shù)的選取,對(duì)預(yù)測(cè)結(jié)果的影響具有關(guān)鍵意義。大量的研究表明,經(jīng)濟(jì)時(shí)問(wèn)序列是混沌的。我們可以用混沌時(shí)間序列的知識(shí)來(lái)確定模型的變量個(gè)數(shù)。
通常的做法是,對(duì)給定的經(jīng)濟(jì)時(shí)間序列,求出該序列的飽和嵌入維數(shù),即重構(gòu)相交間的最佳嵌入維數(shù),那么這個(gè)維數(shù)就可作為構(gòu)經(jīng)網(wǎng)絡(luò)輸入變量個(gè)數(shù)的數(shù)目。這里有一定的道理,神經(jīng)網(wǎng)絡(luò)的每個(gè)輸入就是經(jīng)濟(jì)時(shí)間序列的重構(gòu)相空間向量的一個(gè)分量。大量的數(shù)值實(shí)驗(yàn)證實(shí)了這種方法的有效性和可靠性。
系統(tǒng)的飽和嵌入維數(shù)可以由C-C法進(jìn)行估測(cè)。上海交通大學(xué)的葉中行,楊利平曾經(jīng)’采用相空間重構(gòu)法計(jì)測(cè)算過(guò)上證指數(shù)的飽和嵌入維數(shù)為10。①但是實(shí)際測(cè)試訓(xùn)練中輸入單元數(shù)為10的效果并不是很好。經(jīng)過(guò)多次測(cè)試比較,發(fā)現(xiàn)輸入單元數(shù)字在15~20之間效果較好??梢怨烙?jì)目前上證指數(shù)的飽和嵌入維數(shù)可以在10到20之間。最后,本人選擇了輸入單元數(shù)目為20。①
④隱層單元數(shù)目
網(wǎng)絡(luò)的隱層單元個(gè)數(shù)的多寡關(guān)系到網(wǎng)絡(luò)的泛化性,目前圍繞隱層單元個(gè)數(shù)的選取方法有很多種。比較常見(jiàn)的有:
_________________________________
①呂金虎陸君安,《混沌時(shí)間序列分析及其應(yīng)用》2002年第一版
1)
2)=()/2
其中表示隱層單元個(gè)數(shù),表示輸入單元個(gè)數(shù),表示輸出單元個(gè)數(shù),表示一常數(shù),一般取值范圍為[1,10]。
在實(shí)際應(yīng)用中,由于逼近的股票指數(shù)函數(shù)變化劇烈波動(dòng)很大,所以要求調(diào)整的聯(lián)接權(quán)數(shù)很多因此隱層單元應(yīng)該多一些,而且更多的隱層單元能夠提供更高的逼近精度。當(dāng)然隱層單位數(shù)目并不是越多越好的。經(jīng)過(guò)對(duì)測(cè)試數(shù)據(jù)的多次測(cè)試,我們選擇了第2種隱層單元數(shù)的確定方式,最終的隱層單元數(shù)為12。當(dāng)隱層單元數(shù)大于12后,神經(jīng)網(wǎng)絡(luò)的逼近精度并沒(méi)有進(jìn)一步的提高,所以不需要繼續(xù)增加隱蔽層單元數(shù)目。
⑤算法工具以及樣本來(lái)源
在本文的預(yù)測(cè)和計(jì)算過(guò)程中,本人采用了Matlab6.0數(shù)學(xué)計(jì)算工具軟件。
Matlab是美國(guó)MathWorks公司自20世紀(jì)80年代中期推出的數(shù)學(xué)軟件,優(yōu)秀的數(shù)值計(jì)算能力和卓越的數(shù)據(jù)可視化能力使其很快在數(shù)學(xué)軟件中脫穎而出。Matlab已經(jīng)成為線性代數(shù)、自動(dòng)控制理論、概率論及數(shù)理統(tǒng)計(jì)、數(shù)字信號(hào)處理、時(shí)間序列分析、動(dòng)態(tài)系統(tǒng)仿真等方面重要的數(shù)學(xué)計(jì)算工具。該軟件在6.0及以上版本里提供了眾多實(shí)用的數(shù)學(xué)計(jì)算工具,尤其是包含有功能豐富的神經(jīng)網(wǎng)絡(luò)函數(shù)集合以及GAOT工具箱,提供了靈活、開(kāi)放、高效的計(jì)算環(huán)境,設(shè)計(jì)者可以根據(jù)自己的需要去調(diào)用工具箱中相關(guān)函數(shù),使自己能夠從繁瑣的編程中解脫出來(lái)從而提高效率和工作質(zhì)量。
本文所有樣本以及測(cè)試數(shù)據(jù)均來(lái)自錢龍軟件網(wǎng)絡(luò)版V.4.53的日K線資料,未對(duì)指數(shù)做任何處理。
第二節(jié)利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)上證指數(shù)的流程
數(shù)據(jù)的預(yù)訓(xùn)練和測(cè)試
該步驟是為了確定下合適的訓(xùn)練樣本個(gè)數(shù),輸入單
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 條形碼、電子標(biāo)簽等物聯(lián)網(wǎng)技術(shù)在文檔管理中的應(yīng)用
- 2025年福建省職教高考《職測(cè)》核心考點(diǎn)必刷必練試題庫(kù)(含答案)
- 2025年楊凌職業(yè)技術(shù)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 中國(guó)銀行個(gè)人借款合同
- 正規(guī)的借款合同范本
- 航空運(yùn)輸人才培養(yǎng)與行業(yè)發(fā)展
- 事業(yè)單位的試用期勞動(dòng)合同范本
- 鋼筋單項(xiàng)勞務(wù)承包合同
- 臨設(shè)建設(shè)工程施工勞務(wù)分包合同
- 消防產(chǎn)品的買賣合同
- (二模)遵義市2025屆高三年級(jí)第二次適應(yīng)性考試試卷 地理試卷(含答案)
- 二零二五隱名股東合作協(xié)議書(shū)及公司股權(quán)代持及回購(gòu)協(xié)議
- IQC培訓(xùn)課件教學(xué)課件
- 2025年計(jì)算機(jī)二級(jí)WPS考試題目
- 高管績(jī)效考核全案
- 2024年上海市中考英語(yǔ)試題和答案
- 教育部《中小學(xué)校園食品安全和膳食經(jīng)費(fèi)管理工作指引》知識(shí)培訓(xùn)
- 長(zhǎng)沙醫(yī)學(xué)院《無(wú)機(jī)化學(xué)》2021-2022學(xué)年第一學(xué)期期末試卷
- eras婦科腫瘤圍手術(shù)期管理指南解讀
- 初一到初三英語(yǔ)單詞表2182個(gè)帶音標(biāo)打印版
- 《人力資源管理》全套教學(xué)課件
評(píng)論
0/150
提交評(píng)論