高頻金融時間序列模型化研究綜述_第1頁
高頻金融時間序列模型化研究綜述_第2頁
高頻金融時間序列模型化研究綜述_第3頁
高頻金融時間序列模型化研究綜述_第4頁
高頻金融時間序列模型化研究綜述_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

高頻金融時間序列模型化研究綜述

1高頻數據與非高頻金融時間序列信息技術的發(fā)展提高了數據采集和處理方法的進步。除了從年、月、周、日收集的金融數據外,人們變得越來越容易獲得在較小的時間間隔內(例如,小時、分鐘、秒等)獲得的觀測數據。通常,從小時、分鐘或秒中收集的數據稱為高頻數據,而在流程中實時交易的數據稱為高頻數據。這些數據的獲取對于研究市場的微觀結構和運行機制具有重要的理論和實踐意義。一般來說,基于分散采集數據序列的信息將不可避免地導致信息損失。數據頻率越低,相關信息的損失越多。因此,高頻數據比低頻數據更多地包括市場微觀結構和太陽現象信息。在金融低頻時間序列的波動性度量研究領域,ARCH模型及其擴展形式和隨機波動(SV)模型及其擴展形式是兩類非常成功的方法.而研究結果表明它們并不適合直接用于高頻金融時間序列的建模.例如,金融時間序列的波動率的驅動因素是GARCH等計量模型難以揭示的,而通過對高頻數據的分析,人們發(fā)現許多市場的微觀結構因素和一些交易者的行為因素才是使價格產生波動的真正原因,如實時交易的不等間隔、交易規(guī)則和指令流等.這些發(fā)現無疑具有重要的研究價值.考慮到高頻數據和超高頻金融數據之間在模型分析上質的區(qū)別,下面我們將把它們分開討論.2高頻交易時長數據的時序特征(超)高頻金融時間序列的生成以及采集機制決定了其獨有的特征,主要包括以下4個方面:1)超高頻的交易的時間記錄間隔往往不是均等的.金融市場的交易是在隨機的時點上進行的,因而間隔不是均等的.建立在等時間間隔觀測基礎上的傳統(tǒng)計量經濟模型(如ARCH模型和SV模型)將無法精確描述這種非等間隔的時間序列的性質.而非等間隔時序也突出了交易之間的持續(xù)時間的重要性.2)交易記錄時間的不一致性.隨著交易記錄的時間刻度的精確化和機械化,同一時間的交易可能會因為交易系統(tǒng)或數據傳輸的原因在不同時刻發(fā)布并記錄;而不同時刻的交易則有可能在同一時刻被合并發(fā)布,高頻數據的時間間隔的隨機性因而增加.3)離散取值.在時間刻度趨于連續(xù)化的高頻數據記錄中,因為交易機制的原因,所記錄的價格數據卻是離散觀測值,如中國滬深股市的最小價格變動單位是分,美國NYSE股價變動最小單位是1/8美元.4)海量數據.高頻數據的記錄中,在交易活躍的時段會有多筆交易同時發(fā)生,它們往往伴隨著不同的價格變化,而以秒、分來計量的交易時間則顯著的延長了時間序列的長度.除擁有與日度、周度或者月度等低頻金融時間序列相似的特征如厚尾、非正態(tài)、波動率聚集等之外,高頻金融時間序列也表現出一些典型的統(tǒng)計特征,主要表現如下:1)“日歷效應”(CalendarEffects).在成熟市場中,波動率、交易量、買賣價差、交易頻率等金融指標在一個交易日內表現出穩(wěn)定的、周期性的U型運動模式,即一天中早上、下午開市、閉市時高,中午時間低.2)時間序列峰度遞增性.Anderson和Bollerslev在1998年發(fā)現隨著數據頻率的增加,時間序列的峰度也隨之增加,當數據頻率取到分鐘數據時,峰度就已超過100.3)價格序列一階負相關性.Low和Muthuswamy在1996年用5分鐘頻率的數據驗證序列的負相關性,并進一步證明了這種相關性具有非線性的特征.4)波動率具有杠桿效應.正收益對波動率的影響弱于負收益的影響.5)波動率的斜偏性.Anderson等在2001年通過研究DowJones股票日收益波動率和相關系數時發(fā)現:已實現的波動率和協(xié)方差的非條件分布高度右偏,已實現波動率和相關系數呈現很強的時間依賴性并有移動到一起的趨勢.6)收益率波動與平均交易量具有正相關性.Xu等在1999年研究表明:收益波動率與平均交易量的正相關性在交易活躍的股票上表現得很突出.3高數據建模研究方法在高頻金融時間序列的研究領域中,形成了許多處理高頻數據的分析模型,其中幾類模型由于其代表性而成為該領域研究的重點.3.1基于fff回歸模型的評估除Dacorogna等在1994年提出的時間變換模型(TimeDeformationModels)和Beltratti與Morana在1998年提出了的隨機波動率模型(SV模型)外,在日歷性模型中影響最大的要屬Anderson和Bollerslev的一系列工作.他們1994年提出了用一種FFF回歸建??蚣?FourierFlexibleFormRegressionFramework),在這種框架下估計量假設沒有方差,從而可以在二步法分析中得到真實的波動率值.為改進二步分析法對估計量的方差的敏感性,他們于1998年進一步修正和拓展了此估計方法.Bai等人則在2000年拓展了他們的結果去研究在高頻數據波動率估計的依存性和非正態(tài)性問題.Ann等人在2001年利用此方法實證分析了香港證券市場,取得了不錯的效果.3.2高頻金融時間序列的模擬ARCH類模型在低頻時間序列分析中的表現優(yōu)良,人們很自然的考慮如何將其移植到高頻數據建模中來.雖然此研究的效果還有待提高,但是依然有一些很具影響的結論和模型.它們大致可以分為兩大類,一類是異質ARCH模型(HARCH);一類則是弱GARCH模型(WeaklyGARCH).針對高頻數據的兩個基本特征,即波動的長記憶性(絕對值收益的相關系數呈雙曲線形下降)和非對稱性,Müller和Dacorogna等在1997年提出了HARCH模型(HeterogeneousARCH).HARCH模型中,條件方差是過去不同期限長度的收益率的平方和,而GARCH模型是HARCH模型的一種特殊形式.此外,他們在HARCH模型基礎上建立了EMA-HARCH模型(ExponentialMovingAverageHARCH),此模型可以更好的刻畫波動率的長記憶性.由ARCH模型擴展出的另一類研究高頻金融時間序列的模型是弱GARCH模型,其由Drost和Nijman在1993年提出.對不同頻率的數據,不管是流量,還是存量,弱GARCH模型的參數之間需滿足一定解析關系,即在時間聚合(Temporalaggregation)下是封閉的.Drost和Werker在1996年討論了連續(xù)時間GARCH模型與弱GARCH模型的聯系.弱GARCH模型建立了低頻時間序列和高頻時間序列之間的解析關系,其參數封閉性的結論可以作為評價模型適合性的一個標準.3.3應用一致性的理想統(tǒng)計在非參數領域,神經網絡、遺傳算法、小波變換和數據挖掘中近鄰分析技術等已在高頻數據分析中得到一定程度的應用.這里需要特別提出的是Zhou在1998年提出F—致性的思想:經典統(tǒng)計學中一致性是指隨樣本量無限增大時,統(tǒng)計量所具有的一種良好的大樣本性質;但如果考慮數據頻率的不斷細分而使得樣本量無限增大,F—致性是指統(tǒng)計量的性質不會隨著數據頻率的變化而改變.4acd模型及其祖先研究中的數據延伸4.1模型構建和檢驗記錄每筆交易的數據就是所謂的超高頻(UltraHighFrequency)時間序列.超高頻數據的時間間隔是隨機的,針對這一點,Engle和Rusell在1994年的一篇WorkingPaper中對下一筆交易到達時間的條件分布建立了ACD模型(AutoregressiveConditionalDurationModel)的雛形形式.他們在1998年正式提出ACD模型.ACD模型的核心思想是用隨機標值點過程(MarkedStochasticPointProcess)去刻畫交易過程.不同的標值點過程得到不同的ACD模型.在實證方面:Engle和Russell在1997年利用ACD模型對外匯報價變化的頻率進行了成功的研究.在金融研究中使用的久期序列通常有價格久期和交易久期.價格久期指的是市場上交易品種的價格發(fā)生變動的時間間隔,交易久期是指兩筆連續(xù)發(fā)生交易的時間間隔.受交易費用的影響,我們更關注價格久期.前后兩次價格變化超過某一閥值,就定義為一個標記事件,把相鄰兩次事件的時間間隔定義為價格久期,即前后兩次價格變化超過該閥值,即|Pi-Pj|≥c所需的時間.通常情況下,價格久期越小,價格變動越頻繁,市場波動越劇烈.價格久期序列存在著顯著的“日內效應”,即在日內呈現出周期性的走勢.為防止日內效應對模型性數據分析產生負面影響,在建模分析之前一般剔除“日內效應”.“日內效應”是時間的函數,可以采用以時間為自變量的線性樣條函數(LinearSplineFunction)來描述它.用原始的久期序列除以樣條插值擬合而來的久期序列,得到剔除了日內效應的久期序列.而價格變動時間間隔往往存在著“聚類性”,即短的時間間隔后面也往往跟隨著短的時間間隔,而長的時間間隔后面往往會出現長的時間間隔,這與低頻數據的聚類性相似.對時間間隔相關性進行研究可以檢驗是否存在聚類性,即如果時間間隔表現出顯著的相關性,那么它往往存在聚類性.我們也可以對剔除日內效應的久期建立ACD模型,通過觀察模型中的估計系數來判斷時間間隔是否具有聚類性.ACD模型與GARCH模型具有相似的結構特征.GARCH模型主要描述波動的聚類性,ACD模型則主要描述交易或價格持續(xù)時間的聚類性.GARCH模型是對回報方差的自回歸過程,而ACD模型是對久期的自回歸過程.ACD模型能夠對金融產品交易過程中的久期進行衡量,也可以作為進一步研究波動性密度特征的基礎.設{xi}為剔除日內效應后的價格久期序列,ACD模型把久期表示為:其中ψi=E(xi|Ii-1),Ii-1為ti-1時刻的信息集,過去的信息全部通過ψi影響現在的久期.ACD(p,q)形式如下:其中ω>0,αj≥0,βj≥0,<1.4.2模型構建及殘差聚合分析一般情況下,當{εi}假設獨立同分布并服從某特定分布的時候,ACD模型稱之為強型ACD模型.此時歷史信息以條件均值ψi的形式進入久期,xi的波動被ψi完全捕捉到.然而,當{εi}獨立同分布的假設過強并難以捕捉久期的變化時,則假設{εi-1}是一個鞅差序列,此時的ACD模型被稱之為弱型ACD模型.如同GARCH(1,1)模型可以很好地描述大多數金融數據一樣,ACD(1,1)可以很好地擬合原始數據.為此,人們往往采用簡單有效的ACD(1,1)模型來實證研究.在諸多ACD模型中,線性ACD是最基礎的模型,不過它存在兩方面的缺陷.首先,線性的條件期望函數對參數有限制,即必須確保模型不會預測到負的久期,這一條件要求系數必須為正;其次,基于最近久期的條件期望值的調整過程,可能用非線性形式來建模相對更合適.于是,在強型ACD模型族中有了相對更具彈性的非線性ACD模型,如對數ACD模型、BOX-COXACD模型,指數ACD模型等.一般,ψi是過去久期及其條件期望的函數,根據函數形式的不同,分為:1)Engle和Russell在1998年提出的線性ACD模型約束條件:ω>0,α≥0,β≥0,α+β<1.最后一個條件保證了價格久期的非條件均值的存在性和過程的平穩(wěn)性,其他條件則保證價格久期的條件期望為正.2)Bauwens和Giot在2000年提出的對數ACD模型避免了線性ACD模型隱含的參數約束,更加方便合理,同時為了檢驗市場微觀結構效應,還可以方便的加入其它外生的條件變量.3)Dufour和Engle在2000年提出的BOX-COXACD模型也是一種非線性模型,在δ→0時,BOX-COXACD模型就退化為對數ACD模型.4)Dufour和Engle在2000年提出的指數ACD模型也是一種非線性模型,可以描述非對稱效應,若,則此時模型中斜率是α+δ,截距是ω-δ.若,則此時模型中斜率是α-δ,截距是ω+δ.關于殘差εi的分布,同GARCH模型中的正態(tài)分布一樣,指數分布是ACD模型的研究起點,復雜些的還有常見的威布爾分布(Weibull)、Lunde在2000年引入的廣義伽馬分布,和Gramming與Maurer于同年引入的更為復雜的布爾分布(Burr).不同的分布假設拓展了模型的適用性.1)標準指數分布(E)指數分布的生存函數(S(x)=P(X>x)是常數.2)威布爾分布(W)其中γ>0威布爾分布的生存函數是單調的.當γ=1時,威布爾分布就退化為指數分布.γ<1時,生存函數是遞增的,表示更可能表現出較短的久期值,當γ>1時,生存函數是遞減的,則表示更可能表現出較長的久期值.威布爾分布可以更好的描述出現較短和較長久期出現的可能性.3)廣義伽馬分布(G)其中γ,λ>0當λ=1時,廣義伽馬分布就退化為威布爾分布,當γ=λ=1時,廣義伽馬分布就退化為指數分布.當λγ<1,γ>1時,生存函數為U型,表示交易不很活躍.當λγ>1,γ<1時,生存函數為倒U型,表示交易很活躍.4)布爾分布(B)Burr分布可以由Gamma分布和Weibull分布的混合分布導出.指數分布、Weibull分布可以視為Burr分布的極限分布.ACD模型可以采用極大化似然函數的方法來估計參數,其數值算法可采用Berndt等人在1974年提出的BHHH算法.對模型的殘差進行診斷檢驗,可以檢驗各ACD模型是否較好地捕捉久期的動態(tài)性和分布特征及其預測效果.Engle和Russell在1998年指出,ACD模型捕捉數據自回歸結構的程度可以通過考察標準殘差εi=xi/ψi其自相關的程度來確定:由于殘差是模型無法預測的,所以如果它是白噪聲,則表明該ACD模型對久期自回歸結構的描述正確.而這可以利用Ljung-Box的Q統(tǒng)計量來檢驗“標準化”久期εi=xi/ψi的自相關性,若無法拒絕前k階自相關系數都為0的原假設,則說明該ACD模型很好地解釋了價格久期的聚集效應.4.3門限變量zi-1,rj的形式弱型ACD模型則放寬了強型ACD模型的分布函數的限制條件,使得許多ACD模型更具適用性,其中,應用最為廣泛、發(fā)展最為完備的弱型ACD模型為門限ACD模型和Markov變換ACD模型.1)門限ACD模型(TACD模型)Zhang,Russell和Tsay在2001年提出了TACD模型,它允許ψi序列是非線性的.TACD模型作為線性ACD模型的推廣,它允許在時間序列的不同子時期內久期的條件均值方程不相同并具有不同形式的分布.TACD(p,q)的形式如下:設xi為調整后的久期,定義Rj=[rj-1,rj),j=1,…,J,其中-∞=r0<r1<…<rJ=∞表示門限值,如果門限變量Zi-d∈Rj,則有:其中,為獨立同分布的序列,它們在不同的時間區(qū)間上可以服從不同的分布形式,門限變量為Zi=h(xi,…,xj;Yi,…,Yj),{Yj}為相關經濟變量組成的向量.2)Markov變換ACD模型(MSACD模型)Hujer等在2002年提出了MSACD(MarkovSwitchingACD)模型.該模型久期序列xi依賴于某個潛在的服從Markov過程的隨機變量Si.該模型和Hamilton在1989年推廣的Markov變換自回歸模型(MarkovSwitchingAutoregressiveRegressionModels)相似,它包括了很多已有的ACD模型.以兩階段MSACD為例:Si=1是第一階段,Si=2是第二階段.隨機變量Si的引入對了解市場的微觀結構有一定的幫助.為避免ψi的條件均值由于序列相關性帶來的計算復雜性,可采用Gray在1996年提出的方法,將ψi在各個階段的條件期望根據其在該狀態(tài)的條件概率來平均,即:其中P(Si=j|Ii

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論