




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、基于多元線性回歸的期權價格預測模型王某某(北京航空航天大學 計算機學院 北京 100191)作者簡介:王某某,北京航空航天大學研究生 郵箱:bnuwjx。摘 要:期權是國際市場成熟、普遍的金融衍生品,是金融市場極為重要的金融工具。2015年2月9日,上海證券交易所正式推出了我國首支場內交易期權上證50ETF期權,翻開了境內場內期權市場的新篇章。50ETF期權上市以來,市場規(guī)模逐步擴大,其發(fā)展情況境外期權產品相同時期。本文以此為研究背景,以“50ETF購12月1.95”這支期權為研究對象,以今日開盤價、收盤價、最高價、最低價、結算價、成交量、成交額、持倉量、漲停價和跌停價為解釋變量,通過多元線性
2、回歸模型,預測該期權的明日收盤價。本次研究以多元線性回歸的全模型(模型1)為出發(fā)點,通過異方差檢驗、殘差的獨立性檢驗、誤差的正太分布檢驗以及多重共線性檢驗,說明該模型不違反回歸的基本假設條件。進而通過主成分回歸(模型4)和逐步回歸(模型5)進行降維,結果表明因變量與解釋變量之間存在強烈的線性相關關系,且主成分回歸和逐步回歸相比全模型有更好的預測能力。關鍵詞:期權價格 多元線性回歸 50ETF 多重共線性 因子分析一、引言期權(option)是依據合約形態(tài)劃分的一種衍生品,指賦予其購買方在規(guī)定期限內按買賣雙方約定的價格(即協(xié)議價格或行權價格)購買或者出售一定數量某種金融資產(即標的資產)的權利的
3、合約。期權購買方為了獲得這個權利,必須支付給期權出售方一定的費用,稱為權利金或期權價格1。2015年2月9日,上海證券交易所正式推出了我國首支場內交易期權上證50ETF,翻開了境內場內期權市場的新篇章。期權是與期貨并列的基礎衍生產品,是金融市場極為重要的金融工具之一。自50ETF上市以來,市場規(guī)模逐步擴大。2015年2月日均合約成交面值為5.45億元,12月就達到了47.69億元,增長了7.75倍;2月日均合約成交量為2.33萬張,12月就達到了19.81萬張,增長了7.5倍;2月權利金總成交額為2.48億元,12月就達到了35.98億元,增長了13.51倍1。我國股票市場有上億的個人投資者,
4、是一個較為典型的散戶市場1。相較于專業(yè)投資機構講,散戶缺乏時間,精力以及專業(yè)分析,投資具有很大的投機行為。對于這些投資者來說,期權價格的變動則是他們最為關注的問題,其變化直接影響到自身的收益。在實際情況中,影響股票價格的因素很多,涉及到金融政策、利率政策以及國際市場等因素,其作用機制也相當復雜2。因此,對于期權價格預測的研究,則可以降低投資者的投資風險,及時調整投資結構,從而保障自身的收益。本文選擇“50ETF購12月1.95(期權代碼:10000629)”這支期權作為研究對象,根據過去一個月內期權的交易數據,以今日開盤價、收盤價、最高價、最低價、結算價、成交量、成交額、持倉量、漲停價和跌停價
5、為解釋變量,通過多元線性回歸模型,預測該期權的明日收盤價。下文由如下幾部分構成:第二部分介紹了本次研究的數據集,包括數據來源、和數據字段;第三部分重點介紹了各個多元線性回歸模型,包括全模型及異方差檢驗,殘差的獨立性檢驗、誤差的正太分布檢驗和多種共線性檢驗,在第4小節(jié)和第5小節(jié)分別采用主成分回歸和逐步回歸對模型加以改善;第四部分運用第三部分建立的各個模型對期權價格進行了預測;第五部分對本文研究進行了總結并未來的研究加以展望。二、數據說明本次研究的數據來源于Wind資訊金融終端,從上面獲取了“50ETF購12月1.95”這支期權自2016年10月24日至2016年11月24日(只包含工作日)共計2
6、4日的交易數據。經過整理后得到最終的數據字段,見表1。表 1 期權交易數據字段收盤價開盤價最高價最低價結算價成交額成交量持倉量漲停價跌停價 期權交易數據見附錄1。三、建模1 符號說明 各個變量及其符號說明見表2。表 2 各個變量及其符號說明變量符號明日收盤價Y今日開盤價X1今日收盤價X2今日最高價X3今日最低價X4今日結算價X5今日成交額X6今日成交量X7今日持倉量X8今日漲停價X9今日跌停價X102 解釋變量與指標變量的散點圖在建立模型之前,首先利用MATLAB繪制各個解釋變量與指標變量(明日收盤價)之間的散點圖,觀察各個解釋變量與指標變量之間的關系,散點圖結果見圖1。圖 1 各個解釋變量與
7、指標變量(明日收盤價)的散點圖通過圖一中的散點圖可以看出,明日收盤價與今日收盤價、今日開盤價、今日最高價、今日最低價、今日結算價、今日持倉量、今日漲停價以及今日跌停價之間有較為明顯的線性關系;而與今日成交額以及今日成交量之間的線性關系并不明顯。3 全模型 通過散點圖我們觀察到指標變量與各個解釋變量之間大致上為線性關系,所以考慮多元線性回歸模型進行建模。3.1 模型建立與求解首先建立各個解釋變量與指標變量的全模型,即考慮如下模型:Y=0+1X1+10X10+ N0, 2 式中,0,1,10,2都是與解釋變量無關的未知參數,其中0,1,10稱為回歸系數。在MATLAB中使用regress函數即可求
8、解此多元線性回歸模型,求解結果見表3.表 3 MATLAB求解全模型結果回歸系數回歸系數的估計值回歸系數置信區(qū)間00.1555-0.1938 0.504911.8288-0.9212 4.578720.0586-1.5671 1.684330.6199-0.4249 1.66474-1.0532-1.9703 -0.13625-1.2208-3.8759 1.434260.0000-0.0000 0.00007-0.0000-0.0001 0.00008-0.0000-0.0000 0.000090.3233-1.0317 1.67831000 0R2 = 0.9489 F = 26.7989
9、 p < 0.0001 s2 = 0.0001從上表容易看出模型(1)成立,此時指標變量與解釋變量滿足的回歸模型為:Y=0.1555+1.8288X1+0.0586X2+0.6199X3-1.0532X4-1.2208X5+0.3233X9 (模型1)在MATLAB中畫出模型1的殘差分布,見圖2。圖 Error! Main Document Only. 模型1的殘差分布除第12個數據外其余殘差的置信區(qū)間均包含零點,因此第12個點應當視為異常點,將其剔除后重新計算,得到模型2:Y=0.2484+1.5432X1+0.0291X2+0.7482X3-0.8726X4-1.1292X5+0.1
10、584X9 (模型2)模型2的R2 = 0.9736,F(xiàn) = 49.1655,p < 0.0001,s2 = 0.0001。但同時我們發(fā)現(xiàn),各個回歸系數的置信區(qū)間仍然均包含零點。畫出模型2的殘差分布,發(fā)現(xiàn)又出現(xiàn)了異常點,按照上面的方法剔除異常點直至沒有異常點產生。最終一共去掉了5個異常點(分別是2,12,15,22以及23),最終得到模型3:Y=0.3999+2.7664X1-0.5987X2+1.6607X3-1.3712X4- 3.1596X5-0.0001X7+0.6669X9 (模型3)模型3的R2 = 0.9969,F(xiàn) = 281.6079,p < 0.0001,s2 &
11、lt; 0.0001。可見模型2相當顯著,各個回歸系數的置信區(qū)間均不包含零點;但是去除的數據點有5個(總共23個),去除的異常點比較多,容易去除有用信息,所以我們只把模型3作為后期預測的一個對比模型,在之后的分析中,我們只考慮去除第12個異常點的數據。接下來進行異方差檢驗,殘差的獨立性檢驗以及多重共線性檢驗。3.2 異方差檢驗圖 Error! Main Document Only. 殘差對預測值的散點圖通過SPSS畫出殘差對預測值的散點圖,見圖3。根據圖3可以認為數據基本不存在異方差性,即認為隨機誤差具有相同的方差。3.3 殘差的獨立性檢驗通過SPSS的Durbin-watson檢驗得到DW值
12、為2.545,模型2中解釋變量數量k(包括常數項)為7,樣本數量n 為22,查DW分布表得到相應的dL= 0.510,dU= 2.015。由于dU<DW<4-dL,認為隨機誤差之間無自相關3。3.4 誤差的正態(tài)分布檢驗通過SPSS畫出正態(tài)P-P圖以及回歸標準化殘差頻率分布直方圖,見圖4。圖 Error! Main Document Only. 誤差的正太分布檢驗圖從上圖可以認為誤差服從均值為0的正態(tài)分布。3.5 多重共線性檢驗多元線性回歸模型的基本假設中要求設計矩陣X的列向量之間不存在密切的線性關系3,如果存在,就稱它們之間存在多重共線性。表 Error! Main Documen
13、t Only. 多重共線性診斷結果通過SPSS進行多重共線性診斷,結果如下表。從上表可以看出絕大部分變量的VIF值遠遠大于10,說明嚴重存在多重共線性,針對多重共線性的問題,接下來用主成分分析加以處理。4 主成分回歸利用MATLAB對這個十個解釋變量進行主成分分析,分析過程如下。1)對原始數據進行標準化處理xi= xi- isi即每個元素的值減去該列的均值,然后除以這一列的方差。2)計算相關系數矩陣R,結果見表表 5 解釋變量的相關系數X1X2X3X4X5X6X7X8X9X10X11.000.920.980.961.000.610.50-0.880.920.92X20.921.000.900.
14、960.910.430.31-0.880.990.99X30.980.901.000.940.980.680.58-0.880.910.91X40.960.960.941.000.950.460.34-0.840.960.96X51.000.910.980.951.000.640.54-0.880.910.91X60.610.430.680.460.641.000.99-0.540.460.46X70.500.310.580.340.540.991.00-0.450.340.34X8-0.88-0.88-0.88-0.84-0.88-0.54-0.451.00-0.86-0.86X90.920
15、.990.910.960.910.460.34-0.861.001.00X100.920.990.910.960.910.460.34-0.861.001.003)計算特征值和累計貢獻率見表6表 6 各個解釋變量的特征根和累計貢獻率變量特征根累計貢獻率X18.103081.03%X21.501196.04%X30.187897.92%X40.155399.47%X50.024099.71%X60.017399.89%X70.007499.96%X80.002899.99%X90.0013100.0%X100.0000100.0%可以看出,前兩個特征根的累計貢獻率就達到了90%以上,主成分分析效
16、果很好。下面選擇前四個主成分(累計貢獻率99.47%)進行綜合分析。4)前四個特征根對應的特征向量見表7表 7 前四個特征根對應的特征向量X1X2X3X4X5X6X7X8X9X10第1個特征向量0.34 0.33 0.35 0.34 0.35 0.23 0.19 -0.32 0.34 0.34 第2個特征向量-0.03 -0.22 0.05 -0.18 0.01 0.61 0.68 0.05 -0.20 -0.20 第3個特征向量0.07 0.04 0.09 0.26 0.06 0.10 0.01 0.93 0.14 0.14 第4個特征向量0.45 -0.36 0.27 0.18 0.43
17、-0.14 -0.18 0.01 -0.40 -0.40 5)主成分回歸模型求得的主成分回歸模型如下:Y=0.204151+0.199353*X1+0.044479*X2+0.154424*X3+0.082825*X4+0.193987*X5+0.000289*X9+0.000353*X10 (模型4)5 逐步回歸主成分回歸求出的主成分是原始變量的線性組合,表示新的綜合變量。接下來使用逐步回歸的方法來篩選變量。在逐步回歸中,決定一個變量時候有必要進入模型或者從模型中剔除時,常用的方法是偏F檢驗3,關于偏F檢驗這里不做贅述。圖 Error! Main Document Only. 逐步回歸結果在
18、MATLAB中使用stepwise函數進行逐步回歸4,運行結果如圖5求得的逐步回歸模型如下:Y=1.0103*X3-0.6147*X4+0.6815*X9-0.7097*X10 (模型5)四、預測接下來我們利用上面求得的模型來進行期權價格預測。利用模型1、模型2、模型3、模型4和模型5分別預測了11月25日至12月10日的期權價格,11月25日至12月20日的真實期權以及預測結果如表8。表 8 各個模型的預測結果日期真實數據模型1模型2模型3模型4模型52016-11-250.50410.52290.51350.10100.49400.52232016-11-280.53250.53810.5
19、3150.14800.51640.52292016-11-290.51410.59320.58070.04920.52930.55702016-11-300.52560.58200.56770.01570.54310.54582016-12-010.50790.55170.54250.18280.53190.53972016-12-020.46210.54730.53610.20310.52670.53772016-12-050.46230.49510.48910.38880.48960.49812016-12-060.46600.46060.46150.45790.46910.4682201
20、6-12-070.46690.46530.46450.41790.46810.47492016-12-080.49890.45990.46110.40660.47380.47202016-12-090.47570.52780.52400.28200.49330.51792016-12-120.46600.53190.52650.28170.50410.51192016-12-130.45550.48120.47980.41310.47770.48442016-12-140.40030.47120.47410.43950.47050.46552016-12-150.39260.47000.468
21、30.21020.44900.43672016-12-160.38120.41400.42320.45520.40920.39072016-12-190.36330.40550.41440.38920.40030.38292016-12-200.39040.40040.40890.31030.39190.3757各個模型的平均誤差以及誤差百分比見表9。表 9 各個模型預測結果評價真實數據模型1模型2模型3模型4模型5平均誤差0.04140.03850.18840.02640.0301平均誤差百分比9.18%8.71%38.84%6.02%6.66%從表8和表9可以看出,模型4(主成分回歸)和模
22、型5(逐步回歸)的結果最好,而模型3由于去掉了較多的異常點反而導致預測結果不好。接下來不考慮模型3,畫出其余4個模型的預測結果與真實數據的折線圖,見圖6在圖圖 Error! Main Document Only. 4個模型預測結果與真實數據的折線圖4中,橫坐標表示數據的序號,分別與各個日期對應,其中前面24個數據來自訓練集,故而各個模型的預測結果與實際結果接近;后面的數據則來自測試集,可以看出各個模型的預測結果與實際數據存在一定差異,不過總體趨勢與實際數據比較匹配。其中模型4和模型5的預測結果最好。五、結論本文從以期權今日開盤價、收盤價、最高價、最低價、結算價、成交量、成交額、持倉量、漲停價和
23、跌停價為解釋變量,期權明日收盤價為指標變量,建立了多元線性回歸模型1,通過異方差檢驗、殘差的獨立性檢驗、誤差的正太分布檢驗以及多重共線性檢驗,說明該模型不違反回歸的基本假設條件。進而通過主成分回歸(模型4)和逐步回歸(模型5)進行降維,通過預測結果與真實數據的差異比較了各個模型的預測效果,結果表明主成分回歸以及逐步回歸相比全模型有更好的預測能力。實際情況中,該期權的當日價格波動一般不會超過15%,而普遍真是情況是8%以內,可見模型4和模型5的預測效果并不理想,今后的研究可以在以下兩個方面進行改進:不斷向模型加入得到的最新數據;運用時間序列模型進行研究。參考文獻1 吳清. 期權交易策略十講M.
24、上海人民出版社, 20162 李珺. 基于因子分析的多元線性回歸方法及其在股價預測中的應用D. 南京大學, 20143 孫海燕, 周夢, 李衛(wèi)國, 馮偉. 數理統(tǒng)計M. 北京航空航天大學出版社, 20164 司守奎. 數學建模算法與應用(第2版)M. 國防工業(yè)出版社, 2015Option price forecasting model based on multiple linear regressionWang MoumouSchool of Computer Science, BeiHang University, Beijing 100191Abstract: Option is on
25、e kind of universal financial derivatives with a mature international market, and it is extremely important financial instrument. On February 9, 2015, the Shanghai Stock Exchange officially launched China's first floor trading options - SSE 50ETF options, opened a new chapter in the domestic mar
26、ket options market. 50ETF options since listing, the market gradually expanded, the development of offshore options products the same period. In this paper, the background of this study, "50ETF purchase December 1.95" this option for the study to today's opening, closing price, the hig
27、hest price, lowest price, settlement price, volume, turnover, open interest, price and the limit price for the explanatory variables, through multiple linear regression model, the option of the closing price of tomorrow. In this study, the heterogeneity test, residual independence test, error positi
28、ve distribution test and multicollinearity test were taken as the starting point of the whole model (model 1) of multivariate linear regression to show that the model did not violate the basic assumptions of regression. The results show that there is a strong linear correlation between the dependent
29、 variable and the explanatory variable, and the principal component regression and the stepwise regression are better than the whole regression model (step 4) and stepwise regression (model 5). The results show that there is a strong linear correlation between the dependent variable and the explanat
30、ory variable, and the principal component regression and stepwise regression have better prediction ability than the whole model.Keywords: Option price, Multiple linear regression, Multicollinearity, Factor analysis附錄1 期權交易數據日期收盤價開盤價最高價最低價結算價2016-11-240.46130.45100.47020.45060.47502016-11-230.45280.
31、44550.46800.44540.46502016-11-220.44650.43500.44820.43500.45802016-11-210.43040.40690.44300.40450.44002016-11-180.40690.40970.42130.40370.41302016-11-170.41130.41100.41300.39620.41902016-11-160.40770.41060.41500.40500.41102016-11-150.41070.41400.41630.40710.41602016-11-140.41170.40000.43290.40000.42
32、402016-11-110.40740.38310.40930.38250.41302016-11-100.38690.37290.39660.36750.39402016-11-090.35970.38100.38100.33780.37002016-11-080.38050.37580.39140.37320.38802016-11-070.36860.36600.37380.36170.38002016-11-040.36500.36920.37870.36250.37402016-11-030.36670.34300.37830.34000.37702016-11-020.34580.35880.35880.34380.35002016-11-010.35880.34870.36250.34530.36602016-10-310.34700.35220.36100.33040.35502016-10-280.35100.35210.37490.35060.357020
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 文件打印設置表格(細節(jié)參數)
- 文化藝術活動參與度調查表
- 投融資體制機制的現(xiàn)狀與發(fā)展趨勢分析
- 小學生語文口語表達能力的提升路徑
- 網絡技術與網絡安全常識題
- DB15-T 2579-2022 草種質資源保存圃建設和管理技術規(guī)范
- 提高建筑垃圾回收利用率的措施
- 植物學概論高中生物教學大綱
- 企業(yè)內審職能的演變與重要性提升
- 零售業(yè)銷售業(yè)績增長情況表
- 浙江省杭州市杭州第二中學2024屆高三入學考試數學試題
- 獨特婚禮婚車服務
- 無人機校企合作方案
- 思想道德與法治(湖南師范大學)智慧樹知到課后章節(jié)答案2023年下湖南師范大學
- 04D701-3 電纜橋架安裝
- 房屋衛(wèi)生間閉水實驗情況確認單
- 叉車操作安全規(guī)范(圖片版)課件
- 處方權考試(含答案)
- 世界老年人跌倒的預防和管理指南解讀及跌倒應急處理-
- 前置胎盤臨床診斷與處理指南課件
- 東方廣場招商執(zhí)行方案
評論
0/150
提交評論