機器學習視角下的考察:因子擁擠度指標及其擇時作用_第1頁
機器學習視角下的考察:因子擁擠度指標及其擇時作用_第2頁
機器學習視角下的考察:因子擁擠度指標及其擇時作用_第3頁
機器學習視角下的考察:因子擁擠度指標及其擇時作用_第4頁
機器學習視角下的考察:因子擁擠度指標及其擇時作用_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、正文目錄 HYPERLINK l _TOC_250019 因子擁擠度研究背景介紹4 HYPERLINK l _TOC_250018 因子擁擠度指標構建5 HYPERLINK l _TOC_250017 公募基金持倉數(shù)據(jù)6 HYPERLINK l _TOC_250016 相對值指標的構建6 HYPERLINK l _TOC_250015 相對指標 1:估值價差7 HYPERLINK l _TOC_250014 相對指標 2:配對相關性8 HYPERLINK l _TOC_250013 相對指標 3:因子收益波動率9 HYPERLINK l _TOC_250012 相對指標 4:因子長期反轉10

2、HYPERLINK l _TOC_250011 機器學習算法對單因子多空收益進行擇時11 HYPERLINK l _TOC_250010 XGBoost 算法預測單因子收益11 HYPERLINK l _TOC_250009 特征變量和標簽數(shù)據(jù)處理13 HYPERLINK l _TOC_250008 預測結果評估13 HYPERLINK l _TOC_250007 LSTM 算法預測單因子收益13 HYPERLINK l _TOC_250006 神經(jīng)網(wǎng)絡結構14 HYPERLINK l _TOC_250005 特征變量和標簽數(shù)據(jù)處理15 HYPERLINK l _TOC_250004 預測結果

3、評估15 HYPERLINK l _TOC_250003 利用合成指標對多因子模型進行擇時16 HYPERLINK l _TOC_250002 多因子加權組合構建20 HYPERLINK l _TOC_250001 總結20 HYPERLINK l _TOC_250000 附錄22圖表目錄圖 1 美國市場動量因子多空凈值走勢4圖 2 A 股流通市值因子多空凈值表現(xiàn)5圖 3 估值價差 EP 與因子未來多空收益相關系數(shù)走勢8圖 4 估值價差 BP 與因子未來多空收益相關系數(shù)走勢8圖 5 估值價差 SP 與因子未來多空收益相關系數(shù)走勢8圖 6 配對相關性與因子未來多空收益相關系數(shù)走勢9圖 7 多頭組

4、合因子波動與因子未來多空收益相關系數(shù)10圖 8 多空組合因子波動與因子未來多空收益相關系數(shù)10圖 9 因子長期反轉(3 年)與因子多空收益相關系數(shù)11圖 10 因子長期反轉(4 年)與因子多空收益相關系數(shù)11圖 11 XGBoost 算法示意圖12圖 12 LSTM 網(wǎng)絡神經(jīng)元示意圖14圖 13 LSTM 網(wǎng)絡結構圖14圖 14 LSTM 中間過程預測結果15圖 15 成長因子各擁擠度指標兩兩相關系數(shù)16圖 16 市值因子各擁擠度指標兩兩相關系數(shù)16圖 17 反轉因子各擁擠度指標兩兩相關系數(shù)17圖 18 情緒因子各擁擠度指標兩兩相關系數(shù)17圖 19 交易行為因子各擁擠度指標兩兩相關系數(shù)17圖

5、20 價值因子各擁擠度指標兩兩相關系數(shù)18圖 21 成長因子多空凈值與擁擠度合成指標18圖 22 市值因子多空凈值與擁擠度合成指標18圖 23 反轉因子多空凈值與擁擠度合成指標19圖 24 情緒因子多空凈值與擁擠度合成指標19圖 25 交易行為因子多空凈值與擁擠度合成指標19圖 26 價值因子多空凈值與擁擠度合成指標19圖 27 擁擠度加權組合與等權組合凈值走勢20因子擁擠度研究背景介紹近十年來,量化投資在國內(nèi)市場取得了長足的發(fā)展,尤為突出的是因子模型被眾多機構投資者所接受和使用。因子模型相對穩(wěn)健的表現(xiàn)和較大資金容量的優(yōu)點很能符合機構量化投資的需要。隨著國內(nèi)外投資者對因子模型研究的深入,一些常

6、見、有效且符合經(jīng)濟學邏輯的因子被不少投資機構有針對性地投資。大量的資金有方向性的流入到某個因子中,可能會導致單因子上聚集的資金過多,投資研究者可能會擔憂尾部風險事件的發(fā)生, “因子擁擠度”的概念隨之逐漸被投資者所關注。建筑師在設計公共場所建筑主體時往往會從多種角度綜合考量,力求在商業(yè)價值、美學和安全性等眾多因素中找到最好的平衡。考量安全性時,人口的擁擠度是重要考察依據(jù), 公共場所的人口過度擁擠可能導致災難性后果。投資者對因子的投資與建筑師設計建筑主體有相似之處,因子擁擠度往往也可以影響到一個因子的生命周期。資金的追逐是讓一個因子表現(xiàn)優(yōu)秀的必要條件,但是過度投資某個因子也會導致尾部風險事件的發(fā)生

7、。美國市場中,動量因子(Momentum Factor)一直以來是被投資者關注的重要因子,然而動量因子在 2009 年出現(xiàn)了大幅回撤,曾讓國外投資者措手不及。投資者和學術界的研究人員對因子失效有多維度的解釋,其中一個重要的解釋是單因子擁擠度過高導致因子出現(xiàn)大幅回撤,認為因子擁擠度指標是影響因子生命周期的重要因素。圖 1 美國市場動量因子多空凈值走勢資料來源:MSCI、招商證券定量研究團隊整理與美股動量因子相似,A 股市場上的市值因子在 2016 年之前曾經(jīng)是不少機構量化部門重倉的重要因子,但是在 2016 年底和 2017 年卻遭遇較大回撤,使量化投資者措手不及,如今市值因子依舊處于長期的震蕩

8、之中,風采不再。圖 2 A 股流通市值因子多空凈值表現(xiàn)資料來源:Wind 資訊、招商證券定量研究團隊整理從直覺上來說,因子擁擠度指標似乎應該是一個與因子收益呈負相關的指標,但是在國外,對美股因子的實際測算結果卻并非如此。國外的研究認為,因子擁擠度指標本身并非一個因子收益的負向指標,因為必須有資金的穩(wěn)定流入才能推動因子維持優(yōu)秀的收益表現(xiàn)。只有在某個時期有過多的資金聚集在某個因子上的時候,才會使得因子過于擁擠。也就是說,在因子擁擠度指標沒有達到非常高值的時候,因子擁擠度是可以推動因子取得優(yōu)秀表現(xiàn)的。為了探究在 A 股市場是否也有類似關系,本報告將著手研究因子擁擠度指標對 A 股市場常用因子的影響。

9、因子擁擠度指標構建構建因子擁擠度指標,衡量因子當前的擁擠情況,統(tǒng)計指標可以分為絕對值指標和相對值指標。絕對值指標是直接對市場上投資者的持倉數(shù)據(jù)進行分析,了解具體有多少資金投入到單因子上,這種方式邏輯直接,但是在實現(xiàn)上難度高。相對值指標則是統(tǒng)計得到的能代表某個因子的一組股票的相對估值、配對相關性等指標,用這些指標來間接判斷是否出現(xiàn)了因子投資過于擁擠的情況。表 1:因子擁擠度指標類型指標類型指標名稱絕對值指標投資者持倉數(shù)據(jù)估值價差相對值指標資料來源:招商證券定量研究團隊整理配對相關性因子波動率 因子長期反轉公募基金持倉數(shù)據(jù)所謂基金持倉是指該基金重點投資股票、債券、貨幣等的資產(chǎn)數(shù)量和比例。投資者可以

10、從基金持倉了解該基金的風險程度。常規(guī)地,我們獲取基金持倉數(shù)據(jù)的依據(jù)是公募基金在每季度末公布的季度公告中的數(shù)據(jù)。但是由于季度報告的公布存在比較長的滯后期(參見表 2),且公布的持倉數(shù)據(jù)是期末的持倉數(shù)據(jù)的快照,是一個靜態(tài)數(shù)據(jù),用報告數(shù)據(jù)計算因子擁擠度的方法在實際中并不是一個理想的方法。雖然目前也有些方法通過研究基金復權單位凈值增長率和因子收益率序列來反推基金產(chǎn)品在各因子上的暴露,然而就目前而言,并沒有十分盡如人意的解決方案。在國外也同樣面臨類似問題,比如美股的 13F Filling 每季度公布一次,且截止日為報告期結束后的 45 天。表 2:證監(jiān)會規(guī)定的公募基金各類公開報告公布的截止日期季度報告

11、半年度報告年度報告15 個工作日60 日90 日重倉股持倉數(shù)據(jù)(前 10 只)全部持倉數(shù)據(jù)資料來源:Wind 資訊、招商證券定量研究團隊整理定量研究團隊整理由于上述原因,我們沒有采用基金產(chǎn)品公布的季報中的持倉數(shù)據(jù)來計算因子的擁擠度, 而是采用因子模型在應用中產(chǎn)生的交易數(shù)據(jù)來計算因子的擁擠度,我們將這類指標稱為相對值指標。相對值指標的構建在說明我們?nèi)绾螛嫿ㄒ蜃訐頂D度指標之前,有必要對我們構建因子擁擠度的方法進行簡述。表 3:大類風格因子構建方式和細分因子表因子名稱大類風格代碼合成該風格因子所用到的細分因子價值ValueBP_LR, EP_Fwd12M, SP_TTM, OCFP_TTM, Sal

12、es2EV市值FloatCapLn_flaotcap成長GrowthGr_Q_Earning, Gr_Q_OpEarning, Gr_Q_Sale情緒SentimentEPS_FY0_R1M, Rating_R3M, TargetReturn反轉MomentumRTN_20D, RTN_60D, RTN_1200D交易行為TradingBehaviorVolAvg_20D_240D,RealizedSkewness_240D,VolCV_20D,TurnoverAvg_20D, SpreadBias_120D, IVR, VWAPP_OLS資料來源:招商證券定量研究團隊整理定量研究團隊整理我們

13、根據(jù)招商多因子庫中的細分類別下的單因子合成了價值、成長、情緒、反轉和交易行為五大類風格因子。其中,價值因子由 BP_LR,EP_Fwd12M,SP_TTM 等五個描述子以等權方式合成。成長因子由 Gr_Q_Earning,Gr_Q_OpEarning,Gr_Q_Sale 三個描述子以等權方式合成。情緒因子由 EPS_FY0_R1M,Rating_R3M,TargetReturn 三個描述子以等權方式合成。反轉因子由 RTN_20D,RTN_60D,RTN_1200D 三個描述子以等權方式合成。交易行為因子由 VolAvg_20D_240D,RealizedSkewness_240D, VolC

14、V_20D 等七個描述子以等權方式合成。合成各大類風格因子的細分因子如表 3 所示,具體單個因子的定義見附錄。以下我們對因子擁擠度指標進行一一解釋。相對指標 1:估值價差一般認為,若有大量的資金追逐某只股票時,股票的估值傾向于上升,而不被資金所偏好的個股估值傾向于走低。與研究股票估值的思路類似,當資金大量追逐某個因子時, 能代表該單因子一組股票(多頭組合)的估值傾向于上升,同時,該因子的空頭組合的估值傾向于走低。以反轉因子為例,我們根據(jù)如下步驟進行多頭組合與空頭組合的劃分:取每月月底為截面觀測日,選取 A 股市場上的在該時點上符合計算要求的個股(剔除 ST 股和上市不滿 100 個交易日的股票

15、)。按其當期的因子暴露度大小進行排序,然后依次平均分成 10 組,抽取排名第 1 的一個組合作為多頭組合,排名第 10 的組合為空頭組合,等權組合。分別計算多頭組合和空頭組合的相對估值指標的中位數(shù),相對估值指標我們?nèi)∽钔ㄓ玫?P/E(市盈率)、P/B(市凈率)和 P/S(市銷率),為了解決估值指標在收益接近 0 時取值接近無窮等不良情況,我們?nèi)」乐抵笜说牡箶?shù)E/P,B/P 和 S/P,進行估值的刻畫。構建估值價差指標:估值價差 = 空頭組合的估值指標倒數(shù)中位數(shù) - 多頭組合的估值指標倒數(shù)中位數(shù)估值價差指標越高,則說明該時點上因子擁擠度越高。我們計算了估值價差指標和因子未來 1 個月、3 個月、

16、6 個月和 12 個月的收益相關性。結果如下:圖 3 估值價差 EP 與因子未來多空收益相關系數(shù)走勢圖 4 估值價差 BP 與因子未來多空收益相關系數(shù)走勢 資料來源:Wind 資訊、招商證券定量研究團隊整理資料來源:Wind 資訊、招商證券定量研究團隊整理圖 5 估值價差 SP 與因子未來多空收益相關系數(shù)走勢資料來源:Wind 資訊、招商證券定量研究團隊整理A 股市場上,估值價差指標與因子未來一年的收益走勢相關性并不是單調(diào)的,比如情緒因子未來收益與估值價差呈現(xiàn)持續(xù)正相關,而市值因子卻呈現(xiàn)持續(xù)的負相關。相對指標 2:配對相關性當大量資金追逐某個因子的時候,投資者可能會同向買入在該因子上暴露度較大

17、的股票, 同時同向賣出在該因子上暴露度低的股票,因此多頭組合內(nèi)部的股票可能會同漲同跌的 態(tài)勢,空頭組合內(nèi)部的股票也有類似效應。根據(jù)這一邏輯我們計算了各因子多頭組合與空頭組合過去 3 個月收益與組內(nèi)平均收益的相關系數(shù)。構成配對相關性指標:取每月月底為截面觀測日,選取 A 股市場上的在該時點上符合計算要求的個股(剔除 ST 股和上市不滿 100 個交易日的股票)。按其當期的因子暴露度大小進行排序,然后依次平均分成 10 組,抽取排名第 1 的一個組合作為多頭組合,排名第 10 的組合為空頭組合,等權組合。在截面觀測日回看 3 個月,將多(空)頭組合內(nèi)的成分股日收益等權,計算多(空) 頭組合的日收益

18、。分別計算組內(nèi)成分股和多(空)頭組合的日收益相關系數(shù),并取均值,計算多(空)頭配對相關性。3 個月個月3多頭配對相關性 = Mean(Corr(個股 i , 多頭組合均收益 )3 個月個月3空頭配對相關性 = Mean(Corr(個股 i , 空頭組合均收益 )最終的配對相關性指標為多頭配對相關性與空頭配對相關性之和。配對相關性指標 = 多頭配對相關性 +空頭配對相關性從經(jīng)濟學邏輯出發(fā),配對相關性指標越大,則因子越擁擠。我們同樣給出了配對相關性指標與因子未來 1 個月、3 個月、6 個月和 12 個月的相關系數(shù),結果如下:圖 6 配對相關性與因子未來多空收益相關系數(shù)走勢資料來源:Wind 資訊

19、、招商證券定量研究團隊整理大部分因子的未來一年收益和配對相關性指標呈現(xiàn)正相關。相對指標 3:因子收益波動率因子收益波動率指標的思路是,當有較多資金聚集在某資產(chǎn)上時,資產(chǎn)價格的波動可能會變大。根據(jù)這一邏輯構建因子收益的波動率指標。取每月月底為截面觀測日,選取 A 股市場上的在該時點上符合計算要求的個股(剔除 ST 股和上市不滿 100 個交易日的股票)。按其當期的因子暴露度大小進行排序,然后依次平均分成 10 組,抽取排名第 1 的一個組合作為多頭組合,排名第 10 的組合為空頭組合,等權組合。在截面觀測日回看 3 個月,將多(空)頭組合內(nèi)的成分股日收益等權,計算多(空) 頭組合的日收益,并計算

20、多(空)頭組合日收益序列的標準差。將歷史時點上的 A股市場上符合要求的股票等權組合,構建市場組合,用一樣的方法計算市場組合的收益。構建因子波動率指標公式如下:多頭組合因子波動 多空組合因子波動 多頭組合 市場組合) 多頭組合 空頭組合)多頭組合因子波動指標和多空組合因子波動指標的區(qū)別在于分母。多頭組合的因子波動用多頭組合收益標準差除以市場組合的收益標準差,來剔除市場整體波動對多頭組合波動的影響。而多空組合因子波動則是反映多頭組合的波動異于空頭組合波動的程度。同樣地,我們給出了該類指標對因子未來一年各時間段收益的相關系數(shù),示列如下: 圖 7 多頭組合因子波動與因子未來多空收益相關系數(shù) 圖 8 多

21、空組合因子波動與因子未來多空收益相關系數(shù)資料來源:Wind 資訊、招商證券定量研究團隊整理資料來源:Wind 資訊、招商證券定量研究團隊整理相對指標 4:因子長期反轉當大量資金涌向某個因子時,能代表該因子的一組股票的價格會上漲,股票資產(chǎn)收益的優(yōu)秀表現(xiàn)又會進一步吸引資金進入,形成正向反饋,最終導致該因子擁擠。因而因子的長期反轉可能也是衡量因子擁擠度的一個重要指標。我們分別設置了 3 年和 4 年的回溯期,去計算某個因子多空組合在回溯期里收益,滾動觀測,形成因子長期反轉指標。取每月月底為截面觀測日,選取 A 股市場上的在該時點上符合計算要求的個股,剔除 ST 股和上市不滿 100 個交易日的股票。

22、按其當期的因子暴露度大小進行排序,然后依次平均分成 10 組,抽取排名第 1 的一個組合作為多頭組合,排名第 10 的組合為空頭組合,等權組合。繼而構建多空組合,計算多空組合的日收益序列。分別計算多空組合過去 3 年和過去 4 年的累積收益。因子長期反轉( 年) 因子多空組合近 年) 因子長期反轉( 年) 因子多空組合近 年)根據(jù)我們的研究,A 股市場上,常用因子的 Alpha 屬性強于美國市場的因子表現(xiàn),美國市場因子收益大約是 3 年發(fā)生較大回撤,而A 股市場的這一回撤大約是 48 個月,因而我們分別計算了 3 年和 4 年的長期反轉。圖 9 和圖 10 給出了這兩個指標對因子未來 1 個月

23、、3 個月、6 個月和 12 個月的收益相關系數(shù)走勢。圖 9 因子長期反轉(3 年)與因子多空收益相關系數(shù) 圖 10 因子長期反轉(4 年)與因子多空收益相關系數(shù) 資料來源:Wind 資訊、招商證券定量研究團隊整理資料來源:Wind 資訊、招商證券定量研究團隊整理僅從數(shù)據(jù)上來看,在 A 股市場,3 年長期反轉指標與因子收益更多地呈現(xiàn)出正相關性, 而 4 年長期反轉指標則更多地呈現(xiàn)負相關,這和我們之前的推測相符合。以上,我們構建了 4 類(共 8 個)因子擁擠度指標,這些指標背后都具有一定的經(jīng)濟學邏輯支撐,用這些指標能在一定程度上反映因子的擁擠程度,而且在數(shù)據(jù)可獲得性上要顯著優(yōu)于其他類型的指標。

24、在美國市場,還有一些指標被用來刻畫因子擁擠度,比如能代表某個因子的一組股票的做空成本,但是由于在 A 股市場上,做空的成本要顯著大于美國市場,做空行為在 A 股市場上并不流行,因而該類型指標在 A 股市場上的應用也有較大的局限性。所以在本篇報告中,沒有借鑒美國市場上的這類指標。下文中,我們將用這些指標嘗試對單因子和多因子模型進行擇時。機器學習算法對單因子多空收益進行擇時我們將計算得到的 8 個因子擁擠度指標作為特征變量,來預測單因子多空組合在未來一周的收益方向,分別嘗試XGBoost 和 LSTM 兩種不同的機器學習算法進行預測。XGBoost 算法預測單因子收益XGBoost(Extreme

25、 Gradient Boosting)是一種非常有效的機器學習方法,也是時下比較前沿的機器學習算法之一。XGBoost 的一個顯著特征是其在很多應用場景下的可擴展性。我們認為它或許可以應用于對因子下期方向的判斷。相較于其他機器學習算法,XGBoost 對于金融數(shù)據(jù)分析的優(yōu)勢主要有三點:首先,該算法處理數(shù)據(jù)非常高效,在單臺機器上的運行速度比現(xiàn)有流行解決方案快十倍以上,這對于處理海量的行情數(shù)據(jù)尤其重要。再者,該算法擅長處理稀疏矩陣(稀疏數(shù)據(jù)),即存在大量缺失值的數(shù)據(jù)。第三,XGBoost 可以學習特征之間更高級別的相互關系。因子擁擠度和因子收益之間的關系很可能并不是線性的,而是比線性關系更復雜的存

26、在。因而需要用 XGBoost 對更高級別關系進行探索和學習,往往可以更加吻合特征變量之間真實的、更高級別的關系。XGBoost 是一個樹集成算法(Tree Ensemble Model)。對于一個有個樣本、個特征的數(shù)據(jù)集, , (| , , , ),樹集成模型會用個可加的函數(shù)來預測結果: 圖 11 XGBoost 算法示意圖資料來源:Chen, Tianqi, and Carlos Guestrin. Xgboost: A scalable treeboosting system. Proceedings of the 22nd acm sigkdd international confer

27、ence on knowledge discovery and data mining. ACM, 2016、招商證券定量研究團隊整理表 4:XGBoost 超參數(shù)設置表參數(shù)名稱取值釋義max_depth3樹的最大深度。樹越深通常模型越復雜,更容易過擬合。learning_rate0.1學習率或收縮因子。學習率和迭代次數(shù)弱分類器數(shù)目 n_estimators 相關。n_estimators100弱分類器數(shù)目。gamma0節(jié)點分裂所需的最小損失函數(shù)下降值。min_child_weight1葉子結點需要的最小樣本權重和。subsample1構造每棵樹的所用樣本比例(樣本采樣比例),同 GBM。參數(shù)

28、名稱取值釋義colsample_bytree1構造每棵樹的所用特征比例。colsample_bylevel1樹在每層每個分裂的所用特征比例。reg_lambda1L2 正則的懲罰系數(shù)。資料來源:招商證券定量研究團隊整理和其他機器學習的模型一樣,XGBoost 也有較多的超參數(shù)需要設置,我們給出了我們的模型中超參數(shù)的設置方案,總體來說,我們在超參數(shù)的設置上盡量控制模型的復雜度, 因為我們能使用的樣本量有限,若模型的復雜度過高,不利于模型的準確性和泛化能力。特征變量和標簽數(shù)據(jù)處理輸入的特征變量數(shù)據(jù)是 2005 年 1 月到 2019 年 11 月的周頻數(shù)據(jù),共 755 個樣本。標簽(被解釋變量)為

29、下一周的因子多空組合收益方向,收益為正取 1,否則取 0。進行了數(shù)據(jù)歸一化處理(XGBoost 算法在進行樹分裂的時候,依據(jù)的是數(shù)據(jù)的排序,因而是否對輸入的特征變量數(shù)據(jù)進行歸一化基本沒有影響。)按時間序列對樣本數(shù)據(jù)進行排序,取前 80%的數(shù)據(jù)作為訓練集,后 20%的數(shù)據(jù)作為測試集。預測結果評估表 5:XGBoost 模型預測結果評價表因子名稱模型預測準確性做多策略準確性成長60.54%63.53%市值40.70%58.75%反轉64.00%67.24%情緒69.01%72.81%交易行為82.76%84.08%價值46.43%62.86%資料來源:Wind 資訊、招商證券定量研究團隊整理我們考

30、察了 XGBoost 算法在測試集中的準確性,對于成長因子、反轉因子、情緒因子和交易行為因子的預測準確性均在 60%以上,但是 XGBoost 的預測效果仍然不太理想。因為若我們不進行擇時,每期都堅持做多,則勝率會高于 XGBoost 模型預測的勝率, 交易行為因子的勝率甚至高達 84.08%。LSTM 算法預測單因子收益LSTM 即長短期記憶網(wǎng)絡(Long Short-Term Memory),是一種時間循環(huán)神經(jīng)網(wǎng)絡(RNN),循環(huán)神經(jīng)網(wǎng)絡適合于處理和預測時間序列問題。LSTM 是在原有的 RNN 的神經(jīng)網(wǎng)絡上進行了神經(jīng)元結構改造,在每個神經(jīng)元中引入了三個“門”,分別叫做輸入門、遺忘門和輸出

31、門,用于數(shù)據(jù)的篩選和保留。一般的神經(jīng)網(wǎng)絡不具備像人一樣的思維延續(xù)性。為了能使機器像人一樣連續(xù)思考,科學家在原有的前饋神經(jīng)網(wǎng)絡中加入了內(nèi)部反饋鏈接,RNN 應運而生,是專門用于處理時間序列問題的神經(jīng)網(wǎng)絡。但是 RNN 在剛出現(xiàn)的時候是難以被訓練的,存在“梯度爆炸”(Exploding Gradients)和“梯度消失”(Vanishing Gradient)的問題。這兩個問題導致 RNN 在剛出現(xiàn)的時候難以訓練。為了解決上述問題,于是又發(fā)明了 LSTM,LSTM 較好的處理了“梯度爆炸”和“梯度消失”的問題。圖 12 LSTM 網(wǎng)絡神經(jīng)元示意圖資料來源:維基百科、招商證券金融工程組整理神經(jīng)網(wǎng)絡結

32、構圖 13 LSTM 網(wǎng)絡結構圖資料來源:招商證券定量研究團隊整理我們構建的神經(jīng)網(wǎng)絡的結構為 3 層,第 1 層和第 2 層為 LSTM 層,用于對特征數(shù)據(jù)和標簽進行學習,并在測試集中對標簽數(shù)據(jù)進行預測,第 3 層是全連接層,這層對數(shù)據(jù)進行整理,通過 sigmoid 函數(shù)輸出最后我們需要的方向信號數(shù)據(jù)。特征變量為我們計算的8 個擁擠度指標和 1 個標簽的一階滯后項,回看周期為 3 期,學習率設置為 0.0005, 迭代次數(shù)(epochs)設置為 15。特征變量和標簽數(shù)據(jù)處理輸入的特征變量數(shù)據(jù)是 2005 年 1 月到 2019 年 11 月的周頻數(shù)據(jù),共 755 個樣本。標簽(被解釋變量)為下

33、一周的因子多空組合收益方向,收益為正取 1,否則取 0。進行了數(shù)據(jù)歸一化處理。按時間序列對樣本數(shù)據(jù)進行排序,取前 80%的數(shù)據(jù)作為訓練集,后 20%的數(shù)據(jù)作為測試集。預測結果評估表 6:LSTM 模型預測結果評價表因子名稱模型預測準確性做多策略準確性成長63.53%63.53%市值58.75%58.75%反轉67.24%67.24%情緒72.81%72.81%交易行為84.08%84.08%價值62.86%62.86%資料來源:Wind 資訊、招商證券定量研究團隊整理十分湊巧的是,我們發(fā)現(xiàn)模型預測準確性簡單做多策略的準確性是一致的,為了弄清楚其中的原因,我們查看了模型中間過程的計算結果:圖 1

34、4 LSTM 中間過程預測結果資料來源:Wind 資訊、招商證券定量研究團隊整理上圖中,藍色折表示的是經(jīng)過第二層 LSTM 層輸出的預測值,盡管預測值有變動,但是由于始終大于 0.5,因而經(jīng)過第三層的 sigmoid 函數(shù)之后,輸出的是接近 1 的值,也就是說模型始終給出做多的投資建議,這也就是模型預測準確性與多頭策略的準確性是一致的原因。綜上,LSTM 算法也未能在因子擁擠度指標中,學習到有利于單因子收益方向判斷的增量信息。既然在單因子多空收益預測上,因子擁擠度指標的應用并不是很理想,我們轉變思路,看能否在多因子組合上,獲得擇時方面的增量信息,取得一些超額收益。利用合成指標對多因子模型進行擇

35、時我們對這 8 個擁擠度指標按不同的因子,進行了相關系數(shù)計算和展示。圖 15 成長因子各擁擠度指標兩兩相關系數(shù)資料來源:Wind 資訊、招商證券定量研究團隊整理圖 16 市值因子各擁擠度指標兩兩相關系數(shù)資料來源:Wind 資訊、招商證券定量研究團隊整理圖 17 反轉因子各擁擠度指標兩兩相關系數(shù)資料來源:Wind 資訊、招商證券定量研究團隊整理圖 18 情緒因子各擁擠度指標兩兩相關系數(shù)資料來源:Wind 資訊、招商證券定量研究團隊整理圖 19 交易行為因子各擁擠度指標兩兩相關系數(shù)資料來源:Wind 資訊、招商證券定量研究團隊整理圖 20 價值因子各擁擠度指標兩兩相關系數(shù)資料來源:Wind 資訊、

36、招商證券定量研究團隊整理對于不同的因子,這些指標的相關系數(shù)有差異,但是總體而言,比較顯著的特征是同一類型指標的相關系數(shù)較高,比如因子長期反轉(3 年)和因子長期反轉(4 年)指標。而其中一個比較顯著的特例是配對相關性指標和多空組合因子波動指標有比較顯著的負相關關系。在 A 股市場上,部分擁擠度指標存在自相矛盾的情況。鑒于部分指標的相關系數(shù)絕對值偏高,我們用主成分分析法(PCA)分析每個指標貢獻的方差,保留能貢獻較大方差的指標,同時利用因子旋轉降維、組合合成指標,具體方法如下:利用因子旋轉將 8 個指標降維成 3 個指標(考慮到前 3 個因子的方差貢獻顯著高于其他因子);將降維得到的 3 個指標

37、等權組合,合成一個因子擁擠度指標。圖 21 成長因子多空凈值與擁擠度合成指標圖 22 市值因子多空凈值與擁擠度合成指標 資料來源:Wind 資訊、招商證券定量研究團隊整理資料來源:Wind 資訊、招商證券定量研究團隊整理圖 23 反轉因子多空凈值與擁擠度合成指標圖 24 情緒因子多空凈值與擁擠度合成指標 資料來源:Wind 資訊、招商證券定量研究團隊整理資料來源:Wind 資訊、招商證券定量研究團隊整理圖 25 交易行為因子多空凈值與擁擠度合成指標 圖 26 價值因子多空凈值與擁擠度合成指標 資料來源:Wind 資訊、招商證券定量研究團隊整理資料來源:Wind 資訊、招商證券定量研究團隊整理圖

38、 21 至圖 26 中,紅色折線為因子擁擠度合成指標的走勢,黃色折線則代表因子多空累積收益。從上圖看,由于以量價指標計算的因子(比如情緒因子和交易行為因子)有很強的 Alpha 屬性,在過去的觀測期中很少出現(xiàn)明顯的回撤,因而因子擁擠度指標對于這些因子的風險指示作用并不顯著。相對而言,對市值因子的尾部風險指示作用更為明顯一些。由于市值因子在 2009 年至 2016 年底這段時間里有很穩(wěn)定的正向收益,小市值的股票走勢長期好于大市值股票,而且一般股票在市值因子上的暴露度波動不會很大,市值因子在該期間是十分受追捧。因子擁擠度合成指標顯示,在 2013 年至 2016 年,市值因子的擁擠度快速上升,在

39、 2016 年底達到頂峰之后,市值因子發(fā)生了較大回撤,藍籌股和大市值股票的收益要好于小市值股票,因子擁擠度指標也幾乎在同時發(fā)生下降。2018 年以來,市值因子的收益方向始終維持在震蕩走勢,因子擁擠度指標也處于歷史低位。然而總體而言,在 A 股市場上,因子擁擠度指標的指示作用弱于國外市場。我們猜測一個可能的原因是,A 股市場的投資者結構中個人投資者居多,個人投資者在交易的時候很難形成同一方向的合力,因而在某些時段從合成指標上看因子擁擠度較高,但是即使在最高處,可能也遠遠沒有達到這些常用因子的資金容量上限,不足以使因子發(fā)生尾部風險事件。因而在A 股市場,因子擁擠度指標的指示作用并不顯著。多因子加權

40、組合構建盡管因子擁擠度能在一定程度上提示因子的尾部風險,但是在大部分情況下是呈現(xiàn)正相關的,而不是邏輯直覺上的負相關關系。因此,我們可以構建以因子擁擠度指標加權的多因子組合,具體做法如下:滾動觀測因子擁擠度指標,計算當前因子擁擠度指標在過去 3 年中的分位數(shù)。以分位數(shù)作為因子加權權重,月頻調(diào)倉構建多因子組合。模型只對基本面類因子(價值、市值、成長)進行擇時,對 Alpha 屬性較強的量價類因子依然是等權配置,持續(xù)做多。以等權多因子組合的多空凈值為對標基準,因子擁擠度加權組合凈值走勢如圖 27 所示:圖 27 擁擠度加權組合與等權組合凈值走勢資料來源:Wind 資訊、招商證券定量研究團隊整理圖 2

41、7 中,黃色折線是因子的等權組合凈值走勢線,等權組合常被用來當做比較的基準。紅色折線是根據(jù)因子擁擠度指標進行加權后的多因子組合凈值走勢。自 2015 年以來, 因子的加權組合小幅戰(zhàn)勝了等權組合??偨Y由于過多的資金追逐同一資產(chǎn)可能會引發(fā)尾部風險,因而國外十分重視對于因子擁擠度研究。國外的研究認為因子擁擠度指標本身并非一個因子收益的負向指標,因為必須有資金流入才能推動因子有優(yōu)秀的收益表現(xiàn)。只有在某個時期有過多的資金聚集在某個因子上的時候,才會使得因子過于擁擠。在國外研究的基礎上,我們試圖探索因子擁擠度指標是否能在國內(nèi)市場上對因子進行有效擇時。我們繼而構建了 4 種描述因子擁擠度的相對值指標,分別是估值價差、配對相關性、因子波動率、因子長期反轉。在 A 股市場,因子擁擠度指標對跟因子的多空收益相關性并不單調(diào)。我們分別利用了兩種機器學習方法(XGBoost 和 LSTM)基于因子擁擠度指標對單因子進行擇時,但是由于國內(nèi)的因子 alpha 屬性很顯著,在單因子層面并沒有獲得良好的擇時效果。我們隨后用主成分分析法降維合成因子擁擠度單一指標,并以該指標加權構建多因子組合,組合凈值線小幅戰(zhàn)勝等權的多因子組合??傮w而言,A 股市場的因子擁擠度有一定的尾部風險警示作用,但是持續(xù)用于因子的擇時效果并不顯著。我們猜測一個可能的原因是,A 股市場的投資者結構中個人投資者居

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論