HIST模型:基于SAM產(chǎn)業(yè)鏈的策略研究及因子挖掘_第1頁
HIST模型:基于SAM產(chǎn)業(yè)鏈的策略研究及因子挖掘_第2頁
HIST模型:基于SAM產(chǎn)業(yè)鏈的策略研究及因子挖掘_第3頁
HIST模型:基于SAM產(chǎn)業(yè)鏈的策略研究及因子挖掘_第4頁
HIST模型:基于SAM產(chǎn)業(yè)鏈的策略研究及因子挖掘_第5頁
已閱讀5頁,還剩25頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

11將行業(yè)分類作為預(yù)定義概念的HIST模型作為對照組,每只股票只對應(yīng)一個預(yù)定義概念。在實(shí)測時加念的共有信息pred_is]、股票特質(zhì)信息因子[股票22于大家熟悉的概念板塊,公司的所屬行業(yè)、主營業(yè)務(wù)、經(jīng)營范圍等都可以算作“概作者將股票特征所包含的信息分割成了3部分:來自預(yù)定義概念的33本次實(shí)證分析將采用SAM產(chǎn)業(yè)鏈中的產(chǎn)品節(jié)點(diǎn)作為預(yù)定義概念,SAM產(chǎn)業(yè)鏈中的每個產(chǎn)品節(jié)點(diǎn)本次研究將結(jié)合產(chǎn)品節(jié)點(diǎn)和業(yè)務(wù)營收數(shù)據(jù),取“相同營業(yè)收入下最細(xì)層級的產(chǎn)品”作為預(yù)定義概念。以下圖的比亞迪為例,比亞迪所屬的預(yù)定義概念有:汽車制造、手機(jī)零件、二元電池。(注:由此可知,一只股票會同時屬于多個預(yù)定義概念,而且預(yù)定義概念會隨著公司披露的主營產(chǎn)品的經(jīng)統(tǒng)計(jì)可知,滬深300成分股中,所屬預(yù)定義概念數(shù)>=2的占比高達(dá)95.5%,所屬預(yù)定義概念預(yù)定義概念采用的是上面【數(shù)據(jù)介紹】部分提到公司主營業(yè)務(wù)分項(xiàng)數(shù)據(jù),由于主營業(yè)務(wù)大部分來44sec_code、第三層為產(chǎn)品代碼product,取值為concept=1),這樣存的好處在于剔除了缺失產(chǎn)品的數(shù)據(jù),在模型訓(xùn)練的過程中,再提取每個交易日對應(yīng)的defget_stock2concept_matrix_dt(stock2concept_matrix,indexdt=index.get_level_valuesstock_code=index.get_lestock2concept_matrix_dt=stock2concept_matrix.loc[dt[0]].unstack().reindex(streturnstock2concept_ma55利用get_stock2concept_matrix_dt函數(shù)就后的概念表征進(jìn)行修正,進(jìn)而解決“預(yù)定義概念的信息缺失”和“預(yù)定義概念的信息過剩b)計(jì)算股票剩余表征與初始化的隱含概念表征之間的cos相似4.構(gòu)建股票特質(zhì)信息模型(Individualinformationmodule主要用于生成股票特征中66def__init__(self,d_feat=6,hidden_size=64,num_layers=2,dropout=0.0,base_model="GRU",K=3):)self.fc_es=nn.Linear(hidden_size,hidden_size)#構(gòu)建全連接層,in_features輸入的特征數(shù)和輸出的特征數(shù)都為torch.nn.init.xavier_uniform_(self.fc_es.weigtorch.nn.init.xavier_uniform_(self.fself.fc_es_fore=nn.Linear(hidtorch.nn.init.xavier_uniform_(self.fc_eself.fcisfore=nn.torch.nn.init.xavier_uniform_(self.fcisself.fc_es_back=nn.Linear(torch.nn.init.xavier_uniform_(self.fc_esself.fcisback=nn.Lineartorch.nn.init.xavier_uniform_(self.fcisself.fc_indi=nn.Litorch.nn.init.xavier_uniform_(self.f77defcal_cos_similarity(self,x,y):#the2nddimcos_similarity=xy/x_norm.mm(tcos_similarity[cos_similarity!=cos_similarity]=0#令無法進(jìn)行除法的取值為0returncos_similaritydefforward(self,x,concept_matrix,mdevice='cuda:0'iftorch.cuda.is_amarket_value_matrix=market_value.reshape(market_value.shape[0]stock_to_concept_sum=torch.sum(stock_to_concept,0).reshape(1,88stock_to_concept_sum=stock_to_cstock_to_concept.shape[1stock_to_concept=stock_to_concept/stochidden=torch.t(stockhidden=hidden[hiddstock_to_concept=cal_cos_similarity(x_hid#將stock_to_concept按列進(jìn)行stock_to_concept=self.softmax_s2hidden=torch.t(stock_to#計(jì)算股票原始特征與修正后的概念特征之間的cos相似度,維度concept_to_stock=cal_cos_concept_to_stock=self.se_shared_info=concepe_shared_info=self.fc_output_es=self.fc_es_fpred_es=self.fc_out_念i_stock_to_concept=cal_cos_similarity(i_sh99diag=i_stock_to_concepi_stock_to_concept=i_stock_to_concept*(torch.ones(dim,dim)-torch.eyerow=torch.linspace(0,dim-1,dim).reshape([-1,1]).repeatcolumn=torch.topk(i_smask=torch.zeros([i_stock_to_concept.shape[0],i_stock_to_concept.shape[i_stock_to_concept=i_stock_to_concept*mask#只保留得分i_stock_to_concept=i_stock_to_concept+torch.diag_embed((i_stock_to_concept.sum(0)!=0).float()*dhidden=torch.t(i_shared_infoi_concept_to_stock=self.softmax_t2s(i_concepti_shared_info=i_concept_to_stock.mm(hidden)i_shared_info=selfi_shared_back=self.fcispred_is=self.fc_out_iindividual_info=x_hidden-e_shared_bapred_indi=self.fc_out_inreturnpred_all,pred_es,pred_is,fromqlib.contrib.evaluateimportbackfromqlib.contrib.evaluateimportrisfromqlib.contrib.strategyimportTopkDro}}strategy=TopkDropoutStratereport_normal,positions_normal=backtest_daily(start_time='2021-01-01',end_time='2022-03-23analysis["excess_return_without_cost"]=risk_analysis(report_normal["return"]-analysis["excess_return_with_cost"]=risk_analysis(report_normal["return"]-report_normal["bench"]-analysis_df=pd.concat(analysis)#type:print(analysis_df)息分解成了3部分:來自預(yù)定義概念的共有股票自身特有的特質(zhì)信息(pred_indi),最終綜合這3部分信息(pred)來共同預(yù)測股價未來趨勢。為了測試不同持倉期下的因子表現(xiàn),我們變更了label對模型重新進(jìn)行了訓(xùn)模型預(yù)測值綜合了預(yù)定義概念、隱含概念、股票特質(zhì)這3方面的信息,可以看作是“在股票原有綜合特征基礎(chǔ)上嵌入了股票間共有概念圖網(wǎng)絡(luò)信息”后的股票綜合特征,進(jìn)一步的可以將其看作是一3.長期持倉的因子有效性優(yōu)于短期持倉的因子有效性,可能是由于股票所屬概念變動的頻率本身就20因子存在一定的正向單調(diào)性。pred_is勢,中間可能存在些許聯(lián)系。比如1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論