版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一、簡介投資者情緒能夠幫助研究者理解并預(yù)測金融市場活動,為此研究者們一直在探索度量投資者情緒的不同方法。較多研究從新聞文本中提取投資者情緒信息,但信息化時代下愈發(fā)流行的照片化新聞報道傳達(dá)著更為直接的信息,因此如何從新聞?wù)掌刑崛⊥顿Y者情緒信息成為學(xué)界的熱點問題。既有文獻(xiàn)嘗試從新聞?wù)掌腥斯ぬ崛⊥顿Y者情緒信息,然而受限于人工判定照片情緒的高額成本與主觀性,這一方法處理的樣本量通常較小且可能存在偏誤。為此,由 Khaled Obaid 與Kuntara Pukthuanthong 兩位學(xué)者合作撰寫并發(fā)表在 Journal of Financial Economics 的論文“A Picture i
2、s Worth a Thousand Words: Measuring Investor Sentiment by Combining Machine Learning and Photos from News”使用機器學(xué)習(xí)對新聞?wù)掌M(jìn)行分類,構(gòu)建出照片悲觀指數(shù)來預(yù)測美國金融市場活動,并創(chuàng)新性地對照片悲觀指數(shù)與文本悲觀指數(shù)進(jìn)行了比較。首先,作者介紹了構(gòu)建照片悲觀指數(shù)與文本悲觀指數(shù)的技術(shù)細(xì)節(jié)。模型方面,卷積神經(jīng)網(wǎng)絡(luò)技術(shù)(Convolutional Neural Networks)中的 Google Inception v3 模型能夠非常好地對照片進(jìn)行分類,因此被廣泛地應(yīng)用于實踐與研究。作者使用該
3、模型通過分析新聞?wù)掌膶ο蟆⑸始懊娌勘砬閷⒄掌譃闃酚^情緒組與悲觀情緒組。在變量構(gòu)建方面,作者將照片悲觀指數(shù)定義為每天新聞?wù)掌斜荒P头譃楸^情緒組的比例,文本悲觀指數(shù)則通過文本分析方法對新聞標(biāo)題與摘要的悲觀情緒進(jìn)行評估得到。其次,作者對照片悲觀指數(shù)預(yù)測金融市場活動的能力進(jìn)行評估。金融工程模型預(yù)測在市場悲觀情緒上升時金融市場回報會迅速下降并在周內(nèi)剩余交易日回升至正常水平。在金融市場交易量方面,作者發(fā)現(xiàn)紐交所交易量在照片悲觀指數(shù)波動時增加,表明照片悲觀指數(shù)影響投資者情緒而非交易成本的增加。為分析套利限制對照片悲觀指數(shù)影響幅度的作用,作者將資產(chǎn)組合根據(jù)特質(zhì)波動率(Idiosyncratic Vo
4、latility)與公司規(guī)模進(jìn)行分類。異質(zhì)性分析表明照片悲觀指數(shù)對金融市場回報的影響幅度在資產(chǎn)組合具有更高特質(zhì)波動率或公司規(guī)模更小時更大,表明照片悲觀指數(shù)對難以套利的資產(chǎn)組合有更大影響。隨后,為顯示從新聞?wù)掌刑崛⊥顿Y者情緒信息的優(yōu)勢,作者對照片悲觀指數(shù)與文本悲觀指數(shù)進(jìn)行了比較。結(jié)果表明新聞文本除投資者情緒信息外還傳達(dá)出反映金融市場活動的基本信息。照片悲觀指數(shù)影響金融市場回報的系數(shù)在恐慌時期約是平時的數(shù)倍,而文本悲觀指數(shù)在恐慌時期的系數(shù)與平時類似,表明照片在傳達(dá)恐慌情緒時較文本更為有效。進(jìn)一步的分析表明,新聞?wù)掌c新聞文本包含的悲觀情緒的作用相互替代,即照片悲觀指數(shù)變動導(dǎo)致的金融市場回報下降幅
5、度在文本悲觀指數(shù)處于高水平時較小。本文創(chuàng)新性地利用機器學(xué)習(xí)分析新聞?wù)掌瑯?gòu)建出了照片悲觀指數(shù),該指數(shù)能夠很好地預(yù)測金融市場活動。未來研究者應(yīng)該繼續(xù)發(fā)展照片分類的機器學(xué)習(xí)技術(shù)以捕捉新聞?wù)掌刑N含的信息。二、數(shù)據(jù)選取本章首先討論了計算的方法。其次,討論了選擇 Getty Images 作為照片數(shù)據(jù)來源的原因,以及篩選照片樣 本的方法。第三,對進(jìn)行了描述性統(tǒng)計,分析其與其他投資者情緒指標(biāo)的關(guān)系。1、照片分類文章使用 CNN 模型中的 Google Inception v3 對新聞?wù)掌M(jìn)行分類,通過使用預(yù)先訓(xùn)練好的Google Inception v3 模型(用 ImageNet 數(shù)據(jù)集訓(xùn)練)并進(jìn)行轉(zhuǎn)移
6、學(xué)習(xí)(用二分類問題的新層替換原來的全連接層)使其適用于本文的問題,轉(zhuǎn)移學(xué)習(xí)可以利用預(yù)先訓(xùn)練好的模型中的已有知識,簡化模型構(gòu)建。使用DeepSent 數(shù)據(jù)集進(jìn)行轉(zhuǎn)移學(xué)習(xí),DeepSent 數(shù)據(jù)集的主要優(yōu)點是通過人工任務(wù)網(wǎng)站(MTurk)驗證情緒標(biāo)簽,確保標(biāo)簽準(zhǔn)確性。為提高可靠性,文章使用了所有 5 名 MTurk 調(diào)查參與者在情緒標(biāo)簽(干凈標(biāo)簽)上達(dá)成一致的照片,該條件限制將訓(xùn)練樣本減少到 882 張照片。模型學(xué)習(xí)率設(shè)為 0.01,步驟設(shè)為 5000 步,測試容量為 100 張。保留 10%的訓(xùn)練照片作為驗證集,10%作為測試集。訓(xùn)練集是用來調(diào)整最后全連接層中的權(quán)重,驗證集用來降低模型訓(xùn)練中的過
7、擬合,另外還使用增強算法擴大訓(xùn)練集,并應(yīng)用正則化算法降低過擬合。測試集用來檢驗?zāi)P偷淖罱K準(zhǔn)確率。DeepSent 訓(xùn)練集中的照片可能與Getty Images 樣本中的專業(yè)照片不太相似。因此,使用 DeepSent 訓(xùn)練集訓(xùn)練的模型可能無法準(zhǔn)確地對照片進(jìn)行專業(yè)分類。為解決這個問題,文章使用分層抽樣從 Getty Images 樣本中隨機抽取 100張照片,并由 MTurk 的 5 位人士對每張照片進(jìn)行分類。將通過深度學(xué)習(xí)模型獲得的預(yù)測結(jié)果與從 MTurk 收集的分類結(jié)果進(jìn)行比較,可以得到如下的混淆矩陣:圖 1 混淆矩陣A Picture is Worth a Thousand Words: M
8、easuringInvestor Sentiment by Combining Machine Learning and Photos from混淆矩陣顯示,準(zhǔn)確率為 77.0%,召回率為 77.9%,精確率為 90.9%,F(xiàn)1 為 83.9%,可見使用 DeepSent 訓(xùn)練集訓(xùn)練的模型對 Getty Images 數(shù)據(jù)集進(jìn)行分類方面表現(xiàn)良好。2、Getty Images作者在 1926 年 1 月至 2018 年 6 月間的每天從 Getty Images Editorial News 收集照片,關(guān)注編輯新聞部分有助于避免包括創(chuàng)造性或藝術(shù)性的照片、體育賽事照片、名人集會、時裝秀和股票照片。
9、Getty Images 數(shù)據(jù)庫包含為 Getty Images 工作的攝影師拍攝的照片,以及為各種新聞媒體工作的攝影記者拍攝的照片,如彭博、洛杉磯時報和華盛頓郵報等。在時間方面,Getty Images 數(shù)據(jù)庫中的照片最早在事件發(fā)生后幾分鐘內(nèi)發(fā)布;而傳統(tǒng)的印刷新聞(如華爾街日報)的滯后時間更長,因為要為編輯和印刷過程留出時間。作者按受歡迎程度對照片進(jìn)行排序,每天下載 20 張最受歡迎的照片,受歡迎程度考察購買歷史和查看次數(shù)。理想情況下,會根據(jù)受歡迎程度分布選擇照片,而不是等級。在 1.4 節(jié)中,使用了基于給定月份受歡迎程度等級分布前 5%的替代樣本選擇標(biāo)準(zhǔn),優(yōu)點是重點關(guān)注最有影響力的照片,,
10、缺點是不是每天都有照片數(shù)據(jù),因為某些天可能沒有符合受歡迎程度前 5%的照片。為了過濾掉不重要或不相關(guān)的照片,對照片樣本應(yīng)用兩個過濾器。首先,要求每天至少有 15 張照片可用,因為可能有幾天的照片比較少,而這幾天沒有什么重要事件或與金融市場沒有明顯的聯(lián)系,要求每天有至少 15 張照片有助于只包括有重要事件的日期。其次,根據(jù) Loughran 和 McDonald(2011)詞典,要求照片描述包含至少一個表示否定或肯定的單詞,該過濾器刪除了非英文描述的照片,也有助于增加照片與金融市場相關(guān)的概率??偟膩碚f,經(jīng)過篩選后,分別有有 220,136 張(前 20 張)、169,886 張(前 15 張)和
11、 74,044 張(前 10 張)合格照片,下表總結(jié)了每一步篩選過程后的照片數(shù)量:圖 2 過濾后的照片樣本數(shù)量A Picture is Worth a Thousand Words: Measuring Investor Sentiment byCombining Machine Learning and Photos from News對于文章中的主要檢驗,作者使用了經(jīng)過干凈標(biāo)簽數(shù)據(jù)(5/5 的調(diào)查參與者一致同意的情緒標(biāo)簽)訓(xùn)練的模型,但對于穩(wěn)健性測試,作者還使用了用噪聲標(biāo)簽數(shù)據(jù)(至少 4/5 的調(diào)查參與者一致同意的標(biāo)簽)訓(xùn)練的模型結(jié)果。選擇使用清潔標(biāo)簽數(shù)據(jù)訓(xùn)練的照片分類模型的原因是,清潔標(biāo)
12、簽數(shù)據(jù)有助于模型達(dá)到較高的測試精度,預(yù)測結(jié)果更加可靠。3、變量構(gòu)建文章的主要變量定義為最受歡迎的前 10 張照片中預(yù)測為悲觀的照片的比例。在文章最后,作者也展示了如果包括最受歡迎的前 15 位或前 20 位照片,文章主要結(jié)論依然成立。作者根據(jù)照片的受歡迎程度來進(jìn)行賦權(quán)(即1 ),加權(quán)的目的為了給予更受歡迎的照片更高的權(quán)重,因為這些照片更有可能包含引起更大市場關(guān)注的事件。第 t 天的計算方法如下: ( 1), = 1 其中是樣本預(yù)測為悲觀的指示變量,分母是樣本權(quán)重之和,每天照片樣本的數(shù)量最大為 10 張。文本悲觀()是基于照片描述中悲觀與樂觀單詞數(shù)量差除以總單詞數(shù)的平均值構(gòu)建的,并通過照片的受歡
13、迎程 度等級來加權(quán),的計算方法如下:) ( 1 = 1, 其中為悲觀單詞數(shù)量,為樂觀單詞數(shù)量, 為照片描述的總單詞數(shù)。作者使用 Loughran 和 McDonald(2011) 詞典將單詞分類為悲觀或樂觀。Loughran 和 McDonald(2011)認(rèn)為,使用來自其他學(xué)科的詞表來判斷文本的語氣會在金融市場問題中導(dǎo)致重大錯誤。例如,哈佛社會心理學(xué)詞典中將“稅收”和“成本”這樣的單詞歸類為悲觀,但在財務(wù)背景下,這些單詞只是在描述公司的正常運作。三、實證分析行為金融學(xué)理論暗含兩個假設(shè):第一,一些投資者是非理性的,能夠影響價格(De Long 等,1990a),外推(Tversky和 Kahn
14、eman,1983)和過度自信(Fischhoff、Slovic 和 Lichtenstein,1977)等偏倚可能導(dǎo)致非理性投資者增加風(fēng)險偏好和投資需求,將價格抬高到遠(yuǎn)離基本面的位置;第二,套利限制使理性投資者無法迅速糾正價格偏離的情況(Pontiff,1996;Shleifer 和 Vishny,1997)。因而,當(dāng)樂觀(悲觀)情緒飆升時,非理性投資者將增加(減少)風(fēng)險偏好和投資需求,推動價格遠(yuǎn)離基本面。行為金融學(xué)模型預(yù)測,這種需求的增加(減少)將導(dǎo)致更高(更低)的回報,隨著時間推移,市場糾正資產(chǎn)價格到正常水平,回報將發(fā)生反轉(zhuǎn)。1、照片和文字中的新聞情緒首先,照片中的悲觀情緒預(yù)示著與行為金
15、融學(xué)模型預(yù)測相一致的市場回報反轉(zhuǎn)(De Long 等人,1990a)。其次,作者發(fā)現(xiàn)照片中的悲觀情緒是文本中悲觀情緒的補充。第三,作者探索了與文本相比,哪些新聞內(nèi)容能夠更有效地通過照片傳達(dá)。第四,作者發(fā)現(xiàn)在包含有影響力的照片的日子里,照片的悲觀情緒包含了文本的悲觀情緒。第五,作者構(gòu)建了三種交易策略,以突出分析新聞?wù)掌膬?yōu)勢。、PhotoPes 對市場回報的影響在驗證模型預(yù)測之前,作者進(jìn)行了一些匯總統(tǒng)計,對兩個市場指數(shù)進(jìn)行時間序列回歸來評估指數(shù)表現(xiàn)以及在回歸中需要控制什么。下表分別列示了簡單平均(EWRETD)和市值加權(quán)平均(VWRETD)的 CRSP 指數(shù)收益的樣本統(tǒng)計量, Panel A 顯
16、示 1926 年 1 月至 2018 年 6 月間,VWRETD 平均日收益為 3.6bp,日均標(biāo)準(zhǔn)差為 106.3bp。在 Panel C中,對于EWRETD,作者也得出了相似的結(jié)論,平均日收益為 7.1bp,日均波動率為 104.4bp。圖 3 簡單平均和加權(quán)平均的市場回報的樣本統(tǒng)計量(Panel A)A Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining MachineLearning and Photos from News圖 4 簡單平均和加權(quán)平均的市場回報的樣本統(tǒng)計量(Panel
17、C)A Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining MachineLearning and Photos from NewsPanel B 和Panel D 展示了如下時間序列回歸的結(jié)果: = () + + ,其中表示VWRETD(Panel B)和EWRETD(Panel D)的對數(shù)日收益,表示 s 期滯后算子(設(shè)定 s=5),是 一組包含截距的外生變量。VWRETD 和 EWRETD 收益都表現(xiàn)出顯著的自相關(guān),而 EWRETD 自相關(guān)性更強。作者還發(fā)現(xiàn)星期一的回報明顯低于一周中的其
18、他日子。圖 5 簡單平均和加權(quán)平均的市場回報的樣本統(tǒng)計量(Panel B)A Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining MachineLearning and Photos from News圖 6 簡單平均和加權(quán)平均的市場回報的樣本統(tǒng)計量(Panel D)A Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining MachineLearning and Photos from News
19、下面幾張表展示了市場回報對和控制變量做回歸的結(jié)果,帶有 White-t 統(tǒng)計量的模型如下: = 1 + 2() + 3() + 4(2) + 5 + ,其中表示VWRETD 和 EWRETD 下的對數(shù)日收益,是 t 日最受歡迎的照片中預(yù)測為悲觀的數(shù)量占比, 表示 s 期滯后算子(設(shè)定 s=5),是一組包含截距的外生變量。在第(1)種情況中,與是顯著負(fù)相關(guān)的,換句話說,悲觀情緒的照片占比越高,市場收益越 低。這個效應(yīng)在經(jīng)濟意義上也是顯著的,一個標(biāo)準(zhǔn)差的變動將導(dǎo)致變動 1.9bp,比 VWRETD 的 日均收益的一半還高??疾斓臏箜?,作者發(fā)現(xiàn)的系數(shù)顯著為正,表明在第三天發(fā)生收益反 轉(zhuǎn),并且收益反
20、轉(zhuǎn)的大小與初始效應(yīng)近乎一致,3一個標(biāo)準(zhǔn)差的變動將導(dǎo)致變動 1.7bp。第(2)種情況與第(1)種情況相似,與顯著負(fù)相關(guān),然而收益反轉(zhuǎn)的情形卻略有不同:1的系數(shù)顯著為正,說明在第二天發(fā)生了反轉(zhuǎn)。3的系數(shù)也顯著為正說明在第三天反轉(zhuǎn)仍持續(xù)。另外,從系數(shù)的總和來看,作者發(fā)現(xiàn) EWRETD 的反轉(zhuǎn)比 VWRETD 更全面。作者不知道照片的具體發(fā)布時間,推測大部分照片是在開市同時也是記者最活躍的時候發(fā)布的。如果一張照片是 t 日閉市后發(fā)布的,作者仍然控制了1變量。實證結(jié)果顯示照片在開市時發(fā)布,由于1顯著為正,市場對照片 信息反應(yīng)非常迅速。第(3)-(6)種情況的結(jié)論與之前較為相似,當(dāng)天發(fā)布的照片與當(dāng)天市場
21、回報呈負(fù)相關(guān),與之后一天的市場回報呈顯著正相關(guān)??傊?,結(jié)果拒絕系數(shù)的總和顯著不為 0 的假設(shè)。如果照片含有新的基本面信息,下跌后將不會有后續(xù)的反 轉(zhuǎn);反之,如果照片含有的信息已經(jīng)充分反映到股票價格上,照片將對收益沒有影響。圖 7 PhotoPes 對市場回報的影響A Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining Machine Learning and Photos from、PhotoPes 和文本中的情緒下面作者對和市場收益的關(guān)系是否能被新聞文本中的情緒解釋進(jìn)行了分析,并做了如下回歸
22、: = 1 + 2 + 3() + 4() + 5() + 6(2) + 7 + ,其中是或,其他變量與之前相同。在控制了新聞文本中的悲觀情緒后,與、仍顯著負(fù)相關(guān),效應(yīng)略微減小,尤其是對于 VWRETD。與相比,的系數(shù)與的系數(shù)顯著不同,然而與沒有顯著不 同。由于不含有與市場回報相關(guān)的信息,后文將用作為新聞文本情緒的代理變量。第(5)和(6)種情況檢驗了對文本情緒信息是否有加強或替代作用。無論控制文本情緒變量與否,的系數(shù)不會發(fā)生太大改變,說明具有額外的解釋力。為了進(jìn)一步說明這個問題,作者引入了和的交互項,結(jié)果顯示交互項的系數(shù)顯著為負(fù),說明照片的悲觀情緒加強了文本中的悲觀情緒,并且交互項的加 強作
23、用是比較強的。由于 Getty Images 中的照片不一定都與金融市場相關(guān),用金融詞典去分析照片描述文字中的情緒可能不是最優(yōu)。作者用哈佛社會心理學(xué)詞典重新計算,記為。在情形(7)和(8)中,的系數(shù)分別是-1.1 和-1.5bp,都不顯著,意味著應(yīng)用非金融詞典進(jìn)行文本分析并無助益。作者應(yīng)用自然語言處理軟件(斯坦福大學(xué)的 CoreNLP 軟件)對照片描述文字進(jìn)行分析,對每句話的情緒打分然后取平均,最后對某天所有照片描述的情緒得分按照受歡迎程度加權(quán)計算。在情形(9)和(10)中,的系數(shù)分別是-0.6bp、0.1bp,都不顯著,說明應(yīng)用更復(fù)雜的文本處理方法并無助益。A Picture is Wort
24、h a Thousand Words: Measuring Investor Sentiment by Combining Machine Learning and Photos fromA Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining Machine Learning and Photos from News、哪些信息能夠更有效地借助照片傳遞?作者嘗試解答哪些信息是新聞?wù)掌軌騻鬟f的而文本不能。有研究表明照片在災(zāi)難性事件上是更好的傳播媒介,作者測試了在災(zāi)難性事件發(fā)生時,市場回報和照片及
25、文本中情緒的關(guān)系是否會變化。作者定義死亡人數(shù)超過 1000 人為災(zāi)難性事件發(fā)生日,考慮災(zāi)難性事件是否發(fā)生進(jìn)行如下回歸: = ()1 + 2() + 3 + 4() + 5 + 6() + 7(2)+ (1 )1 + 2() + 3 + 4() + 5+ 6() + 7(2) + 8 + ,其中是啞變量,當(dāng)災(zāi)難性事件發(fā)生時為 1,否則為 0,其他變量與前文相同。在情形(1)中,作者發(fā)現(xiàn)1是1的 15 倍且是3的 5 倍,說明在災(zāi)難性事件發(fā)生時照片的重要性。情形(2)的結(jié)論也類似。、有影響力的照片作者發(fā)現(xiàn)在具有較高影響力新聞?wù)掌娜兆?,與基線模型結(jié)果相比,與市場回報之間呈現(xiàn)更強的關(guān)系。此 外,在具
26、有較高影響力照片的日子,比文本中的悲觀情緒與市場回報之間的關(guān)系更強。文本中的悲觀情緒及 其與的交互項不顯著,這表明,與文本相比,某些新聞內(nèi)容能更有效地被照片捕獲。、應(yīng)用作者構(gòu)建了三種交易策略,以突出分析新聞?wù)掌膬?yōu)勢。為確保交易策略的回報不受收益動量或日歷效應(yīng)影響,作者將或?qū)蟮氖袌龌貓蠛腿掌趩∽兞炕貧w的殘差分別表示為或。策略要求投資 者每天基于新聞中的悲觀情緒持有道瓊斯工業(yè)平均指數(shù)或國債。第一個策略是基于照片中的新聞悲觀情緒,第二個策略是基于文本中的悲觀情緒,第三個策略涉及文本和照片的悲觀情緒??紤]每日 1 個bp 的交易成本。圖 10 顯示,開始投入 1 美元,在結(jié)束時三個策略分別能夠獲
27、得 255.84、146.44、437.56 美元,年化收益分別為 6.18%、 5.54%、6.80%,基于以及和的策略總回報遠(yuǎn)高于買入并持有的策略。圖 11 展示了采 用而不是的模型結(jié)果,模型表現(xiàn)不佳的原因是交易策略只利用了第二天的反轉(zhuǎn)。圖 10 交易策略表現(xiàn)A Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining Machine Learning and Photos from News圖 11 交易策略表現(xiàn)A Picture is Worth a Thousand Words: Meas
28、uring Investor Sentiment by Combining Machine Learning and Photos from News2、PhotoPes 的穩(wěn)健型檢驗、套利限制下表重點說明了套利限制如何影響與市場回報之間的關(guān)系。糾正市場上的定價錯誤是有風(fēng)險的,定價錯誤 可能需要很長的時間來糾正。De Long 等人(1990a)表示投資者情緒會對最難套利的股票產(chǎn)生最大的影響,而 DAvolio(2002)發(fā)現(xiàn),對于風(fēng)險更大的股票來說,套利風(fēng)險比更安全的股票更大,成本更高。我們基于組合總波動率進(jìn)行分類測試,驗證對難以估值或風(fēng)險更高的股票會產(chǎn)生更大影響,為此作者進(jìn)行如下回歸: =
29、 1 + 2() + 3() + 4(2) + 5 + ,其中是按照過去一個月日均波動率分組的股票平均日收益。圖 12 中情形(1)和情形(5)表明,與所有投資組合呈負(fù)相關(guān),但最高波動組合的統(tǒng)計顯著性高于最低 波動組合。最低和最高波動組合的收益反轉(zhuǎn)均發(fā)生在第二天,因為1上的系數(shù)顯著為正。然而,與最低波 動組合相比,最高波動組合的反轉(zhuǎn)幅度更高??ǚ綑z驗顯示,所有滯后的系數(shù)總和與 0 無顯著差異,表明不包含任何與基本面有關(guān)的新信息。為了檢驗與最低波動股票相比,最高波動股票的情緒對股票回報的影響是否更強,作者對最高和最低波動分位組合 (H-L)的回報差和以及控制變量進(jìn)行了回歸。的系數(shù)在 1%置信水平
30、下顯著為負(fù),且系數(shù)大小具有 經(jīng)濟意義一個標(biāo)準(zhǔn)差的偏離將 H-L 組合的條件平均日收益提高 2.4bp。圖 12 穩(wěn)健型檢驗:PhotoPes 和波動率A Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining Machine Learning and Photos from、不確定性作者研究了照片的悲觀情緒是如何根據(jù)市場的不確定性而變化的。個人投資者會基于不同的情緒(包括不確定性)對信息做出不一樣的反應(yīng)。因此作者推測,在市場高度不確定性的時期,投資者將會更加情緒化。NVIX 是通過對華爾街日報頭版
31、新聞文章進(jìn)行文本分析構(gòu)建的新聞隱含波動率指數(shù)。NVIX 是從所有類型的新聞中提取的,而不僅僅是金融類新聞,它是基于機器學(xué)習(xí)開發(fā)的,并在 1889 年至 2016 年間月頻更新。作者進(jìn)行以下回歸,以區(qū)分在 不同波動率水平對市場回報的影響。 = ()1 + 2() + 3() + 4(2) + (1 )1 + 2()+ 3() + 4(2) + 5 + ,其中是啞變量,當(dāng)波動率水平高于當(dāng)月NVIX 中位數(shù)時為 1,反之為 0,其他變量與之前一致。情形(1)中,1衡量在高隱含波動率時期對市場回報的影響,系數(shù)顯著為負(fù),且比圖 7 中系數(shù)絕對值更大。1衡量在低隱含波動率時期對市場回報的影響,系數(shù)僅 0.
32、1bp 且統(tǒng)計不顯著??疾?和2檢驗是否存在反 轉(zhuǎn)效應(yīng),作者發(fā)現(xiàn)在高隱含波動率時期,在照片發(fā)布后第三天有收益反轉(zhuǎn),但是在低隱含波動率時期并沒有反轉(zhuǎn)現(xiàn)象。情形(2)揭示的結(jié)論類似,總之,在經(jīng)濟意義和統(tǒng)計意義上,在市場高隱含波動率時期對市場回報的影響均更強。圖 13 穩(wěn)健型檢驗:PhotoPes 和總體不確定性A Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining Machine Learning and Photos from News3、PhotoPes 的機制、基于金融新聞的 PhotoPe
33、s本節(jié)目標(biāo)是探索背后是哪種類型的新聞能提供額外的信息。數(shù)據(jù)收集自 1997 年 7 月至 2018 年 3 月期間的1,036 期經(jīng)濟學(xué)人。雖然經(jīng)濟學(xué)人可以追溯到 1843 年,但 1997 年 7 月之前的出版物只有印刷品,舊照片的掃描版將使算法難以正確預(yù)測情緒,因為舊照片的掃描版與數(shù)碼照片的可比性較低。作者共收集 17284 篇文章,其中 8253 篇來自“商業(yè)”部分,988 篇來自“本周商業(yè)”,8043 篇來自“金融和經(jīng)濟”。作者手動檢查所有照片,并刪除圖表和徽標(biāo),這一步將樣本減少到 814 期,其中包含 4939 張符合標(biāo)準(zhǔn)的照片。作者使用干凈模型對照片進(jìn)行分類,以獲得對情緒的預(yù)測。悲
34、觀指數(shù)是 t 日三個部分的所有照片中負(fù)面情緒的平均概率。平均而言,該樣本預(yù)測結(jié)果中 19.66%的照片具有負(fù)面情緒(而 Getty Images 樣本中概率為 30.9%)。為了檢驗經(jīng)濟學(xué)人照片中的悲觀指數(shù)是否與投資者情緒理論一致,作者進(jìn)行了以下回歸: = 1 + 25 + 3() + 4(2) + 5 + ,其中表示i 日(i=t,t+1,(t,t+1)以 VWRETD 或 EWRETD 計算的對數(shù)日均收益。t 日是經(jīng)濟學(xué)人出版的日期(星期五)。作者預(yù)測,與當(dāng)前市場回報呈負(fù)相關(guān),與未來市場回報呈正相 關(guān)。如果在經(jīng)濟學(xué)人出版后的第二天發(fā)生反轉(zhuǎn),則 與 t 日和 t+1 日間的累積市場回報無關(guān)。
35、圖 14 中 結(jié)果顯示,第一天的市場跌幅在出版的第二天就被完全反轉(zhuǎn)了,用 VWRETD 和 EWRETD 均呈現(xiàn)類似的結(jié)果。接下來,作者基于非金融市場主題的照片進(jìn)行測試,從經(jīng)濟學(xué)人的“書籍和藝術(shù)”部分選擇照片,涵蓋與書籍、電影、歷史和藝術(shù)相關(guān)的主題,作者收集了 3167 張可用照片,發(fā)現(xiàn)這些照片中的悲觀情緒與同期和未來市場回報之間沒有關(guān)系。本節(jié)中,作者證明了金融類主題是照片與市場回報之間聯(lián)系的關(guān)鍵因素,來自非金融新聞的照片(書籍和藝術(shù)除外)可能會產(chǎn)生影響,但影響不如金融新聞?wù)掌黠@。圖 14 PhotoPes 和金融新聞A Picture is Worth a Thousand Words:
36、Measuring Investor Sentiment by Combining Machine Learning and Photos from News、PhotoPes 的非線性性鑒于做空限制,作者推測,與負(fù)面情緒相比,正面情緒對市場回報的影響更大。Miller(1977)認(rèn)為,做空限制限制了投資者糾正定價過高的能力。圖 15 考察了與市場回報在悲觀、樂觀情緒照片上是否對稱,作者運行了以下 回歸 = 15 + 24 + 33 + 42 + 51 + 6()+ 7(2) + 8 + ,其中5 是的最高分位(大部分照片都被預(yù)測為包含負(fù)面情緒),1 是的 最低分位(只有少量照片被預(yù)測為包含樂
37、觀情緒)。根據(jù)圖 15,與市場回報之間的關(guān)系主要由大多數(shù)照片為正面(負(fù)面照片最少)的日子驅(qū)動。當(dāng)大多數(shù)照片 都是負(fù)面時,市場并沒有給出強烈的反應(yīng)。作者推測,這是由于在大多數(shù)照片都是負(fù)面時,市場存在做空限制。圖 15 PhotoPes 和市場回報的非線性關(guān)系A(chǔ) Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining Machine Learning and Photos from News、PhotoPes 對交易量的影響影響市場活動的另一個渠道是交易量。在圖 16 中,作者測試了 NYSE 總交易
38、量是否與相關(guān)。DeLong 等(1990a)預(yù)測,情緒沖擊表明噪音投資者會想買入或賣出。隨著市場吸收這些訂單,的變化與交易量 的增加有關(guān)。但是如果將視為交易成本,則可以預(yù)期的激增應(yīng)導(dǎo)致交易量減少。為了消除交易量的時間趨勢,作者對交易量建模如下: = () + + ,其中表示紐交所每日總交易量的對數(shù)。從上述公式中取殘差,將其歸一化為單位方差和零均值,并將其用作以下回歸中的關(guān)鍵因變量。本回歸旨在消除時間趨勢外的日歷或星期效應(yīng)影響。為了測試與交易量是否相關(guān),作者運行了以下模型: = 1 + 2 + 3() + 4() + 5() + 6(2) + ,其中,是大于 0.5 的,是小于或等于 0.5 的
39、,兩者的系數(shù)均為正但不顯著表明照片中的負(fù)面或正面情緒與同期異常交易量之間無顯著相關(guān)性。然而, 、 、11、的系數(shù)顯著為正,說明照片的悲觀情緒能夠預(yù)測異常交易量增加。與未來交45易量之間的關(guān)系主要由負(fù)面情緒驅(qū)動。圖 16 PhotoPes 和紐約證券交易所的異常交易量A Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining Machine Learning and Photos from News、PhotoPes 是投資者情緒的代表還是直接影響投資者情緒?新聞?wù)掌瞧胀ㄍ顿Y者情緒的代表,還是會直
40、接驅(qū)動情緒?一方面,投資者在新聞中看到很多負(fù)面照片,變得更加悲觀。Bazley 等人(2017)認(rèn)為,視覺信息可以直接影響個體的風(fēng)險偏好。報紙編輯挑選的照片一般與市場當(dāng)下的情緒一致。Shiller(2005) 認(rèn)為,新聞情緒是投資者情緒的代表,由于需求動機,新聞編輯傾向于提供與讀者想法一致的新聞。作者認(rèn)為,照片中的悲觀情緒與市場回報之間的關(guān)系主要是由于照片對市場情緒的直接影響。作者驗證是 否由過去的市場回報決定。圖 17 顯示過去的生產(chǎn)回報不是的主要決定因素。作者發(fā)現(xiàn)只有第 t-4 天的回報 在 10%的顯著性水平下對產(chǎn)生微弱影響。情形(4)和(5)作者使用經(jīng)濟學(xué)人中有影響力的照片和所 有照片
41、進(jìn)行相同的測試,發(fā)現(xiàn)過去的市場回報對沒有任何影響。相比之下,情形(3)中,過去的市場回報強烈影響??紤]到 Getty Images 數(shù)據(jù)庫中的照片可快速獲得(多數(shù)情況下拍攝后幾分鐘即可獲得),新聞?wù)?片中的悲觀情緒與過去市場回報之間沒有負(fù)相關(guān)關(guān)系,表明投資者在獲得照片后立即對照片做出反應(yīng)。如果 正在捕捉編輯的情緒,則過去的市場回報應(yīng)該可以預(yù)測,因為拍攝照片和編輯選擇將照片納入新聞之間存在 延遲。因此,作者認(rèn)為不太可能捕捉現(xiàn)有的投資者情緒。當(dāng)然,作者不能證明消除 t 日的照片包含當(dāng)時編輯 的情緒的情況完全不存在,因為這很難測試,Getty Images 的照片沒有準(zhǔn)確的時間戳。圖 17 市場回報
42、對投資者悲觀情緒的影響A Picture is Worth a Thousand Words: Measuring Investor Sentiment by Combining Machine Learning and Photos from News4、穩(wěn)健性檢驗作者進(jìn)行了穩(wěn)健性檢驗,大部分檢驗均與核心變量的構(gòu)建有關(guān),也討論了采樣時間和機器學(xué)習(xí)算法的問題。、變量構(gòu)建在原始變量設(shè)定中,如果判定為悲觀情緒的概率值高于 50%,則照片被標(biāo)記為悲觀。在下表的前 3 個情形中,作者將臨界值從 50%分別調(diào)整為 55%、60%和 65%。作者還將檢驗中使用的照片數(shù)量從 10 張增加到 20 張,因為調(diào)整臨界值會減少滿足要求的照片數(shù)量。根據(jù)前三個情形的結(jié)果,可以發(fā)現(xiàn)收益反轉(zhuǎn)現(xiàn)象與之前類似。在情形(4)中,作者不對變量進(jìn)行極端值處理,結(jié)果不受影響。在情形(5)中,作者基于照片受歡迎程度加權(quán)計算,結(jié)果亦 不受影響。有些人可能會有疑問,為什么計算時不使用負(fù)面情緒的置信度,原因是模型不是用來識別照片悲觀情緒的強 弱,而只是簡單地對照片進(jìn)行二分類。因此,模型預(yù)測的置信度與照片中情緒的強弱無直接關(guān)系。然而,基線模型結(jié)果并不依賴于虛擬變量,而是預(yù)測的置信度。在情形(6)中,作者用負(fù)面情緒的預(yù)測置信度替換負(fù)面情緒虛擬變量,結(jié)果仍與之前一致。圖 18 穩(wěn)健性檢驗:變量構(gòu)建A Picture is
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版墊資贖樓業(yè)務(wù)風(fēng)險控制合同2篇
- 2024電商技術(shù)服務(wù)合同3篇
- 2024年版市區(qū)高級公寓租賃合同版B版
- 2025年度玩具OEM貼牌加工安全標(biāo)準(zhǔn)合同3篇
- 2025年房屋貸款延期合同3篇
- 二零二五年度火鍋店餐飲服務(wù)承包合同范本2篇
- 二零二五年度跨境電商產(chǎn)業(yè)園房地產(chǎn)收購合同3篇
- 2024版打膠合同書
- 二零二五年度智能機器人OEM委托研發(fā)與市場拓展合同
- 西南科技大學(xué)《西方音樂史(二)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年工程合作協(xié)議書
- 2025年山東省東營市東營區(qū)融媒體中心招聘全媒體采編播專業(yè)技術(shù)人員10人歷年高頻重點提升(共500題)附帶答案詳解
- 2025年宜賓人才限公司招聘高頻重點提升(共500題)附帶答案詳解
- 六年級下冊第四單元語文園地-語文園地四-學(xué)習(xí)任務(wù)單
- 《新聞采訪寫作》課程思政優(yōu)秀教學(xué)案例(一等獎)
- 竣工驗收程序流程圖
- 清華經(jīng)管工商管理碩士研究生培養(yǎng)計劃
- 口腔科診斷證明書模板
- 管溝挖槽土方計算公式
- 國網(wǎng)浙江省電力公司住宅工程配電設(shè)計技術(shù)規(guī)定
- 煙花爆竹零售應(yīng)急預(yù)案
評論
0/150
提交評論