股票相關(guān)性分析_第1頁
股票相關(guān)性分析_第2頁
股票相關(guān)性分析_第3頁
股票相關(guān)性分析_第4頁
股票相關(guān)性分析_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、股票的關(guān)聯(lián)規(guī)則挖掘目錄nCopula函數(shù)n股票相關(guān)性網(wǎng)絡(luò)n協(xié)同微粒群nApriori算法Copula函數(shù)n一致性相關(guān)系數(shù):度量了兩個隨機變量的變化一致性或協(xié)調(diào)性(同時增大或減小)程度。n=P(x1-x2)(y1-y2)0-P(x1-x2)(y1-y2)x1|X2x2:當(dāng)X2x2時X1x1的概率是否會發(fā)生變化,x1,x2相當(dāng)大時,就是X1和X2的尾部相關(guān)性。Copula函數(shù)nCopula函數(shù)描述的是變量間的相關(guān)性,實際上是一類將聯(lián)合分布函數(shù)與它們各自的邊緣分布函數(shù)連接在一起的函數(shù)。n利用Copula函數(shù)可以計算一致性相關(guān)系數(shù)。構(gòu)造股票相關(guān)性網(wǎng)絡(luò)n將每一只股票看作一個節(jié)點,股票與股票之間的關(guān)聯(lián)關(guān)系

2、看成邊;n當(dāng)股票 a 的價格變化影響股票 b 的價格變化時,則它們的關(guān)聯(lián)關(guān)系是從 a 指向 b 的。當(dāng)股票 b 的價格變化影響股票 a 的價格變化時,則它們的關(guān)聯(lián)關(guān)系是從 b 指向 a 的;n當(dāng) a 對 b 的影響大于 b對 a 的影響,則認為兩只股票的關(guān)聯(lián)關(guān)系是從 a 指向 b,反之則是從b 指向 a。構(gòu)造股票相關(guān)性網(wǎng)絡(luò)n任意選取兩只股票 a 和 b,則 a 股票和 b 股票的相關(guān)性系數(shù)為:其中構(gòu)造股票相關(guān)性網(wǎng)絡(luò)根據(jù)關(guān)鍵點可以對股票網(wǎng)絡(luò)進行板塊劃分協(xié)同微粒群n將粒子編碼為影響股票走勢的各個相關(guān)因素,粒子通過適應(yīng)度函數(shù)來進行更新,并且在更新的過程中保留原來的較優(yōu)成分進行遺傳。協(xié)同微粒群n假設(shè)微

3、粒群的節(jié)點搜索位置空間的維度為 D 維 ,粒子的編碼使用某種屬性下的關(guān)聯(lián)股票的屬性值。初始化選取m個粒子構(gòu)成的粒子群,粒子的空間優(yōu)化問題就是選取屬性關(guān)聯(lián)下的符合目標函數(shù)的粒子。n空問中第 i個粒子的編碼就是選取的分析股票下某種屬性的屬性值,表示為以下的形式Xi = (Xi1 ,Xi2 ,Xin ) ,n代表分析股票的總數(shù)。協(xié)同微粒群第第i個粒子空間更新的速度為個粒子空間更新的速度為第第i個粒子歷史最優(yōu)位置為個粒子歷史最優(yōu)位置為整個粒子群歷史最優(yōu)位置整個粒子群歷史最優(yōu)位置粒子可以根據(jù)如下的公式進行速度與位置的更新粒子可以根據(jù)如下的公式進行速度與位置的更新K 為微粒群中優(yōu)化的迭代次數(shù),為微粒群中優(yōu)

4、化的迭代次數(shù),r 1和和 r2是在區(qū)間是在區(qū)間 0 ,1上的隨機數(shù),這兩個隨機數(shù)能夠有效保持上的隨機數(shù),這兩個隨機數(shù)能夠有效保持微粒群優(yōu)化的多樣性。微粒群優(yōu)化的多樣性。 C1和和 C2是兩個學(xué)習(xí)因子,這兩個系數(shù)可以保證粒子對全局位置的學(xué)習(xí)能力。是兩個學(xué)習(xí)因子,這兩個系數(shù)可以保證粒子對全局位置的學(xué)習(xí)能力。 協(xié)同微粒群支持度挖掘粒子群S(i),S(R)分別表示微粒的支持度與用戶預(yù)先設(shè)置的支持度。分別表示微粒的支持度與用戶預(yù)先設(shè)置的支持度。cov(A+B)是指兩種事件在數(shù)據(jù)庫中的比例。)是指兩種事件在數(shù)據(jù)庫中的比例。置信度挖掘粒子群協(xié)同微粒群初始化m個粒子支持度微粒群規(guī)則度微粒群規(guī)則提取更新進入規(guī)則

5、微粒群更新符合適應(yīng)度粒子補充不符合適應(yīng)度粒子更新能力保持Apriori算法n依據(jù)支持度找出所有頻繁項集n依據(jù)置信度產(chǎn)生關(guān)聯(lián)規(guī)則項集(項集(Itemset):同時出現(xiàn)的項的集合。定義為:):同時出現(xiàn)的項的集合。定義為:k-itemset(k項集)。項集)。Apriori算法n首先,找出頻繁“1項集”的集合,該集合記作L1。L1用于找頻繁“2項集”的集合L2,而L2用于找L3。如此下去,直到不能找到“K項集”。找每個Lk都需要一次數(shù)據(jù)庫掃描。n置信度大于給定最小置信度minConf的關(guān)聯(lián)規(guī)則稱為頻繁關(guān)聯(lián)規(guī)則(Frequent Association Rule)。數(shù)據(jù)預(yù)處理n插值:由于連續(xù)交易的時間

6、間隔不同,因此在一個時間段內(nèi),甚至可能沒有任何的記錄。按照給定的時間單元間隔對高頻交易數(shù)據(jù)采樣,選擇最近的一個價格點填充。n小波分析:股票的價格變動可以看作一個一維離散信號,對于一維離散信號來說,其高頻部分影響的是小波分解的第一層細節(jié),其低頻部分影響的是小波分解的最深層和低頻層。小波降噪的過程,就是把信號分解為多個子信號,通過對小波分解系數(shù)的處理去掉其中的噪音部分,然后把余下部分進行合并重構(gòu)的過程。n使用SYM8小波,對價格信號進行兩層分解,對分解得到的分解系數(shù)進行Heursure閾值處理。數(shù)據(jù)預(yù)處理n漲幅z定義如下:若第I時刻成交價為Pi ,第I-1時刻成交價為Pi-1 ,則漲幅z=( Pi - Pi-1 )/Pi-1 。同時約定:z 1%時為漲,記為1;z -1%時為跌,記為0。n考慮時滯性:以時間窗口的個數(shù)作為事務(wù)項。數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理構(gòu)造股票相關(guān)性網(wǎng)絡(luò)n利用股票的相關(guān)性網(wǎng)絡(luò)找出關(guān)鍵點并進行板塊劃分。投資

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論