第六章ARIMA某模型_第1頁
第六章ARIMA某模型_第2頁
第六章ARIMA某模型_第3頁
第六章ARIMA某模型_第4頁
第六章ARIMA某模型_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

{管理信息化VR虛擬現(xiàn)實}第六章ARIMA某模型第六章ARIMAX模型一、ARIMAX模型的概念ARIMA模型也稱為ARIMAX模型。Box和刁錦寰提出ARIMAX模型。例子1)9.11事件對道瓊斯指數(shù)的影響2)廣告對銷售量的效應3)美國月批發(fā)物價指數(shù)對零售價指數(shù)的影響4)1960年前后時間X1、冬季X2、夏季X3對臭氧數(shù)據(jù)Yt5)固有股減少X1、道瓊斯指數(shù)X2、石油價格X3對上證指數(shù)數(shù)學模型i=1,…,k)其中,Xt(1)Xt(2)…xt(k).注:為減少參數(shù)個數(shù),通??紤]簡化為:其中(i=1,……,k)=稱上述模型為ARIMAX模型,又稱為帶有干預序列的ARIMA模型或動態(tài)回歸模型。這個模型

列也稱為相依序列或輸出序列,輸入序列也稱為獨立序列或預測因子序列。二、兩個獨立滑動平均過程之和它是階數(shù)分別為的兩個獨立平均過程之和即均是均值為零的白噪聲且相互獨立記可得的自相關函數(shù)當時為零故可表示成階的單一滑動平均過程為零均值白噪聲(證明可參考Hamiton三、附加噪聲對一般模型的影響考慮ARIMA設本身不可觀測,只能觀測到表示有關的附加的噪聲,則對有若對有即則有四、帶有回歸項和時間序列誤差的模型為解釋變量,而誤差是一個ARMA(p,q,的最小二乘估計為,并具有性質(zhì)。的樣本性質(zhì)和統(tǒng)計推斷的方=1t-統(tǒng)計量及置信區(qū)間等就不再有效。例:,的子協(xié)方差為。的最小二乘估計為,它的方差為:如果模型中誤差為不相關的,我們會取,而這會引起明顯的錯誤推斷。的殘差稱為廣義最小二乘估計為。在實際中,根據(jù)噪聲項確定具體的ARMA模型,可以確定協(xié)方差的具體形式,并可找到一個

以必須在計算和極大似然估計以及模型中的參數(shù)之間迭代。(BOXJENKINSp415-420)三、附加噪聲的傳遞函數(shù)模型干擾或噪聲和的水平獨立,且添加到有關的影響上,它們可以寫成干預序列如果噪聲模型可以用ARIMA(p,d,q)過程表示這里是白噪聲,則模型最終可以寫成:互協(xié)方差和互相關系數(shù)一般地,一個雙變量隨機過程無須是平穩(wěn)的,但適當進行差分后的過程是平穩(wěn)的,這里。一般,但稱之為互協(xié)方差,和互相關系數(shù)P470)互協(xié)方差和互相關的估計假設對原始的輸入輸出序列作了d次差分后有n=N-dk互協(xié)方差系數(shù)的估計值為:傳遞函數(shù)模型的識別對預白噪化輸入的傳遞函數(shù)模型的識別穩(wěn)的,并且可由ARMA模型來描述,那么可以對用通常的識別和估計方法得到一個模型:計。如果我們對使用同樣的變換得到:則原模型可以寫為:其中轉(zhuǎn)換后的噪聲序列有將上式兩邊同時乘以并取數(shù)學期望,我們得到:于是應函數(shù)成正比。在實際中我們并不知道理論互相關函數(shù),故我們可以用其估計量替代:噪聲模型的識別假設模型可以寫成(如果必要,做適當?shù)牟罘种螅┯们懊嫠龇椒ńo出傳遞函數(shù)的初步估計后,噪聲序列的估計由下式得到:還可以用初步識別所確定的試用傳遞函數(shù)模型來替代。于是的計算:先通過寫為遞推計算出,然后由計算噪聲序列。假如輸入可以被完全白燥化,出了獨立性的假設,從而也獨立。由此計算得到模型識別后可以用條件平方和法進行參數(shù)的計算。干預模型其中代表干預事件的影響是噪聲它表示在沒有干預影響時序列的變化一般可設是一個ARIMA(p,d,q)即干預序列分為脈沖式干預序列和持續(xù)式干預序。列。脈沖式干預序列:

持續(xù)式干預序列:一般有兩種通用的形式①它表示在時刻T之后干預的影響仍保留下去的情形②它可表示暫時或瞬間干預的影響干預分析模型可表示為+持續(xù)式干預序列需預白噪聲化,即先將干預序列擬合ARIMA模型。預白噪聲:用途:①對非脈沖干預因子,有可能計算機不好計算②估計干預因子對應的傳遞函數(shù)的推移算子有關附加異常值與新息異常值模型1.設~ARIMA(p,d,q)若在時刻T附加異常值,則有稱之為附加異常值模型(AOModel)2.新息異常值(IO)模型=[]第三節(jié)SAS實現(xiàn)計算一、差分輸入序列的差分由CROSSCORR=選項來指定,并且如同相應序列的差分那樣工作。例如Identify=var=y(1)crosscorr=(x1(1)x2(1))表示對Y作一階差分,對X1,X2作一階差分,在隨后的ESTIMATE語句中,任何在INPUT=選

項中用到X1和X2時,這些名字指差分序列。二、使用輸入序列identifycrosscorr=選項中列出輸入序列,并在隨后的ESTIMATE語句中用INPUT=選項說明它們是如何進入模型的。Procarimadata=a;Identifyvar=salescrosscorr=price;Estimateinput=price;本例使用一個稱作price的序列來幫組對salessales關于price的簡單線性回歸,生成和procreg過程相同的結(jié)果。由這些語句所得出的估計模型的數(shù)學形式為:模型中可以使用任意多個輸入變量,例如:Procarimadata=a;Identifyvar=salescrosscorr=(priceine);Estimateinput=(priceine);由這些語句所得出的估計模型的數(shù)學形式為:三、延遲和差分輸入序列procarimadata=a;identifyvar=sales(1)crosscorr=price(1);estimateinput=(1$price);run;這些語句給出估計模型其中price的一階滯后由input=(1$price).說明。四、帶ARMA誤差的回歸可以把輸入序列與關于誤差的ARMA模型結(jié)合起來。建立回歸模型,但回歸模型的誤差(噪聲序列)假定是一個時間序列模型。procarimadata=a;identifyvar=salescrosscorr=(priceine);estimatep=1q=1input=(priceine);run;這些語句給出估計模型:五、平穩(wěn)性和輸入序列聲序列相同,但是如果存在輸入,則在輸入的影響消除后,噪聲序列變?yōu)闅埐睢?/p>

聲是平穩(wěn)的。當使用輸入序列時,你可以首先不假定誤差為ARMA模型的情況下擬合輸入變量,然后再對

噪聲部分擬合一個ARMA模型前考慮一下殘差的平穩(wěn)性。識別帶有ARMA誤差的回歸模型對于ARIMA模型可以用identify語句進行識別。當響應序列依賴于輸入變量時,這種識別ARIMA均值調(diào)整后的序列不再是噪聲序列的一個估計。然后對此殘差序列應用ARIMA模型識別過程。通常此時我們假定噪聲過程是平穩(wěn)的。ESTIMATE語句中的PLOT選項為模型的殘差生成與IDENTIFY語句為響應序列生成的一樣的散點圖。PLOT選項打印出殘差序列的自相關、偏相關和逆相關系數(shù)圖。

下列語句演示了識別帶回歸變量,噪聲過程為ARMA(1,1)模型procarimadata=a;identifyvar=salescrosscorr=(priceine)noprint;estimateinput=(priceine)plot;run;estimatep=1q=1input=(priceine)plot;run;此例中,IDENTIFY語句包括NOPRINT選項是因為響應變量的自相關圖在序列依賴于輸入變量時是沒有什么作用的,所以不顯示出來。第一個ESTIMATEPLOT選項生成了對于pricehe和ine回歸的殘差的自相關、偏相關和逆相關系數(shù)圖。通過PLOTARMA(1,1)個ESTIMATE語句擬合最終的模型。為ARIMA模型的識別。六、干預模型和中斷時間序列脈沖干預此時,輸入變量在某時刻為1而在其它時間為0。這類干預變量也稱為脈沖函數(shù)。下列語句假設SALES是月度數(shù)據(jù),一個廣告是在March1992。下列語句假設saless是ARMA(1,1)。估計干預的效果。dataa;seta;ad=date='1mar1992'd;

run;procarimadata=a;identifyvar=salescrosscorr=ad;estimatep=1q=1input=ad;run;連續(xù)干預梯函數(shù)。例:考慮新聞對某產(chǎn)品需求的影響。假設1992年三月有報道說某產(chǎn)品可預防心臟病,那么在此后sales持續(xù)的較高。下列程序?qū)@種干預效果進行建模。dataa;seta;news=date>='1jul1996'd;run;procarimadata=a;identifyvar=salescrosscorr=news;estimatep=1q=1input=news;run;相互作用可以在模型中包含多個干預變量。干預變量可以是脈沖式的也可以是連續(xù)干預等任何形式。的時間序列,你就可以通過利用輸入變量用PROCARIMA對于誤差過程擬合任何一個ARMA模型相連的一般線性模型。此時輸入變臉對應于線性模型中的設計矩陣。有理轉(zhuǎn)移函數(shù)和分布時滯模型輸入序列進入模型的途徑也叫轉(zhuǎn)移函數(shù)。因此帶輸入序列的ARIAM模型也叫轉(zhuǎn)移函數(shù)模型。有理函數(shù)的復雜轉(zhuǎn)移函數(shù)。這些轉(zhuǎn)移函數(shù)如同作用于ARMA或誤差項一樣作用于輸入序列。分子因子procarimadata=a;identifyvar=salescrosscorr=price;estimateinput=((123)price);run;這些語句估計下列模型:該模型把PRICE對SALES的影響擬合為PRICESALES關于和PRICE,LAG(PRICE),LAG2(PRICE),和LAG3(PRICE)的多元線性回歸。

列所滿足ARMA的MA部分。分母因子所滿足ARMA的AR部分。分母因子是把指數(shù)加權和無窮分布時滯引入轉(zhuǎn)移函數(shù)。為了說明帶分母因子的轉(zhuǎn)移函數(shù),需將分母因子置于INPUT=選項的斜杠號(/)之后。procarimadata=a;identifyvar=salescrosscorr=price;estimateinput=(/(1)price);

run;上述轉(zhuǎn)移韓式為:這個轉(zhuǎn)移函數(shù)也可以等價地寫為:某個極限值。有理轉(zhuǎn)移函數(shù)在INPUT=選項中組合各種分子分母因子,就可以指定任意復雜程度的有理轉(zhuǎn)移函數(shù)。input=(k$(-lags)/(-lags)x)INPUT和轉(zhuǎn)移函數(shù)的進一步說明:輸入變量及其轉(zhuǎn)移函數(shù)可以通過ESTIMATE語句的INPUT=選項指定,這些變量必須在IDENTIFY語句的CROSSCORR=選項中列出。如果在CROSSCORR中給出的是差分,那么也是差分變量作為在INPUT中用于轉(zhuǎn)移函數(shù)的。ESTIMATE...INPUT=(transfer-functionvariable...)轉(zhuǎn)移函數(shù)可以用作純回歸轉(zhuǎn)移函數(shù)可以特殊化為:S$(L1,1,L1,2,...)(L2,1,...).../(Li,1,Li,2,...)(Li+1,1,...)...S是輸入變量的延遲時間(lag)(/)之前為分子及其因子,之后為分母及其因子。各個不同的變量用逗號隔開。項Li,1,Li,2,...,Li,k表示下列形式:第一個分母因子的形式依賴于ALTPARM1被自由參數(shù)替代。.AlternativeModelParameterizationALTPARMOptionINPUT=OptionALTPARMModelINPUT=((12)(12)/(1)X)No;Yes差分和輸入變量如果對響應變量和輸入變量作差分,那么差分運算并不改變模型的意義。如要擬合模型:那么IDENTIFY語句為:identifyvar=y(1,12)crosscorr=x(1,12);estimateq=1input=(/(1)x)noconstant;如果差分部分寫為:identifyvar=y(1,12)crosscorr=x;estimateq=1input=(/(1)x)noconstant;那么模型為:由VAR=分。識別轉(zhuǎn)移函數(shù)模型Identify語句中的CROSSCORR=選項打印出了不同時間間隔的響應序列和輸入序列的樣本互必須對輸入序列的預白燥化模型對輸入和響應變量序列進行濾波。預白噪聲處理對于兩者之間的關系會給出誤導性指示。解決這個問題的方法就是預白噪聲處理。首先用一個ARIMA樣的模型過濾響應序列,并計算過濾后響應序列和過濾后輸入序列的互相關序列。當在用響應序列的IDENTIFY語句前,使用IDENTIFY和ESTIMATE語句來擬合關于輸入序列的模型時,ARIMA過程自動地執(zhí)行這個預白燥化。如果一個不帶輸入的模型先用來擬合CROSSCORR=理,然后才可以計算輸入序列的互相關函數(shù)。例procarimadata=in;identifyvar=x;estimatep=1q=1;identifyvar=ycrosscorr=x;X和Y都被ARMA(1,1)模型過濾,然后計算過濾后的互相關系數(shù)。ESTIMATE和FORECAST語句中使用未過濾序列,并且Y在自身時間間隔上的相關系數(shù)利用未經(jīng)過濾的Y序列計算。但ESTIMATE預白燥化處理的結(jié)果不同。為了取消對輸入變量的預白燥化的處理,可以在IDENTIFY語句中使用CLEAR選項,以使PROCARIMA忘記以前所有模型。預白噪聲化合差分如果VAR=和CROSSCORR=選項指定了差分操作,則序列在預白噪聲化前作差分。帶輸入變量的預測為了使用帶輸入的ARIMADATA=dataset中給出預測時刻的輸入變量值,或者用PROCARIMA預測輸入變量的值。如果在FORECAST語句使用的數(shù)據(jù)集中沒有輸入變量的未來值,則你必須在ARIMA模型過程ARIMA模型來擬合需要預測FORECAST語句自動對于輸入序列使用ARIMA模型以生成所需輸入的預測值。下列語句在擬合和預測SALES之前,用AR(2)擬合PRICE的變化量。FORECAST語句使用此AR(2)自動地預測PRICE來獲取生成SALES預測的未來輸入值。procarimadata=a;identifyvar=price(1);estimatep=2;identifyvar=sales(1)crosscorr=price(1);estimatep=1q=1input=price;forecastlead=12interval=monthid=dateout=results;run;來自DATA數(shù)據(jù)集的輸入值和由PROCARIMA預測的輸入值可以結(jié)合起來。例如關于SALES的

模型可以有三個輸入序列:PRICE,INCOME,andTAXRATE從另一途徑獲取的INCOME預測值,但這僅僅是你想獲得的最初幾個時刻的SALES預測值。

沒有用前面例子中的方法預測的PRICE的未來值。SALES和PRICE賦值為丟

失值,對TAXRATE賦值為它的上一個真實值,而對于INCOME在有預測值的時刻賦值為預測

值而在以后的時刻賦值為丟失值。在PROCARIMA階段,先要估計關于PRICE和INCOME的

ARIMA模型,然后再估計SALES的模型。procarimadata=a;identifyvar=price(1);estimatep=2;identifyvar=ine(1);estimatep=2;identifyvar=sales(1)crosscorr=(price(1)ine(1)taxrate);estimatep=1q=1input=(priceinetaxrate);forecastlead=12interval=monthid=dateout=results;run;在預測SALES,ARIMA過程用做輸入的值是使用ARIMA模型產(chǎn)生的PRICE的預測值,DATA=的數(shù)據(jù)集中的TAXRATEDATA=的數(shù)據(jù)集中找到的INCOMEARIMA模型在INCOME缺失時所得的預測值。例5.41955年至1977年大氣臭氧數(shù)據(jù),試建立ARIMAX模型,以1966年前后,1965年后的冬夏為干預引子,并預報1978年臭氧數(shù)據(jù)。解:用ozone表示臭氧數(shù)據(jù),x1表示1966年前后不同(1966年前為0,1966年后為1summer,winter表示夏冬(夏冬分別表示為1,其余為0ozone作年差分以便絕大部分為0。模型如下:(1-B12)(0zonet-a*x1t)=c*summer+d*winter+(1-eB)(1-Fb12)at程序如下:dataair;dot=1to228/*最后10個為預報值*/;inputozone@@;year=int((t-0.2)/12)+1955;month=(t-(year-1955)*12);x1=year>=1960;summer=(5<month<11)*(year>1965);winter=(year>1965)-summer;output;end;cards;...;procarimadata=air;identifyvar=ozone(12)crosscorr=(x1(12)summerwinter)noprint;

estimateq=(1)(12)input=(x1summerwinter)noconstantmethod=mlitprint;

forecastlead=12id=tinterval=month;run;quit;/*結(jié)束arima程序*/參數(shù)的最大似然估計ParameterEstimatetValueApproxPr>|t|VariableMA1,1-0.26684-3.98<.0001ozoneMA2,10..83<.0001ozoneNUM1-1.33062-6.92<.0001x1NUM2-0.23936-4.02<.0001summerNUM3-0.08021-1.610.1071winter/*可嘗試去掉*/AIC=501.7696SBC=518.3602適應性檢驗(通過)Lagchisquarepr>chisq67.470.11321210.210.42201814.530.55932419.990.58343027.000.51803632.650.5336給出模型Nomeanterminthismodel.(無均值)MovingAverageFactors(滑動平均因子)第一個因子:Factor1:1+0.26684B**(1)第二個因子:Factor2:1-0.76665B**(12)輸入因子:InputNumber1(第一個輸入(干預)因子)InputVariable(變量名):x1Period(s)ofDifferencing(差分階數(shù)):12OverallRegressionFactor(系數(shù)):-1.33062InputNumber2(第二個輸入因子)InputVariable(變量名):summerOverallRegressionFactor(系數(shù)):-0.23936InputNumber3(第三個輸入因子)InputVariable(變量名):winterOverallRegressionFactor(系數(shù)):-0.0802模型為:給出預報值:Forecastsforvariableozone

ObsForecastStdError95%ConfidenceLimits2171.42050.7966-0.14072.98172181.84460.82440.22873.46042192.45670.82440.84084.07252202.85900.82441.24314.47482213.15010.82441.53424.76592222.72110.82441.10534.33702233.31470.82441.69894.93062243.47870.82441.86295.09462252.94050.82441.32474.55642262.35870.82440.74293.97462271.85880.82440.24293.47462281.28980.8244-0.32602.9057例5.5某天然氣爐的天然氣輸入速率x和co2輸出速率y,3044個co2x為干預因子,建立ARIMAX數(shù)學模型并預報下5個co2值。解:先對x實行預白噪聲化:dataseriesj;dot=1to300;inputxy@@;output;end;cards;...;procarimadata=seriesj;identifyvar=xnlags=10;run;輸出結(jié)果:樣本自相關函數(shù)指數(shù)衰減;偏、逆自相關函數(shù)截尾。可認為是AR(p)模型,并試用AR(p)模型。程序如下:estimatep=3;run;輸出結(jié)果:ConditionalLeastSquaresEstimation(參數(shù)的條件最小方差估計)StandardApproxParameterEstimateErrortValuePr>|t|Lag

MU-0.118050.10911-1.080.28010AR1,11.969720..95<.00011AR1,2-1.365360.09922-13.76<.00012AR1,30.339750.054806.20<.00013AIC-142.256SBC-127.441AutocorrelationCheckofResiduals(適應性檢驗)ToChi-Pr>LagSquareDFChiSq69.3630.02491218.3090.03191826.73150.03112430.02210.09153034.15270.16173639.22330.21094242.22390.33364843.90450.5185表明基本符合白噪聲條件,可認為預白噪聲成功。再采用干預模型。試用模型:程序為:identifyvar=ycrosscorr=(x)nlags=10;estimateinput=(3$(1,2)/(1,2)x)plot;run;輸出結(jié)果:ConditionalLeastSquaresEstimation(參數(shù)估計值)StandardApproxParameterEstimateErrortValuePr>|t|LagVariableMU53.322370.81.24<.00010yNUM1-0.628610.25385-2.480.01390xNUM1,10.472670.622580.760.44831xNUM1,20.736340.810520.910.36442xDEN1,10.154290.905390.170.86481xDEN1,20.277630.573800.480.62892xAIC729.7249SBC751.7648

AutocorrelationCheckofResiduals

ToChi-Pr>LagSquareDFChiSq6496.456<.000112498.5812<.000118539.3818<.000124561.8724<.000130585.9030<.000136592.4236<.000142593.4442<.000148601.9448<.0001由于chisquare值很大,prob值很小,表明殘差序列相關,模型擬合得不好。CrosscorrelationCheckofResidualswithInputxToChi-Pr>LagSquareDFChiSq50.4820.7856110.9380.9987172.68140.99952319.50200.48942920.44260.77033524.62320.82104131.13380.77744732.13440.9080殘差序列不互相關,不需變動干預因子試用模型:程序為:estimatep=2input=(3$(1,2)/(1,2)x);run;輸出結(jié)果:ConditionalLeastSquaresEstimation(參數(shù)的條件最小方差估計值)StandardApproxParameterEstimateErrortValuePr>|t|LagVariableMU53.263370.4.30<.00010yAR1,11.533030..19<.00011yAR1,2-0.632860.05017-12.62<.00012yNUM1-0.536170.07552-7.10<.00010xNUM1,10.363790.149402.430.01551xNUM1,20.507420.157623.220.00142xDEN1,10.571120.209302.730.00681xDEN1,2-0.016450.14486-0.110.90972xAIC10.27807(偏大)SBC39.66466(偏大)試用模型:程序為:estimatep=2input=(3$(1,2)/(1)x);run;輸出結(jié)果:ConditionalLeastSquaresEstimation(參數(shù)的條件最小方差估計值)StandardApproxParameterEstimateErrortValuePr>|t|LagVariableMU53.263060.6.60<.00010yAR1,11.532910..25<.00011yAR1,2-0.632970.05006-12.64<.00012yNUM1-0.535220.07482-7.15<.00010xNUM1,10.376020.102873.660.00031xNUM1,20.518940.107834.81<.00012xDEN1,10.548410..35<.00011xAIC8.29281SBC34.00607AutocorrelationCheckofResiduals(適應性檢驗)ToChi-Pr>LagSquareDFChiSq68.6140.07171215.43100.11721821.13160.17342427.52220.19223036.94280.12023644.26340.11184245.62400.25004848.60460.3688適應性檢驗通過。給出模型:ModelforvariableyEstimatedIntercept(均值估計值)53.26306

AutoregressiveFactors(自回歸因子)

Factor1:1-1.53291B**(1)+0.63297B**(2)

InputNumber1(第一個干預因子)InputVariable(變量名):xShift(差分階數(shù)):3NumeratorFactors(分子因子)Factor1:-0.5352-0.37602B**(1)-0.51894B**(2)

DenominatorFactors(分母因子)

Factor1:1-0.54841B**(1)模型為:預報語句:forecastlead=5;run;輸出結(jié)果:ForecastsforvariableyObsForecastStdError95%ConfidenceLimits29756.52660.242556.051257.002029856.04370.443955.173656.913829955.60200.608754.409056.794930055.21110.737053.766656.655630154.81170.880653.085756.5376作業(yè):設太陽黑子和某地年降水數(shù)據(jù)分別是,用ARIMAX模型擬合,寫出相應的程序。第四節(jié)單位根檢驗含單位根的單元過程一.AR(1)~iidN(0,且y0,得到…,可得的OLS估計得=,如果的真實值的絕對值小于1。則有如果在時,上式也成立,則似乎可斷言有零方差,或者這一分布聚向零點:但上式無法檢驗:,為了得到單位根情形下的非退化漸近分布,我們必須乘以T,即此時以更快的速度收斂于1若時()=(*)首先考察上式的分子,在時,該模型描述了一個隨機游動。有…故~,又-因兩邊同時除以得而~意味著~。而也是T個i.i.d隨機變量的和,每個的均值為。由大數(shù)定律知故,其中~。對于(*故,為了獲得一個具有收斂分布的隨機變量,量要除以,正如(*)的分母一樣。

OLS估計距真實值的偏離要乘以T以得到一個漸近

標準分布的比。的漸近分布在后面論述。二、布朗運動~iidN(0,1)~N(0,t)且對任意時期,它獨立于時期r和q之間的變化??疾斓街g的變化。如果將看成兩個獨立的高斯變量之和將與和在某個中間點(如)的值間的變化聯(lián)系起來:數(shù)時期和非整數(shù)期的性質(zhì)。即,且獨立與任何其它非重疊區(qū)間上的變化。同理,可設想將t-1和t的區(qū)間的變化分成N個不同的子時期有。當時的極限,是一個連續(xù)時間過程,稱為標準布朗運動,該過程在t時之值記為w(t)定義:標準的布朗運動是一個連續(xù)時間過程,與每一個時期對應的數(shù)值為w(t),它是有:是多元高斯的且(c):對任意實現(xiàn)w(t)以概率為1關于t連續(xù)。三、函數(shù)形式的中心極限定理布朗運動的用途之一是允許中心極限定理有更為一般的結(jié)論。如果有零均值和方差,則樣本均值(中心極限定理)當給定容量為T的一個樣本,我們計算前半個樣本的均值,而將其余觀測值拋開:另外,這一估計量獨立于用后半個樣本的估計量。一般地,取定義則,它是r的分段函數(shù),有:于是:但是而,故有(1)對于,如果我們考察基于觀測值的樣本均值的行為,我們可以得到的結(jié)論也是漸近正態(tài)的:并且獨立于(1)中的估計量,其條件是。更一般的有:上式稱為是函數(shù)形式的中心極限定理。特別地:。隨機過程,而表示它在時刻t1是r的連續(xù)函數(shù)。對于這樣一個連續(xù)函數(shù)序列。我們稱,如果下面(a)(b)(c)全成立:(a)對于任意k有限時期K維隨機向量序列收斂于向量的分布,其中(b)T一致地趨于零。(c)當時,關于T一致地成立。連續(xù)映射定理其中g是一個連續(xù)函數(shù)。對于隨機函數(shù)序列也有一個相似的結(jié)果成立。連續(xù)映射定理表明,只要,且是一個連續(xù)泛函,則有:。連續(xù)映射定理也可以應用到(0,1)上的一個連續(xù)有界

函數(shù)映射到(0,1)上的另一個連續(xù)有界函數(shù)的連續(xù)泛函。故有:,由于,意味著考察在r的值為則單位根過程的應用對將上式兩邊同乘以得到當故有:又:則有故它是個具有N的隨機變量之前定義的:故可得:類似的可得:上述結(jié)果綜述如下:定理:假設是一個隨機游動,,則有:(a)(b)(c)(d)(e)(f)(g)(h)上述定理用W(r)a(b)是一個分布,(c)d)是分布。該定理可用于計算含單位根的統(tǒng)計量的漸近分布。下面討論幾種重要形式的DF檢驗:1.無常數(shù)或時間趨勢的回歸:真實過程是一個隨機游動考察下式關于的OLS估計其ols估計:,當=1時,由(b)和(e)得到(1)另一個檢驗零假設=1的常用統(tǒng)計量基于如下假設的普通olst檢驗:

是估計系數(shù)的OLS標準差,是殘差方差的OLS估計。故有:(2)(12)稱為DF檢驗。2.回歸含常數(shù)項但不含時間趨勢項:真實過程是一個隨機游動真實過程是隨機游動:而參數(shù)的估計根據(jù):其ols估計為:若,則:可得:(1)(2)3.回歸含常數(shù)項不含時間趨勢:真實過程為含位移的隨機游動真實過程為:參數(shù)還是根據(jù)來計算其OLS估計。其中t=1,2,….T其中因此在這種情形下,兩個估計的系數(shù)都是漸近高斯的。4.回歸含常數(shù)項和時間趨勢:真實過程是含或不含位移的隨機游動真實模型為:參數(shù)根據(jù):來估計。時的ols的t檢驗的漸進分布為;其中:。我們看到當?shù)恼鎸嵵禐?時,OLS估計的性質(zhì)取決于要估計的回歸中是否包含常數(shù)項或時間趨勢,以及描述的真實過程的隨機游動是否包含一個位移。哪一個是用于檢驗單位根零假設的“正確情形取決于我們?yōu)槭裁磳z驗單位根感興趣。如定限制。這一原理可建議對含明顯趨勢項的序列應用情形4序列應用情形2的檢驗。DF檢驗為單邊檢驗,當顯著性水平為時,為其DF檢驗的分為點,則時,拒絕原假設,認為序列顯著平穩(wěn);時,接受原假設,認為序列平穩(wěn)。含一般序列相關的單位根過程的漸近結(jié)果定理令,其中,且是i.i.d序列,其均值為零,方差為,且四階矩有限。定義且有。則(a)(b)(c)(d)(e)(f)(g)(h)(i)(j)(k)菲利普斯-佩龍單位根檢驗情形2,真實過程是隨機游動:,而參數(shù)的估計根據(jù):在下來計算其ols估計為。菲利普斯-佩龍將這些結(jié)果推廣到序列相關以及可使異方差的情形。情形2現(xiàn)在假設真是過程為考察則有:(1)(參考hamiton《時間序列分析》P613—624)(2)其中:同樣在情形1和4下響應的檢驗統(tǒng)計量為:情形1:考察(1)(2)情形4:真實模型為:,參數(shù)根據(jù):來估計。(見Hamilton《時間序列分析》P652-653)P階自回歸的性質(zhì)和擴展的DF單位根檢驗假定數(shù)據(jù)由一個AR(p)過程生成:

(1)其中序列,均值為零,方差為,四階矩有限。定義:(2)(3)而(4)因此(1)可以等價地表示為:(5)或(6)假定生成過程包含一個單個的單位根,其它的根都在單位元之外。即(7)的一個根為一。(8)上式表明上述。另外,當時,(4)意味著(9)在使(9)左邊為0的p個z值中,其一是,其余預定全落在單位元之外。對于右邊也同樣為真。在下,(5)可寫作:或(10)123的結(jié)果,如果含有常數(shù)項和一個時間趨勢,則得到情形4的結(jié)果。情形2:估計的自回歸包含一個常數(shù)項,但數(shù)據(jù)確由一個無位移的單位根自回歸生成假定數(shù)據(jù)由一個AR(p)過程生成:或按照通常的自回歸的OLS估計的方法,假定初始樣本容量為T+p,其觀測值為,以前的p個觀測值為條件。對(11)的OLS估計。設(1*)其中表示最后的位置為一,其余皆為零的(p+1)維向量。情形1:估計的自回歸不包含一個常數(shù)項,但數(shù)據(jù)確由一個無位移的單位根自回歸生成真實過程為:估計由情形4:估計的自回歸包含一個常數(shù)項和時間趨勢,但數(shù)據(jù)確由一個無位移或含位移的的單位根自回歸生成真實過程為:估計由見P655SAS計算平穩(wěn)性檢驗當時間序列具有單位根時,序列是非平穩(wěn)的,傳統(tǒng)的OLS估計就不是正態(tài)的。Dickey(1976)和DickeyandFuller(1979)研究了帶單位根的自回歸模型的最小二乘估計的極限分布,Dickey,Hasza,andFuller(1984)獲得了帶有季節(jié)單位根的時間序列模型的OLS估計的極限分布,Hamilton(1994)討論了各種類型的單位根的的檢驗問題。在SAS計算中的實現(xiàn)可以通過PROCARIMA過程中identify語句中的選項STATIONARITY=;PROBDF函數(shù)或者宏DFTESTMacro來實現(xiàn)。1、STATIONARITY=test=armaxtest=(ar1,..,arn)給出一個列表來確定,其中,test是ADF,PP,orRW.缺損值為(0,1,2).STATIONARITY=(ADF=ARordersDLAG=s)STATIONARITY=(DICKEY=ARordersDLAG=s)執(zhí)行ADFDLAG=s中s大于1則做季節(jié)性DFs是12.缺損值是1。下列代碼對自回歸階數(shù)分別為2和5做ADF檢驗。procarimadata=test;identifyvar=xstationarity=(adf=(2,5));run;STATIONARITY=(PP=ARorders)STATIONARITY=(PHILLIPS=ARorders)執(zhí)行Phillips-Perrontests.下列代碼執(zhí)行自回歸階數(shù)從0到6階執(zhí)行擴展的Phillips-Perrontestsprocarimadata=test;identifyvar=xstationarity=(pp=6);run;STATIONARITY=(RW=ARorders)STATIONARITY=(RANDOMWALK=ARorders)執(zhí)行帶位移的隨機游動檢驗。下列代碼執(zhí)行自回歸階數(shù)從0到2的帶位移的隨機游動檢驗。procarimadata=test;identifyvar=xstationarity=(rw);run;PROBDF函數(shù)做Dickey-FullerTestsPROBDF函數(shù)對時間序列的單位根做Dickey-Fullertests計算其顯著性概率。該函數(shù)可以用于任何SAS庫函數(shù),包括DATA步程序、SCL程序和PROC。其語法為:PROBDF(x,n[,d[,type]])xistheteststatistic.nisthesamplesize.Theminimumvalueofnalloweddependsonthevaluespecifiedforthesecondargumentd.Fordintheset(1,2,4,6,12),nmustbeanintegergreaterthanorequaltomax(2d,5);forothervaluesofdtheminimumvalueofnis24.disanoptionalintegergivingthedegreeoftheunitroottestedfor.Specifyd=1fortestsofasimpleunitroot(1-B).Specifydequaltotheseasonalcyclelengthfortestsforaseasonalunitroot(1-Bd).Thedefaultvalueofdis1;thatis,atestforasimpleunitroot(1-B)isassumedifdisnotspecified.Themaximumvalueofdallowedis12.typeisanoptionalcharacterargumentthatspecifiesthetypeofteststatisticused.ThevaluesoftypeareSZMstudentizedteststatisticforthezeromean(nointercept)caseRZMregressionteststatisticforthezeromean(nointercept)caseSSMstudentizedteststatisticforthesinglemean(intercept)case

RSMregressionteststatisticforthesinglemean(intercept)caseSTRstudentizedteststatisticforthedeterministictimetrendcaseRTRregressionteststatisticforthedeterministictimetrendcaseThevaluesSTRandRTRareallowedonlywhend=1.ThedefaultvalueoftypeisSZM.DetailsTheoreticalBackgroundWhenatimeserieshasaunitroot,theseriesisnonstationaryandtheordinaryleastsquares(OLS)estimatorisnotnormallydistributed.Dickey(1976)andDickeyandFuller(1979)studiedthelimitingdistributionoftheOLSestimatorofautoregressivemodelsfortimeserieswithasimpleunitroot.Dickey,Hasza,andFuller(1984)obtainedthelimitingdistributionfortimeserieswithseasonalunitroots.Considerthe(p+1)thorderautoregressivetimeseriesanditscharacteristicequationIfallthecharacteristicrootsarelessthan1inabsolutevalue,Ytisstationary.Ytisnonstationaryifthereisaunitroot.Ifthereisaunitroot,thesumoftheautoregressiveparametersis1,and,hence,youcantestforaunitrootbytestingwhetherthesumoftheautoregressiveparametersis1ornot.Forconvenience,themodelisparameterizedaswhereandTheestimatorsareobtainedbyregressingon.Thetstatisticoftheordinaryleastsquaresestimatorofistheteststatisticfortheunitroottest.IftheTREND=1optionisused,theautoregressivemodelincludesameanterm.IfTREND=2,themodelalsoincludesatimetrendtermandthemodelisasfollows:Fortestingforaseasonalunitroot,considerthemultiplicativemodelLet.Theteststatisticiscalculatedinthefollowingsteps:1.Regressontoobtaintheinitialestimatorsandputeresiduals.Underthenullhypothesisthat,areconsistentestimatorsof.2.Regresson,...,toobtainestimatesofand.Thetratiofortheestimateofproducedbythesecondstepisusedasateststatisticfortestingforaseasonalunitroot.Theestimatesofareobtainedbyaddingtheestimatesoffromthesecondsteptofromthefirststep.TheestimatesofandaresavedintheOUTSTAT=datasetiftheOUTSTAT=optionisspecified.Theseries(1-Bd)Ytisassumedtobestationary,wheredisthevalueoftheDLAG=option.IftheOUTSTAT=optionisspecified,theOUTSTAT=datasetcontainsestimates.IftheseriesisanARMAprocess,alargevalueoftheAR=optionmaybedesirableinordertoobtainareliableteststatistic.TodetermineanappropriatevaluefortheAR=optionforanARMAprocess,refertoSaidandDickey(1984).TestStatisticsTheDickey-Fullertestisusedtotestthenullhypothesisthatthetimeseriesexhibitsalagdunitrootagainstthealternativeofstationarity.ThePROBDFfunctionputestheprobabilityofobservingateststatisticmoreextremethanxundertheassumptionthatthenullhypothesisistrue.YoushouldrejecttheunitroothypothesiswhenPROBDFreturnsasmall(significant)probabilityvalue.ThereareseveraldifferentversionsoftheDickey-Fullertest.ThePROBDFfunctionsupportssixversions,asselectedbythetypeargument.Specifythetypevaluethatcorrespondstothewaythatyoucalculatedtheteststatisticx.ThelasttwocharactersofthetypevaluespecifythekindofregressionmodelusedtoputetheDickey-Fullerteststatistic.Themeaningofthelasttwocharactersofthetypevalueareasfollows.ZMzeromeanornointerceptcase.TheteststatisticxisassumedtobeputedfromtheregressionmodelSMsinglemeanorinterceptcase.TheteststatisticxisassumedtobeputedfromtheregressionmodelTRinterceptanddeterministictimetrendcase.TheteststatisticxisassumedtobeputedfromtheregressionmodelThefirstcharacterofthetypevaluespecifieswhethertheregressionteststatisticorthestudentizedteststatisticisused.Letbetheestimatedregressioncoefficientforthedthlagoftheseries,andletbethestandarderrorof.Themeaningofthefirstcharacterofthetypevalueisasfollows.Rtheregressioncoefficient-basedteststatistic.Theteststatisticis

Sthestudentizedteststatistic.TheteststatisticisRefertoDickeyandFuller(1979)andDickey,Hasza,andFuller(1984)formoreinformationabouttheDickey-Fullertestnulldistribution.TheprecedingformulasareforthebasicDickey-Fullertest.ThePROBDFfunctioncanalsobeusedfortheaugmentedDickey-Fullertest,inwhichtheerrortermetismodeledasanautoregressiveprocess;however,theteststatisticisputedsomewhatdifferentlyfortheaugmentedDickey-Fullertest.RefertoDickey,Hasza,andFuller(1984)andHamilton(1994)forinformationaboutseasonalandnonseasonalaugmentedDickey-Fullertests.ThePROBDFfunctioniscalculatedfromapproximatingfunctionsfittoempiricalquantilesproducedbyMonteCarlosimulationemploying108replicationsforeachsimulation.Separatesimulationswereperformedforselectedvaluesofnandford=1,2,4,6,12.ThemaximumerrorofthePROBDFfunctionisapproximatelyfordintheset(1,2,4,6,12)andmaybeslightlylargerforotherdvalues.(BecausethenumberofsimulationreplicationsusedtoproducethePROBDFfunctionismuchgreaterthanthe60,000replicationsusedbyDickeyandFuller(1979)andDickey,Hasza,andFuller(1984),thePROBDFfunctioncanbeexpectedtoproduceresultsthataresubstantiallymoreaccuratethanthecriticalvaluesreportedinthosepapers.)ExamplesSupposethedatasetTESTcontains104observationsofthetimeseriesvariableY,andyouwanttotestthenullhypothesisthatthereexistsalag4seasonalunitrootintheYseries.Thefollowingstatementsillustratehowtoperformthesingle-meanDickey-FullerregressioncoefficienttestusingPROCREGandPROBDF.datatest1;settest;y4=lag4(y);run;procregdata=test1outest=alpha;modely=y4/noprint;run;data_null_;setalpha;x=100*(y4-1);p=probdf(x,100,4,"RSM");putp=pvalue5.3;run;ToperformtheaugmentedDickey-Fullertest,regressthedifferencesoftheseriesonlaggeddifferencesandonthelaggedvalueoftheseries,andputetheteststatisticfromtheregressioncoefficientforthelaggedseries.Thefollowingstatementsillustratehowtoperformthesingle-meanaugmentedDickey-FullerstudentizedtestusingPROCREGandPROBDF.datatest1;settest;yl=lag(y);yd=dif(y);yd1=lag1(yd);yd2=lag2(yd);

yd3=lag3(yd);yd4=lag4(yd);run;procregdata=test1outest=alphacovout;modelyd=ylyd1-yd4/noprint;run;data_null_;setalpha;retaina;if_type_='PARMS'thena=yl-1;if_type_='COV'&_NAME_='YL'thendo;x=a/sqrt(yl);p=probdf(x,99,1,"SSM");putp=pvalue5.3;end;run;The%DFTESTmacroprovidesaneasierwaytoperformDickey-Fullertests.Thefollowingstatementsperformthesametestsastheprecedingexample.%dftest(test,y,ar=4);%putp=&dftest;DFTESTMacroThe%DFTESTmacroperformstheDickey-Fullerunitroottest.Youcanusethe%DFTESTmacrotod

ecideifatimeseriesisstationaryandtodeterminetheorderofdifferencingrequiredforth

etimeseriesanalysisofanonstationaryseries.Mosttimeseriesanalysismethodsrequirethattheseriestobeanalyzedisstationary.Howev

er,manyeconomictimeseriesarenonstationaryprocesses.Theusualapproachtothisproble

mistodifferencetheseries.Atimeserieswhichcanbemadestationarybydifferencingissaidtohaveaunitroot.Formoreinformation,seethediscussionofthisissueinthe"GettingStarted"sectionofChapter9,"TheARIMAProcedure."TheDickey-Fullertestisamethodfortestingwhetheratimeserieshasaunitroot.The%DFTESTmacroteststhehypothesisH0:"Thetimeserieshasaunitroot"vs.Ha:"Thetimeseriesisstationary"basedontablesprovidedinDickey(1976)andDickey,Hasza,andFuller(1984).Thetestcanbeappliedforasimpleunitrootwithlag1,orforseasonalunitrootsatlag2,4,or12.Notethatthe%DFTESTmacrohasbeensupersededbythePROCARIMAstationaritytests.SeeChapter9,"TheARIMAProcedure,"fordetails.SyntaxThe%DFTESTmacrohasthefollowingform:%DFTEST(SAS-data-set,variable[,options])Thefirstargument,SAS-data-set,specifiesthenameoftheSASdatasetcontainingthetimeseriesvariabletobeanalyzed.Thesecondargument,variable,specifiesthetimeseriesvariablenametobeanalyzed.Thefirsttwoargumentsarerequired.Thefollowingoptionscanbeusedwiththe%DFTESTmacro.Optionsmustfollowtherequiredargumentsandareseparatedbymas.AR=nspecifiestheorderofautoregressivemodelfitafteranydifferencingspecifiedbytheDIF=andDLAG=options.ThedefaultisAR=3.DIF=(differencing-list)specifiesthedegreesofdifferencingtobeappliedtotheseries.Thedifferencinglistisalistofpositiveintegersseparatedbymasandenclosedinparentheses.Forexample,DIF=(1,12)specifiesthattheseriesbedifferencedonceatlag1andonceatlag12.Formoredetails,seethe"IDENTIFYStatement"sectioninChapter9,"TheARIMAProcedure."IftheoptionDIF=(d1,...,dk)isspecified,theseriesanalyzedis(1-Bd1)...(1-Bdk)Yt,whereYtisthevariablespecified,andBisthebackshiftoperatordefinedbyBYt=Yt-1.DLAG=1|2|4|12specifiesthelagtobetestedforaunitroot.ThedefaultisDLAG=1.OUT=SAS-data-setwritesresidualstoanoutputdataset.OUTSTAT=SAS-data-setwritestheteststatistic,parameterestimates,andotherstatisticstoanoutputdataset.TREND=0|1|2specifiesthedegreeofdeterministictimetrendincludedinthemodel.TREND=0includesnodeterministictermandassumestheserieshasazeromean.TREND=1includesaninterceptterm.TREND=2specifiesaninterceptandalineartimetrendterm.ThedefaultisTREND=1.TREND=2isnotallowedwithDLAG=2,4,or12.ResultsTheputedp-valueisreturnedinthemacrovariable&DFTEST.Ifthep-valueislessthan0.01orlargerthan0.99,themacrovariable&DFTESTissetto0.01or0.99,respectively.(Thesamevalueisgiveninthemacrovariable&DFPVALUEreturnedbythe%DFPVALUEmacro,whichisusedbythe%DFTESTmacrotoputethep-value.)ResultscanbestoredinSASdatasetswiththeOUT=andOUTSTAT=options.DetailsMinimumObservationsTheminimumnumberofobservationsrequiredbythe%DFTESTmacrodependsonthevalueoftheDLAG=option.LetsbethesumofthedifferencingordersspecifiedbytheDIF=option,lettbethevalueoftheTREND=option,andletpbethevalueoftheAR=option.Theminimumnumberofobservationsrequiredisasfollows:DLAG=Min.Obs.11+p+s+max(9,p+t+2)22+p+s+max(6,p+t+2)44+p+s+max(4,p+t+2)1212+p+s+max(12,p+t+2)Observationsarenotusediftheyhavemissingvaluesfortheseriesorforanylagordifferenceusedintheautoregressivemodel.Example9.6:DetectionofLevelChangesintheNileRiverDataThisexampleisdiscussedindeJongandPenzer(1998).ThedataconsistofreadingsoftheannualflowvolumeoftheNileRiveratAswanfrom1871to1970.ThesedatahavealsobeenstudiedbyCobb(1978).Thesestudiesindicatethatlevelsintheyears1877and1913arestrongcandidatesforadditiveoutliers,andthattherewasashiftintheflowlevelsstartingfromtheyear1899.Thisshiftin1899isattributedpartlytotheweatherchangesandpartlytothestartofconstructionworkforanewdamatAswan.datanile;inputlevel@@;year=intnx('year','1jan1871'd,_n_-1);formatyearyear4.;datalines;;run;YoucanstartthemodelingprocesswiththeARIMA(0,1,1)model,anARIMAmodelclosetotheStructuralmodelsuggestedindeJongandPenzer(1998),andexaminetheparameterestimates,theresidualautocorrelations,carimadata=nile;identifyvar=level(1)noprint;estimateq=1nointmethod=mlplot;outliermaxnum=5id=year;run;AportionoftheestimationandtheoutlierdetectionoutputisshowninFigure9.6.1.Output9.6.1:ARIMA(0,1,1)ModelTheARIMAProcedureOutlierDetectionSummaryMaximumnumbersearched5Numberfound5Significanceused0.05OutlierDetailsObsTimeIDTypeEstimateChi-SquareApproxProb>ChiSq291899Shift-315.7534613.130.0003431913Additive-403.9710511.830.000671877Additive-335.493517.690.0055941964Additive305.035686.160.0131181888Additive-287.814846.000.0143Notethatthefirstthreeoutliersdetectedareindeedtheonesdiscussedearlier.YoucanincludetheshocksignaturescorrespondingtothesethreeoutliersintheNiledataset.datanile;setnile;ifyear='1jan1877'dthenAO1877=1.0;elseAO1877=0.0;ifyear='1jan1913'dthenAO1913=1.0;elseAO1913=0.0;ifyear>='1jan1899'dthenLS1899=1.0;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論