![SAS講義 第二十課散布圖折線圖和層次圖_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/21/e2e92428-2b40-4168-acc3-911ca2e740d1/e2e92428-2b40-4168-acc3-911ca2e740d11.gif)
![SAS講義 第二十課散布圖折線圖和層次圖_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/21/e2e92428-2b40-4168-acc3-911ca2e740d1/e2e92428-2b40-4168-acc3-911ca2e740d12.gif)
![SAS講義 第二十課散布圖折線圖和層次圖_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/21/e2e92428-2b40-4168-acc3-911ca2e740d1/e2e92428-2b40-4168-acc3-911ca2e740d13.gif)
![SAS講義 第二十課散布圖折線圖和層次圖_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/21/e2e92428-2b40-4168-acc3-911ca2e740d1/e2e92428-2b40-4168-acc3-911ca2e740d14.gif)
![SAS講義 第二十課散布圖折線圖和層次圖_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/21/e2e92428-2b40-4168-acc3-911ca2e740d1/e2e92428-2b40-4168-acc3-911ca2e740d15.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第二十課 散布圖、折線圖和層次圖SAS系統(tǒng)中繪制散布圖、折線圖和層次圖,使用PROC PLOT過程和PROC GPLOT過程。PROC PLOT過程是用來畫易生成的低分辯率的圖形,輸出在OUTPUT窗口。而PROC GPLOT過程是用來生成定制的、高分辨率的圖形,輸出在GRAPH窗口,并且還可以對輸出的圖形進行編輯修改。一. PROC PLOT過程使用PLOT過程可以在兩個不同的坐標系中對兩個變量作散布圖、折線圖、半對數(shù)圖和層次圖。用于數(shù)據(jù)處理中,直觀地了解數(shù)據(jù)的變化趨勢和數(shù)據(jù)間的相互關(guān)系等。它的一般形式為:Proc Plot DATA=數(shù)據(jù)集 </選項列表> ;Plot 縱坐標變
2、量Y*橫坐標變量X</選項列表>Run ; 1 PROC PLOT語句PROC PLOT語句中的選項列表主要分成三類:有關(guān)圖形的坐標軸選項、有關(guān)外觀的選項和有關(guān)圖形大小的選項。其中圖形大小的兩個選項較為常用:l VPCT=百分比列表規(guī)定產(chǎn)生圖形在垂直方向占一頁的百分比。例如VPCT=33表示這張輸出圖占一頁的33%,即占一頁的1/3,所以一頁可以縱向打印3張圖。VPCT=50 25 25表示每一頁在縱向打印3張圖,第一張占全頁的一半,第二和第三張各占1/4頁。VPCT=200表示要求輸出圖占2頁的長度。l HPCT=百分比列表規(guī)定產(chǎn)生圖形在水平方向占一頁的百分比。2 PLOT語句P
3、LOT語句里首先要規(guī)定數(shù)據(jù)集中的哪兩個變量作為圖形中的垂直變量和水平變量,以及在圖形中用于畫點的作圖字符。PLOT語句的幾種使用格式如下:plot y*x ;plot y*x =+;plot y*x=符號變量 ;plot y*x $ 標記變量 =+;plot y*x=+ b*a=* /overlay ;第一條語句作圖符號用缺省形式,依此用英文大寫字母A、B、CZ作為作圖符號。當觀測的條數(shù)較多時,低分辯率圖不可能畫出所有觀測的點,所以當圖中的某一點表示有一條觀測的點時,用作圖符號A;當圖中的某一點表示有二條觀測的點時,用作圖符號B;以此類推。例如,輸出圖中有一個Z符號,表示在這點上共有26條觀測
4、的點或更多點。對于PROC GPLOT過程默認的作圖符號為加號(+)。第二條語句用等號(=)規(guī)定一個字符作為作圖符號。此例中每個散點用加號(+)表示。第三條語句用等號(=)規(guī)定一個變量的值作為作圖符號,變量可以是字符變量,也可以是數(shù)值變量。此時,每個散點的作圖符號用數(shù)據(jù)集中同一條觀測的這個符號變量的值表示。例如,假定為=SEX變量,則作圖符號為SEX變量的值F或M。第四條語句用符號($)規(guī)定一個變量的值用于標記圖中的散點。此例中每個散點不僅用加號(+)表示,而且還標出了圖中每一個散點在數(shù)據(jù)集的同一條觀測中這個標記變量的值。第五條語句規(guī)定在同一張圖上重疊兩個圖,當然可以重疊更多的圖。OVERLA
5、Y選項要求定義在PLOT語句中的幾個圖打印在一張圖上。例如,我們有一個上證指數(shù)周線數(shù)據(jù)集INDEXSH,包含日期變量DATE、成交量變量VOLUME、開盤價變量OPEN、最高價變量HIGH、最低價變量LOW、收盤價變量CLOSE和漲跌百分比CHANGE,用PROC PLOT過程定制一個指數(shù)對交易周的最高和最低價的重疊散點圖。程序如下:Libname Study “D:/Sasdata/Mydir”;Proc Plot Data=Study.IndexSh Vpct=50 Hpct=70 Formchar=|-|- ;Where date<01feb91 d ;Plot high*date
6、=+ low*date $low =- /overlay ;Run ;程序的運行結(jié)果顯示在OUTPUT窗口中,見圖201所示(為顯示清晰起見,窗口的大小和顯示內(nèi)容的位置移動過)。圖201 用PLOT過程定制重疊散點圖3 PLOT語句中的選項PLOT語句除了上述的重疊作圖選項OVERLAY外,還有幾類重要的選項如下:(1). 關(guān)于坐標軸刻度的任選項用VAXIS(或HAXIS)=標記值列表,定義沿垂直(或水平)坐標軸相等間隔的刻度標記值??梢杂肂Y n的方式規(guī)定刻度的增量。這些值可以是均勻上升或下降,也可以不是,既可以是數(shù)字值,也可以日期時間值。幾種可能的選項格式如下:haxis=0 to 100
7、 by 5haxis=01jan20d to 31dec20d by 7vaxis=1 10 100 100 1000haxis=by 10其它還有VEXPAND(或HEXPAND)、VREVERSE(或HREVERSE)、VZERO(或HZERO)等有關(guān)坐標軸刻度選項。(2). 關(guān)于參考線的任選項如果要求在散布圖的垂直或水平軸的指定數(shù)值上畫出垂直或水平線作為參考線,可以使用如下選項:verf=100 400 1000 (三條水平參考線)href=01mar20d 01oct20d (兩條垂直參考線)還可以用VERFCHAR或HREFCHAR=字符定義參考線的畫線符號。(3). 關(guān)于圖形輪廓的
8、任選項BOX選項可以畫出邊框圍住整個圖形,而不僅僅是畫出底部和左邊框。VPOS或HPOS=軸長度,規(guī)定水平或垂直軸上打印輸出的數(shù)目。(4). 關(guān)于作等值線(層次圖)的任選項當要求散點(x,y)的作圖符號能根據(jù)z(通常z=f(x,y))值的大小規(guī)定不同的層次強度字符時,也就是相同z值的點用相同的作圖符號,不同z值的點用不同的作圖符號,但最多只能把z值分成10個層次的不同值。我們可以使用如下選項:plot x*y=z /contour=3 s1=A s2=+ s3=* ;plot x*y=z /contour=3語句說明:=z指定按Z變量的內(nèi)容確定散點作圖符號,選項contour=3規(guī)定三個層次強
9、度,s1=A s2=+ s3=*按上升順序給出層次強度的作圖符號。用戶自己可以不定義S1、S2、S3的層次強度的作圖符號,而使用缺省值。下面我們舉例說明PLOT語句中選項的使用。例如,繪制上證指數(shù)周線數(shù)據(jù)集INDEXSH的散點圖時,根據(jù)股票技術(shù)分析的需要,要畫支撐和阻力線,以及趨勢變異的時間和周期,這對以后的各種分析都很重要。我們可以通過調(diào)整縱橫坐標軸的刻度和增加水平和垂直參考線來實現(xiàn)。程序如下:Libname Study “D:/Sasdata/Mydir”;Proc plot Data=Study.IndexSh Vpct=50 Hpct=80 Formchar=|-|- ;plot cl
10、ose*date='+' /haxis='21dec90'd to '01jan93'd by 98 vaxis=100 200 400 800 1600href='16aug91'd '30apr92'd '20nov92'dvref=96 135 400 1429 ;title1 'Shanghai StockIndex' ;title2 '21dec90-01jan93' ;Run ;程序的運行結(jié)果顯示在OUTPUT窗口中,見圖202所示。圖202 用PLOT過
11、程定制重疊散點圖輸出解釋:對上證指數(shù)從1990年12月21日開市到1993年1月1日的交易數(shù)據(jù)進行分析,主要經(jīng)歷三種市場狀況:第一種市場狀況是從1990年12月21日到1991年7月底8月初,在96點至135點之間盤整筑底,歷經(jīng)大約3134周,形成W底;第二種市場狀況是從1991年8月中旬有效突破阻力線135,形成穩(wěn)步盤升單邊市,至1992年4月24日歷經(jīng)大約2831周;第三種市場狀況是從1992年4月30日至1992年11月20,在400點一線開始飆升沖頂1429,最后回落原地400點,歷經(jīng)大約29周。從上面的分析我們可以看到,水平和垂直參考線提供了一種看得見的暗示。技術(shù)分析的目的就是找到購
12、買資產(chǎn)的適宜點,盡可能地識別一種趨勢結(jié)束且另一種趨勢開始的點,然后可作出適宜的交易。二. 生成高分辨率圖形雖然PROC PLOT過程生成的散布圖對基本數(shù)據(jù)分析是有用的,但是為了更詳細的分析和表達目的也可用PROC GPLOT過程來生成高分辨率圖形。1 GOPITONS語句通常,當在使用PROC GPLOT和PROC GCHART等能生成高分辨率圖形的過程時,要用到系統(tǒng)的一些特定特征,因此,要求指定圖形設(shè)備和計算機系統(tǒng)的一些另外可能的選擇。用下列GOPITONS語句能規(guī)定一個圖形設(shè)備以運行SAS/GRAPH軟件。 Goptions device=圖形設(shè)備 ;例如,如果我們要指定圖形輸出設(shè)備為Wi
13、ndows環(huán)境下的黑白打印機:Goptions device=winprtm ;例如,如果我們要指定圖形輸出設(shè)備為Windows環(huán)境下的彩色打印機:Goptions device=winprtc ;另外,我們還可以通過選擇菜單命令Globals/Options/Global options或Globals/Graph/File/Print/SAS Graph Driver來設(shè)定圖形輸出設(shè)備。2 PROC GPLOT過程生成高分辨率圖形的PROC GPLOT過程的一般使用格式如下:Porc Gplot DATA=數(shù)據(jù)集 ;Plot 縱坐標變量Y*橫坐標變量X</選項列表>Symbol
14、n <選項列表> ;Axisn <選項列表> ;Run ;使用PROC GPLOT過程和PROC PLOT過程的區(qū)別,對于PROC GPLOT語句,PROC PLOT語句中的VPCT和HPCT等選項不可使用。兩者的PLOT語句使用方法基本相同。最主要的區(qū)別是,在PROC GPLOT過程中,可使用SYMBOLn語句和AXISn語句。3 用SYMBOLn語句定義線和符號SYMBOLn語句的主要作用:可以定義數(shù)據(jù)點的符號,可以定義數(shù)據(jù)點之間的連接方式,可以定義數(shù)據(jù)點和線的顏色。SYMBOLn語句的n取值范圍從1到99,缺省值是1,n代表Y*X兩個變量形成數(shù)據(jù)連線的系列數(shù)。一些
15、主要選項如下:l V=數(shù)據(jù)點圖形符號數(shù)據(jù)點的符號有NONE(沒有)、PLUS(缺省值加號)、STAR(星號)、SQUAR(小方塊)、DIAMOND(小菱形)、TRANGLE(三角形)、CIRCLE(小圓圈)。l I=數(shù)據(jù)點間連接方式常用的連接有NONE(沒有)、JOIN(直線)、SPLINE(平滑)、NEEDLE(從數(shù)據(jù)點到橫坐標畫垂直線)、HILOC(最高、最低、收盤價)、RL(直線回歸線)、BOX25(盒形線)。l W=連線的線寬例如w=5。l H=圖形符號的高度例如h=2.5。l L=定義連線的類型例如l=2。l C=定義顏色例如c=red。l FONT=定義一種字體例如font=swi
16、ssb。SYMBOLn語句所定義的各種選現(xiàn),由于數(shù)量眾多,用戶一般很難記憶,我們上面所列出的僅僅是一小部分。通??梢栽诿钶斎肟蛑邪l(fā)布SYMBOL命令,調(diào)出SYMBOL窗口,在選項參數(shù)的橫線上鍵入?后,在參數(shù)對話框中選擇參數(shù)。共有14項參數(shù)選現(xiàn),每項中還有許多參數(shù)值。一個SYMBOLn語句一旦被定義就一直保持有效,直到重新定義或者退出SAS系統(tǒng)。執(zhí)行一個不帶任何選項的SYMBOLn語句將取消SYMBOLn的全部定義,并不影響其它的SYMBOL語句。如果想要取消所有的SYMBOL語句定義,提交下面的語句:goptions reset=symbol ;4 用AXISn語句定義坐標軸在PROC GP
17、LOT中,可以通過PLOT語句的選項、LABEL語句和FORMAT語句來修飾坐標軸。PLOT語句的選項允許控制坐標軸的刻度、文本和顏色。但使用AXISn語句的選項可以更集中、更方便地控制和管理坐標軸。常見的使用格式如下:Proc Gplot DATA=數(shù)據(jù)集 ;Plot Y*X / vaxis=axis1 haxis=axis2 ;Symboln <選項列表> ;axis1 label=(Price) order=(100 to 1500 by 200 ) offset=(20,10) ;axis2 label=(Date) order=(21dec90d to 01jan93d
18、by 98 ) ;Run ;AXISn語句的LABEL選項規(guī)定該軸的標簽,ORDER選項規(guī)定該軸的取值范圍,OFFSET選項規(guī)定從該軸的原點開始的第一個主刻度空間大小,及從該軸最末端到最后一個刻度的空間大小。例如語句中的OFFSET=(20,10),當單位是PCT時,表示第一個主刻度空間為圖形輸出區(qū)域的20%,最后一個刻度的空間為圖形輸出區(qū)域的10%。有時需要給圖形加第二根縱軸,用來表示在同一時間期間上的另一個變量。兩個變量不用同一縱坐標軸的原因,常常是兩個變量的值的相差太大,如果兩個變量的值顯示在同一縱軸上,在圖形上就會很難分辨值較小那個變量的值的變化。定義第二根縱軸(右軸)的方法如下:Po
19、rc Gplot DATA=數(shù)據(jù)集 ;Plot Y1*X / vaxis=axis1 haxis=axis2 ;Plot2 Y2*X / vaxis=axis3 ;Symboln <選項列表> ;axis1 <選項列表> ;axis2 <選項列表> ;axis3 <選項列表> ;Run ;用第二條PLOT2語句定義了第二根縱軸AXIS3。例如,我們要在同一圖形上繪制上證指數(shù)的最高-最低-收盤價和交易量的圖形。由于價格和交易量的取值范圍不同且相差懸殊,交易量用左邊的縱軸來度量,價格采用右邊的縱軸來度量。要生成最高-最低-收盤價圖,原來INDEXSH
20、數(shù)據(jù)集中的數(shù)據(jù)排列格式不符合要求,需要用數(shù)據(jù)步修改INDEXSH為INDEXSH2,將一條觀測中最高HIGH、最低LOW、收盤價CLOSE三個數(shù)據(jù),轉(zhuǎn)換成三條觀測中VALUE變量的數(shù)據(jù),且三條觀測的日期DATE不變。程序如下:Libname study "d:sasdatamydir" ;data study.indexsh2;set study.indexsh;value=high; output;value=low; output;value=close; output;Run ;Goptions reset=global gunit=pct cback=white b
21、orderhtitle=6 htext=3 ftext=swissb colors=(back) ;Proc gplot data=study.indexsh2;plot volume*date /vaxis=axis1 hvxis=axis2;plot2 value*date /vaxis=axis3 vref=0;symbol1 i=needle;symbol2 i=hiloc;axis1 label=('Volume') order=( 0 to 700000 by 100000) offset=(0,50) ;axis2 label=('Date') o
22、rder=('21dec90'd to '01jan93'd by 98) ;axis3 label=('Price') order=(0 to 1500 by 100) offset=(25,0) ;title 'Shanghai StockIndex'Run ;程序的運行結(jié)果顯示在GRAPH窗口中,見圖203所示。圖203 用GPLOT過程定制的價格和成交量圖在用PROC GPLOT過程繪制高分辨率的前,首先把繪圖的數(shù)據(jù)轉(zhuǎn)換和處理成能符合I=HOLOC連接方式的數(shù)據(jù)格式,另外為了確保在生成圖形時,各種符號定義準確,一般先使用G
23、OPTIONS語句,清除先前定義各種符號(RESET=GLOBAL),然后再定義將在圖中使用的全局符號體系。三. 散布圖散布圖又稱散點圖或相關(guān)圖。它是以散點的分布反映變量之間相關(guān)情況的統(tǒng)計圖。根據(jù)圖中的各點分布和密集程度,大致可以判斷變量之間協(xié)變關(guān)系的類型。在回歸模型中,常用散布圖來描述變量之間的相關(guān)關(guān)系,橫軸上自變量的改變將引起縱軸上因變量的改變,回歸模型中參數(shù)的計算。是通過使因變量的理論值與實際值之間偏差的平方和達到最小而得到的。為了便于理解散布圖在回歸模型中的應(yīng)用,我們先用已知的線性方程來虛擬構(gòu)造一組樣本數(shù)據(jù),畫出散布圖,從圖中各散點形成的趨勢看,是否符合線性關(guān)系,然后決定用線性回歸模型
24、求回歸方程,作為對總體回歸直線的近似,必須進行統(tǒng)計檢驗才能確定這種近似是否恰當,最后我們可以得到確認的總體回歸方程,再比較我們已知的方程,應(yīng)該發(fā)現(xiàn)非常接近。例如,新創(chuàng)建的數(shù)據(jù)集LINE,是我們用身高(HEIGH)=體重(WEIGHT)+100這樣一個簡單直線方程來生成的模擬數(shù)據(jù)集。數(shù)據(jù)集中有一組高度HEIGH和體重WEIGHT的觀測值。假設(shè)我們需要繪制回歸直線及置信帶等??梢韵犬嫵龈叨葘w重的散布圖進行觀察和分析,然后利用回歸過程建立高度(因變量)和體重(自變量)的線性方程式后,進一步可畫出高度預(yù)測值對體重的散布圖進行比較和分析。程序如下:Libname study "d:sasda
25、tamydir"data study.line ;do n=1 to 200 by 1;weight=40+60*ranuni(1) ;height=1*weight+100+5*normal(1) ;output ;end ;Proc reg data=study.line;model height=weight; output out=study.linereg p=predict ;proc gplot data=study.linereg ;plot height*weight predict*weight / overlay;symbol1 v=dot c=red i=no
26、ne;symbol2 v=none c=blue i=spline;Run ;程序說明:數(shù)據(jù)步DATA自動生成200條觀測,SAS系統(tǒng)提供了兩個均勻分布的隨機函數(shù)RANUNI()和UNIFORM()產(chǎn)生01之間的隨機數(shù),用隨機函數(shù)構(gòu)成的40+60*ranuni(1)表達式,將使WEIGHT變量的取值范圍為40100公斤之間的隨機值。SAS系統(tǒng)還提供了兩個標準正態(tài)分布的隨機函數(shù)NORMAL()和RANNOR(),產(chǎn)生均值為0標準差為1標準正態(tài)隨機數(shù)。隨機數(shù)表達式1*weight+100+5*normal(1) 是經(jīng)過線性變換產(chǎn)生的均值為1*weight+100,標準差為5的隨機數(shù),對于正態(tài)分布將
27、有95%的數(shù)據(jù)落在均值附近的兩個標準差之內(nèi),例如,對于weight=50來說,身高的均值為50+100=150,因此將有95%可能HEIGHT變量的取值范圍為140160厘米。PROC REG回歸過程,首先建立輸入為WEIGHT輸出為HEIGHT的回歸模型,并用OUTPUT語句創(chuàng)建包含身高預(yù)測值的輸出數(shù)據(jù)集,定義輸出數(shù)據(jù)集名為Study.LineReg,定義存放預(yù)測值的變量名為PREDICT。最后用PROC GPLOT過程把實際高度對重量及預(yù)測高度對重量兩張散布圖重疊放在一張圖上,通常兩張圖應(yīng)該用不同的作圖字符來表示散點,實際高度對重量用無任何連線的小圓點表示,預(yù)測高度對重量用平滑曲線連接散點
28、。高分辨率的輸出圖形顯示在GRAPH窗口,在OUTPUT窗口還顯示輸出PROC REG過程的統(tǒng)計報告,如下所示:Model: MODEL1Dependent Variable: HEIGHT Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 1 58792.37183 58792.37183 2524.881 0.0001 Error 198 4610.47060 23.28521 C Total 199 63402.84243 Root MSE 4.82547 R-square
29、0.9273 Dep Mean 170.67056 Adj R-sq 0.9269 C.V. 2.82736 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > |T|INTERCEP 1 97.812209 1.48957643 65.664 0.0001WEIGHT 1 1.033179 0.02056151 50.248 0.0001從回歸分析報告中我們看出,對樣本回歸直線與觀測值之間的擬合程度的檢驗(也稱擬合優(yōu)度檢驗)用判定系數(shù)R2檢驗,R2的
30、取值范圍01,越接近1,擬合程度越好;反之越差。本例中R2為0.9273,調(diào)整后的R2也為0.9269,非常接近于1。還有參數(shù)顯著性檢驗(T檢驗)和回歸總體線性的顯著性檢驗(F檢驗)都顯示高度顯著。我們可以確認回歸模型的估計式為:HEIGHT=1.033179*WEIGHT+97.812209SAS系統(tǒng)的許多圖形過程都帶有統(tǒng)計計算,許多統(tǒng)計分析過程都帶有圖形輸出。PROC GPLOT畫圖過程就帶有回歸模型的預(yù)測值和置信帶計算,并用曲線連接。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=
31、swissb colors=(back) ;proc gplot data=study.line ;plot height*weight height*weight /vaxis=axis1 haxis=axis2 overlay;symbol1 i=none v=dot cv=black h=1.5 ;symbol2 i=rlcli95 ci=black cv=black co=black w=2.5 L=1;axis1 label=('Height') order=(130 to 210 by 10) ;axis2 label=('Weight') orde
32、r=(40 to 100 by 10) ;title 'Linear Regression'Run ;程序說明:對樣本數(shù)據(jù)集STUDY.LINE不先調(diào)用統(tǒng)計計算過程求回歸預(yù)測值,而是直接繪制實際身高對體重的兩張重疊散點圖。然后對第二張圖的連接方式I選項確定為RLCLI95,分成三部分含義:RL表示作直線回歸,還可用表示作2次回歸RQ和RQ0(消除截距,強制線經(jīng)過原點)代替,或表示作3次回歸的RC、RC0代替;CLI表示作單個預(yù)測值的置信帶,可用CLM代替,表示作均數(shù)的置信帶;95表示置信度為95%,另有兩個可用值為90和99。有關(guān)散布圖中I選項的回歸參數(shù)取值,可在SYMBOL窗
33、口的TYPE參數(shù)選項橫線上鍵入?后,再選擇User regress analysis子菜單來查看或選定。CI表示回歸線的顏色,CO表示置信帶的顏色,CV表示散點的顏色,W表示連接線的寬度,L表示連接線的類型。程序的運行結(jié)果顯示在GRAPH窗口中,見圖214所示。圖中大約有5%的數(shù)據(jù)點落在兩條虛線構(gòu)成的置信帶之外。圖204 一元線性回歸和95%置信限四. 折線圖折線圖又稱曲線圖,是用線段的升降來說明現(xiàn)象變動情況的一種統(tǒng)計圖,它主要用于表現(xiàn)在時間上的變化趨勢、現(xiàn)象的分配情況和兩個現(xiàn)象之間的依存關(guān)系等。折線圖常應(yīng)用于時間序列模型中,把有關(guān)時間序列的數(shù)據(jù)繪制成圖形。廣義上說,模型可劃分為回歸模型與時間
34、序列模型。從數(shù)學(xué)角度看,時間序列數(shù)據(jù)的建模是構(gòu)造一個包含時間序列本身、推薦函數(shù)的殘差以及可選擇的其它時間序列的函數(shù)。我們所觀測到時間序列的值是時間序列過程的實現(xiàn)。用描述方法判定時間序列數(shù)據(jù)的趨勢后,技術(shù)分析人員往往要對該序列建立模型并預(yù)測它們的將來值。用時間序列的數(shù)據(jù)建立模型時,可以去掉序列的確定分量,也可以對確定部分建立一個明確的模型。利用時間序列的其它組成部分建模后,把確定部分也加進去形成最終模型。例如,股票價格趨向于沿看得見可識別的趨勢移動,技術(shù)分析想盡可能地識別趨勢并在趨勢反轉(zhuǎn)點改變投資。然而,由于隨機波動遮掩了反轉(zhuǎn)點或使反轉(zhuǎn)點錯誤地出現(xiàn),因此技術(shù)分析必須借助于估計序列成分(包括趨勢周
35、期計算、季節(jié)和交易日方式的循環(huán)和非規(guī)則成分的循環(huán))或計算序列的移動平均來估計序列的趨勢。直接使用一些股票市場的時間序列數(shù)據(jù)繪制折線圖,全部趨勢可能難以直觀識別。如果移去非趨勢成分會使趨勢更容易顯現(xiàn)。可以使用SAS/ETS軟件中PROC X11過程來估計和調(diào)節(jié)序列成分。作為對使用PROC X11過程去估計趨勢成分的一種補充,可以采用平滑時間序列的數(shù)據(jù)的方法,以便移去隨機波動從而揭示數(shù)據(jù)中的趨勢。一般地,通過計算數(shù)據(jù)的移動平均可實現(xiàn)數(shù)據(jù)的平滑。移動平均有很多種類,主要有簡單移動平均、加權(quán)移動平均和指數(shù)加權(quán)移動平均,最優(yōu)長度依賴于使用的時間結(jié)構(gòu)。理解了數(shù)據(jù)中有關(guān)趨勢的知識,將有助于買、賣和持有股票的
36、決定及交易的時機。下面,我們首先對上證指數(shù)INDEXSH數(shù)據(jù)集計算簡單的、加權(quán)的和指數(shù)加權(quán)的移動平均線。然后繪制原始序列和移動平均的圖形。程序如下:Goptions reset=global gunit=pct cback=white borderhtitle=6 htext=3 ftext=swissb colors=(back) ;Libname Study “d:sasdatamydir”;Data study.indexma ;Set study.indexsh ; Ma10=(close+lag(close)+lag2(close) +lag3(close) +lag4(close)
37、 +lag5(close)+lag6(close)+lag7(close) +lag8(close) +lag9(close)/10; Wma10=(10*close+9*lag(close)+8*lag2(close)+7*lag3(close)+6*lag4(close) +5*lag5(close)+4*lag6(close)+3*lag7(close)+2*lag8(close)+lag9(close)/55 ; W1=0.3 ; retain ewma1 ; If _n_=1 then ewma1=close ; else ewma1=w1*close+(1-w1)*ewma1 ;
38、W2=0.75 ; retain ewma2 ; If _n_<2 then ewma2=ewma1 ; else ewma2=w2*ewma1+(1-w2)*ewma2 ;Proc gplot data=study.indexma ;plot close*date ma10*date /vaxis=axis1 haxis=axis2 overlay ;symbol1 i=join v=none L=1 h=2.5 ;symbol2 i=join v=none L=1 h=2.5 w=2;axis1 label=('Price') logbase=10 order=(10
39、0 200 400 800 1600 3200);axis2 label=('Date') ;title 'Shanghai StockIndex'Title2 Close and MoveAverage;Run ;程序說明:DATA數(shù)據(jù)步創(chuàng)建了一個名為INDEXMA數(shù)據(jù)集,共生成了四種移動平均線,使用滯后函數(shù)LAGn()生成了收盤價CLOSE的十日簡單移動平均線MA10和十日加權(quán)移動平均線WMA10;用平滑因子W1生成一次指數(shù)加權(quán)移動平均EWMA1,用平滑因子W2生成二次指數(shù)加權(quán)移動平均EWMA2,平滑因子值較大,則對最近的序列值給出較大的權(quán)數(shù),作為一個一般原
40、則,較小的平滑因子適于緩緩改變的趨勢序列,而較大的平滑因子適于快速改變的易變序列。IFTHENELSE語句作用是將初始化處理和后面的正常處理分開來。RETAIN語句作用是從DATA步這次到下次重復(fù)時,保留變量EWMA1和EWMA2的值。調(diào)用PROC GPLOT過程繪制了收盤價和十日簡單移動平均的圖形,其中對縱軸(Price)定義的AXIS1語句中加上了LOGBASE=10(或PI或e)的選項,就表示該軸是以10為底的對數(shù)軸。程序的運行結(jié)果顯示在GRAPH窗口中,見圖215所示圖215 對時間序列的數(shù)據(jù)用移動平均估計趨勢除了用DATA數(shù)據(jù)步直接計算移動平均外,我們還可以用SAS/ETS軟件的EXPAND過程來生成時間序列數(shù)據(jù)的簡單、加權(quán)和中心移動平均,用SAS/QC軟件的MACONTROL過程生成一致加權(quán)和指數(shù)加權(quán)的移動平均控制圖表。 五. 層次圖PROC PLOT過程還能繪制層次圖,又稱等值線圖或輪廓圖。在地理學(xué)研究中用來繪制等高線,在經(jīng)濟學(xué)研究中常用來畫等值的利潤曲線。例如線性規(guī)劃中的產(chǎn)品混合問題,經(jīng)濟學(xué)的一個核心問題是在有限的資源情況下,如何合理的分配資源,使效益最大化。假設(shè)我們要生產(chǎn)兩種產(chǎn)品X和Y,但受到時間T、空間S、能力C三種資源約束的,在已知兩個產(chǎn)品的單位利潤為f1(x)和f2(y)情況下,各生產(chǎn)產(chǎn)品X和Y多少數(shù)量,才能使利潤Z最
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 供貨合同范本詳細版
- 關(guān)于終止入股合同范本
- 加氣塊合同范本
- 典當合伙投資合同范本
- 共貸協(xié)議合同范本
- 主合同與從合同范本
- 保險與車輛維修合同范本
- 勞動聘請合同范本
- 2025年3M膠項目投資分析及可行性報告
- 2025-2030年戶外多功能工具行業(yè)跨境出海戰(zhàn)略研究報告
- 婦科惡性腫瘤免疫治療中國專家共識(2023)解讀
- 2024年浪潮入職測評題和答案
- 小班數(shù)學(xué)《整理牛奶柜》課件
- 中考語文真題雙向細目表
- 我國新零售業(yè)上市公司財務(wù)質(zhì)量分析-以蘇寧易購為例
- 青島版三年級下冊科學(xué)25.小改變大效率教學(xué)課件
- 藥品集采培訓(xùn)課件
- 股骨干骨折教學(xué)演示課件
- 動靜脈內(nèi)瘺血栓
- 朗誦《詩頌風(fēng)華》
- 醫(yī)共體人財物管理系統(tǒng)需求說明
評論
0/150
提交評論