SAS基礎(chǔ)與金融計(jì)算2_第1頁
SAS基礎(chǔ)與金融計(jì)算2_第2頁
SAS基礎(chǔ)與金融計(jì)算2_第3頁
SAS基礎(chǔ)與金融計(jì)算2_第4頁
SAS基礎(chǔ)與金融計(jì)算2_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1SAS基礎(chǔ)與金融計(jì)算游家興廈門大學(xué)經(jīng)濟(jì)學(xué)院計(jì)統(tǒng)系2上節(jié)課上機(jī)操作(1)對上節(jié)課生成的最終數(shù)據(jù)集total進(jìn)行如下操作:(1)剔除金融業(yè)上市公司;(2)剔除每股收益為負(fù)的上市公司;(3)由于數(shù)據(jù)集中年漲跌幅采用百分比表示,建立一個(gè)新的變量,采用小數(shù)表示。(4)建立一個(gè)新的變量,表示除第一大股東外其它股東所持有的股份比例。3(1)剔除金融業(yè)上市公司第一步:運(yùn)用substr語句Datatest;settotal; code=substr(code,1,6);Run;4第二步:Datatemp1;settest;

ifcode='000562'orcode='000001'or

code='000563'orcode='600015'or

code='600016'orcode='600030'or

code='600036'orcode='600816'or

code='600000'orcode='601998'or

code='601328'orcode='601166'or

code='601318'orcode='601398'or

code='601628'thendelete;

Run;

5(2)剔除每股收益為負(fù)的上市公司Datatemp2;settemp1;ifeps<0thendelete;Run;Datatemp2;settemp1;ifeps>=0;Run;6(3)建立新變量:用小數(shù)表示的漲跌幅Datatemp3;settemp2;re2=re/100;Run;7(4)建立新的變量表示其它股東持股比例Datatemp4;settemp3;ratio2=1-ratio/100;Run;8本節(jié)課上機(jī)作業(yè)(2)公共信箱下載數(shù)據(jù)集test1和test2,運(yùn)用SAS將test1和test2縱向拼成新的數(shù)據(jù)test。根據(jù)股票收益率大小將test分成四個(gè)組,并形成四個(gè)子數(shù)據(jù)集:tmp1,tmp2,tmp3,tmp4。在數(shù)據(jù)集test中,第一大股東持股比例在50%以上且每股收益超過1元的公司有多少家?9描述統(tǒng)計(jì)分析常見的數(shù)據(jù)統(tǒng)計(jì)描述量及意義(1)表示分布平均水平和位置的特征量:均值:數(shù)據(jù)的平均值—Mean眾數(shù):觀測值中出現(xiàn)最頻繁的數(shù)值—Mode中位數(shù):觀測值排序中處于中間位置的值—Median百分位數(shù):中位數(shù)的推廣—P1、P33、P9910(2)表示分布離散程度的特征量標(biāo)準(zhǔn)差Std方差Var變異系數(shù)CV標(biāo)準(zhǔn)誤STDEER11(3)表示形形狀的特特征量:偏度和峰峰度偏度(Skewness):偏度主要要用于判判斷分布布形狀是是否對稱稱:若g1=0,則對稱稱;若g1>0,則分布布右偏((正偏));若g1<0,則分布布左偏((負(fù)偏))。12峰度(Kurtosis):峰度是以以正態(tài)分分布為比比較標(biāo)準(zhǔn)準(zhǔn)。對于于正態(tài)分分布,g2=0;若g2>0,表示變變量分布布比正態(tài)態(tài)分布更更集中,,分布呈呈尖峰狀狀態(tài),平平均數(shù)的的代表性性較好;;若g2<0,表示變變量分布布比正態(tài)態(tài)分布更更分散,,分布呈呈平坦峰峰,平均均數(shù)的代代表性較較差。13SAS中可以以對數(shù)數(shù)據(jù)進(jìn)進(jìn)行描描述統(tǒng)統(tǒng)計(jì)分分析的的過程程步有有很多多,其其中兩兩個(gè)最最常用用的過過程步步是::(1)MEANS過程((均值值過程程)(2)UNIVARIATE過程((單變變量過過程))14MEANS過程用用來對對數(shù)據(jù)據(jù)集中中的數(shù)數(shù)值變變量計(jì)計(jì)算簡簡單描描述統(tǒng)統(tǒng)計(jì)量量。該該過程程由下下列語語句控控制::PROCMEANS[options][statistics-keywords];VARvariables;BYvariables;CLASSvariables;OUTPUT[OUT=SAS-data-set][output-statistics];Run;1.MEANS過程15(1)PROCMEANS語語句PROCMEANS[options][statistic-keywords][options]:DATA=SASdataset,即用以說說明過過程分分析處處理的的數(shù)據(jù)據(jù)集的的名字字,若若省略略,則則用最最近操操作的的SAS數(shù)據(jù)集集;[statistic-keywords]:在MEANS過程中中指出出你需需要計(jì)計(jì)算哪哪些統(tǒng)統(tǒng)計(jì)量量。16N,MEAN,STD,MIN,MAX,SUM,Variance,CV,STDERR,T,PRT,Range,SKEWNESS,KURTOSIS,CLM,LCLM,UCLM,Maxdec…T:檢驗(yàn)總體平平均值是否否為0的T統(tǒng)計(jì)量的值值PRT:大于T的概率Maxdec=n:指定打印統(tǒng)統(tǒng)計(jì)量的小小數(shù)位的位位數(shù)如省略不寫寫,SAS將固定輸入入默認(rèn)的最最常見的幾幾個(gè)統(tǒng)計(jì)量量。該過程可計(jì)計(jì)算如下統(tǒng)統(tǒng)計(jì)量:17VARvariables規(guī)定要計(jì)算算描述性統(tǒng)統(tǒng)計(jì)量的數(shù)值變量及順序。若省略該句句,則對除除BY、CLASS語句中列出出的變量之之外所有數(shù)數(shù)值變量計(jì)計(jì)算描述性性統(tǒng)計(jì)量。。(2)VAR語句句18(3)BY語句BYvariables;使用BY語語句可以用用BY變量量定義的觀觀測組分別別計(jì)算其相相應(yīng)的描述述統(tǒng)計(jì)量。。當(dāng)使用BY語句時(shí)時(shí),要求輸輸入數(shù)據(jù)集集已按BY變量排序序。(4)CLASS語句CLASSvariables;該語句和BY語句一一樣,可用用CLASS變量定定義的觀測測組分別計(jì)計(jì)算其相應(yīng)應(yīng)的描述統(tǒng)統(tǒng)計(jì)量。不不同點(diǎn)在于于排序要求求,CLASS語句句不要求數(shù)數(shù)據(jù)集事先先已按CLASS變變量排序。。19(5)Freq語句Freqvariable;該語句指定定一個(gè)數(shù)值值型的變量量,它的值值表示輸入入數(shù)據(jù)集中中相應(yīng)觀測測出現(xiàn)的頻頻數(shù)。該變變量的值應(yīng)應(yīng)為正整數(shù)數(shù)。若變量量值<1或缺失,相相應(yīng)的觀測測不參加計(jì)計(jì)算統(tǒng)計(jì)量量。若這個(gè)個(gè)值不是正正整數(shù),則則取整數(shù)部部分。20(5)Weight語句Weightvariable;該語句規(guī)定定一個(gè)數(shù)值值型的變量量,它的值值表示相應(yīng)應(yīng)觀測的權(quán)權(quán)數(shù)。該變變量的值應(yīng)應(yīng)大于0。若變量值值<0或缺失,假假定該值為為0。21OUTPUT[OUT=SAS-data-set][output-statistics];該語句要求求MEANS過程把計(jì)算算的描述統(tǒng)統(tǒng)計(jì)量輸出出到新的SAS數(shù)據(jù)集中,,并用任選選項(xiàng)規(guī)定新新數(shù)據(jù)集的的名及所包包含的變量量名。這里里:OUT=SAS-data-set:給出由MEANS過程產(chǎn)生的的輸出數(shù)據(jù)據(jù)集的名字字,若想創(chuàng)創(chuàng)建一個(gè)永永久數(shù)據(jù)集集,則必須須規(guī)定一個(gè)個(gè)兩級名字字,缺省時(shí)時(shí),機(jī)器默默認(rèn)的數(shù)據(jù)據(jù)集名為data1等。Output-statistics:規(guī)定在新新數(shù)據(jù)集中中所要求的的統(tǒng)計(jì)量,,并規(guī)定存存放這些統(tǒng)統(tǒng)計(jì)量的變變量名。(6)OUTPUT語句22Datastudent;inputclasssex$ageweightheight;cards;1f15461561f14411491m13481551m14381502m16551652f17501602f16601652m17651753f18651653f17581603m18701803m1768176;Run;例23Procmeansdata=student;varageweightheight;Run;Procmeansdata=studentmaxdec=2;varageweightheight;bysex;Run;觀察以下幾組組程序24procmeansdata=studentmaxdec=2;varageweightheight;classsex;run;procmeansdata=studentmaxdec=2;varageweightheight;outputout=stan=nummean=a1a2a3std=b1b2b3max=c1c2c3;run;25libnamea'd:\sasdata';procmeansdata=studentmaxdec=2;varageweightheight;outputout=a.stan=nummean=a1a2a3std=b1b2b3max=c1c2c3;run;26本次課上機(jī)作作業(yè)公共信箱下載載數(shù)據(jù)集finance,進(jìn)行如下操操作:(1)計(jì)算市場平平均股票收益益率及其相應(yīng)應(yīng)的標(biāo)準(zhǔn)差,,并將結(jié)果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論