![stata命令大全課件_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/bf0f8d93-5f4d-4825-9e5a-40be15b85aaf/bf0f8d93-5f4d-4825-9e5a-40be15b85aaf1.gif)
![stata命令大全課件_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/bf0f8d93-5f4d-4825-9e5a-40be15b85aaf/bf0f8d93-5f4d-4825-9e5a-40be15b85aaf2.gif)
![stata命令大全課件_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/bf0f8d93-5f4d-4825-9e5a-40be15b85aaf/bf0f8d93-5f4d-4825-9e5a-40be15b85aaf3.gif)
![stata命令大全課件_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/bf0f8d93-5f4d-4825-9e5a-40be15b85aaf/bf0f8d93-5f4d-4825-9e5a-40be15b85aaf4.gif)
![stata命令大全課件_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/bf0f8d93-5f4d-4825-9e5a-40be15b85aaf/bf0f8d93-5f4d-4825-9e5a-40be15b85aaf5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、調(diào)整變量格式: format x1 %10.3f 將x1的列寬固定為10,小數(shù)點后取三位 format x1 %10.3g 將x1的列寬固定為10,有效數(shù)字取三位 format x1 %10.3e 將x1的列寬固定為10,采用科學(xué)計數(shù)法 format x1 %10.3fc 將x1的列寬固定為10,小數(shù)點后取三位,加入千分位分隔符 format x1 %10.3gc 將x1的列寬固定為10,有效數(shù)字取三位,加入千分位分隔符 format x1 %-10.3gc 將x1的列寬固定為10,有效數(shù)字取三位,加入千分位分隔符,加入“-”表示左對
2、齊 合并數(shù)據(jù): use "C:Documents and Settingsxks桌面2006.dta", clear merge using "C:Documents and Settingsxks桌面1999.dta" 將1999和2006的數(shù)據(jù)按照樣本(observation)排列的自然順序合并起來 use "C:Documents and Settingsxks桌面2006.dta", clear merge id using "C:Documents and
3、 Settingsxks桌面1999.dta" ,unique sort 將1999和2006的數(shù)據(jù)按照唯一的(unique)變量id來合并,在合并時對id進(jìn)行排序(sort) 建議采用第一種方法。 對樣本進(jìn)行隨機篩選: sample 50 在觀測案例中隨機選取50%的樣本,其余刪除 sample 50,count 在觀測案例中隨機選取50個樣本,其余刪除 查看與編輯數(shù)據(jù): browse x1 x2 if x3>3 (按所列變量與條件打開數(shù)據(jù)查看器) edit x1 x2 if
4、x3>3 (按所列變量與條件打開數(shù)據(jù)編輯器) 數(shù)據(jù)合并(merge)與擴展(append) merge表示樣本量不變,但增加了一些新變量;append表示樣本總量增加了,但變量數(shù)目不變。 one-to-one merge: 數(shù)據(jù)源自stata tutorial中的exampw1和exampw2 第一步:將exampw1按v001v003這三個編碼排序,并建立臨時數(shù)據(jù)庫tempw1 clear use "t:statatutexampw1.dta" su summarize的簡寫
5、sort v001 v002 v003 save tempw1 第二步:對exampw2做同樣的處理 clear use "t:statatutexampw2.dta" su sort v001 v002 v003 save tempw2 第三步:使用tempw1數(shù)據(jù)庫,將其與tempw2合并: clear use tempw1 merge v001 v002 v003 using tempw2 第四步:查看合并后的數(shù)據(jù)狀況: ta _merge
6、 tabulate _merge的簡寫 su 第五步:清理臨時數(shù)據(jù)庫,并刪除_merge,以免日后合并新變量時出錯 erase tempw1.dta erase tempw2.dta drop _merge 數(shù)據(jù)擴展append: 數(shù)據(jù)源自stata tutorial中的fac19和newfac clear use "t:statatutfac19.dta" ta region append using "t:statatutnewfac"
7、60;ta region 合并后樣本量增加,但變量數(shù)不變 莖葉圖: stem x1,line(2) (做x1的莖葉圖,每一個十分位的樹莖都被拆分成兩段來顯示,前半段為04,后半段為59) stem x1,width(2) (做x1的莖葉圖,每一個十分位的樹莖都被拆分成五段來顯示,每個小樹莖的組距為2) stem x1,round(100) (將x1除以100后再做x1的莖葉圖) 直方圖 采用auto數(shù)據(jù)庫 histogram mpg, discrete frequency normal xlabel(1(1)5)&
8、#160;(discrete表示變量不連續(xù),frequency表示顯示頻數(shù),normal加入正太分布曲線,xlabel設(shè)定x軸,1和5為極端值,(1)為單位) histogram price, fraction norm (fraction表示y軸顯示小數(shù),除了frequency和fraction這兩個選擇之外,該命令可替換為“percent”百分比,和“density”密度;未加上discrete就表示將price當(dāng)作連續(xù)變量來繪圖) histogram price, percent by(foreign) (按照變量“foreign”的分類,將不同類
9、樣本的“price”繪制出來,兩個圖分左右排布) histogram mpg, discrete by(foreign, col(1) (按照變量“foreign”的分類,將不同類樣本的“mpg”繪制出來,兩個圖分上下排布) histogram mpg, discrete percent by(foreign, total) norm (按照變量“foreign”的分類,將不同類樣本的“mpg”繪制出來,同時繪出樣本整體的“總”直方圖) 二變量圖: graph twoway lfit price weight | scatter pr
10、ice weight (作出price和weight的回歸線圖“l(fā)fit”,然后與price和weight的散點圖相疊加) twoway scatter price weight,mlabel(make) (做price和weight的散點圖,并在每個點上標(biāo)注“make”,即廠商的取值) twoway scatter price weight | lfit price weight,by(foreign) (按照變量foreign的分類,分別對不同類樣本的price和weight做散點圖和回歸線圖的疊加,兩圖呈左右分布) twoway
11、 scatter price weight | lfit price weight,by(foreign,col(1) (按照變量foreign的分類,分別對不同類樣本的price和weight做散點圖和回歸線圖的疊加,兩圖呈上下分布) twoway scatter price weight fweight= displacement,msymbol(oh) (畫出price和weight的散點圖,“msybol(oh)”表示每個點均為中空的圓圈,fweight= displacement表示每個點的大小與displacement的取值大小成比例) tw
12、oway connected y1 time,yaxis(1) | y2 time,yaxis(2) (畫出y1和y2這兩個變量的時間點線圖,并將它們疊加在一個圖中,左邊“yaxis(1)”為y1的度量,右邊“yaxis(2)”為y2的) twoway line y1 time,yaxis(1) | y2 time,yaxis(2) (與上圖基本相同,就是沒有點,只顯示曲線) graph twoway scatter var1 var4 | scatter var2 var4 | scatter var3 var4 (做三個點圖的疊加)
13、0;graph twoway line var1 var4 | line var2 var4 | line var3 var4 (做三個線圖的疊加) graph twoway connected var1 var4 | connected var2 var4 | connected var3 var4 (疊加三個點線相連圖) 更多變量: graph matrix a b c y (畫出一個散點圖矩陣,顯示各變量之間所有可能的兩兩相互散點圖) graph matrix a b c d,half (生成散點圖矩陣,只顯
14、示下半部分的三角形區(qū)域) 用auto數(shù)據(jù)集: graph matrix price mpg weight length,half by( foreign,total col(1) ) (根據(jù)foreign變量的不同類型繪制price等四個變量的散點圖矩陣,要求繪出總圖,并上下排列】=具) 其他圖形: graph box y,over(x) yline(.22) (對應(yīng)x的每一個取值構(gòu)建y的箱型圖,并在y軸的0.22處劃一條水平線) graph bar (mean) y,over(x) 對應(yīng)x的每一個取值,顯示y的平
15、均數(shù)的條形圖。括號中的“mean”也可換成median、sum、sd、p25、p75等 graph bar a1 a2,over(b) stack (對應(yīng)在b的每一個取值,顯示a1和a2的條形圖,a1和a2是疊放成一根條形柱。若不寫入“stack”,則a1和a2顯示為兩個并排的條形柱) graph dot (median)y,over(x) (畫點圖,沿著水平刻度,在x的每一個取值水平所對應(yīng)的y的中位數(shù)上打點) qnorm x (畫出一幅分位-正態(tài)標(biāo)繪圖) rchart a1 a2 a2 (畫出質(zhì)量控制R圖,顯示a
16、1到a3的取值范圍) 簡單統(tǒng)計量的計算: ameans x (計算變量x的算術(shù)平均值、幾何平均值和簡單調(diào)和平均值,均顯示樣本量和置信區(qū)間) mean var1 pweight = var2 (求取分組數(shù)據(jù)的平均值和標(biāo)準(zhǔn)誤,var1為各組的賦值,var2為每組的頻數(shù)) summarize y x1 x2,detail (可以獲得各個變量的百分比數(shù)、最大最小值、樣本量、平均數(shù)、標(biāo)準(zhǔn)差、方差、峰度、偏度) *注意* stata中summarize所計算出來的峰度skewness和偏度kurtosis有問題,與E
17、CELL和SPSS有較大差異,建議不采用stata的結(jié)果。 summarize var1 aweight = var2, detail (求取分組數(shù)據(jù)的統(tǒng)計量,var1為各組的賦值,var2為每組的頻數(shù)) tabstat X1,stats(mean n q max min sd var cv) (計算變量X1的算術(shù)平均值、樣本量、四分位線、最大最小值、標(biāo)準(zhǔn)差、方差和變異系數(shù)) 概率分布的計算: (1)貝努利概率分布測試: webuse quick bitest quick=0.3,detail (假設(shè)每次
18、得到成功案例1的概率等于0.3,計算在變量quick所顯示的二項分布情況下,各種累計概率和單個概率是多少) bitesti 10,3,0.5,detail (計算當(dāng)每次成功的概率為0.5時,十次抽樣中抽到三次成功案例的概率:低于或高于三次成功的累計概率和恰好三次成功概率) (2)泊松分布概率: display poisson(7,6) .44971106 (計算均值為7,成功案例小于等于6個的泊松概率) display poissonp(7,6) .14900278 (計算均值為7,成功案例恰好等于6個的
19、泊松概率) display poissontail(7,6) .69929172 (計算均值為7,成功案例大于等于6個的泊松概率) (3)超幾何分布概率: display hypergeometricp(10,3,4,2) .3 (計算在樣本總量為10,成功案例為3的樣本總體中,不重置地抽取4個樣本,其中恰好有2個為成功案例的概率) display hypergeometric(10,3,4,2) .96666667 (計算在樣本總量為10,成功案例為3的樣本總體中,不重置地抽取4個樣本,其中有
20、小于或等于2個為成功案例的概率) 檢驗極端值的步驟: 常見命令:tabulate、stem、codebook、summarize、list、histogram、graph box、gragh matrix step1.用codebook、summarize、histogram、graph boxs、graph matrix、stem看檢驗數(shù)據(jù)的總體情況: codebook y x1 x2 summarize y x1 x2,detail histogram x1,norm(正態(tài)直方圖) graph box x1(箱圖)
21、60;graph matrix y x1 x2,half(畫出各個變量的兩兩x-y圖) stem x1(做x1的莖葉圖) 可以看出數(shù)據(jù)分布狀況,尤其是最大、最小值 step2.用tabulate、list細(xì)致尋找極端值 tabulate code if x1=極端值(作出x1等于極端值時code的頻數(shù)分布表,code表示地區(qū)、年份等序列變量,這樣便可找出那些地區(qū)的數(shù)值出現(xiàn)了錯誤) list code if x1=極端值(直接列出x1等于極端值時code的值,當(dāng)x1的錯誤過多時,不建議使用該命令) list in -20/l(l表示la
22、st one,-20表示倒數(shù)第20個樣本,該命令列出了從倒數(shù)第20個到倒數(shù)第一個樣本的各變量值) step3.用replace命令替換極端值 replace x1=? if x1=極端值 去除極端值: keep if y<1000 drop if y>1000 對數(shù)據(jù)排序: sort x gsort +x (對數(shù)據(jù)按x進(jìn)行升序排列) gsort -x (對數(shù)據(jù)按x進(jìn)行降序排列) gsort -x, generate(id) mfirst (對數(shù)據(jù)按x進(jìn)行
23、降序排列,缺失值排最前,生成反映位次的變量id) 對變量進(jìn)行排序: order y x3 x1 x2 (將變量按照y、x3、x1、x2的順序排列) 生成新變量: gen logx1=log(x1)(得出x1的對數(shù)) gen x1=exp(logx1)(將logx1反對數(shù)化) gen r61_100=1 if rank>=61&rank<=100(若rank在61與100之間,則新變量r61_100的取值為1,其他為缺失值) replace r61_100 if r61_100!=1(“!=”表示
24、不等于,若r61_100取值不為1,則將r61_100替換為0,就是將上式中的缺失值替換為0) gen abs(x)(取x的絕對值) gen ceil(x)(取大于或等于x的最小整數(shù)) gen trunc(x)(取x的整數(shù)部分) gen round(x)(對x進(jìn)行四舍五入) gen round(x,y)(以y為單位,對x進(jìn)行四舍五入) gen sqrt(x)(取x的平方根) gen mod(x,y)(取x/y的余數(shù)) gen reldif(x,y)(取x與y的相對差異,即|x-y|/(|y|+1)) ge
25、n logit(x)(取lnx/(1-x)) gen x=autocode(x,n,xmin,xmax)(將x的值域,即xmax-xmin,分為等距的n份) gen x=cond(x1>x2,x1,x2)(若x1>x2成立,則取x1,若x1>x2不成立,則取x2) sort x gen gx=group(n)(將經(jīng)過排序的變量x分為盡量等規(guī)模的n個組) egen zx1=std(x1)(得出x1的標(biāo)準(zhǔn)值,就是用(x1-avgx1)/sdx1) egen zx1=std(x1),m(0) s(1)(得出x1的標(biāo)準(zhǔn)分,標(biāo)
26、準(zhǔn)分的平均值為0,標(biāo)準(zhǔn)差為1) egen sdx1=sd(x1)(得出x1的標(biāo)準(zhǔn)差) egen meanx1=mean(x1)(得出x1的平均值) egen maxx1=max(x1)(最大值) egen minx1=min(x1)(最小值) egen medx1=med(x1)(中數(shù)) egen modex1=mode(x1)(眾數(shù)) egen totalx1=total(x1)(得出x1的總數(shù)) egen rowsd=sd(x1 x2 x3)(得出x1、x2和x3聯(lián)合的標(biāo)準(zhǔn)差) egen rowmea
27、n=mean(x1 x2 x3)(得出x1、x2和x3聯(lián)合的平均值) egen rowmax=max(x1 x2 x3)(聯(lián)合最大值) egen rowmin=min(x1 x2 x3)(聯(lián)合最小值) egen rowmed=med(x1 x2 x3)(聯(lián)合中數(shù)) egen rowmode=mode(x1 x2 x3) (聯(lián)合眾數(shù)) egen rowtotal=total(x1 x2 x3)(聯(lián)合總數(shù)) egen xrank=rank(x)(在不改變變量x各個值排序的情況下,獲得反映x值大小排序的xrank) 數(shù)據(jù)計算器di
28、splay命令: display x12(顯示x的第十二個觀察值) display chi2(n,x)(自由度為n的累計卡方分布) display chi2tail(n,x)(自由度為n的反向累計卡方分布,chi2tail(n,x)=1-chi2(n,x)) display invchi2(n,p)(卡方分布的逆運算,若chi2(n,x)=p,那么invchi2(n,p)=x) display invchi2tail(n,p)(chi2tail的逆運算) display F(n1,n2,f)(分子、分母自由度分別為n1和n2的累計F分
29、布) display Ftail(n1,n2,f)(分子、分母自由度分別為n1和n2的反向累計F分布) display invF(n1,n2,P)(F分布的逆運算,若F(n1,n2,f)=p,那么invF(n1,n2,p)=f) display invFtail(n1,n2,p)(Ftail的逆運算) display tden(n,t)(自由度為n的t分布) display ttail(n,t)(自由度為n的反向累計t分布) display invttail(n,p)(ttail的逆運算) 給數(shù)據(jù)庫和變量做標(biāo)記:
30、label data ""(對現(xiàn)用的數(shù)據(jù)庫做標(biāo)記,""就是標(biāo)記,可自行填寫) label variable x ""(對變量x做標(biāo)記) label values x label1(賦予變量x一組標(biāo)簽:label1) label define label1 1 "a1" 2 "a2"(定義標(biāo)簽的具體內(nèi)容:當(dāng)x=1時,標(biāo)記為a1,當(dāng)x=2時,標(biāo)記為a2) 頻數(shù)表: tabulate x1,sort tab1 x1-x7,sort(做x1到x
31、7的頻數(shù)表,并按照頻數(shù)以降序顯示行) table c1,c(n x1 mean x1 sd x1)(在分類變量c1的不同水平上列出x1的樣本量和平均值) 二維交互表: auto數(shù)據(jù)庫: table rep78 foreign, c(n mpg mean mpg sd mpg median mpg) center row col (rep78,foreign均為分類變量,rep78為行變量,foreign為列變量,center表示結(jié)果顯示在單元格中間,row表示計算行變量整體的統(tǒng)計量,col表示計算列變量整體的統(tǒng)計量) tabulate
32、 x1 x2,all (做x1和x2的二維交互表,要求顯示獨立性檢驗chi2、似然比卡方獨立性檢驗lrchi2、對定序變量適用的等級相關(guān)系數(shù)gamma和taub、以及對名義變量適用的V) tabulate x1 x2,column chi2(做x1和x2的二維交互表,要求顯示列百分比和行變量和列變量的獨立性檢驗零假設(shè)為變量之間獨立無統(tǒng)計關(guān)系) tab2 x1-x7,all nofreq(對x1到x7這七個變量兩兩地做二維交互表,不顯示頻數(shù):nofreq) 三維交互表: by x3,sort:tabulate x1 x2,nofreq col c
33、hi2(同時進(jìn)行x3的每一個取值內(nèi)的x1和x2的二維交互表,不顯示頻數(shù)、顯示列百分比和獨立性檢驗) 四維交互表: table x1 x2 x3,c(ferq mean x1 mean x2 mean x3) by(x4) tabstat X1 X2,by(X3) stats(mean n q max min sd var cv) col(stats) tabstat X1 X2,by(X3) stats(mean range q sd var cv p5 p95 median),aw=X4(以X4為權(quán)重求X1、X2的均值,標(biāo)準(zhǔn)差、方差等) tt
34、est X1=1 count if X1=0 count if X1>=0 gen X2=1 if X1>=0 corr x1 x2 x3(做x1、x2、x3的相關(guān)系數(shù)表) swilk x1 x2 x3(用Shapiro-Wilk W test對x1、x2、x3進(jìn)行正太性分析) sktest x1 x2 x3(對x1、x2、x3進(jìn)行正太性分析,可以求出峰度和偏度) ttest x1=x2(對x1、x2的均值是否相等進(jìn)行T檢驗) ttest x1,by(x2) unequal(按x2的分組方式對x1進(jìn)行T
35、檢驗,假設(shè)方差不齊性) sdtest x1=x2(方差齊性檢驗) sdtest x1,by(x2)(按x2的分組方式對x1進(jìn)行方差齊性檢驗) 聚類分析: cluster kmeans y x1 x2 x3, k(3) 依據(jù)y、x1、x2、x3,將樣本分為n類,聚類的核為隨機選取 cluster kmeans y x1 x2 x3, k(3) measure(L1) start(everykth) "start"用于確定聚類的核,"everykth"表示將通過構(gòu)造三組樣本獲得聚類核:構(gòu)
36、造方法為將樣本id為1、1+3、1+3×2、 1+3×3分為一組、將樣本id為2、2+3、2+3×2、2+3×3分為第二組,以此類推,將這三組的均值作為聚類的核;"measure"用 于計算相似性和相異性的方法,"L1"表示采用歐式距離的絕對值,也直接可采用歐式距離(L2)和歐式距離的平方(L2squared)。PS:這個方法 所得的結(jié)果與SPSS所得結(jié)果相同。 sort c1 c2(對c1和c2兩個分類變量排序) by c1 c2:reg y x1 x2 x3(在c1、c2的各個水平上分別進(jìn)行
37、回歸) bysort c1 c2:reg y x1 x2 x3 if c3=1(逗號前面相當(dāng)于將上面兩步驟合一,既排序又回歸,逗號后面的“if c3=1”表示只有在c3=1的情況下才進(jìn)行回歸) stepwise, pr(.2): reg y x1 x2 x3(使用Backward selection,去除P值大于0.2時變量) stepwise, pe(.2): reg y x1 x2 x3(使用forward selection,去除P值小于0.2時變量) stepwise, pr(.2) pe(.01):reg y x1 x2 x3(使用backwa
38、rd-stepwise selection,取P值在0.01和0.2之間的變量) stepwise, pe(.2) forward: reg y x1 x2 x3(使用forward-stepwise selection) reg y x1 x2 x3 predict Yhat,xb predict u,resid predict ustd,stdr(獲得殘差的標(biāo)準(zhǔn)誤) predict std,stdp(獲得y估計值的標(biāo)準(zhǔn)誤) predict stdf,stdf(獲得y預(yù)測值的標(biāo)準(zhǔn)誤) predict e,e(1,
39、12)(獲得y在1到12之間的估計值) predict p,pr(1,12)(獲得y在1到12之間的概率) predict rstu,rstudent(獲得student的t值) predict lerg,leverage(獲得杠桿值) predict ckd,cooksd(獲得cooksd) reg y x1 x2 x3 c1 c2 adjust x1 x2 x3,se(使得變量x1、x2和x3等于其均值,求y的預(yù)測值和標(biāo)準(zhǔn)誤) adjust x1 x2 x3,stdf ci(使得變量x1、x2和x3等于其均值,求y的預(yù)測
40、值,預(yù)測標(biāo)準(zhǔn)誤和置信區(qū)間) adjust x1 x2,by(c1) se ci(控制變量x1、x2,亦即取它們的均值,在分類變量c1的不同水平上求y預(yù)測值,標(biāo)準(zhǔn)誤和置信區(qū)間) adjust x1 x2 x3,by(c1) stdf ci(控制變量x1、x2、x3,亦即取它們的均值,在分類變量c1的不同水平上求y預(yù)測值,預(yù)測標(biāo)準(zhǔn)誤和置信區(qū)間) adjust x1 x2,by(c1 c2) se ci(控制變量x1、x2,在分類變量c1、c2的不同水平上求y的預(yù)測值,標(biāo)準(zhǔn)誤和置信區(qū)間) adjust x1 x2 x3,by(c1 c2) stdf ci(控制
41、變量x1、x2、x3,在分類變量c1、c2的不同水平上求y的預(yù)測值,預(yù)測標(biāo)準(zhǔn)誤和置信區(qū)間) adjust x1=a x2=b x3=c,se ci(當(dāng)x1=a、x2=b、x3=c時,求y的預(yù)測值、標(biāo)準(zhǔn)誤和置信區(qū)間) adjust x1=a x2=b x3=c,by(c1) se ci(當(dāng)x1=a、x2=b、x3=c時,在分類變量c1的不同水平上,求y的預(yù)測值、標(biāo)準(zhǔn)誤和置信區(qū)間) adjust x1=a x2=b c1=1,by(c1) se ci(當(dāng)x1=a、x2=b,并假設(shè)所有的樣本均為c1=1,求在分類變量c1的不同水平上,因為變量x3的均值不同,而導(dǎo)致的y的
42、不同的預(yù)測值) mvreg Y1 Y2 : X1 X2 X3(多元回歸) mvreg y1 y2 y3: x1 x3 x3(多元回歸分析,y1 y2 y3為因變量,x1 x3 x3為自變量) 以下命令只有在進(jìn)行了mvreg之后才能進(jìn)行 test y1(測試對y1的回歸系數(shù)聯(lián)合為0) test y1: x1 x2(測試對y1的回歸中x1、x2的系數(shù)為0) test x1 x2 x3(測試在所有的回歸中,x1、x2、x3的系數(shù)均為0) test y1=y2(對y1的回歸和對y2的回歸系數(shù)相等) test y1=y2:
43、x1 x2 x3, mtest(對y1和y2的回歸中,分別測試x1、x2、x3的系數(shù)是否相等,若沒有mtest這個命令,則測試他們的聯(lián)和統(tǒng)計) test y1=y2=y3(三個回歸的系數(shù)是否相等,可加mtest以分別測試) test y1=y2=y3: x1 x2 (測試三個回歸中的x1、x2是否相等,可加mtest) est命令的用法: (1)儲存回歸結(jié)果: reg y x1 x2 x3(不限于reg,也可儲存ivreg、mvreg、reg3) est store A (2)重現(xiàn)回歸結(jié)果: est replay
44、A (3)對回歸結(jié)果進(jìn)行進(jìn)一步分析 est for A:sum(對A回歸結(jié)果中的各個變量運行sum命令) 異方差問題: 獲得穩(wěn)健性標(biāo)準(zhǔn)誤 reg y x1 x2 x3 if c1=1(當(dāng)分類變量c1=1時,進(jìn)行y和諸x的回歸) reg y x1 x2 x3,robust(回歸后顯示各個自變量的異方差-穩(wěn)健性標(biāo)準(zhǔn)誤) estat vif(回歸之后獲得VIF) estat hettest,mtest(異方差檢驗) 異方差檢驗的套路: (1)Breusch-pagan法: reg y x1
45、x2 x3 predict u,resid gen usq=u2 reg usq x1 x2 x3 求F值 display R/(1-R)*n2/n1(n1表示分子除數(shù),n2表示分母除數(shù)) display Ftail() 求LM值 display R*n(n表示總樣本量) display chi2tail() (2)white法: reg y x1 x2 x3 predict u,resid gen usq=u2 predict y gen ys
46、q=y2 reg usq y ysq 求F值 display R/(1-R)*n2/n1(n1表示分子除數(shù),n2表示分母除數(shù)) display Ftail() 求LM值 display R*n(n表示總樣本量) display chi2tail() (3)必要補充 F值和LM值轉(zhuǎn)換為P值的命令: display Ftail(n1,n2,a)(利用F值求p值,n1表示分子除數(shù),n2表示分母除數(shù),a為F值) display chi2tail(n3,b)(利用LM值求p值,n3表示自由度的損
47、失量,一般等于n1,b為LM值) 異方差的糾正WLS(weighted least square estimator) (1)基本思路: reg y x1 x2 x3 aw=x1(將x1作為異方差的來源,對方程進(jìn)行修正) 上式相當(dāng)于: reg y/(x10.5) 1/(x10.5) x1/(x10.5) x2/(x10.5) x3/(x10.5),noconstant (2)糾正異方差的常用套路(構(gòu)造h值) reg y x1 x2 x3 predict u,resid gen usq=u2 ge
48、n logusq=log(usq) reg logusq x1 x2 x3 predict g gen h=exp(g) reg y x1 x2 x3 aw=1/h 異方差hausman檢驗: reg y x1 x2 x3 est store A(將上述回歸結(jié)果儲存到A中) reg y x1 x2 x3 aw=1/h est store B hausman A B 當(dāng)因變量為對數(shù)形式時(log(y))如何預(yù)測y reg logy x1 x2 x3 predict k
49、 gen m=exp(k) reg y m,noconstant m的系數(shù)為i y的預(yù)測值=i×exp(k) 方差分析: 一元方差分析 anova y g1 / g1|g2 /(g*表示不同分類變量,計算g1和交互項/ g1|g2 /這兩種分類的y值是否存在組內(nèi)差異) anova y d1 d2 d1*d2(d*表示虛擬變量,計算d1、d2和d1*d2的這三種分類的y值是否有組內(nèi)差異) anova y d1 d2 x1 d2*x1, continuous(x1)(x*表示連續(xù)的控制變量)
50、0;多元方差分析 webuse jaw manova y1 y2 y3 = gender fracture gender*fracture(按性別、是否骨折及二者的交互項對y1、y2和y3進(jìn)行方差分析) manova y1 = gender fracture gender*fracture(相當(dāng)于一元方差分析,以y1為因變量) webuse nobetween gen mycons = 1 manova test1 test2 test3 = mycons, noconstant mat c = (1,0,-1
51、0,1,-1) manovatest mycons, ytransform(c) 進(jìn)行多元回歸的方法: 多元回歸分析:(與mvreg相同) foreach vname in y1 y2 y3 (確定y變量組vname) reg vname' x1 x2 x3 (將y變量組中的各個變量與諸x變量進(jìn)行回歸分析,注意vname的標(biāo)點符號) 上式等價于: mvreg y1 y2 y3 = x1 x2 x3 reg3命令: (1)簡單用法: reg3 (y1 = x1 x2 x3) (
52、y2 = x1 x3 x4) (y3 = x1 x2 x5) 測試y1 coefs = 0 test y1 測試不同回歸中相同變量的系數(shù): test y1=y2=y3, common test (y1=y2) (y1=y3), common constant(constant表示包含截距項) (2)用reg3進(jìn)行2SLS reg3 (y1 = y2 x1 x2) (y2 = y1 x4),2sls (2)用reg3進(jìn)行OLS reg3 (y1 = y2 x1 x2) (y2 = y1 x4),ols
53、60;對兩個回歸結(jié)果進(jìn)行hausman檢驗: reg3 (y1=x1 x2 x3)(y2=y1 x4),2sls est store twosls reg3 (y1=x1 x2 x3)(y2=y1 x4),ols est store ols hausman twosls ols,equations(1:1)(對兩次回歸中的方程1,即“y1=x1 x2 x3”進(jìn)行hausman檢驗) hausman twosls ols,equations(2:2)(對兩次回歸中的方程2,即“y2=y1 x4”進(jìn)行hausman檢驗) hau
54、sman twosls ols,alleqs(對所有方程一起進(jìn)行檢驗) 檢驗忽略變量(模型的RESET): reg y x1 x2 x3 estat ovtest 滯后變量的制取 對變量y滯后一期: gen y_l1=y_n-1 滯后兩期: gen y_l2=y_n-2 以此類推。 制取樣本序號: gen id=_n 獲得樣本總量: gen id=_N 時間序列回歸: 回歸元嚴(yán)格外生時AR(1)序列相關(guān)的檢驗 reg y x1 x2
55、160;predict u,resid gen u_1=u_n-1 reg u u_1,noconstant 回歸之后,u_1的序數(shù)如果不異于零,則該序列不相關(guān) 用Durbin-Watson Statistics檢驗序列相關(guān): tsset year (對時間序列回歸中代表時間的變量進(jìn)行定義) reg y x1 x2 dwstat (求出時間序列回歸的DW值) durbina (對該回歸是否具有序列相關(guān)進(jìn)行檢驗,H0為無序列相關(guān),可根據(jù)chi2值求出P值) durbina,small (small可以根據(jù)F
56、值求出P值,以代替chi2值) durbina,force (讓檢驗?zāi)茉趓obust、neway之后進(jìn)行) durbina,small lag(1/10) (lag可以求出更高階滯后的序列相關(guān),如本例中可求出1到10階的序列相關(guān)) durbina,robust lag(1/10) (robust可進(jìn)行異方差穩(wěn)健性回歸,避免未知形式的異方差) bgodfrey (利用Breusch-Godfrey test求出高階序列相關(guān)) bgodfrey,small lag(1/10) 數(shù)據(jù)調(diào)查:survey data 源數(shù)據(jù):datas
57、et文件夾中的svydata 步驟: 1、定義survey data svyset psuid pweight=finalwgt, strata(stratid) 定義primary sampling unit為psuid??赡苁菧y試的編號,1or2 定義pweight為finalwgt 定義stratum identifer為stratid??赡苁菧y試中被試的編號,1to31 2、生成male gen male= (sex=1) if !missing(sex) 當(dāng)sex不缺失且等于1時,male=se
58、x 3、生成行變量為highbp,列變量為sizplace的表格 svy, subpop(male): tabulate highbp sizplace, col obs pearson lr null wald subpop規(guī)定了以male為數(shù)據(jù)調(diào)查的范圍 tabulate highbp sizplace表示繪制行變量為highbp,列變量為sizplace的表格 col表示每一列的加總為100%,row表示每一行的加總為100%,cell表示橫縱所有單元格的加總為100% obs表示列出每個單元格的樣本量,se表示列出每個單元格的
59、標(biāo)準(zhǔn)誤,ci表示列出每個單元格的置信區(qū)間 pearson表示求取pearson's chi-squired,皮爾遜的卡方檢定 lr表示求取likelihood ratio null表示求取null-based statistics wald表示求取adjusted wald,llwald表示求取adjusted log-linear Wald,noadjust表示求取unadjusted Wald statistics 4、svy:mean x1 x2 x3 對x1、x2、x3求取mean、se和ci 5、簡單的tabulate twoway(不用svyset就可執(zhí)行) tab2 y x,col chi2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 校園文化建設(shè)與小學(xué)生綜合素質(zhì)提升策略
- 科技與家居營銷的深度融合探討
- 數(shù)字經(jīng)濟與宏觀經(jīng)濟的協(xié)同發(fā)展研究
- 提升學(xué)習(xí)效率從改善學(xué)生睡眠開始
- 環(huán)保材料在家裝中的應(yīng)用與美學(xué)
- 2025年漯河食品職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 科技驅(qū)動的學(xué)前兒童智能培養(yǎng)方案
- 2025年湖南食品藥品職業(yè)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 科普力量啟航-揭開教育科技領(lǐng)域的星辰大海
- 2025年高壓電動噴霧器項目可行性研究報告
- 電力基建復(fù)工安全教育培訓(xùn)
- 2018注冊環(huán)保工程師考試公共基礎(chǔ)真題及答案
- 勞務(wù)經(jīng)紀(jì)人培訓(xùn)
- 如何提高售后服務(wù)的快速響應(yīng)能力
- ?;愤\輸安全緊急救援與處理
- Unit-3-Reading-and-thinking課文詳解課件-高中英語人教版必修第二冊
- 高數(shù)(大一上)期末試題及答案
- 婚介公司紅娘管理制度
- 煤礦電氣試驗規(guī)程
- 物業(yè)客服培訓(xùn)課件PPT模板
- 火力發(fā)電廠節(jié)能管理制度實施細(xì)則
評論
0/150
提交評論