版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2015春計(jì)量1班stata軟件入門(2)
Stata登堂入室中級(jí)計(jì)量1班助教組王赫2015.3.18任務(wù)與回顧簡介文章任務(wù)介紹上周回顧數(shù)據(jù)與命令命令語法數(shù)據(jù)存取格式、缺失數(shù)據(jù)合并數(shù)據(jù)處理描述性表格Sum命令Tab命令回歸分析Reg命令Test命令輸出命令predict命令作圖簡介Histogram命令Twoway命令ScatterLfitLine*lowess命令任務(wù)與回顧文章簡介文章簡介Health,Height,HeightShrinkage,andSESatOlderAges…olderpeoplesufferheightshrinkageduringaging.Agingisassociatedwithseveralphysiologicalandbiologicalchanges,including…adecreasein…bonemass.Onehealthconditionthatcaninfluenceshrinkagedirectlyandthroughmanyoftheseotherproximatecausesisosteoporosis.Earlyosteoporosiscanbecausedbymechanismssuchasearlymenopause,diet,exercise,smoking,excessdrinkingandexposuretocertainheavymetalssuchasleadThissuggestsapotentialrelationshipbetweenshrinkageanddifferentSESfactorsthatareassociatedwithcurrenthealthandearlychildhoodhealthproblems.(fromintroductionofthepaper)文章簡介本節(jié)課,我們僅關(guān)心身高縮短(heightshrinkage)這個(gè)問題!在同一時(shí)段內(nèi)觀測,年輕一代比年老一代的平均身高要更高稍后我們做圖表來驗(yàn)證這一點(diǎn)(CHARLS2011)有兩類原因第一,年老一代的身高發(fā)生了縮短第二,年老一代縮短前的平均身高就低于年輕一代究竟哪一類原因?yàn)橹??我們需要?duì)已經(jīng)發(fā)生身高縮短的老人,進(jìn)行身高預(yù)測如何預(yù)測?文章簡介身高預(yù)測:First,weusedatafromthe“young”group,aged45–49,andregressmeasuredheightonlowerleglength,upperarmlength,theirsquaresandinteraction,andtheHandummy.Thesecoefficientsarethenappliedinthe“older”sample,thoseaged60andabove,andthepredictedvalueistheestimatedpre-shrinkageheightforthisgroup.文章簡介
本節(jié)任務(wù)用CHARLS2011數(shù)據(jù)還原文章結(jié)果:數(shù)據(jù)處理與變量構(gòu)造變量描述表格:身高方程的估計(jì)圖:身高縮短隨年齡的變化本節(jié)任務(wù)本節(jié)任務(wù)上周回顧Stata常用的有三個(gè)界面:Do-file編輯器界面窗口界面數(shù)據(jù)界面下面我們嘗試打開一個(gè)數(shù)據(jù)在安裝目錄下,有一個(gè)名為“auto.dta”的文件帶.dta后綴的文件是Stata的專用數(shù)據(jù)文件(類比.xls文件)在Stata窗口界面的工具欄上找到圖標(biāo),通過該按鈕打開auto.dta上周回顧數(shù)據(jù)在哪兒呢?(請(qǐng)注意“聊天記錄”里白色字體命令:usexxxx,clear)上周回顧數(shù)據(jù)界面每個(gè)縱列是一個(gè)變量(variable)每個(gè)橫行是一個(gè)觀測值(observation)上周回顧打開Do-file編輯器窗口上周回顧Do-file編輯器窗口點(diǎn)擊,執(zhí)行代碼上周回顧Do-file編輯器stata窗口數(shù)據(jù)提供命令操作數(shù)據(jù)反饋結(jié)果上周回顧上周用到的命令數(shù)據(jù)庫描述:
describe變量描述:
summarizevarname;tabulatevarname生成變量:
generatevarname=exp改變變量:
replacevarname=exp剔除變量:
dropvarname排序變量:
sortvarname更改變量名:
renameold_varnamenew_varname直方圖:
histgramvarname散點(diǎn)圖:
twowayscattervarname1varname2回歸:
regressy_varnamex_varname都還記得嗎?數(shù)據(jù)與命令數(shù)據(jù)存取文件夾組織根目錄路徑$rootsraw_data$path1working_data$path2results$path3graphics$path4log_files$log_pathdo_files用$path#代替路徑數(shù)據(jù)存取例如:use“E:\00_Research\Tempwork\HeightShrinkage\raw_data\demo.dta”,clearuse“$path1\demo.dta”,clearsave“E:\00_Research\Tempwork\HeightShrinkage\working_data\part1.dta”save“$path2\part1.dta”數(shù)據(jù)存取打開數(shù)據(jù)命令use“path/data.dta”,clear存儲(chǔ)數(shù)據(jù)命令save“path/data.dta”,replace*命令加粗顯示,紅色命令是必須掌握的。斜體為被替換部分。圖片為同學(xué)需要在dofile中輸入的代碼數(shù)據(jù)格式數(shù)據(jù)主要以數(shù)值和字符串兩種形式存儲(chǔ)數(shù)值:byte,int,float…;在數(shù)據(jù)界面下為黑色顯示字符串:str#,#代表位數(shù);在數(shù)據(jù)界面下為紅色顯示數(shù)值還可以被賦予標(biāo)簽(label);在數(shù)據(jù)界面下為藍(lán)色顯示數(shù)據(jù)格式數(shù)據(jù)主要以數(shù)值和字符串兩種形式存儲(chǔ)數(shù)值:byte,int,float…字符串:str#,#代表位數(shù)數(shù)值還可以被賦予標(biāo)簽(label)描述數(shù)據(jù)庫,觀察變量格式命令describe[varname](建議以后拿到數(shù)據(jù)首先進(jìn)行des命令熟悉數(shù)據(jù))*方括號(hào)[]中的內(nèi)容是可省略的。輸入下劃線字符可以代替命令單詞。數(shù)據(jù)格式如何輸入一個(gè)字符串?用英文引號(hào)括起來”string”,會(huì)被識(shí)別為一個(gè)字符串如di“HelloWorld!”,就是展示了一個(gè)字符串將以字符串存儲(chǔ)的數(shù)字,轉(zhuǎn)為數(shù)值型的數(shù)字命令destringvarname,gen(newvar)*黑色字體的命令為非必須掌握的,作為課堂延伸。數(shù)據(jù)缺失
數(shù)據(jù)缺失如何觀察數(shù)據(jù)缺失?命令codebookvarname比describe更詳細(xì)地描述變量的各種特征數(shù)據(jù)缺失如何觀察數(shù)據(jù)缺失?命令tabvarname,m列出變量分布時(shí)會(huì)包含缺失值命令語法如何處理缺失?對(duì)同一個(gè)變量進(jìn)行有選擇地刪除/改變數(shù)值If結(jié)構(gòu)!命令語法stata命令的語法(Syntax)helptab,看一下help文件命令語法stata命令的語法(Syntax)Command[varlist][if][in],[option]一般情況下空格數(shù)量不影響命令執(zhí)行If結(jié)構(gòu)If+判斷表達(dá)式等于:==大于,小于:>,<大于等于,小于等于:>=,<=與&或
|非~,!對(duì)判斷表達(dá)式為真(取值為1)的觀測值(橫行)執(zhí)行命令命令語法例如:刪除han變量中,取值為.的缺失值再通過tab命令查看缺失情況命令語法In結(jié)構(gòu)In用于選擇命令執(zhí)行的觀測值范圍如in1/10表示僅在第1~第10個(gè)觀測值的位置執(zhí)行命令應(yīng)用in結(jié)構(gòu)比較多的是命令listvarlist將所選變量的數(shù)據(jù)全部列出,通常列出前n個(gè),如命令語法Option的妙用每個(gè)命令幾乎都有附加option,option在if/in結(jié)構(gòu)的結(jié)尾,用英文逗號(hào)隔開。Option為基礎(chǔ)命令提供了更豐富的功能,在作圖過程中會(huì)有更多的體現(xiàn)。如sum命令有一個(gè)option:,detail請(qǐng)對(duì)比二者區(qū)別之前的Use“xxx”,clearSave“xxx”,replaceTabvarname,missing都是相應(yīng)命令里常用的option可以嘗試一下去掉option的結(jié)果數(shù)據(jù)合并Raw_data文件夾中還有一個(gè)文件名為bio.dta的文件保存著同一批受訪者個(gè)人的身高、臂長、腿長的數(shù)據(jù)如何將包含不同變量的兩個(gè)文件,合并成一個(gè)文件?命令merge1:1idvarnameusing“usingdata”注意:1、在應(yīng)用merge之前,保證idvarname在兩個(gè)文件中都是經(jīng)過排序的回顧:排序命令sortvarname2、還需保證,idvarname對(duì)每個(gè)觀測值都是唯一識(shí)別并非唯一識(shí)別的情況怎么辦?比如,A文件個(gè)人數(shù)據(jù),每人有各自省份編號(hào);B文件省級(jí)數(shù)據(jù),如何合并?命令merge1:m或者mergem:1,具體請(qǐng)helpmerge*sort命令其實(shí)可以再加一些變量,如sortvar1var2,則先依var1排序,var1相同則依var2排序。數(shù)據(jù)合并合并demo.dta與bio.dta合并數(shù)據(jù)merge命令之后,會(huì)自動(dòng)生成一個(gè)變量:_mergeMasterUsingMerged_merge==1_merge==2_merge==3IdId_mergemissingmissing數(shù)據(jù)處理刪除缺失數(shù)據(jù)除drop命令,還可以使用命令keep[varname][if]與drop類似,會(huì)刪除varname以外的變量函數(shù)mi(varname),會(huì)返回一個(gè)數(shù)值如果該觀測值有缺失(包括.,.a,.b…),則返回1;否則返回0刪除無關(guān)變量數(shù)據(jù)處理處理異常值(outlier)在進(jìn)行下一步之前,先觀察每一個(gè)變量,是否有異常值,否則后續(xù)工作的結(jié)論很可能不可靠。生成demo與bio數(shù)據(jù)所用的原始代碼變量生成為了方便,將gender重命名為male重新對(duì)male變量重新賦值生成年齡變量添加變量標(biāo)簽對(duì)變量:命令
labelvarvarname“varlabel”對(duì)數(shù)值:請(qǐng)helplabeldefine和helplabelval去除數(shù)據(jù)標(biāo)簽:命令labeldroplabname描述性表格sum命令與變量描述對(duì)待回歸的變量進(jìn)行描述性統(tǒng)計(jì)(SummaryStatistics)sum命令可以加一組變量varlist,同時(shí)進(jìn)行描述還可以用by結(jié)構(gòu),分性別sum變量輸出?最直接的辦法,在結(jié)果窗口手動(dòng)copytable,到excle中sum命令與變量描述sum命令之后:對(duì)單變量sum之后描述性統(tǒng)計(jì)結(jié)果會(huì)存儲(chǔ)在一系列標(biāo)量中即標(biāo)量r(xx)中標(biāo)量(scalar):標(biāo)量存儲(chǔ)在電腦的內(nèi)存中,并不顯示于數(shù)據(jù)表格里(顯示在數(shù)據(jù)表格里的是我們的變量variable)stata中的標(biāo)量,可以存儲(chǔ)一個(gè)數(shù)值或一個(gè)字符串,類似于c語言中的普通變量,如int,float,string等sum命令與變量描述標(biāo)量怎么用?命令displayexpexp
代表一個(gè)表達(dá)式,如1+1,獨(dú)自一個(gè)數(shù)值或字符串也可以構(gòu)成表達(dá)式,如“hello,world”標(biāo)量就像一個(gè)普通數(shù)值/字符串一樣,可以直接被display命令打印在結(jié)果窗口;也可以參與普通的數(shù)學(xué)運(yùn)算;還可以被賦值給變量(填到表格中)tab命令與二維表格tab是最常用的觀察變量命令不僅可以列出單一變量的取值分別還可以列出兩個(gè)變量交叉分布的二維表格命令tabvar1var2[,row/col/cell]Option:row格子中的總數(shù)占橫行總數(shù)的百分比;col豎列;cell全體tab命令與二維表格Tab命令還可以通過option:sum(varname)來對(duì)其他變量進(jìn)行sum命令tabvar1var2,sum(var_sum)無論男性女性45-49歲群體平均身高高于60歲+群體平均身高休息一下~回歸分析本節(jié)任務(wù)reg命令與回歸Reg命令可以做任意多自變量(x變量)的多元回歸命令regyvarnamexvar1xvar2xvar3…[if]第一個(gè)變量為因變量,后邊所有變量都是自變量可以用if來控制回歸的樣本對(duì)于男性的“年輕”樣本進(jìn)行回歸分析reg命令與回歸細(xì)心同學(xué)會(huì)發(fā)現(xiàn),標(biāo)準(zhǔn)誤大小稍有差異后邊在講到異方差時(shí),我們會(huì)用到“穩(wěn)健標(biāo)準(zhǔn)誤”具體操作為在reg命令后邊,加上一個(gè)option:robustreg命令與回歸reg命令之后?。?!Obs: e(N)R2: e(r2)Adjusted-R2: e(r2_a)F-stat: e(F)SSR: e(rss)SSE: e(mss)Coeff: _b[var]Standederror:_se[var]reg命令與回歸reg命令之后!??!Obs: e(N)R2: e(r2)Adjusted-R2: e(r2_a)F-stat: e(F)SSR: e(rss)SSE: e(mss)Coeff: _b[var]Standederror:_se[var]在作業(yè)/考試需要展示回歸后的參數(shù)時(shí)用代碼display命令+內(nèi)存參數(shù)來表示!如:展示arm的回歸系數(shù)di_b[arm]如:利用SSR和SSE構(gòu)造R2die(mss)/(e(rss)+e(mss))test命令與聯(lián)合檢驗(yàn)聯(lián)合顯著性的檢驗(yàn)在回歸后,可以對(duì)變量系數(shù)的聯(lián)合顯著性進(jìn)行檢驗(yàn)命令testvar1var2var3…test命令與聯(lián)合檢驗(yàn)test命令之后定義一個(gè)標(biāo)量rf來儲(chǔ)存F統(tǒng)計(jì)量命令scalarscaname=exp回歸輸出用outreg2命令可以便捷地輸出回歸結(jié)果命令outreg2using”xxx.xls”,replace/append用option:adds(title,scalar)可以在表格底部添加一行統(tǒng)計(jì)量本節(jié)任務(wù)補(bǔ)充:二次項(xiàng)與交叉項(xiàng)在回歸方程中添加二次項(xiàng)與交叉項(xiàng)補(bǔ)充:二次項(xiàng)與交叉項(xiàng)
*如果一行命令太長,可以將命令分兩行輸入,且在第一行尾輸入空格和///補(bǔ)充:二次項(xiàng)與交叉項(xiàng)在回歸中加入:arm2,knee2,knee_arm*如果一行命令太長,可以將命令分兩行輸入,且在第一行尾輸入空格和///predict命令與預(yù)測值
怎么會(huì)預(yù)測值會(huì)偏高這么多?predict命令與預(yù)測值請(qǐng)對(duì)女性重新做一次回歸和預(yù)測直接copy代碼,并在回歸命令的if結(jié)構(gòu)中,將male==1改為male==0在長回歸方程后predict一個(gè)新變量fheight;注意修改append!predict命令與預(yù)測值最后,將男性女性預(yù)測值合并為一個(gè)pheight,再生成縮短量shrink用replace命令和if結(jié)構(gòu)本節(jié)任務(wù)Mission1completed!作圖簡介histogram命令與直方圖用histogram命令做直方圖,可以直觀地觀察變量的取值分布類似于sum,d和tab命令histogramvarname[if],[bin(#)/width(#)]由于之后預(yù)測的身高和身高縮短只適用于60+群體,所以先刪去60歲以下的觀測值:histogram命令與直方圖圖的輸出在作圖命令
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年軟件開發(fā)項(xiàng)目經(jīng)理勞動(dòng)合同3篇
- 2025年度城市廣場草坪修剪與夜間經(jīng)濟(jì)合同3篇
- 2024甲乙雙方關(guān)于區(qū)塊鏈技術(shù)研發(fā)與應(yīng)用的合同
- 2024年財(cái)產(chǎn)分割協(xié)議:無共同債權(quán)雙方自愿離婚協(xié)商書3篇
- 2024年環(huán)保新材料研發(fā)與應(yīng)用合作協(xié)議
- 2024年車間租賃合同:工業(yè)用途
- 2025賓館股權(quán)轉(zhuǎn)讓與旅游產(chǎn)品開發(fā)協(xié)議3篇
- 2024年砌墻工程質(zhì)量檢測合同
- 2024年食堂食品安全追溯系統(tǒng)委托運(yùn)營管理協(xié)議3篇
- 2024長租公寓協(xié)議標(biāo)準(zhǔn)格式版A版
- 個(gè)體工商營業(yè)執(zhí)照變更委托書
- 2024版【人教精通版】小學(xué)英語六年級(jí)下冊(cè)全冊(cè)教案
- 人教版歷史2024年第二學(xué)期期末考試七年級(jí)歷史試卷(含答案)
- 預(yù)算法及實(shí)施條例測試題(含答案)
- 2024屆新高考數(shù)學(xué)大題訓(xùn)練:數(shù)列(30題)(解析版)
- DL∕T 1802-2018 水電廠自動(dòng)發(fā)電控制及自動(dòng)電壓控制技術(shù)規(guī)范
- 50以內(nèi)加減法口算題卡(1000道打印版)每日100道
- 黑龍江省2025屆高三最后一卷歷史試卷含解析
- GB/T 4008-2024錳硅合金
- 合伙人入股合作協(xié)議書
- 2024年中級(jí)經(jīng)濟(jì)師考試題庫含答案(完整版)
評(píng)論
0/150
提交評(píng)論