(完整word版)Stata命令整理_第1頁
(完整word版)Stata命令整理_第2頁
(完整word版)Stata命令整理_第3頁
(完整word版)Stata命令整理_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Stata 命令語句格式:by varlist : command varlist = exp if exp in range weight , options 1、 by varlist :* 如果需要分別知道國產(chǎn)車和進(jìn)口車的價(jià)格和重量,可以采用分類操作來求得,sort foreign /按國產(chǎn)車和進(jìn)口車排序. by foreign : sum price weight* 更簡(jiǎn)略的方式是把兩個(gè)命令用一個(gè)組合命令來寫。. by foreign , sort : sum price weight如果不想從小到大排序,而是從大到小排序,其命令為gsort 。. sort - price / 按價(jià)格

2、從高到低排序. sort foreign -price /* 先把國產(chǎn)車都排在前,進(jìn)口車排在后面, 然后在國產(chǎn)車內(nèi)再按價(jià)格從大小到排序,在進(jìn)口車內(nèi)部,也按從大到小排序*/2、 = exp賦值運(yùn)算. gen nprice =price+10 / 生成新變量nprice,其值為 price+10/* 上面的命令 generate(略寫為 gen) 生成一個(gè)新的變量,新變量的變量名為nprice,新的價(jià)格在原價(jià)格的基礎(chǔ)上均增加了10 元。. replace nprice =nprice -10 /* 命令 replace則直接改變?cè)兞康馁x值,nprice調(diào)減后與 price變量取值相等 */3、

3、if exp條件表達(dá)式. list make price ifforeign=0* 只查看價(jià)格超過1 萬元的進(jìn)口車(同時(shí)滿足兩個(gè)條件) ,則. list make price if foreign=1 & price>10000* 查看價(jià)格超過 1萬元或者進(jìn)口車(兩個(gè)條件任滿足一個(gè)). list make price ifforeign=1 | price>100004、 in range 范圍篩選sum price in 1/5注意 “1/5中”,斜杠不是除號(hào),而是從1 到 5的意思,即 1, 2,3, 4, 5。如果要計(jì)算前 10臺(tái)車中的國產(chǎn)車的平均價(jià)格,則可將范圍和條

4、件篩選聯(lián)合使用。. sum price in 1/10 if foreign=05、 weight 加權(quán)sum score weight=num其中, num 為每個(gè)成績所對(duì)應(yīng)的人數(shù)6、 , options 其他可選項(xiàng)例如,我們不僅要計(jì)算平均成績,還想知道成績的中值,方差,偏度和峰度等*/. sum score, detail. sum score, d /d 為 detail 的略寫,兩個(gè)命令完全等價(jià). list price , nohead /不要表頭Stata 數(shù)據(jù)類型轉(zhuǎn)換1、字符型轉(zhuǎn)化成數(shù)值型destring, replace/全部轉(zhuǎn)換為數(shù)值型,replace 表示將原來的變量(值)更

5、新destring date, replace ignore(“將字”符)型數(shù)據(jù)轉(zhuǎn)換為數(shù)值型數(shù)據(jù):去掉字符間的空格destring price percent , gen(price2 percent2 ) ignore($ “,% ”) 與 date 變量類似,變量price前面有美元符號(hào),變量percent后有百分號(hào),換為數(shù)值型時(shí)需要忽略這些非數(shù)值型字符2、數(shù)值型轉(zhuǎn)化為字符型tostringyear day, replace/將年和日轉(zhuǎn)化為字符型gen date1=month+ ” / ” +day+ ” / ”/month+year day 變?yōu)樽址秃罂梢赃\(yùn)算,將年月日構(gòu)成一個(gè)新的日期

6、變量gen date2=date(date1,” mdy/*”date)()為日期函數(shù), 它以1960 年 1月 1日為第 0 天,計(jì)算從那天起直到括號(hào)中指定的某天date1 一共過了多少天?!眒dy”指定 date1 的排列順序,這里是按照月日年的順序來表示日期。*/數(shù)據(jù)顯示格式/*format只控制數(shù)據(jù)的顯示格式,并不改變內(nèi)存中數(shù)據(jù)的大小。*/變量的格式為%14s ,表示右對(duì)齊,共14 個(gè)字符 ,%為固定用法(字符變量跟s,數(shù)值變量跟 g)ormat state %-14s / 該命令使 stata 的顯示格式左對(duì)齊 ,14前面多了個(gè)負(fù)號(hào)formatpop %11.0gc /*pop的顯示

7、格式為%11.0g,后面加上c,則每三位數(shù)間用逗號(hào)分開 ,c 為 comma 的意思 .*/formatmedage %8.1f /要求所有的 medage 都顯示一位小數(shù)formatid %05.0f /對(duì)于編號(hào),我們希望前面用零使得位數(shù)對(duì)齊,通過在前面補(bǔ)零,所有的 id都成了5 位數(shù)。導(dǎo)入 /導(dǎo)出其他格式數(shù)據(jù)1、數(shù)據(jù)導(dǎo)入insheet using3origin.csv/txt , clearinsheet using3origin.txt , double clear當(dāng)數(shù)據(jù)中某個(gè)變量的位數(shù)特別長或者對(duì)導(dǎo)入數(shù)據(jù)的精度要求很高的時(shí)候,需要在該命令后面加double 選項(xiàng)。2、數(shù)據(jù)導(dǎo)出outsh

8、eet using myresult.asc, nonames如果不希望在第一行存儲(chǔ)變量名, 則可以使用 nonames選項(xiàng)outsheet using myresult.asc, nonames replace 如果文件已經(jīng)存在,則需要使用replace 選項(xiàng)數(shù)據(jù)合并1、 縱向合并use male, clear /打開記錄男生信息的數(shù)據(jù)文件maleappend usingfemale /將記錄女生信息的female 文件追加到當(dāng)前數(shù)據(jù)集中save mydata1, replace2、 橫向合并use economy,clear / 打開經(jīng)濟(jì)學(xué)成績數(shù)據(jù)文件sort id / 按學(xué)號(hào)排序save

9、 economy, replace / 重新保存一下use student,c clear /打開學(xué)生基本信息數(shù)據(jù)文件sort id /按學(xué)號(hào)排序merge id using economy /以學(xué)號(hào)為關(guān)聯(lián),將學(xué)生的信息和成績一一對(duì)應(yīng)對(duì)接tab _merge / 顯示對(duì)接情況, 3 表示成功對(duì)接,1 和 2 表示未成功對(duì)接drop _merge/去掉標(biāo)識(shí)對(duì)接是否成功變量_mergeStata 很多命令可單獨(dú)使用,單獨(dú)使用時(shí),一般是對(duì)所有變量進(jìn)行操作,等價(jià)于后面加上代表所有變量的 _all數(shù)據(jù)重整1、長寬轉(zhuǎn)換寬:長:1)寬變長use mywide, clearreshape long math

10、economy, i( id name) j( year) /數(shù)據(jù)重整 ,寬變長 save mylong, replace2)長變寬reshape wide* 或者use mylong , clearreshape wide math economy, i(id name) j( yearr) / 數(shù)據(jù)重整 ,長變寬 save mywide2, replace2、多列數(shù)據(jù)轉(zhuǎn)為少數(shù)幾列有些數(shù)據(jù)集雖然有很多列,但實(shí)際上只有一個(gè)變量,利用stata 轉(zhuǎn)化成一項(xiàng)數(shù)據(jù)。stack var1 -var6, into(x) clearx 是新生成變量的名稱drop _stack變量stack記錄觀測(cè)值原來所

11、在行數(shù)3、數(shù)據(jù)轉(zhuǎn)置use math,clearxpose, clear變量運(yùn)算:Stata 中,加( +)號(hào)同樣可用于字符運(yùn)算,當(dāng)加號(hào)出現(xiàn)在兩個(gè)字符之間時(shí),兩個(gè)字符將被連成一個(gè)字符。比如把 ”我愛 ” “STA”合并在一起,命令為:. scalar a= 我愛” + “ STATA”一些運(yùn)算函數(shù):comb(n,k) 從 n 中取 k 個(gè)的組合fill()自動(dòng)填充數(shù)據(jù)int(x)取整log10(x)以 10 為底的對(duì)數(shù)mod(x,y)求余數(shù)round(x)四舍五入di round(3.345,.1) / 四舍五入到十分位,結(jié)果為3.3di round(3.345,.01) /四舍五入到百分位,結(jié)

12、果為3.35di round(335.1,10) / 四舍五入到十位,結(jié)果為340sqrt(x) 開更號(hào)substr(s,n1,n2) 從 S 的第n1 個(gè)字符開始,截取n2 個(gè)字符word(s,n) 返回 s 的第 n個(gè)字符_n 當(dāng)前觀察值的序號(hào)_N 共有多少觀察值gen y=sum( x) /求列累積和egen z=sum( x) /求列總和egen avgx=mean( x) / 求列均值egen byte dxy = diff( x y) / 當(dāng) x 與 y 相等時(shí), differ 取 0,若不相等為1分離變量值clearinput str15 x"10*123"&

13、quot;543*21""12*422""43532*32134""4349*1"endgen a=strpos(x,"*")gen b=substr(x,1,a -1)gen c=substr(x,a+1,.)/計(jì)算出 * 所在的位數(shù)/取 * 前面的字符/取* 后面的字符stata 中,系統(tǒng)缺失值大于任何一個(gè)數(shù)據(jù),因此在生成分類啞變量時(shí):gen agegrp2=(age>=65) if age<.生成的數(shù)據(jù)中,將缺失值排除在外生成分組變量:clearset obs 100 / 設(shè)定 100

14、個(gè)觀察值gen age=_n /生成一個(gè)假設(shè)的年齡變量age,依次取1,recode age (min/30=1) (30/60=2) (60/max=3),gen(agegrp) /*2, 100生成新的分組變量agegrp,當(dāng)年齡 age 在30 及以下時(shí)取值為1,30 到60 為2, 60 以上為3*/分組運(yùn)算:by x, sort: gen n1=_n 根據(jù) x 的不同,生成n1 變量對(duì)不同類的x 計(jì)數(shù)by hhid,sort: egen mage=mean( age) /根據(jù)不同類別求平均年齡bysort hhid (age): gen nid1=_n / 括號(hào)中的變量age 只排序

15、,不參于分組。bysort hhid age: gen nid2=_n / hhid 和 ag e 都既用來參與排序也分組encode country, gen(country1)將文本變量轉(zhuǎn)化為數(shù)值變量di splay 5+9顯示計(jì)算結(jié)果sum price weight描述統(tǒng)計(jì):求價(jià)格和重量的觀察值個(gè)數(shù)、平均值、標(biāo)準(zhǔn)差、最小值和最大值scatter price weight line price weight, sort繪出價(jià)格和重量的散點(diǎn)圖繪出價(jià)格和重量的折線圖clear 清除內(nèi)存中原有內(nèi)容cd d:/stata9在打開數(shù)據(jù)之前,先定位數(shù)據(jù)的位置use打開STATA格式的數(shù)據(jù)文件set o

16、bs 5 /設(shè)定5 個(gè)觀察值dir查看當(dāng)前路徑下有哪些文件save mydata / 保存數(shù)據(jù),數(shù)據(jù)文件名為mydatasave mydata, replace如果同一文件夾下已經(jīng)存有mydata.dta,而你又要再次執(zhí)行savemydata 時(shí)edit 編輯數(shù)據(jù)log 將輸出結(jié)果存放入結(jié)果文件gen id=_n / 生成一個(gè)新變量 id,根據(jù)觀測(cè)值排列順序從上到下取值依次為 123 replace id=9842 in 3 第三個(gè)觀測(cè)的 id 值改變compress / 壓縮數(shù)據(jù),使之在不損失任何信息的前提下占用空間最小 erase mydata1.dta 刪除文件,一定要帶上后綴名。報(bào)告數(shù)據(jù)describe 總體展示變量信息codebook 展示數(shù)據(jù)庫中的每個(gè)變量情況(有多少缺失值,主要分位數(shù),區(qū)間)list 列示內(nèi)存中的數(shù)據(jù)c

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論