各種常見隨機(jī)化的SAS實(shí)現(xiàn)_第1頁
各種常見隨機(jī)化的SAS實(shí)現(xiàn)_第2頁
各種常見隨機(jī)化的SAS實(shí)現(xiàn)_第3頁
各種常見隨機(jī)化的SAS實(shí)現(xiàn)_第4頁
各種常見隨機(jī)化的SAS實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、各種常見隨機(jī)化的SAS實(shí)現(xiàn)在前兩期的講座中我們介紹了實(shí)驗(yàn)設(shè)計(jì)的三要素與四原則1,本期將結(jié)合實(shí)例重點(diǎn)闡述實(shí)驗(yàn)設(shè)計(jì)中如何實(shí)現(xiàn)各種常見的隨機(jī)化。隨機(jī)化體現(xiàn)在如下三個方面2:抽樣隨機(jī):每一個符合條件的實(shí)驗(yàn)對象參加實(shí)驗(yàn)的機(jī)會相同,即總體中每個個體有相同的機(jī)會被抽到進(jìn)入樣本之中。它保證所得到的樣本具有代表性,使實(shí)驗(yàn)結(jié)論具有普遍意義;分組隨機(jī):每個實(shí)驗(yàn)對象分配到不同組(通常為對照組、不同處理組)的機(jī)會相同。它保證大量難以控制的非處理因素在對比組間盡可能均衡一致,以提高各組間的可比性;實(shí)驗(yàn)順序隨機(jī):每個受試對象先后接受處理的機(jī)會相等,它使實(shí)驗(yàn)順序的影響也達(dá)到均衡。本期主要就如何用SAS實(shí)現(xiàn)隨機(jī)抽樣和隨機(jī)分組進(jìn)

2、行闡述。已知編號為1-20的20例病人的基本信息見表1。本文將以表1數(shù)據(jù)為例,闡述隨機(jī)化的SAS實(shí)現(xiàn)。表1 20例病人的基本信息病人編號12345678910性別FFMFFFMMMM年齡60643757413160645816病人編號11121314151617181920性別MMFFFFFMFF年齡586323372033394049421. 隨機(jī)抽樣目前在SAS/STAT模塊中,有一個與調(diào)查設(shè)計(jì)有關(guān)的SURVEYSELECT過程。該過程可用來實(shí)現(xiàn)各種隨機(jī)抽樣,包括:單純隨機(jī)抽樣、系統(tǒng)隨機(jī)抽樣、分層抽樣、無限隨機(jī)抽樣(有替換)、序貫隨機(jī)抽樣、以及按規(guī)模大小成比例概率抽樣(PPS)等。1.1

3、簡單隨機(jī)抽樣的實(shí)現(xiàn)簡單隨機(jī)抽樣,就是從總體中不加任何分組、劃類、排隊(duì)等,完全隨機(jī)地抽取受試對象。特點(diǎn)是每個個體(樣品)被抽中的概率相等,各樣品之間完全獨(dú)立,彼此間無一定的關(guān)聯(lián)性和排斥性。簡單隨機(jī)抽樣是其他各種抽樣形式的基礎(chǔ)。通常只是在總體樣品之間差異程度較小和數(shù)目較少時,采用這種方法。例1:從編號為1到20的人中用簡單隨機(jī)化的方法抽取10名作為受試者。用SAS9.1.3實(shí)現(xiàn)簡單隨機(jī)抽樣的程序如下:data a;input id sex$ age;cards;1F602F64 20F42;run;ods html;proc surveyselect data=a method=srs n=10

4、out=b;run;proc print data=b;run;ods html close;程序說明:首先,創(chuàng)建SAS數(shù)據(jù)集名為a。然后,調(diào)用SURVEYSELECT過程進(jìn)行隨機(jī)抽樣,并指定一些抽樣選項(xiàng),其中“data=”指定輸入數(shù)據(jù)集,用于指定抽樣框;“method=”用于指定隨機(jī)抽樣的方法,srs表示單純隨機(jī)抽樣;“n=”用于指定抽樣大?。ù颂幙梢杂谩皉ate=”來替換,用于指定抽樣率);“out=”用于指定輸出數(shù)據(jù)集,它包含所有被抽到的樣本(可以添加選項(xiàng)“rep=number”來規(guī)定重復(fù)抽樣的次數(shù),如“rep=2”命令系統(tǒng)同時抽取2份樣本)。最后用PROC PRINT把輸出數(shù)據(jù)集b在輸

5、出窗口中顯示出來。命令ods html和ods html close用于把程序運(yùn)行結(jié)果以網(wǎng)頁格式保存下來。輸出結(jié)果如下:Selection MethodSimple Random SamplingInput Data SetARandom Number SeedSample Size10Selection Probability0.5Sampling Weight2Output Data SetB以上是本次單純隨機(jī)抽樣的基本信息,抽樣方法是簡單隨機(jī)抽樣(Simple Random Sampling)。由于未指定SEED=選項(xiàng)來規(guī)定初始種子,來產(chǎn)生隨機(jī)數(shù)字流。系統(tǒng)使用默認(rèn)種子作為初始種子(SEE

6、D=),如果將來想重新抽取與本次完全相同的樣本,可以在抽樣時指定同一種子。抽取的樣本大小是10。抽樣概率(Selection Probability)是指樣本被抽中的概率,此處為0.5。對于無分層的單純隨機(jī)抽樣,樣本的抽樣概率是一致的。抽樣權(quán)重(Sampling Weight)是抽樣概率的倒數(shù),反映樣本信息量的大小。Obsidsexage15F4126F31310M16411M58512M63613F23715F20816F33919F491020F42以上是PROC PRINT命令顯示的輸出數(shù)據(jù)集,包括所有被抽中的樣本。第二列id顯示了被抽中的病人的編號。1.2 分層隨機(jī)抽樣的實(shí)現(xiàn)分層抽樣,

7、先依據(jù)一種或幾種特征將總體分為若干個子總體,每個子總體稱作一個層,然后從每層中隨機(jī)抽取一個子樣本,這些子樣本合起來就是總體的樣本。分層抽樣所得的樣本具有較好的代表性,抽樣誤差較小。例2:將表1中的20例病人以性別為分層因素,抽取10名受試者。用SAS9.1.3實(shí)現(xiàn)分層隨機(jī)抽樣的程序如下:ods html;proc sort data=a;by sex;run;proc surveyselect data=a method=srs n=(6 4) out=b;strata sex;run;proc print data=b;run;ods html close;程序說明:數(shù)據(jù)步與例1相同,此處省

8、略。過程步,SORT過程用于將數(shù)據(jù)集a排序,by語句指明按性別進(jìn)行排序,此處排序方式為先F后M。SURVEYSELECT過程與例1的不同之處在于選項(xiàng)n=(6 4),規(guī)定每層中得抽樣大小,若每層抽樣大小相同,可寫為n=n1的形式。此外,還多了一個STRATA語句,該語句用于指定分層變量。主要SAS輸出結(jié)果如下:ObssexidageSelectionProbSamplingWeight1F 4570.522F 6310.523F13230.524F15200.525F19490.526F20420.527M 3370.528M 8640.529M11580.5210M18400.521.3 系統(tǒng)

9、隨機(jī)抽樣的實(shí)現(xiàn)系統(tǒng)抽樣,先按照某種順序?qū)⒖傮w中的個體(樣品)從1N相繼編號,并計(jì)算抽樣距離K=N/n。式中N為總體樣品總數(shù),n為樣本容量。然后在1K中抽一隨機(jī)數(shù)i,作為樣本的第一個被抽樣品,接著取i+K,i+2K,i+(n-1)K,直至抽夠n個樣品為止。值得注意的是,當(dāng)總體的被觀察樣品按順序有周期趨勢或增加(減少)趨勢時,容易產(chǎn)生偏倚。例3:將表1中的20例病人按系統(tǒng)隨機(jī)抽樣的方法抽取5名受試者。用SAS9.1.3實(shí)現(xiàn)系統(tǒng)隨機(jī)抽樣的程序如下:ods html;proc surveyselect data=a method=sys n=5 out=b;control id;run;proc pr

10、int data=b;run;ods html close;程序說明:數(shù)據(jù)步與例1相同,此處省略。SURVEYSELECT過程與例1的不同之處在于選項(xiàng)method=sys,規(guī)定抽樣方法為系統(tǒng)隨機(jī)抽樣法。此外,還多了一個control語句,該語句用于指定排序的變量。SAS輸出結(jié)果如下:Obssexageid1F5742M6483M63124F33165F42201.4整群抽樣的實(shí)現(xiàn)整群抽樣是先將總體分成若干群,從中隨機(jī)抽取幾個群;抽中群內(nèi)的全部個體(樣品)組成樣本。可將整群抽樣轉(zhuǎn)化為簡單隨機(jī)抽樣。例如,從10班隨機(jī)抽取5個班作為受試對象,可看做從10個個體中隨機(jī)抽取5個,即為簡單隨機(jī)抽樣。2.

11、隨機(jī)分組利用SAS軟件實(shí)現(xiàn)隨機(jī)分組的途徑有很多,目前比較常用的是SAS/STAT模塊的PLAN過程,它可用于構(gòu)建各種常見的試驗(yàn)設(shè)計(jì)并對設(shè)計(jì)方案進(jìn)行隨機(jī)化,也可用于產(chǎn)生數(shù)字的排列組合表。筆者將介紹如何利用PLAN過程來實(shí)現(xiàn)兩組和多組的隨機(jī)分組。2.1完全隨機(jī)化的實(shí)現(xiàn)完全隨機(jī)化,直接對受試對象進(jìn)行隨機(jī)化分組,常通過擲硬幣或隨機(jī)數(shù)字表,或用計(jì)算機(jī)產(chǎn)生隨機(jī)數(shù)來進(jìn)行隨機(jī)化,在事先或者實(shí)施過程中不作任何限制和干預(yù)或調(diào)整。分組后各組受試對象的例數(shù)不一定相等。例4:將表1中的20例病人隨機(jī)分為2組。用SAS9.1.3實(shí)現(xiàn)簡單隨機(jī)分組的程序如下:proc plan seed=; /*第一步*/ factors

12、a=20; output out=sheji;run;data b c; /*第二步*/ set sheji; patient=_n_; if a=10 then do; group=A; output b; end;else do; group=B;output c;end;run;data d; /*第三步*/ set b; group1=group; patient1=patient; keep group1 patient1;run;data e; /*第四步*/ set c; group2=group; patient2=patient; keep group2 patient2;r

13、un;data f; /*第五步*/ merge d e;run;ods html;proc print noobs; /*第六步*/run;ods html close;程序說明:第一步,調(diào)用PLAN過程產(chǎn)生20個隨機(jī)排列數(shù),并把結(jié)果輸出至數(shù)據(jù)集sheji中,選項(xiàng)seed=,規(guī)定產(chǎn)生隨機(jī)數(shù)的種子。第二步,對數(shù)據(jù)集sheji進(jìn)行操作,把病人按隨機(jī)排列數(shù)進(jìn)行分組,隨機(jī)數(shù)小于等于10的進(jìn)入A組,其余進(jìn)入B組,并將結(jié)果分別保存至數(shù)據(jù)集b和c中。第三步和第四步,分別將數(shù)據(jù)集b、c中的group改為group1、group2,將patient改為patient1和patient2,生成新的數(shù)據(jù)集d和e。

14、最后把數(shù)據(jù)集d和e合并為新的數(shù)據(jù)集f,并通過PRINT過程將隨機(jī)分組的結(jié)果展現(xiàn)出來。SAS輸出結(jié)果如下:group1patient1group2patient2A 4B 1A 5B 2A 7B 3A 8B 6A10B 9A11B14A12B15A13B16A17B18A19B20例5 將這20例病人隨機(jī)分為4組。用SAS9.1.3實(shí)現(xiàn)簡單隨機(jī)分組的程序如下3:proc plan seed=; factors a=20; output out=sheji;run;data b1 b2 b3 b4; set sheji; patient=_n_; if a=5 then do; group=A;

15、output b1; end; if 6=a=10 then do; group=B; output b2; end; if 11=a=15 then do; group=C; output b3; end; if 16=a then do;group=D; output b4;end;run;data d1; set b1; group1=group; patient1=patient; keep group1 patient1;run;data d3; set b3; group3=group; patient3=patient; keep group3 patient3;run;data

16、 d4; set b4; group4=group; patient4=patient; keep group4 patient4;run;data f; merge d1 d2 d3 d4;run;ods html;proc print noobs;run;ods html close;SAS輸出結(jié)果如下:group1patient1group2patient2group3patient3group4patient4A 5B 4C 1D 2A 7B 8C 6D 3A10B11C 9D14A13B12C15D18A19B17C16D202.2 分層隨機(jī)化的實(shí)現(xiàn)分層隨機(jī)化,首先對可能影響實(shí)驗(yàn)過程

17、和結(jié)果的主要混雜因素(如年齡、性別、病情、疾病分期等)進(jìn)行分層,然后在每一層內(nèi)進(jìn)行完全隨機(jī)化分組,最后分別合并為實(shí)驗(yàn)組和對照組。配對隨機(jī)化和區(qū)組隨機(jī)化可看成是分層隨機(jī)化的實(shí)際應(yīng)用。例6 將表1中的20例病人以性別為區(qū)組因素,隨機(jī)分為2組。將20例病人中的12名女性,編號為1-12,按例4中的程序分為2組;8名為男性,編號為1-8,按例4中的程序分為2組,可以實(shí)現(xiàn)對這20例病人的區(qū)組隨機(jī)化。例7現(xiàn)有來自3個窩別的24只大鼠,以窩別為區(qū)組因素,隨機(jī)為4組,每組6只。對大鼠進(jìn)行編號,第一窩編號為18,第二窩編號為916,第三窩編號為1724。用SAS9.1.3實(shí)現(xiàn)區(qū)組隨機(jī)化的程序如下3,4:proc

18、 plan seed=;factors block=3 length=8;output out=sheji;run;data a b c d;set sheji;mouse=_n_; if length=2 then do;group=A;output a;end; else if 3=length=4 then do;group=B;output b;end; else if 5=length=6 then do;group=C;output c;end; else do;group=D;output d;end;run;data aa; set a; group1=group; mouse1=mouse; keep group1 mouse1;run;data bb; set b; group2=group; mouse2=mouse; keep group2 mouse2;run;data cc; set c; group3=group; mouse3=mouse; keep group3 mouse3;run;data dd; set d; group4=group; mouse4=mouse; keep group4 mouse4;run;data e;merge aa bb cc dd;run;ods html;proc print noobs

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論