




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第三章 SAS系統(tǒng)的基礎(chǔ)功能,3.1 SAS過程初步 3.2 制作列表報告 3.3 產(chǎn)生匯總表格 3.4 SAS圖形入門 3.5 定量資料的統(tǒng)計描述,(數(shù)據(jù)集包含較少數(shù)據(jù)時),(數(shù)據(jù)集包含大量信息時),1,3.1 SAS過程初步,SAS過程步的一般形式:,PROC 過程名 DATA=輸入數(shù)據(jù)集 選項; 過程語句/選項; 過程語句/選項; RUN;,2,SAS過程步中常用語句,VAR語句指定分析變量 MODEL語句指定統(tǒng)計建模的模型 BY語句指定分組變量 CLASS語句指定分類變量 OUTPUT語句指定輸出結(jié)果存放的數(shù)據(jù)集 FREQ語句指定一個重復(fù)數(shù)變量 WEIGHT語句指定一個權(quán)重變量 ID語
2、句指定用來標(biāo)識觀測的變量 WHERE語句選擇輸入數(shù)據(jù)集的一個行子集 進行分析 LABEL語句為變量指定一個臨時標(biāo)簽 FORMAT語句為變量輸出規(guī)定一個輸出格式,3,VAR語句在過程步中用來指定分析變量,SAS過程步常用語句,4,MODEL語句在統(tǒng)計建模過程中用來指定 模型的形式,SAS過程步常用語句,如:用語文成績預(yù)測數(shù)學(xué)成績時,可用 Model math=chinese,5,SAS過程步常用語句,BY語句指定一個或幾個分組變量,根據(jù)這些分組變量的值把觀測分組,然后對每一組觀測分別進行本過程指定的分析,6,SAS過程步常用語句,CLASS語句在一些特定的過程(如方差分析)中,用來指定一個或幾個
3、分類變量;而在另一些過程(如MEANS)中,其作用與BY語句類似。,7,SAS過程步常用語句,OUTPUT語句指定輸出結(jié)果存放的數(shù)據(jù)集,指定要輸出的結(jié)果,輸出結(jié)果在輸出數(shù)據(jù)集中的名稱,8,SAS過程步常用語句,FREQ語句指定一個重復(fù)數(shù)變量,每個觀測中此變量的值說明這個觀測實際代表多少個完全相同的重復(fù)觀測。,WEIGHT語句指定一個權(quán)重變量,在某些允許加權(quán)的過程中代表權(quán)重,其值與觀測對應(yīng)的方差的倒數(shù)成比例。,ID語句指定一個可以用來區(qū)分觀測的變量(如人名、省市名等)作為觀測標(biāo)志,用于某些需要輸入觀測代號的過程(如print),來代替觀測序號使用。,9,SAS過程步常用語句,WHERE語句選擇輸
4、入數(shù)據(jù)集的一個行子集 進行分析,10,SAS過程步常用語句,LABEL語句為變量指定一個臨時標(biāo)簽,FORMAT語句為變量輸出規(guī)定一個臨時輸出格式,11,proc print data=sunny.bclass label; id name; var height weight; label name=“姓名” height=“身高” weight=“體重”; format height 5.1 weight 5.1; run;,例,12,第三章 SAS系統(tǒng)的基礎(chǔ)功能,13,制作列表報告 (數(shù)據(jù)集包含較少數(shù)據(jù)時),3.2 制作列表報告,PROC PRINT DATA=數(shù)據(jù)集名 選項; 過程語句/
5、選項; RUN;,14,用PROC PRINT產(chǎn)生列表報告,與 PRINT有關(guān)的其他常用語句及選項:,PROC PRINT DATA=數(shù)據(jù)集名 NOOBS; ID 變量; VAR 變量序列; WHERE 條件表達式; SUM 變量序列; BY 變量序列; PAGEBY 變量序列; RUN;,15,NOOBS選項去掉OBS列 VAR語句控制變量的出現(xiàn)與否及出現(xiàn)順序 WHERE語句控制哪些觀測將出現(xiàn)在報告中 SUM語句計算變量的總和 BY語句對數(shù)據(jù)進行分組并求每一組的小計 (需事先用SORT過程對同一變量進行排序) ID語句取消OBS列,把指定變量排列在報告 的最左邊,且只在每個組的開始處出現(xiàn)一次
6、 PAGEBY語句使產(chǎn)生的報告按組分頁,說明:,16,PROC PRINT DATA=SUNNY.LONPAR NOOBS; VAR FLIGHT DATE DEST BOARDED REVENUE; WHERE REVENUE BETWEEN 155000 AND 170000 ; RUN;,(選擇數(shù)據(jù)集的觀測),用PROC PRINT產(chǎn)生列表報告,例:,17,PROC PRINT DATA=SUNNY.LONPAR ; VAR FLIGHT DATE DEST BOARDED REVENUE; SUM BOARDED REVENUE ; RUN;,(計算變量的總和),用PROC PRINT
7、產(chǎn)生列表報告,例:,18,(數(shù)據(jù)的分組和小計),用PROC PRINT產(chǎn)生列表報告,例:,19,用PROC PRINT產(chǎn)生列表報告,20,(使報告按組分頁及ID語句的應(yīng)用),用PROC PRINT產(chǎn)生列表報告,例:,21,用PROC PRINT產(chǎn)生列表報告,22,TITLEn 文本; (加入標(biāo)題) FOOTNOTEn 文本;(加入腳注),用PROC PRINT產(chǎn)生列表報告,為全程語句,既可用在數(shù)據(jù)步或過程步中,也可單獨使用,其作用具有持續(xù)性,23,PROC PRINT DATA=SORTED; ID FLIGHT; VAR DATE DEST BOARDED REVENUE; SUM BOAR
8、DED REVENUE ; BY FLIGHT; PAGEBY FLIGHT; TITLE International Airlines; TITLE2 Flights to London and Paris; FOOTNOTE Prepared March 12,1990; FOOTNOTE2 by the Corporate Information Center; RUN;,例:,24,25,用PROC PRINT產(chǎn)生列表報告,26,PROC PRINT DATA=SORTED LABEL; ID FLIGHT; VAR DATE DEST BOARDED REVENUE; SUM BOA
9、RDED REVENUE ; BY FLIGHT; PAGEBY FLIGHT; TITLE1 Statistics for Flights to London and Paris; FOOTNOTE1; LABEL FLIGHT=Flight Number DATE=Date of Flight DEST=Flight Destination BOARDED=Number of Passengers REVENUE=Total Revenue; RUN;,例:,27,28,用SPLIT=選項控制表頭的分割:,29,輸出結(jié)果,30,用PROC PRINT產(chǎn)生列表報告,31,用戶化格式可以被賦予
10、單個數(shù)字、某一數(shù)字范圍、字符、字符串或某一范圍的字符 :,VALUE sexfmt 1=女 2=男 other=Miscoded;,VALUE boardfmt low-49=低于平均 50-99=平均 100-high=高于平均;,VALUE $grade A=Good B-D=Fair F=Poor I,U=See Instructor other=Miscoded;,32,PROC FORMAT; VALUE $DESTFMT LON=London PAR=Paris; PROC PRINT DATA=SORTED SPLIT=*; ID FLIGHT; VAR DATE DEST BO
11、ARDED REVENUE; SUM BOARDED REVENUE ; BY FLIGHT; TITLE1 Statistics for Flights to London and Paris; LABEL FLIGHT=Flight*Number DATE=Date*of*Flight DEST=Flight*Destination BOARDED=Number*of*Passengers REVENUE=Total*Revenue; FORMAT DATE YYMMDD8. REVENUE DOLLAR10. DEST $DESTFMT.; RUN;,例:,33,輸出結(jié)果,34,CENT
12、ER|NOCENTER(結(jié)果居中/不居中) DATE|NODATE(顯示/不顯示運行時間日期) NUMBER|NONUMBER(顯示/不顯示頁號) LINESIZE=width (每行最寬不超過的字符數(shù)) PAGESIZE=n (每頁輸出的行數(shù)) PAGENO=n (輸出的起始頁碼),用PROC PRINT產(chǎn)生列表報告,也可由OPTIONS語句或窗口定義,全程有效,35,OPTIONS NODATE NOCENTER; PROC PRINT DATA=SORTED; ID FLIGHT; VAR DATE DEST BOARDED REVENUE; SUM BOARDED REVENUE ;
13、BY FLIGHT; PAGEBY FLIGHT; RUN;,例:,用PROC PRINT產(chǎn)生列表報告,36,SAS中對輸出結(jié)果的管理,輸出的HTML格式(網(wǎng)頁格式),37,由Assist提供的菜單制作列表報告,38,用Report窗口產(chǎn)生列表報告,39,進入Report 窗口的方法:,用Report窗口產(chǎn)生列表報告,40,然后可利用下拉菜單對顯示的缺省輸出報告進行加工,用Report窗口產(chǎn)生列表報告,輸出結(jié)果,41,第三章 SAS系統(tǒng)的基礎(chǔ)功能,3.1 SAS過程初步 3.2 制作列表報告 3.3 產(chǎn)生匯總表格 3.4 SAS圖形入門 3.5 定量資料的統(tǒng)計描述,(數(shù)據(jù)集包含較少數(shù)據(jù)時),(
14、數(shù)據(jù)集包含大量信息時),42,3.3 產(chǎn)生匯總表格,當(dāng)一個SAS數(shù)據(jù)集包含的數(shù)據(jù)較少時,用列表報告可以很好地描述數(shù)據(jù);但當(dāng)數(shù)據(jù)集包含大量的信息時,就需要用匯總報告來描述。,制作匯總表格需明確的要素:,43,分類變量的特性,可以是數(shù)值型或字符型變量,若為數(shù)值型變量,則代表某些離散的類; 能夠?qū)?shù)據(jù)分類,以便在每個類上進行計算和分析。,分析變量的特性,一定是數(shù)值型變量; 適合于作各種統(tǒng)計運算,如計數(shù)、求和、平均、百分比等。,44,用PROC TABULATE 產(chǎn)生匯總表格,控制表格結(jié)構(gòu); 格式化輸出表格中的數(shù)據(jù)值; 在表格的每一維擁有多個變量; 支持一個ALL類變量用以計算總和; 產(chǎn)生用戶化的行標(biāo)
15、題和列標(biāo)題。,功能1 產(chǎn)生格式化的匯總表格,45,功能2 計算統(tǒng)計量,N 含有有效數(shù)據(jù)的觀測數(shù); NMISS 含有缺失值的觀測數(shù); MEAN 算術(shù)平均數(shù); STD 標(biāo)準(zhǔn)差; MIN 最小值; MAX 最大值; RANGE 取值的范圍; SUM 總和; USS 加權(quán)平方和; CSS 加權(quán)離差平方和; PCTN 某一類中某一小類觀測所占百分比; PCTSUM 某一類觀測在全部數(shù)據(jù)中所占百分比;等等,46,TABULATE過程的一般形式:,PROC TABULATE DATA=數(shù)據(jù)集 options; CLASS class-variables ; VAR analysis-variables ;
16、TABLE page-expression,row-expression, column-expression/options; RUN;,如果程序中沒有定義分析變量,則默認的統(tǒng)計量為N; TABLE語句中使用的變量必須在CLASS或VAR語句中定義過。,說明:,用PROC TABULATE 產(chǎn)生匯總表格,47,TABLE語句中表達式的構(gòu)成:,用PROC TABULATE 產(chǎn)生匯總表格,48,TABLE語句,49,50,運行結(jié)果:,51,運行結(jié)果,52,運行結(jié)果,53,運行結(jié)果,54,運行結(jié)果,55,用TUBULATE語句的FORMAT=選項控制每一格的寬度; 用TABLE語句的RTS=選項控
17、制第一列的寬度; 用FORMAT語句格式化變量名; 使用WHERE語句選擇所需要的觀測。,用PROC TABULATE 產(chǎn)生匯總表格,56,【例】已知SAS數(shù)據(jù)集SUNNY.FLTATEN的資料如下,57,PROC FORMAT; VALUE $GENFMT F=女 M=男; PROC TABULATE DATA=SUNNY.FLTATEN FORMAT=5.0; WHERE JOBCODE IN (FA2,FA3); CLASS GENDER JOBCODE; FORMAT GENDER $GENFMT.; TABLE GENDER ALL,JOBCODE ALL/RTS=12; RUN;,
18、運行結(jié)果,58,使用FORMAT、LABEL、TITLE以及FOOTNOTE語句; 使用KEYLABEL語句為ALL類變量以及所有統(tǒng)計量加入標(biāo)記.,說明:TABULATE過程能夠自動使用所有標(biāo)簽,不需要LABEL或SPLIT=選項,用PROC TABULATE 產(chǎn)生匯總表格,59,PROC FORMAT; VALUE $GENFMT F=女 M=男; PROC TABULATE DATA=SUNNY.FLTATEN FORMAT=DOLLAR10.0; CLASS GENDER JOBCODE; VAR SALARY; FORMAT GENDER $GENFMT.; TABLE GENDER,
19、JOBCODE*SALARY*MEAN ALL*SALARY*MEAN / RTS=8; KEYLABEL ALL=OVERALL MEAN=AVERAGE; LABEL JOBCODE=JOB CODES SALARY=ANNUAL SALARY; TITLE AVERAGE SALARY; FOOTNOTE BY JOB CODE AND GENDER; RUN;,例,60,運行結(jié)果,61,由Assist提供的菜單制作匯總表格,62,第三章 SAS系統(tǒng)的基礎(chǔ)功能,3.1 SAS過程初步 3.2 制作列表報告 3.3 產(chǎn)生匯總表格 3.4 SAS圖形入門 3.5 定量資料的統(tǒng)計描述,(數(shù)據(jù)集
20、包含較少數(shù)據(jù)時),(數(shù)據(jù)集包含大量信息時),63,3.4 SAS圖形入門,SAS/GRAPH模塊能實現(xiàn)強大的圖形功能,可以處理:,散點圖及折線圖(plots) 圖表(charts) 地圖(maps) 三維圖形(three-dimensional graphics) 文本縮放及其它(text slides),64,由 PROC GPLOT 作散點圖和折線圖,PROC GPLOT DATA=數(shù)據(jù)集; PLOT 縱坐標(biāo)變量*橫坐標(biāo)變量/選項; 其他SAS語句; RUN;,65,控制坐標(biāo)軸: HAXIS=Values|Axisn 定義水平軸的刻度 VAXIS=Values|Axisn 定義垂直軸的刻度
21、 NOAXIS 取消坐標(biāo)軸及相關(guān)的文字 CAXIS=Color 定義坐標(biāo)軸的顏色 CTEXT=Color 定義坐標(biāo)軸文本的顏色 加框: FRAME 加框 CFRAME= Color 給坐標(biāo)軸包圍的區(qū)域填色,PLOT語句的選項,由 PROC GPLOT 作散點圖和折線圖,66,主要選項有:,VALUE(V)=symbol 定義代表數(shù)據(jù)點的符號 I=interpolation 定義數(shù)據(jù)點之間的連線方式 COLOR(C)=color 定義顏色 WIDTH(W)=width 定義連線的寬度,由 PROC GPLOT 作散點圖和折線圖,67,TITLE語句及FOOTNOTE語句,圖形中標(biāo)題(Title)
22、和腳注(Footnote)的選項有: C=顏色 H=高度及單位 F=字體,由 PROC GPLOT 作散點圖和折線圖,68,DATA GRAPH; SET SUNNY.COLUMN; WHERE DEST=LON; PROC GPLOT DATA=GRAPH; PLOT BOARDED*DATE/VAXIS=125 TO 225 BY 25; SYMBOL V=STAR I=NONE W=5 C=RED; LABEL DATE=CALENDAR DATE BOARDED=PASSENGER ON BOARD; TITLE PASSENGER COUNTS FOR DEST FOR LONDON
23、; FOOTNOTE H=1.2 28FEB,2001; RUN;,69,運行結(jié)果:,70,DATA GRAPH; SET SUNNY.COLUMN; WHERE DEST=LON; PROC GPLOT DATA=GRAPH; PLOT BOARDED*DATE/VAXIS=125 TO 225 BY 25; SYMBOL V=SQUARE I=JOIN W=5 C=RED; LABEL DATE=CALENDAR DATE BOARDED=PASSENGER ON BOARD; TITLE PASSENGER COUNTS FOR DEST FOR LONDON; FOOTNOTE H=1
24、.2 28FEB,2001; RUN;,71,運行結(jié)果:,72,由Assist菜單系統(tǒng)作散點圖和折線圖,進入Assist 主菜單:,73,由Assist菜單系統(tǒng)作散點圖和折線圖,74,由Assist菜單系統(tǒng)作散點圖和折線圖,75,用PROC GCHART過程產(chǎn)生柱狀圖和圓餅圖,柱狀圖和圓餅圖的作用是展示分類匯總信息; 分類變量的不同值對應(yīng)不同的柱或餅的不同部分; 各個類的頻數(shù)或某分析變量的指標(biāo)用柱的高度或餅的角度表示。,76,主要選項有:,用PROC GCHART過程產(chǎn)生柱狀圖和圓餅圖,77,PATTERN c=顏色 v=花紋 ;,PATTERN語句的應(yīng)用,用來逐個指定柱狀圖等每個柱的顏色和花
25、紋,可位于PROC GCHART之中或之前。,花紋:empty|solid|x3|r3|l3,用PROC GCHART過程產(chǎn)生柱狀圖和圓餅圖,78,運行結(jié)果:,(圖中顯示了雇員工資的分布),79,(圖中顯示了各工種的平均工資),運行結(jié)果:,80,運行結(jié)果:,81,PROC GCHART DATA=CHART; PATTERN1 C=RED ; PATTERN2 C=GREEN ; PATTERN3 C=BLUE; PIE JOBCODE/SUMVAR=SALARY TYPE=SUM EXPLODE=FA1 FILL=S; TITLE TOTAL SALARY PAID; TITLE2 TO F
26、LIGHT ATTENDANTS BY JOB LEVEL; RUN;,例 (使用EXPLODE選項來強調(diào)圓餅圖的某些塊),82,運行結(jié)果:,83,由Assist菜單系統(tǒng)作柱狀圖,84,由Assist菜單系統(tǒng)作圓餅圖,85,第三章 SAS系統(tǒng)的基礎(chǔ)功能,3.1 SAS過程初步 3.2 制作列表報告 3.3 產(chǎn)生匯總表格 3.4 SAS圖形入門 3.5 定量資料的統(tǒng)計描述,(數(shù)據(jù)集包含較少數(shù)據(jù)時),(數(shù)據(jù)集包含大量信息時),86,3.5 定量資料的統(tǒng)計描述,UNIVARIATE過程:提供單個變量的詳細描述和對其分布類型的檢驗; MEANS過程: 提供單個或多個變量的簡單描述,對于多個變量,它的輸
27、出格式緊湊,便于閱讀; FREQ過程:對離散變量計算頻數(shù)分布。,為對定量變量進行統(tǒng)計描述,SAS系統(tǒng)提供了UNIVARIATE 、 MEANS和FREQ三個過程:,87,UNIVARIATE過程,語法格式:,PROC UNIVARIATE DATA= 選項 ; VAR ; BY ; FREQ ; WEIGHT ; ID ; OUTPUT OUT= 關(guān)鍵字= . pctlpts= pctlpre= ;,88,VAR語句指定要分析的變量名列; BY語句按變量名列分組統(tǒng)計(數(shù)據(jù)集需事先按該變量名列排序); FREQ語句表明該變量為分析變量的頻數(shù); WEIGHT語句表明分析變量在統(tǒng)計時要按該變量加權(quán); ID語句輸出時加上該變量作為索引; OUTPUT語句指定統(tǒng)計量輸出的數(shù)據(jù)集及輸出的內(nèi)容和形式(OUT指定統(tǒng)計量的輸出數(shù)據(jù)集名,關(guān)鍵字指定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 武漢幼兒園家長活動方案
- 櫥柜打折促銷活動方案
- 格雅裝飾公司團購活動方案
- 湯店鋪營銷活動方案
- 歡樂聚會活動方案
- 法國健康包發(fā)放活動方案
- 漢字打字大賽活動方案
- 河北主場活動方案
- 模擬槍機活動方案
- 四年級下冊語文期末考試作文押題及范文
- 涼糕擺攤技術(shù)培訓(xùn)課件
- 幕墻清洗安全培訓(xùn)
- 制造業(yè)雙重預(yù)防機制實施方案
- 大學(xué)生村官考試公共基礎(chǔ)知識考點
- 雨污分流及路面修復(fù)工程施工組織設(shè)計方案
- 大班航天科技課程設(shè)計
- 裝飾工程項目考核評分表
- 山東省東營市2023-2024學(xué)年高二下學(xué)期7月期末 英語試題(含解析)
- 《人文英語4》形考任務(wù)(1-8)試題答案解析
- 職業(yè)院校教學(xué)能力比賽現(xiàn)場答辯備賽題庫
- 社會語言學(xué)視角下網(wǎng)絡(luò)流行用語研究
評論
0/150
提交評論