




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
22.頻率表和列聯(lián)表分類變量包括無序分類變量、有序分類變量。對于分類變量的描述統(tǒng)計,主要是對分類變量各水平值分別進行頻數(shù)和比例計算,再進步計算所需的一些相對頻數(shù)指標。一、一維列聯(lián)表1.頻數(shù)統(tǒng)計分類變量的分析,首先要了解:各類別的樣本數(shù)(頻數(shù)),以及占總樣本量的百分比;對有序分類變量,還需要了解:累積頻數(shù)、累積百分比。使用table()函數(shù)生成簡單的頻數(shù)統(tǒng)計表,基本格式為:table(var1,var2,…,varN)將N個分類變量(因子)創(chuàng)建一個N維列聯(lián)表。library(vcd)#使用數(shù)據(jù)集Arthritishead(Arthritis,3)IDTreatmentSexAgeImproved157TreatedMale27Some246TreatedMale29None377TreatedMale30Nonemytablev-table(Arthritis$lmproved)#統(tǒng)計頻數(shù)mytableNoneSomeMarked421428prop.table(mytable)#將頻數(shù)轉(zhuǎn)化為比例值NoneSomeMarked0.50000000.16666670.3333333prop.table(mytable)*100#將頻數(shù)轉(zhuǎn)化為百分比NoneSomeMarked50.0000016.6666733.333332.集中/離散趨勢觀察原始頻數(shù),或者使用眾數(shù)。對于分類變量,集中/離散趨勢是一體的。3.相對頻數(shù)指標(1)比(Riatio)兩個有關(guān)指標之比A/B,用來反映相對的大小關(guān)系,例如,月銷售額/銷售人數(shù);(2)構(gòu)成比用于描述事物內(nèi)部各構(gòu)成部分所占的比重,例如,百分比、累積百分比;(3)率(Rate)率是具有時間概念或速度、強度意義的指標,表示某個時期內(nèi)某事件發(fā)生的頻率或強度,例如速率、頻率、費率、發(fā)病率等。二、二維列聯(lián)表1.rXc二維列聯(lián)表:共n個樣本;按兩種屬性A、B,屬性A有r個水平值:A1?屬性1rB有c個水平值:B1?…,B.屬性A=A.,屬性B=B.的樣本數(shù)為n...1cijijn.=“屬性A=A.”的合計數(shù),n.=“屬性B=B.”的合計i.i...數(shù)。JRS.I二維的K.合tt"irAj皿『Kj.5nr.音汁n-l-fl注:多分類變量對應(yīng)高維列聯(lián)表。生成二維列聯(lián)表使用函數(shù)table(),基本格式為:table(A,B)其中,A為行變量,B為列變量。或者使用函數(shù)xtabs(),基本格式為:xtabs(~A+B,data=mydata)其中,mydata為矩陣或數(shù)據(jù)框;要進行交叉分類的變量放在~右側(cè),以+作為分隔符,若某個變量寫在~左側(cè),則為頻數(shù)向量,常用于數(shù)據(jù)已經(jīng)被表格化時。注:table函數(shù)默認忽略NA值,若要將NA值作為一個類別,需要使用參數(shù)useNA="ifany"mytablev-xtabs(~Treatment+lmproved,data=Arthritis#生成治療方法與療效的二維列聯(lián)表(頻數(shù))mytableImprovedTreatmentNoneSomeMarkedPlacebo2977Treated13721prop.table(mytable)#各單元格占的比例(所有行列總和=1)ImprovedTreatmentNoneSomeMarkedPlacebo0.34523810O.O8333333O.O8333333Treated0.154761900.083333330.25000000margin.table(mytable,1)#對第1個變量(行變量)生成邊際頻數(shù)TreatmentPlaceboTreated4341prop.table(mytable,1)#對第1個變量(行變量)生成邊際比例(每行和=1)ImprovedTreatmentNoneSomeMarkedPlacebo0.67441860.16279070.1627907Treated0.31707320.17073170.5121951#可見與安慰劑組相比,治療組的治愈率從16%提高到51%margin.table(mytable,2)#對第2個變量(列變量)生成邊際頻數(shù)ImprovedNoneSomeMarked421428prop.table(mytable,2)#對第2個變量(列變量)生成邊際比例(每列和=1)ImprovedTreatmentNoneSomeMarkedPlacebo0.69047620.50000000.2500000Treated0.30952380.50000000.7500000addmargins(mytable)#將邊際求和結(jié)果添加到表格(頻數(shù))ImprovedTreatmentNoneSomeMarkedSumPlacebo297743Treated1372141Sum42142884addmargins(prop.table(mytable))#將邊際求和結(jié)果添加到表格(比例)ImprovedTreatmentNoneSomeMarkedSumPlacebo0.345238100.083333330.083333330.51190476Treated0.154761900.083333330.250000000.48809524Sum0.500000000.166666670.333333331.00000000addmargins(prop.table(mytable,1),2)#只添加列邊際ImprovedTreatmentNoneSomeMarkedSumPlacebo0.67441860.16279070.16279071.0000000Treated0.31707320.17073170.51219511.0000000addmargins(prop.table(mytable,2),1)#只添加行邊際ImprovedTreatmentNoneSomeMarkedPlacebo0.69047620.50000000.2500000Treated0.30952380.50000000.7500000Sum1.00000001.00000001.00000002.gmodels包中的函數(shù)CrossTable()該函數(shù)仿照SAS中PROCFREQ或SPSS中CROSSTABS的形式生成二維列聯(lián)表。它有很多選項,可以做許多事情:計算(行、列、單元格)的百分比;指定小數(shù)位數(shù);進行卡方、Fisher和McNemar獨立性檢驗;計算期望和(皮爾遜、標準化、調(diào)整的標準化)殘差;將缺失值作為一種有效值;進行行和列標題的標注;生成SAS或SPSS風格的輸出。library(gmodels)CrossTable(Arthritis$Treatment,Arthritis$Improved)tel1contentsINICh1-squa『亡cofit『ibutlonIN/ROWTotalIN/colTotalIN/TableTotalITotalObservaitiiDnsinTab'Ie::&也IArthritisilmprovedArthritisSTre-atment|None|Some|MlarkedIlR.o^Total|P1acebo|?74311?,&16I|3.7521110.6740.163I0.16310.11?10,690I0,500I0.250I1110.345I0.083I0.08311TreatedlI131-121411I0,00413.9351110.317I0.171I0.51210.4S3[10,310|0,50010.750|1110.155|0.083|0=250|11ColumnTotalI42Iu123嗣10.iOO10.167|0.33311三、多維列聯(lián)表table()和xtabs()都可以基于三個或更多的分類變量(因子)生成多維列聯(lián)表。margin.table()、prop.table()和addmargins()函數(shù)也可類似推廣到多維。另外ftable()函數(shù)可以用一種緊湊的“平鋪式”輸出多維列聯(lián)表。mytablev-xtabs(~Treatment+Sex+lmproved,data=Arthritis)mytable,,Improved=NoneSexTreatmentFemaleMaleTOC\o"1-5"\h\zPlacebo1910Treated67,,Improved=SomeSexTreatmentFemaleMalePlacebo70Treated52,,Improved=MarkedSexTreatmentFemaleMalePlacebo61Treated165ftable(mytable)TreatmentSexImprovedNoneSomeMarkedPlaceboFemale1976Male1001TreatedFemale6516Male725margin.table(mytable,1)#邊際頻數(shù)TOC\o"1-5"\h\zTreatmentPlaceboTreated4341margin.table(mytable,2)SexFemaleMale5925margin.table(mytable,3)ImprovedNoneSomeMarked421428margin.table(mytable,c(1,3))#相當于1:治療方法X3:療效的二維列聯(lián)表ImprovedTreatmentNoneSomeMarkedPlacebo2977Treated13721ftable(prop.table(mytable,c(1,2)))#緊湊形式顯示1:治療方法X2:性別的各類療效情況(比例)ImprovedNoneSomeMarkedTreatmentSexPlaceboFemale0.593750000.218750000.18750000Male0.909090910.000000000.09090909TreatedFemale0.222222220.185185190.59259259Male0.500000000.142857140.35714286ftable(addmargins(prop.table(mytable,c(1,2)),3))#繼續(xù)給第3變量添加邊際ImprovedNoneSomeMarkedSumTreatmentSexPlaceboFemale0.593750000.218750000.187500001.00000000Male0.909090910.000000000.090909091.00000000TreatedFemale0.222222220.185185190.592592591.00000000Male0.500000000.142857140.357142861.00000000ftable(addmargins(prop.table(mytable,c(1,2)),3))*100#繼續(xù)改成百分比ImprovedNoneSomeMarkedSumTreatmentSexPlaceboFemale59.37500021.87500018.750000100.000000Male90.9090910.0000009.090909100.000000TreatedFemale22.22222218.51851959.259259100.000000Male50.00000014.28571435.714286100.0000002.多維列聯(lián)表的圖形展示——馬賽克圖單個分類變量,可以使用柱狀圖或者餅圖;若存在兩個分類變量可以使用三維柱狀圖;兩個以上的分類變量可以使用馬賽克圖。馬賽克圖中,嵌套矩形面積正比于單元格頻率,其中該頻率即多維列聯(lián)表中的頻率。顏色和/或陰影可表示擬合模型的殘差值。使用mosaic()函數(shù)'基本格式為:mosaic(table)其中,table為數(shù)組形式的列聯(lián)表;或者用mosaic(formula,data=)其中,formula為形如?varl+var2+…的公式,data為數(shù)據(jù)框或表格;可選項shade=TRUE將根據(jù)擬合模型的皮爾遜殘差值對圖形上色;legend=TRUE將展示殘差的圖例。library(vcd)ftable(Titanic)SurvivedNoYesClassSexAge1stMaleChild05Adult11857FemaleChild01Adult41402ndMaleChild011Adult15414FemaleChild013Adult13803rdMaleChild3513Adult38775FemaleChild1714Adult8976CrewMaleChild00Adult670192FemaleChild00Adult320mosaic(Titanic,shade=TRUE,legend=TRUE)mosaic(~Class+Sex+Age+Survived,data=Titanic,shade=TRUE,legend=TRUE)#上面兩種代碼效果相同2626FemaleSexMale4W<P壬QM島Pearsonresiduals:p-valu&=<2.22e-13FemaleSexMale4W<P壬QM島Pearsonresiduals:p-valu&=<2.22e-13YessNoYessSurvivad上圖為按船艙等級、乘客
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度房屋抵押權(quán)設(shè)立合同
- 教育信息化解決方案項目投資合同
- 物流配送損害免責聲明
- 教育培訓服務(wù)責任豁免協(xié)議
- 文化產(chǎn)業(yè)投資開發(fā)協(xié)議書
- 攝影工作室拍攝作品著作權(quán)歸屬聲明
- 農(nóng)業(yè)現(xiàn)代化高效節(jié)水灌溉技術(shù)推廣方案
- 企業(yè)產(chǎn)品質(zhì)量危機處理預案
- 高考文言文雙文本專練:《史記》《論語》
- 近期項目成果回顧與反思
- 2023年高三新高考英語復習備考策略及方法指導(深度課件)
- 數(shù)字信號處理(課件)
- 社會主義核心價值觀-團課課件
- 城市社會學(2015)課件
- 年產(chǎn)2萬噸馬來酸二乙酯技改建設(shè)項目環(huán)評報告書
- 中國古代文論教程完整版課件
- 中班美工區(qū)角活動教案10篇
- SJG 103-2021 無障礙設(shè)計標準-高清現(xiàn)行
- 皇冠假日酒店智能化系統(tǒng)安裝工程施工合同范本
- 路面工程重點、關(guān)鍵、和難點工程的施工方案(技術(shù)標)
- 合肥市城市大腦·數(shù)字底座白皮書2020
評論
0/150
提交評論