




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第9章分類數(shù)據(jù)分析9.1分類數(shù)據(jù)與卡方統(tǒng)計(jì)量9.2擬合優(yōu)度檢查9.3列聯(lián)分析:獨(dú)立性檢查9.4列聯(lián)表中有關(guān)測量9.5列聯(lián)分析中應(yīng)注意問題2023/10/101第1頁9.1分類數(shù)據(jù)與卡方統(tǒng)計(jì)量分類數(shù)據(jù):數(shù)據(jù)成果用數(shù)值表達(dá),但不一樣數(shù)值描述是調(diào)查對象不一樣特性。分類數(shù)據(jù)匯總成果體現(xiàn)為頻數(shù)。數(shù)值型數(shù)據(jù)也能夠表達(dá)為分類數(shù)據(jù)卡方檢查是對分類數(shù)據(jù)頻數(shù)進(jìn)行分析統(tǒng)計(jì)辦法。
2023/10/102第2頁卡方統(tǒng)計(jì)量:測定兩個(gè)分類變量之間有關(guān)程度2023/10/103第3頁9.2擬合優(yōu)度檢查(goodnessoffittest)對一種分類變量檢查定義:根據(jù)總體分布情況,計(jì)算分類變量中各類別盼望頻數(shù),與觀測頻數(shù)進(jìn)行對比,判斷盼望頻數(shù)與觀測頻數(shù)是否有顯著差異。目標(biāo):對分類變量進(jìn)行分析例:1923年4月15日,豪華巨輪泰坦尼克號與冰山相撞淹沒。當(dāng)初船上共有2208人,其中男性1738人,女性470人。海難發(fā)生后,幸存者共718人,其中男性374人,女性344人,以α=0.1顯著性水平檢查存活情況與性別是否有關(guān)?2023/10/104第4頁假如存活情況與性別無關(guān),男性與女性幸存百分比應(yīng)當(dāng)相等。
海難后幸存百分比為718/2208=0.325
男性應(yīng)當(dāng)為1738*0.325=565人
女性應(yīng)當(dāng)為470*0.325=153人。觀測值盼望值男374565-1913648164.6女34415319136481238.4解:判斷觀測頻數(shù)與盼望頻數(shù)是否一致H0:觀測頻數(shù)與盼望頻數(shù)一致H1:觀測頻數(shù)與盼望頻數(shù)不一致2023/10/105第5頁自由度df為:分類變量(性別)個(gè)數(shù)-1=1c2α=0.12.705決策:回絕H0結(jié)論:存活情況與性別有關(guān)回絕域2023/10/106第6頁例題2一項(xiàng)統(tǒng)計(jì)成果聲稱,某市老年人口所占百分比為14.7%,該市老年人口研究會(huì)為了檢查該項(xiàng)統(tǒng)計(jì)是否可靠,隨機(jī)抽選了400名居民,發(fā)覺其中有57人老年人。調(diào)查成果是否支持14.7%見解?2023/10/107第7頁解:H0:觀測頻數(shù)與盼望頻數(shù)一致H1:觀測頻數(shù)與盼望頻數(shù)不一致盼望頻數(shù):400居民中老年人盼望頻數(shù)應(yīng)當(dāng)為400*14.7%=59
400居民中非老年人盼望頻數(shù)應(yīng)當(dāng)為400-59=341
觀測值盼望值老年人5759-240.0678非老年人343341240.01172023/10/108第8頁自由度為:分類變量類型個(gè)數(shù)-1=1c2α=0.055.024回絕域2023/10/109第9頁9.3列聯(lián)分析:獨(dú)立性檢查獨(dú)立性檢查:對兩個(gè)分類變量分析,是否有關(guān)聯(lián)列聯(lián)表:由兩個(gè)以上變量進(jìn)行交叉分類頻數(shù)分布表行變量類別用R表達(dá),Ri
表達(dá)第i
個(gè)類別列變量類別用C
表達(dá),Cj
表達(dá)第j
個(gè)類別每種組合觀測頻數(shù)用fij
表達(dá)列出了行變量和列變量所有也許組合,因此稱為列聯(lián)表一種
R行C列列聯(lián)表稱為R
C列聯(lián)表2023/10/1010第10頁列聯(lián)表構(gòu)造
(2
列聯(lián)表)列(Cj)行合計(jì)RTj=1j=1i=1f11f12f11+f12i=2f21f22f21+f22列合計(jì)CTf11+f21f12+f22n列(Cj)行(Ri)一種2
列聯(lián)表2023/10/1011第11頁列聯(lián)表構(gòu)造
(RC列聯(lián)表一般表達(dá))列(cj)行合計(jì)RTj=1j=2…i=1f11f12…r1i=2f21f22…r2:::::列合計(jì)CTc1c2…n列(Cj)行(Ri)R行C列列聯(lián)表fij
表達(dá)第i
行第j
列觀測頻數(shù)2023/10/1012第12頁一分公司二分公司三分公司四分公司合計(jì)贊成該方案68755779279反對該方案32453331141合計(jì)10012090110420例:一種集團(tuán)公司在四個(gè)不一樣地域設(shè)有分公司,現(xiàn)該集團(tuán)公司欲進(jìn)行一項(xiàng)改革,此項(xiàng)改革也許包括到各分公司利益,故采取抽樣調(diào)查方式,從四個(gè)分公司共抽取420個(gè)樣本單位(人),理解職員對此項(xiàng)改革見解,調(diào)查成果如下表2023/10/1013第13頁邊緣分布行邊緣分布行觀測值合計(jì)數(shù)分布例如,贊成改革方案共有279人,反對改革方案141人列邊緣分布列觀測值合計(jì)數(shù)分布例如,四個(gè)分公司接收調(diào)查人數(shù)分別為100人,120人,90人,110人條件分布與條件頻數(shù)變量X條件下變量Y
分布,或在變量Y
條件下變量X
分布每個(gè)詳細(xì)觀測值稱為條件頻數(shù)3個(gè)概念:邊緣分布,條件分布和條件頻數(shù)2023/10/1014第14頁一分公司二分公司三分公司四分公司合計(jì)贊成該方案68755779279反對該方案32453331141合計(jì)10012090110420行邊緣分布列邊緣分布條件頻數(shù)2023/10/1015第15頁條件頻數(shù)反應(yīng)了數(shù)據(jù)分布,但不適合進(jìn)行對比百分比分布:以相同基數(shù)計(jì)算對應(yīng)百分比行百分比:行每一種觀測頻數(shù)除以對應(yīng)行合計(jì)數(shù)(f0
/RT)列百分比:列每一種觀測頻數(shù)除以對應(yīng)列合計(jì)數(shù)(f0
/CT)總百分比:每一種觀測值除以觀測值總合計(jì)數(shù)(f0
/n)百分比分布2023/10/1016第16頁一分公司二分公司三分公司四分公司合計(jì)贊成該方案24.4%26.9%20.4%28.3%66.4%68.0%62.5%63.3571.8%—16.2%17.8%13.6%18.8%—反對該方案22.7%31.9%23.4%22.0%33.6%32.0%37.5%36.7%28.2%—7.6%10.7%7.9%7.4%—合計(jì)23.8%28.6%21.4%26.2%100%總百分比列百分比行百分比2023/10/1017第17頁問題:檢查改革方案態(tài)度和各公司之間是否存在依賴關(guān)系H0:改革方案態(tài)度和各公司之間是獨(dú)立(不存在依賴關(guān)系)H1:改革方案態(tài)度和各公司之間不獨(dú)立(存在依賴關(guān)系)一種觀測頻數(shù)f0盼望頻數(shù)fe
,是總頻數(shù)個(gè)數(shù)n乘以該觀測頻數(shù)f0
落入第i
行和第j列概率,即2023/10/1018第18頁計(jì)算各單元盼望頻數(shù)一分公司二分公司三分公司四分公司RT贊成該方案實(shí)際頻數(shù)68755779279盼望頻數(shù)66806073反對該方案實(shí)際頻數(shù)32453331141盼望頻數(shù)34403037CT100120901104202023/10/1019第19頁
統(tǒng)計(jì)量用于檢查列聯(lián)表中變量之間是否存在顯著性差異,或者用于檢查變量之間是否獨(dú)立計(jì)算公式為2023/10/1020第20頁實(shí)際頻數(shù)(f0)盼望頻數(shù)(fe)f0-fe(f0-fe)2(f0-fe)2fe687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合計(jì):3.03192023/10/1021第21頁
獨(dú)立性檢查檢查列聯(lián)表中行變量與列變量之間是否獨(dú)立檢查步驟為提出假設(shè)H0:行變量與列變量獨(dú)立H1:行變量與列變量不獨(dú)立計(jì)算檢查統(tǒng)計(jì)量進(jìn)行決策根據(jù)顯著性水平和自由度(r-1)(c-1)查出臨界值
2若2
2,回絕H0;若
2<
2,不回絕H02023/10/1022第22頁【例】一種原料來自三個(gè)不一樣地域,原料質(zhì)量被提成三個(gè)不一樣等級。從這批原料中隨機(jī)抽取500件進(jìn)行檢查,成果如下表。檢查各地域與原料之間是否存在依賴關(guān)系(
0.05)地域一級二級三級合計(jì)甲地域526424140乙地域605952171丙地域506574189合計(jì)1621881505002023/10/1023第23頁提出假設(shè)H0:地域與原料等級之間獨(dú)立H1:地域與原料等級之間不獨(dú)立計(jì)算檢查統(tǒng)計(jì)量根據(jù)顯著性水平=0.05和自由度(3-1)(3-1)=4查出對應(yīng)臨界值
2=9.488。由于2=19.82>
2=9.448,回絕H02023/10/1024第24頁9.4列聯(lián)表中有關(guān)測量
一:
有關(guān)系數(shù)測度22列聯(lián)表中數(shù)據(jù)有關(guān)程度一種量對于22
列聯(lián)表,
系數(shù)值在0~1之間
有關(guān)系數(shù)計(jì)算公式為n:總頻數(shù)2023/10/1025第25頁一種簡化22列聯(lián)表原因Y原因X合計(jì)RTx1x2y1aba+by2cdc+d合計(jì)CTa+cb+dn2023/10/1026第26頁列聯(lián)表中每個(gè)單元格盼望頻數(shù)分別為將各盼望頻數(shù)代入
計(jì)算公式得2023/10/1027第27頁將
入
有關(guān)系數(shù)計(jì)算公式得ad等于bc,
=0,表白變量X與Y
之間獨(dú)立若b=0
,c=0,或a=0
,d=0,意味著各觀測頻數(shù)所有落在對角線上,此時(shí)|
|=1,表白變量X與Y
之間完全有關(guān)列聯(lián)表中變量位置能夠交換,
符號沒有實(shí)際意義,故取絕對值即可2023/10/1028第28頁二:列聯(lián)有關(guān)系數(shù)C測度大于2
2列聯(lián)表中數(shù)據(jù)有關(guān)程度C取值范圍是0
C<1C=0表白列聯(lián)表中兩個(gè)變量獨(dú)立C數(shù)值大小取決于列聯(lián)表行數(shù)和列數(shù),并隨行數(shù)和列數(shù)增大而增大。2
2列聯(lián)表完全有關(guān)時(shí),c=0.7071;3
3列聯(lián)表完全有關(guān)時(shí),c=0.8165;4
4列聯(lián)表完全有關(guān)時(shí),c=0.87根據(jù)不一樣行和列列聯(lián)表計(jì)算列聯(lián)系數(shù)不便于比較2023/10/1029第29頁三:V有關(guān)系數(shù)計(jì)算公式為
其中
V取值范圍是0
V
1
V=0表白列聯(lián)表中兩個(gè)變量獨(dú)立V=1表白列聯(lián)表中兩個(gè)變量完全有關(guān)不一樣行和列列聯(lián)表計(jì)算列聯(lián)系數(shù)不便于比較當(dāng)列聯(lián)表中有一維為2,min[(r-1),(c-1)]=1,此時(shí)V=
2023/10/1030第30頁四:數(shù)值分析
、C、V比較同一種列聯(lián)表,
、C、V成果會(huì)不一樣不一樣列聯(lián)表,
、C、V成果也不一樣在對不一樣列聯(lián)表變量之間有關(guān)程度進(jìn)行比較時(shí),不一樣列聯(lián)表中行與行、列與列個(gè)數(shù)要相同,并且采取同一種系數(shù)2023/10/1031
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣州美術(shù)學(xué)院《給排水管道工程》2023-2024學(xué)年第二學(xué)期期末試卷
- 江西環(huán)境工程職業(yè)學(xué)院《城鄉(xiāng)韌性理論與規(guī)劃》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年保安證考試綜合素質(zhì)試題及答案
- 三峽旅游職業(yè)技術(shù)學(xué)院《商務(wù)泰語》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶市拔尖強(qiáng)基聯(lián)盟2024-2025學(xué)年高三下學(xué)期3月聯(lián)合考試歷史試題(含答案)
- 哈爾濱理工大學(xué)《鄉(xiāng)村幼兒園教師專業(yè)素養(yǎng)案例原理方法》2023-2024學(xué)年第二學(xué)期期末試卷
- 鄭州旅游職業(yè)學(xué)院《體育基礎(chǔ)俱樂部》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025保安證考試練習(xí)試題及答案
- 河北省石家莊高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)實(shí)驗(yàn)小學(xué)2025屆三年級數(shù)學(xué)第二學(xué)期期末學(xué)業(yè)質(zhì)量監(jiān)測試題含解析
- 2024-2025學(xué)年寧夏開元學(xué)校高三下學(xué)期階段性練習(xí)語文試題含解析
- 2025年園林綠化工(高級)考試題庫及答案
- 有效溝通技巧課件
- 2024春四年級上下冊音樂測試專項(xiàng)測試題及答案
- 多發(fā)傷骨折護(hù)理查房
- 中建二測考試題庫及答案
- 沙特阿拉伯2030年愿景
- 2023年軟件評測師《基礎(chǔ)知識》考試題庫(濃縮500題)
- 中建預(yù)制構(gòu)件吊裝安全專項(xiàng)施工方案
- 《馬化騰創(chuàng)業(yè)經(jīng)歷》課件
- 2023年湖北省生態(tài)環(huán)保有限公司招聘筆試真題
- 2023年新疆事業(yè)單位開展招聘考試真題
評論
0/150
提交評論