版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、關于列聯(lián)分析第一張,PPT共四十五頁,創(chuàng)作于2022年6月背 景統(tǒng)計分析中,我們常常會遇到一些定性的數(shù)據(jù)性別(男、女)態(tài)度(喜歡、不喜歡)性別對態(tài)度是否有影響1.可使用列聯(lián)表分析技術2.可運用對數(shù)線性模型與 Logistic模型分析技術2022/9/32第二張,PPT共四十五頁,創(chuàng)作于2022年6月主要內容2022/9/33第三張,PPT共四十五頁,創(chuàng)作于2022年6月第一節(jié) 分類數(shù)據(jù)與列聯(lián)表 一、分類數(shù)據(jù)二、列聯(lián)表的構造三、列聯(lián)表的分布2022/9/34第四張,PPT共四十五頁,創(chuàng)作于2022年6月分類變量的結果表現(xiàn)為類別例如:性別 (男, 女)各類別用符號或數(shù)字代碼來測度使用分類或順序尺度
2、你吸煙嗎? 1.是;2.否你贊成還是反對這一改革方案?1.贊成;2.反對對分類數(shù)據(jù)的描述和分析通常使用列聯(lián)表可使用檢驗數(shù)值型數(shù)據(jù)也可以轉化為分類數(shù)據(jù)一、分類數(shù)據(jù)2022/9/35第五張,PPT共四十五頁,創(chuàng)作于2022年6月由兩個以上的變量交叉分類的頻數(shù)分布表行變量的類別用 r 表示, ri 表示第 i 個類別列變量的類別用 c 表示, cj 表示第 j 個類別每種組合的觀察頻數(shù)用 fij 表示表中列出了行變量和列變量的所有可能的組合,所以稱為列聯(lián)表一個 r 行 c 列的列聯(lián)表稱為 r c 列聯(lián)表二、列聯(lián)表的構造-列聯(lián)表(contingency table)2022/9/36第六張,PPT共四
3、十五頁,創(chuàng)作于2022年6月列聯(lián)表的結構(2 2 列聯(lián)表)列( cj )合計j =1j =1i =1f11f12f11+ f12i =2f21f22f21+ f22合計f11+ f21f12+ f22n列(cj)行 (ri)2022/9/37第七張,PPT共四十五頁,創(chuàng)作于2022年6月列聯(lián)表的結構(r c 列聯(lián)表的一般表示)列(cj)合計j =1j = 2i =1f11f12r1i = 2f21f22r2:合計c1c2n列(cj)行(ri)fij 表示第 i 行第 j 列的觀察頻數(shù)2022/9/38第八張,PPT共四十五頁,創(chuàng)作于2022年6月例題分析一分公司二分公司三分公司四分公司合計贊成
4、該方案68755779279反對該方案32753331141合計10012090110420【例】一個集團公司在四個不同的地區(qū)設有分公司,現(xiàn)該集團公司欲進行一項改革,此項改革可能涉及到各分公司的利益,故采用抽樣調查方式,從四個分公司共抽取420個樣本單位(人),了解職工對此項改革的看法,調查結果如下表2022/9/39第九張,PPT共四十五頁,創(chuàng)作于2022年6月邊緣分布行邊緣分布行觀察值的合計數(shù)的分布例如,贊成改革方案的共有279人,反對改革方案的141人列邊緣分布列觀察值的合計數(shù)的分布例如,四個分公司接受調查的人數(shù)分別為100人,120人,90人,110人條件分布與條件頻數(shù)變量 X 條件下
5、變量Y 的分布,或在變量Y 條件下變量 X 的分布每個具體的觀察值稱為條件頻數(shù)二、列聯(lián)表的分布-觀察值的分布2022/9/310第十張,PPT共四十五頁,創(chuàng)作于2022年6月觀察值的分布(圖示)一分公司二分公司三分公司四分公司合計贊成該方案68755779279反對該方案32453331141合計10012090110420行邊緣分布列邊緣分布條件頻數(shù)2022/9/311第十一張,PPT共四十五頁,創(chuàng)作于2022年6月條件頻數(shù)反映了數(shù)據(jù)的分布,但不適合對比為在相同的基數(shù)上進行比較,可以計算相應的百分比,稱為百分比分布行百分比:行的每一個觀察頻數(shù)除以相應的行合計數(shù)(fij / ri)列百分比:列
6、的每一個觀察頻數(shù)除以相應的列合計數(shù)( fij / cj )總百分比:每一個觀察值除以觀察值的總個數(shù)( fij / n )百分比分布(概念要點)2022/9/312第十二張,PPT共四十五頁,創(chuàng)作于2022年6月百分比分布(圖示)一分公司二分公司三分公司四分公司合計贊成該方案24.4%26.9%20.4%28.3%66.4%68.0%62.5%63.3571.8%16.2%17.8%13.6%18.8%反對該方案22.7%31.9%23.4%22.0%33.6%32.0%37.5%36.7%28.2%7.6%10.7%7.9%7.4%合計23.8%28.6%21.4%26.2%100%總百分比列
7、百分比行百分比2022/9/313第十三張,PPT共四十五頁,創(chuàng)作于2022年6月假定行變量和列變量是獨立的一個實際頻數(shù) fij 的期望頻數(shù) eij ,是總頻數(shù)的個數(shù) n 乘以該實際頻數(shù) fij 落入第 i 行 和第j列的概率,即期望頻數(shù)的分布2022/9/314第十四張,PPT共四十五頁,創(chuàng)作于2022年6月期望頻數(shù)的分布(例題分析)由于觀察頻數(shù)的總數(shù)為n ,所以f11 的期望頻數(shù) e11 應為例如,第1行和第1列的實際頻數(shù)為 f11 ,它落在第1行的概率估計值為該行的頻數(shù)之和r1除以總頻數(shù)的個數(shù) n ,即:r1/n;它落在第1列的概率的估計值為該列的頻數(shù)之和c1除以總頻數(shù)的個數(shù) n ,即:
8、c1/n 。根據(jù)概率的乘法公式,該頻數(shù)落在第1行和第1列的概率應為2022/9/315第十五張,PPT共四十五頁,創(chuàng)作于2022年6月期望頻數(shù)的分布(例題分析)一分公司二分公司三分公司四分公司贊成該方 案實際頻數(shù)68755779期望頻數(shù)66806073反對該方 案實際頻數(shù)32753331期望頻數(shù)344030372022/9/316第十六張,PPT共四十五頁,創(chuàng)作于2022年6月第二節(jié) 檢驗 一、 統(tǒng)計量 二、擬合優(yōu)度檢驗2022/9/317第十七張,PPT共四十五頁,創(chuàng)作于2022年6月用于檢驗列聯(lián)表中變量間擬合優(yōu)度和獨立性用于測定兩個分類變量之間的相關程度 計算公式為 其自由度為 式中 -列
9、聯(lián)表中第i行第j列類別的實際頻數(shù) -列聯(lián)表中第i行第j列類別的期望頻數(shù)一、 統(tǒng)計量2022/9/318第十八張,PPT共四十五頁,創(chuàng)作于2022年6月 統(tǒng)計量(例題分析)實際頻數(shù)(fij)期望頻數(shù)(eij)fij - eij(fij - eij)2(fij- eij)2eij687557793245333166806073344030372-5-36-253-64259364259360.06060.31250.15000.49320.11760.62500.30000.9730合計:3.03192022/9/319第十九張,PPT共四十五頁,創(chuàng)作于2022年6月二、擬合優(yōu)度檢驗(品質數(shù)據(jù)的假
10、設檢驗)品質數(shù)據(jù)比例檢驗獨立性檢驗Z 檢驗一個總體 檢驗Z 檢驗 檢驗兩個以上總體兩個總體2022/9/320第二十張,PPT共四十五頁,創(chuàng)作于2022年6月檢驗多個比例是否相等檢驗的步驟提出假設H0:1 = 2 = = j;H1: 1 , 2 , , j 不全相等 計算檢驗的統(tǒng)計量擬合優(yōu)度檢驗(goodness of fit test)進行決策 根據(jù)顯著性水平和自由度(r-1)(c-1)查出臨界值2 若22,拒絕H0;若22,接受H02022/9/321第二十一張,PPT共四十五頁,創(chuàng)作于2022年6月H0: 1= 2= 3= 4 H1: 1,2,3,4 不全相等 = 0.1df = (2-
11、1)(4-1)= 3臨界值(s):擬合優(yōu)度檢驗(例題分析)統(tǒng)計量:在 = 0.1的水平上不能拒絕H0可以認為四個分公司對改革方案的贊成比例是一致的 決策:結論:6.2513.0319 =0.10第二十二張,PPT共四十五頁,創(chuàng)作于2022年6月 【例】為了提高市場占有率,A公司和B公司同時開展了廣告宣傳。在廣告宣傳戰(zhàn)之前,A公司的市場占有率為45%,B公司的市場占有率為40%,其他公司的市場占有率為15%。為了了解廣告戰(zhàn)之后A、B和其他公司的市場占有率是否發(fā)生變化,隨機抽取了200名消費者,其中102人表示準備購買A公司產品,82人表示準備購買B公司產品,另外16人表示準備購買其他公司產品。檢
12、驗廣告戰(zhàn)前后各公司的市場占有率是否發(fā)生了變化 ( 0.05)擬合優(yōu)度檢驗(例題分析)2022/9/323第二十三張,PPT共四十五頁,創(chuàng)作于2022年6月H0: 1=0.45 2=0.4 3= 0.15 H1:原假設中至少有一個不成立 = 0.05df = (2-1)(3-1)= 2臨界值(s):擬合優(yōu)度檢驗(例題分析)統(tǒng)計量: 在 = 0.05的水平上拒絕H0可以認為廣告后各公司產品市場占有率發(fā)生顯著變化 決策:結論:08.185.99 =0.05 24第二十四張,PPT共四十五頁,創(chuàng)作于2022年6月第1步:將觀察值輸入一列,將期望值輸入一列第2步:選擇“函數(shù)”選項第3步:在函數(shù)分類中選“
13、統(tǒng)計”,在函數(shù)名中選 “CHITEST”,點擊“確定”第4步:在對話框“Actual_range”輸入觀察數(shù)據(jù)區(qū)域 在對話框“Expected_range”輸入期望數(shù)據(jù)區(qū) 域得到P值為0.016711,所以拒絕原假設 擬合優(yōu)度檢驗(例題分析用P值檢驗) 25第二十五張,PPT共四十五頁,創(chuàng)作于2022年6月第三節(jié) 列聯(lián)表中的相關測量一、 相關系數(shù)二、列聯(lián)相關系數(shù)三、V 相關系數(shù)2022/9/326第二十六張,PPT共四十五頁,創(chuàng)作于2022年6月品質相關對品質數(shù)據(jù)(分類和順序數(shù)據(jù))之間相關程度的測度列聯(lián)表變量的相關屬于品質相關列聯(lián)表相關測量的統(tǒng)計量主要有 相關系數(shù)列聯(lián)相關系數(shù)V 相關系數(shù)列聯(lián)表
14、中的相關測量2022/9/327第二十七張,PPT共四十五頁,創(chuàng)作于2022年6月測度22列聯(lián)表中數(shù)據(jù)相關程度對于22 列聯(lián)表, 系數(shù)的值在01之間 相關系數(shù)計算公式為 式中n為列聯(lián)表的總頻數(shù),即樣本量一、 相關系數(shù)(correlation coefficient)2022/9/328第二十八張,PPT共四十五頁,創(chuàng)作于2022年6月一個簡化的 22 列聯(lián)表 相關系數(shù)(原理分析)因素Y因素 X合計x1x2y1aba + by2cdc + d合計a + cb + dn2022/9/329第二十九張,PPT共四十五頁,創(chuàng)作于2022年6月a、b、c、d均為條件頻數(shù)當變量X,Y相互獨立,不存在相關關
15、系時,頻數(shù)間應有下面的關系:化簡后有:差值 的大小可以反映變量之間相關程度的高低。差值越大,說明兩個變量的相關程度越高。 系數(shù)就是以差值為基礎,實現(xiàn)對兩個變量相關程度的測量。 相關系數(shù)(原理分析)2022/9/330第三十張,PPT共四十五頁,創(chuàng)作于2022年6月列聯(lián)表中每個單元格的期望頻數(shù)分別為 相關系數(shù)(原理分析)將各期望頻數(shù)代入 的計算公式得2022/9/331第三十一張,PPT共四十五頁,創(chuàng)作于2022年6月將代入 相關系數(shù)的計算公式得 相關系數(shù)(原理分析)ad 等于 bc , = 0,表明變量X 與 Y 之間獨立若 b=0 ,c=0,或a=0 ,d=0,意味著各觀察頻數(shù)全部落在對角線
16、上,此時| =1,表明變量X 與 Y 之間完全相關列聯(lián)表中變量的位置可以互換,的符號沒有實際意義,故取絕對值即可2022/9/332第三十二張,PPT共四十五頁,創(chuàng)作于2022年6月用于測度大于22列聯(lián)表中數(shù)據(jù)的相關程度計算公式為二、列聯(lián)相關系數(shù)(coefficient ofcontingency)C 的取值范圍是 0C1C = 0表明列聯(lián)表中的兩個變量獨立C 的數(shù)值大小取決于列聯(lián)表的行數(shù)和列數(shù),并隨行數(shù)和列數(shù)的增大而增大根據(jù)不同行和列的列聯(lián)表計算的列聯(lián)系數(shù)不便于比較2022/9/333第三十三張,PPT共四十五頁,創(chuàng)作于2022年6月計算公式為三、V 相關系數(shù)(V correlation c
17、oefficient)2. V 的取值范圍是 0V13. V = 0表明列聯(lián)表中的兩個變量獨立4. V=1表明列聯(lián)表中的兩個變量完全相關5. 不同行和列的列聯(lián)表計算的列聯(lián)系數(shù)不便于比較6. 當列聯(lián)表中有一維為2,min(r-1),(c-1)=1,此時 V=2022/9/334第三十四張,PPT共四十五頁,創(chuàng)作于2022年6月同一個列聯(lián)表,、C、V 的結果會不同不同的列聯(lián)表,、C、V 的結果也不同在對不同列聯(lián)表變量之間的相關程度進行比較時,不同列聯(lián)表中的行與行、列與列的個數(shù)要相同,并且采用同一種系數(shù)四、C、V 的比較2022/9/335第三十五張,PPT共四十五頁,創(chuàng)作于2022年6月列聯(lián)表中的
18、相關測量(例題分析)【例】一種原料來自三個不同地區(qū),原料質量被分成三個不同等級。從這批原料中隨機抽取500件進行檢驗,結果如下表。分別計算系數(shù)、C系數(shù)和V系數(shù),并分析相關程度地區(qū)一級二級三級合計甲地區(qū)526424140乙地區(qū)605952171丙地區(qū)506574189合計1621881505002022/9/336第三十六張,PPT共四十五頁,創(chuàng)作于2022年6月列聯(lián)表中的相關測量 (例題分析)解:已知n=500,19.82,列聯(lián)表為33結論:三個系數(shù)均不高,表明產地和原料等級之 間的相關程度不高2022/9/337第三十七張,PPT共四十五頁,創(chuàng)作于2022年6月第四節(jié) 列聯(lián)分析中應注意的問題
19、一、條件百分表的方向二、 分布的期望準則2022/9/338第三十八張,PPT共四十五頁,創(chuàng)作于2022年6月對于具有因果關系的兩個品質變量X與Y,在列聯(lián)表中的位置有習慣的處理,即將自變量(X)置于列的位置,將因變量(Y)置于行的位置,這樣可以更好地表現(xiàn)原因對結果的影響。一、條件百分表的方向價值取向Y職業(yè)X制造業(yè)服務業(yè)物質報酬(%)105724556人情關系(%)40283544合計(%)145100801002022/9/339第三十九張,PPT共四十五頁,創(chuàng)作于2022年6月如果因變量在樣本內的分布不能代表其在總體內的分布,例如,為了滿足分析的需要,抽樣時擴大了因變量某項內容的樣本量,這時若仍以自變量的方向計算百分表就會歪曲事實。例如,社會學家欲研究家庭狀況(自變量)對青少年犯罪(因變量)的影響。該地區(qū)有未犯罪記錄的青少年10000名,犯罪記錄的青少年150名。如果從未犯罪青少年中抽取1%,即100名進行研究,按相同比例從犯罪青少年中抽取的樣本量僅為1.5人。顯然,這樣少的樣本量無法滿足研究的需要。故要擴大犯罪青少年的樣本量,如擴大到50%。調查結果:條件百分表的方向(特殊情況)2022/9/340第四十張,PPT共四十五頁,創(chuàng)作于2022年6月青少年行為家庭狀況合計完整家庭離異家庭犯罪
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 關于2025年度市政道路施工管理協(xié)議書3篇
- 2025年度生態(tài)公園清工承包服務合同3篇
- 2025年度生態(tài)園區(qū)土石方整治與生態(tài)修復合作協(xié)議3篇
- 二零二五年度農村自來水管網(wǎng)租賃服務合同
- 二零二五年度農村家庭資產分配協(xié)議范本2篇
- 2025清潔合同樣板
- 2025年度創(chuàng)新型企業(yè)監(jiān)事聘用合同標準模板3篇
- 二零二五年度農村土地租賃與農業(yè)產業(yè)扶貧合同
- 2025年度數(shù)據(jù)中心防火門緊急更換與安全評估服務協(xié)議3篇
- 二零二五年度農業(yè)種植項目環(huán)境保護責任書3篇
- 采購合同范例壁布
- 公司員工出差車輛免責協(xié)議書
- 2024年陜西榆林市神木市公共服務輔助人員招聘775人歷年管理單位遴選500模擬題附帶答案詳解
- 行政強制法講座-PPT課件
- 2022年新媒體編輯實戰(zhàn)教程測試題及答案(題庫)
- 崗位現(xiàn)場應急處置方案卡全套(全套20頁)
- 涼席竹片銑槽機(課程設計)
- 高壓線防護搭設方案
- 綜合機械化固體充填采煤技術要求-編制說明
- 十人聯(lián)名推薦表
- 七、分蛋糕博弈
評論
0/150
提交評論