版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 第九章 屬性(分類)數(shù)據(jù)分析 n9.1 屬性數(shù)據(jù)及其分析屬性數(shù)據(jù)及其分析 n9.2 SAS中的屬性數(shù)據(jù)分析中的屬性數(shù)據(jù)分析 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 n9.1 9.1 屬性數(shù)據(jù)及其分析屬性數(shù)據(jù)及其分析 n9.1.1 屬性數(shù)據(jù)分析與列聯(lián)表屬性數(shù)據(jù)分析與列聯(lián)表 n9.1.2 屬性變量關(guān)聯(lián)性分析屬性變量關(guān)聯(lián)性分析 n9.1.3 屬性變量關(guān)聯(lián)度計(jì)算屬性變量關(guān)聯(lián)度計(jì)算 n9.1.4 有序變量關(guān)聯(lián)性分析有序變量關(guān)聯(lián)性分析 STATSTATSTATSTATSASSAS軟件
2、與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 9.1.1 屬性數(shù)據(jù)分析與列聯(lián)表屬性數(shù)據(jù)分析與列聯(lián)表 1. 1. 屬性變量與屬性數(shù)據(jù)分析屬性變量與屬性數(shù)據(jù)分析 從變量的測(cè)量水平來(lái)看分為兩類:連續(xù)變量和屬性從變量的測(cè)量水平來(lái)看分為兩類:連續(xù)變量和屬性 (Categorical)變量,屬性變量又可分為有序的變量,屬性變量又可分為有序的(Ordinal) 和無(wú)序的變量。和無(wú)序的變量。 對(duì)屬性數(shù)據(jù)進(jìn)行分析,將達(dá)到以下幾方面的目的:對(duì)屬性數(shù)據(jù)進(jìn)行分析,將達(dá)到以下幾方面的目的: 1) 產(chǎn)生匯總分類數(shù)據(jù)產(chǎn)生匯總分類數(shù)據(jù)列聯(lián)表;列聯(lián)表; 2) 檢驗(yàn)屬性變量間的獨(dú)立性檢驗(yàn)屬性變量間的獨(dú)立性(無(wú)關(guān)聯(lián)性無(wú)關(guān)聯(lián)性); 3) 計(jì)算屬
3、性變量間的關(guān)聯(lián)性統(tǒng)計(jì)量;計(jì)算屬性變量間的關(guān)聯(lián)性統(tǒng)計(jì)量; 4) 對(duì)高維數(shù)據(jù)進(jìn)行分層分析和建模。對(duì)高維數(shù)據(jù)進(jìn)行分層分析和建模。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 2. 2. 列聯(lián)表列聯(lián)表 列聯(lián)表(列聯(lián)表(contingency table)是由兩個(gè)以上的屬性變)是由兩個(gè)以上的屬性變 量進(jìn)行交叉分類的頻數(shù)分布表。例如一個(gè)集團(tuán)公司在四量進(jìn)行交叉分類的頻數(shù)分布表。例如一個(gè)集團(tuán)公司在四 個(gè)不同的區(qū)域設(shè)有分公司,現(xiàn)該集團(tuán)公司欲進(jìn)行一項(xiàng)改個(gè)不同的區(qū)域設(shè)有分公司,現(xiàn)該集團(tuán)公司欲進(jìn)行一項(xiàng)改 革,此項(xiàng)改革可能涉及各分公司的利益,故采用抽樣調(diào)革,此項(xiàng)改革可能涉及各分公司
4、的利益,故采用抽樣調(diào) 查方法,從四個(gè)分公司共抽取查方法,從四個(gè)分公司共抽取420個(gè)樣本單位,了解職個(gè)樣本單位,了解職 工對(duì)此項(xiàng)改革的看法,調(diào)查結(jié)果如表工對(duì)此項(xiàng)改革的看法,調(diào)查結(jié)果如表9-1所示。所示。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 表9-1 關(guān)于改革方案的調(diào)查結(jié)果(單位:人) 表中的行表中的行(row)是態(tài)度變量,這里劃分為兩類:贊成改是態(tài)度變量,這里劃分為兩類:贊成改 革方案或反對(duì)改革方案;表中的列革方案或反對(duì)改革方案;表中的列(column)是單位變量,是單位變量, 這里劃分為四類,即四個(gè)分公司。表這里劃分為四類,即四個(gè)分公司。表9-1所
5、示的列聯(lián)表所示的列聯(lián)表 稱為稱為2 4表。表。 一分公司二分公司三分公司四分公司合計(jì) 贊成該方案68755779279 反對(duì)該方案32453331141 合計(jì)10012090110420 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 交叉表的基本形式如圖交叉表的基本形式如圖9-1所示。所示。 這是一張具有這是一張具有r行和行和c列的一般列聯(lián)表,稱它為列的一般列聯(lián)表,稱它為r c表。表。 其中,第其中,第i行第行第j列的單元表示為單元列的單元表示為單元ij。交叉表常給出在。交叉表常給出在 所有行變量和列變量的組合中的觀測(cè)個(gè)數(shù)。表中的總觀所有行變量和列變量的組合
6、中的觀測(cè)個(gè)數(shù)。表中的總觀 測(cè)個(gè)數(shù)用測(cè)個(gè)數(shù)用n表示,在單元表示,在單元ij中的觀測(cè)個(gè)數(shù)表示為中的觀測(cè)個(gè)數(shù)表示為nij,稱為,稱為 單元頻數(shù)。單元頻數(shù)。 c j j n 1 1 c j j n 1 2 c j rj n 1 r i i n 1 1 r i i n 1 2 r i ic n 1 r i c j ij n 11 列 行 第1列第2列第c列行邊緣頻數(shù) 第1行n11n12n1c 第2行n21n22n2c 第r行nr1nr2nrc 列邊緣頻數(shù) STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 9.1.2 屬性變量關(guān)聯(lián)性分析屬性變量關(guān)聯(lián)性分析 對(duì)于不同的屬性變量
7、,從列聯(lián)表中可以得到它們聯(lián)合對(duì)于不同的屬性變量,從列聯(lián)表中可以得到它們聯(lián)合 分布的信息。但有時(shí)還想知道形成列聯(lián)表的行和列變量分布的信息。但有時(shí)還想知道形成列聯(lián)表的行和列變量 間是否有某種關(guān)聯(lián)性,即一個(gè)變量取不同數(shù)值時(shí),另一間是否有某種關(guān)聯(lián)性,即一個(gè)變量取不同數(shù)值時(shí),另一 個(gè)變量的分布是否有顯著的不同,這就是屬性變量關(guān)聯(lián)個(gè)變量的分布是否有顯著的不同,這就是屬性變量關(guān)聯(lián) 性分析的內(nèi)容。性分析的內(nèi)容。 屬性變量關(guān)聯(lián)性檢驗(yàn)的假設(shè)為屬性變量關(guān)聯(lián)性檢驗(yàn)的假設(shè)為 H0:變量之間無(wú)關(guān)聯(lián)性;:變量之間無(wú)關(guān)聯(lián)性; H1:變量之間有關(guān)聯(lián)性:變量之間有關(guān)聯(lián)性 由于變量之間無(wú)關(guān)聯(lián)性說(shuō)明變量互相獨(dú)立,所以原假由于變量之間
8、無(wú)關(guān)聯(lián)性說(shuō)明變量互相獨(dú)立,所以原假 設(shè)和備擇假設(shè)可以寫為:設(shè)和備擇假設(shè)可以寫為: H0:變量之間獨(dú)立;:變量之間獨(dú)立; H1:變量之間不獨(dú)立:變量之間不獨(dú)立 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 1. 1. 2 2檢驗(yàn)檢驗(yàn) 在雙向表的情形下,如果行變量與列變量無(wú)關(guān)聯(lián)性的在雙向表的情形下,如果行變量與列變量無(wú)關(guān)聯(lián)性的 原假設(shè)原假設(shè)H0成立,則列聯(lián)表中各行的相對(duì)分布應(yīng)近似相等,成立,則列聯(lián)表中各行的相對(duì)分布應(yīng)近似相等, 即即 (j = 1,2,c) 或或 (j = 1,2,c) 其中其中mij稱為列聯(lián)表中單元稱為列聯(lián)表中單元ij在無(wú)關(guān)聯(lián)性假設(shè)下的期望頻在
9、無(wú)關(guān)聯(lián)性假設(shè)下的期望頻 數(shù),而數(shù),而nij是單元是單元ij的觀測(cè)頻數(shù)。的觀測(cè)頻數(shù)。 n n n n i ij j ij ij ij def i ij j ij ij m n nn n STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 為了檢驗(yàn)無(wú)關(guān)聯(lián)性,將觀測(cè)的單元頻數(shù)與無(wú)關(guān)聯(lián)的原假為了檢驗(yàn)無(wú)關(guān)聯(lián)性,將觀測(cè)的單元頻數(shù)與無(wú)關(guān)聯(lián)的原假 設(shè)為真時(shí)單元的期望頻數(shù)進(jìn)行比較。一個(gè)通常使用的檢設(shè)為真時(shí)單元的期望頻數(shù)進(jìn)行比較。一個(gè)通常使用的檢 驗(yàn)是驗(yàn)是 2檢驗(yàn)。檢驗(yàn)。 2統(tǒng)計(jì)量為:統(tǒng)計(jì)量為: 在在H0成立的條件下,當(dāng)觀測(cè)數(shù)據(jù)較大時(shí),成立的條件下,當(dāng)觀測(cè)數(shù)據(jù)較大時(shí), 2統(tǒng)計(jì)量的統(tǒng)計(jì)
10、量的 分布近似服從自由度為分布近似服從自由度為(r - 1)(c 1)的的 2分布。分布。 r i c j ij ijij m mn 11 2 2 )( STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 由于由于 2分布是一種連續(xù)性分布,而屬性數(shù)據(jù)是不連續(xù)的,分布是一種連續(xù)性分布,而屬性數(shù)據(jù)是不連續(xù)的, 故上式只是一個(gè)近似計(jì)算公式。計(jì)算出來(lái)的故上式只是一個(gè)近似計(jì)算公式。計(jì)算出來(lái)的 2值往往偏值往往偏 大,相應(yīng)的大,相應(yīng)的p值偏小,從而人為地增加了犯第一類錯(cuò)誤值偏小,從而人為地增加了犯第一類錯(cuò)誤 的機(jī)會(huì)。為糾正這種偏性,可采用校正的機(jī)會(huì)。為糾正這種偏性,可采用校正
11、 2,用,用 C2表示。表示。 注:通常要求注:通常要求 2檢驗(yàn)應(yīng)滿足的條件是:檢驗(yàn)應(yīng)滿足的條件是:n40且所有單且所有單 元的期望頻數(shù)均不小于元的期望頻數(shù)均不小于5。 2校正的條件:校正的條件:n40但有單元的期望頻數(shù)小于但有單元的期望頻數(shù)小于5。 r i c j ij ijij C m mn 11 2 2 )5 . 0|(| STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 2. Fisher2. Fisher精確檢驗(yàn)精確檢驗(yàn) Fisher精確檢驗(yàn)建立在概率論中超幾何分布的基礎(chǔ)上,精確檢驗(yàn)建立在概率論中超幾何分布的基礎(chǔ)上, 對(duì)于單元頻數(shù)小的列聯(lián)表來(lái)說(shuō),它是特
12、別合適的。對(duì)于單元頻數(shù)小的列聯(lián)表來(lái)說(shuō),它是特別合適的。 Fisher精確檢驗(yàn)計(jì)算在精確檢驗(yàn)計(jì)算在H0成立的條件下,當(dāng)總頻數(shù)和成立的條件下,當(dāng)總頻數(shù)和 邊緣頻數(shù)固定時(shí),各種可能的表的超幾何概率邊緣頻數(shù)固定時(shí),各種可能的表的超幾何概率p之和之和 對(duì)于雙邊檢驗(yàn),對(duì)于雙邊檢驗(yàn),A是具有概率是具有概率p小于或等于觀測(cè)表概率小于或等于觀測(cè)表概率 的表的集合;對(duì)于左(右)邊檢驗(yàn),的表的集合;對(duì)于左(右)邊檢驗(yàn),A是這樣一些表的是這樣一些表的 集合,其中每個(gè)表的單元集合,其中每個(gè)表的單元ij中頻數(shù)小于(大于)或等于中頻數(shù)小于(大于)或等于 觀測(cè)表中相應(yīng)的頻數(shù)。觀測(cè)表中相應(yīng)的頻數(shù)。 A pPROB STATST
13、ATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 9.1.3 屬性變量關(guān)聯(lián)度計(jì)算屬性變量關(guān)聯(lián)度計(jì)算 1. 1. 系數(shù)系數(shù) 系數(shù)是描述系數(shù)是描述2 2表數(shù)據(jù)關(guān)聯(lián)程度最常用的一種相關(guān)系表數(shù)據(jù)關(guān)聯(lián)程度最常用的一種相關(guān)系 數(shù)。其計(jì)算公式為:數(shù)。其計(jì)算公式為: 其中,其中, 2即即 2統(tǒng)計(jì)量。統(tǒng)計(jì)量。 |的取值范圍是在的取值范圍是在0 1之間,之間,的絕對(duì)值越大,說(shuō)明的絕對(duì)值越大,說(shuō)明 行變量與列變量的關(guān)聯(lián)程度越高。行變量與列變量的關(guān)聯(lián)程度越高。 = 0,表示變量之間,表示變量之間 相互獨(dú)立;相互獨(dú)立;| = 1,表示變量之間完全相關(guān),此時(shí)列聯(lián),表示變量之間完全相關(guān),此時(shí)列聯(lián) 表某個(gè)
14、方向?qū)蔷€上的值全為表某個(gè)方向?qū)蔷€上的值全為0。 當(dāng)列聯(lián)表當(dāng)列聯(lián)表r c中的行數(shù)中的行數(shù)r或列數(shù)或列數(shù)c大于大于2時(shí),時(shí),系數(shù)將隨系數(shù)將隨 著著r或或c變大而變大,且變大而變大,且無(wú)上界。此時(shí)可用列聯(lián)系數(shù)。無(wú)上界。此時(shí)可用列聯(lián)系數(shù)。 n/ 2 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 2. 2. 列聯(lián)系數(shù)列聯(lián)系數(shù) 列聯(lián)系數(shù)(列聯(lián)系數(shù)(Contingency coefficient)簡(jiǎn)稱為)簡(jiǎn)稱為c系數(shù),系數(shù), 主要用于大于主要用于大于2 2表的情況。表的情況。c系數(shù)的計(jì)算公式為:系數(shù)的計(jì)算公式為: c系數(shù)的取值范圍:系數(shù)的取值范圍:1 c A2且且B1
15、B2, 或或A1A2且且B1A2且且 B1B2,或,或A1B2則稱該對(duì)觀測(cè)是不一致的。則稱該對(duì)觀測(cè)是不一致的。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 用用P表示所有觀測(cè)對(duì)中一致對(duì)的個(gè)數(shù),表示所有觀測(cè)對(duì)中一致對(duì)的個(gè)數(shù),Q表示所有觀表示所有觀 測(cè)對(duì)中不一致對(duì)的個(gè)數(shù)。測(cè)對(duì)中不一致對(duì)的個(gè)數(shù)。 統(tǒng)計(jì)量統(tǒng)計(jì)量(Gamma)的定義為:的定義為: b統(tǒng)計(jì)量統(tǒng)計(jì)量(Kendal Tau-b)的定義為:的定義為: c統(tǒng)計(jì)量統(tǒng)計(jì)量(Kendal Tau-c)的定義為:的定義為: 其中其中m = min(r,c)。 這三個(gè)統(tǒng)計(jì)量的取值均在這三個(gè)統(tǒng)計(jì)量的取值均在-1.0到到1
16、.0之間,值接近于之間,值接近于1.0 表示正關(guān)聯(lián),接近于表示正關(guān)聯(lián),接近于-1.0表示負(fù)關(guān)聯(lián),等于表示負(fù)關(guān)聯(lián),等于0表示沒(méi)有相表示沒(méi)有相 關(guān)關(guān)系。關(guān)關(guān)系。 QP QP c j r i ij r i c j ij b nnnn QP 1 2 1 2 1 2 1 2 )()( mmn QP c ) 1( 2 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 n9.2 SAS9.2 SAS中的屬性數(shù)據(jù)分析中的屬性數(shù)據(jù)分析 n9.2.1 2 2表的分析表的分析 n9.2.2 r c表的分析表的分析 n9.2.3 分層列聯(lián)表分析分層列聯(lián)表分析 n9.2.4 有序變量的關(guān)
17、聯(lián)性分析有序變量的關(guān)聯(lián)性分析 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 9.2.1 2 2表的分析表的分析 【例【例9-1】為了探討吸煙與慢性支氣管炎有無(wú)關(guān)系,調(diào)】為了探討吸煙與慢性支氣管炎有無(wú)關(guān)系,調(diào) 查了查了339人,情況如下:人,情況如下: 表9-2 吸煙與慢性支氣管炎的關(guān)系調(diào)查表 設(shè)想有兩個(gè)隨機(jī)變量:設(shè)想有兩個(gè)隨機(jī)變量:x表示吸煙與否,表示吸煙與否,y表示患慢性支表示患慢性支 氣管炎與否。檢驗(yàn)吸煙與患慢性支氣管炎有無(wú)關(guān)系,即氣管炎與否。檢驗(yàn)吸煙與患慢性支氣管炎有無(wú)關(guān)系,即 檢驗(yàn)檢驗(yàn)x與與y是否相互獨(dú)立。數(shù)據(jù)集是否相互獨(dú)立。數(shù)據(jù)集mylib.zqg
18、y如圖:如圖: 原假設(shè)原假設(shè)H0:x與與y相互獨(dú)立相互獨(dú)立 患慢性支氣管炎未患慢性支氣管炎 吸煙43162 不吸煙13121 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 表表9-2中數(shù)據(jù)使用如下代碼存入數(shù)據(jù)集中數(shù)據(jù)使用如下代碼存入數(shù)據(jù)集mylib.bron,形,形 式如圖式如圖9-2所示。所示。 data mylib.bron; input x $ y $ numcell; label x = 吸煙 y = 慢性支氣管炎; cards; 吸煙 患病 43 吸煙 未患 162 不吸煙 患病 13 不吸煙 未患 121 ; Run; STATSTATSTATS
19、TATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 1. 1. 分析步驟分析步驟 1) 在在“分析家分析家”中,中, 打開數(shù)據(jù)集打開數(shù)據(jù)集Mylib.bron; 2) 選擇菜單:選擇菜單: “Statistics”“Table A n a l y s i s ” , 打 開, 打 開 “Table Analysis”對(duì)話對(duì)話 框;框; 3) 選中變量選中變量smoke,單擊,單擊“Row”按鈕,將其移到行按鈕,將其移到行 變量框中;選中變量變量框中;選中變量bron,單擊按鈕,單擊按鈕“Column”,將其,將其 移到列變量框中;選中變量移到列變量框中;選中變量numcell,單擊按鈕,單
20、擊按鈕“Cell Counts”,將其移到單元格計(jì)數(shù)框中,如圖所示;,將其移到單元格計(jì)數(shù)框中,如圖所示; STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 4) 為了使用為了使用 2 統(tǒng)計(jì)量檢驗(yàn)變量的關(guān)聯(lián)性,單擊統(tǒng)計(jì)量檢驗(yàn)變量的關(guān)聯(lián)性,單擊 “Statistics”按鈕,打開按鈕,打開“Table Analysis:Statistics”對(duì)對(duì) 話框,選中話框,選中“Statistics”欄下的欄下的“Chi-square Statistics” 復(fù)選框,如圖復(fù)選框,如圖9-4所示。所示。 圖9-4 “Table Analysis:Statistics”對(duì)話框 單
21、擊單擊“OK”按鈕,返回。按鈕,返回。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 5) 為了在列聯(lián)表中顯示各種頻數(shù)、百分?jǐn)?shù),單擊為了在列聯(lián)表中顯示各種頻數(shù)、百分?jǐn)?shù),單擊 “Tables(列聯(lián)表)(列聯(lián)表)”按鈕,打開按鈕,打開“Table Analysis: Tables”對(duì)話框。選中對(duì)話框。選中“Frequencies(頻數(shù))(頻數(shù))”欄下的欄下的 “Expected(期望)(期望)”復(fù)選框,取消復(fù)選框,取消“Percentages(百(百 分?jǐn)?shù))分?jǐn)?shù))”欄下的復(fù)選框,如圖欄下的復(fù)選框,如圖9-5所示。所示。 圖9-5 “Table Analysis:
22、Tables”對(duì)話框 兩次單擊兩次單擊“OK”按鈕,得到分析結(jié)果。按鈕,得到分析結(jié)果。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 2. 2. 結(jié)果分析結(jié)果分析 列聯(lián)表中列出了表格單元的觀測(cè)頻數(shù)(上一行)和在列聯(lián)表中列出了表格單元的觀測(cè)頻數(shù)(上一行)和在 原假設(shè)下的期望頻數(shù)(下一行),可以看出,吸煙人中原假設(shè)下的期望頻數(shù)(下一行),可以看出,吸煙人中 患病的觀測(cè)頻數(shù)比期望頻數(shù)大(圖患病的觀測(cè)頻數(shù)比期望頻數(shù)大(圖9-6所示),說(shuō)明吸所示),說(shuō)明吸 煙與患病又一定關(guān)系。煙與患病又一定關(guān)系。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)
23、計(jì)應(yīng)用教程 進(jìn)一步檢驗(yàn)的結(jié)果只要看后面(圖進(jìn)一步檢驗(yàn)的結(jié)果只要看后面(圖9-7)統(tǒng)計(jì)量部分)統(tǒng)計(jì)量部分 的的Chi Square一行,其值為一行,其值為7.4688,p值為值為0.0063,所以,所以 應(yīng)拒絕原假設(shè),作出結(jié)論:吸煙與患慢性支氣管炎是有應(yīng)拒絕原假設(shè),作出結(jié)論:吸煙與患慢性支氣管炎是有 關(guān)聯(lián)的。當(dāng)然,這個(gè)關(guān)聯(lián)度不是很大,三個(gè)關(guān)聯(lián)度系數(shù)關(guān)聯(lián)的。當(dāng)然,這個(gè)關(guān)聯(lián)度不是很大,三個(gè)關(guān)聯(lián)度系數(shù) 均在均在0.15左右。左右。 對(duì)于兩行兩列的表格對(duì)于兩行兩列的表格FREQ過(guò)程自動(dòng)給出過(guò)程自動(dòng)給出Fisher精確檢精確檢 驗(yàn)的結(jié)果,其雙側(cè)檢驗(yàn)驗(yàn)的結(jié)果,其雙側(cè)檢驗(yàn)p值為值為0.0069,應(yīng)拒絕原假設(shè)。
24、,應(yīng)拒絕原假設(shè)。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 9.2.2 r c表的分析表的分析 【例【例9-2】一種原料來(lái)自三個(gè)不同的地區(qū),原料質(zhì)量被】一種原料來(lái)自三個(gè)不同的地區(qū),原料質(zhì)量被 分成三個(gè)不同等級(jí)。從這批原料中隨機(jī)抽取分成三個(gè)不同等級(jí)。從這批原料中隨機(jī)抽取500件進(jìn)行件進(jìn)行 檢驗(yàn),結(jié)果如表檢驗(yàn),結(jié)果如表9-3所示。要求檢驗(yàn)各個(gè)地區(qū)和原料質(zhì)所示。要求檢驗(yàn)各個(gè)地區(qū)和原料質(zhì) 量之間是否存在依賴關(guān)系。量之間是否存在依賴關(guān)系。 表9-3 原料抽樣的結(jié)果 一級(jí)二級(jí)二級(jí) 甲地區(qū)526424 乙地區(qū)605952 丙地區(qū)506574 STATSTATSTATS
25、TATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 設(shè)表設(shè)表9-3數(shù)據(jù)已經(jīng)存放在數(shù)據(jù)集數(shù)據(jù)已經(jīng)存放在數(shù)據(jù)集mylib.yldj中,如圖中,如圖9-9所所 示。示。 圖9-9 數(shù)據(jù)集mylib.yldj 檢驗(yàn)的原假設(shè)為檢驗(yàn)的原假設(shè)為H0:地區(qū)和原料等級(jí)之間是獨(dú)立的:地區(qū)和原料等級(jí)之間是獨(dú)立的 (不存在依賴關(guān)系不存在依賴關(guān)系)。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 1. 1. 分析步驟分析步驟 1) 在在“分析家分析家”中,打開數(shù)據(jù)集中,打開數(shù)據(jù)集Mylib.yldj; 2) 選擇菜單選擇菜單“Statistics”“Table Analysis”
26、,打開,打開 “Table Analysis”對(duì)話框;對(duì)話框; 3) 選中變量選中變量x,單擊,單擊“Row”按鈕,將其移到行變量框按鈕,將其移到行變量框 中;選中變量中;選中變量y,單擊按鈕,單擊按鈕“Column”,將其移到列變,將其移到列變 量框中;選中變量量框中;選中變量numcell,單擊按鈕,單擊按鈕“Cell Counts”, 將其移到單元格計(jì)數(shù)框中,如圖所示;將其移到單元格計(jì)數(shù)框中,如圖所示; STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 4) 為了使用為了使用 2 統(tǒng)計(jì)量檢驗(yàn)變量的關(guān)聯(lián)性,單擊統(tǒng)計(jì)量檢驗(yàn)變量的關(guān)聯(lián)性,單擊 “Statisti
27、cs”按鈕,打開按鈕,打開“Table Analysis:Statistics”對(duì)對(duì) 話框,選中話框,選中“Statistics”欄下的欄下的“Chi-square Statistics” 復(fù)選框;考慮對(duì)列聯(lián)表作復(fù)選框;考慮對(duì)列聯(lián)表作Fisher精確檢驗(yàn),選中精確檢驗(yàn),選中“Exact test”欄下的欄下的“Exact test for (r x c) table”復(fù)選框,如圖復(fù)選框,如圖 所示。所示。 圖9-11 “Table Analysis:Tables”對(duì)話框 單擊單擊“OK”按鈕,返回。按鈕,返回。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程
28、5) 為了在列聯(lián)表中顯示各種頻數(shù)、百分?jǐn)?shù),單擊為了在列聯(lián)表中顯示各種頻數(shù)、百分?jǐn)?shù),單擊 “Tables(列聯(lián)表)(列聯(lián)表)”按鈕,打開按鈕,打開“Table Analysis: Tables”對(duì)話框。選中對(duì)話框。選中“Frequencies(頻數(shù))(頻數(shù))”欄下的欄下的 “Expected(期望)(期望)”復(fù)選框,取消復(fù)選框,取消“Percentages(百(百 分?jǐn)?shù))分?jǐn)?shù))”欄下的復(fù)選框,如圖欄下的復(fù)選框,如圖9-11所示。所示。 兩次單擊兩次單擊“OK”按鈕,得到分析結(jié)果。按鈕,得到分析結(jié)果。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 2. 2. 結(jié)
29、果分析結(jié)果分析 列聯(lián)表(圖列聯(lián)表(圖9-12)中列出了表格單元的觀測(cè)頻數(shù)(上)中列出了表格單元的觀測(cè)頻數(shù)(上 一行)和在原假設(shè)下的期望頻數(shù)(下一行)。一行)和在原假設(shè)下的期望頻數(shù)(下一行)。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 進(jìn)一步檢驗(yàn)的結(jié)果要看(圖左)統(tǒng)計(jì)量部分的進(jìn)一步檢驗(yàn)的結(jié)果要看(圖左)統(tǒng)計(jì)量部分的Chi Square一行,其值為一行,其值為19.8225,p值為值為0.0005,所以應(yīng)拒,所以應(yīng)拒 絕原假設(shè),作出結(jié)論:地區(qū)與原料等級(jí)是有關(guān)聯(lián)的。這絕原假設(shè),作出結(jié)論:地區(qū)與原料等級(jí)是有關(guān)聯(lián)的。這 里的關(guān)聯(lián)度系數(shù)取值分別是里的關(guān)聯(lián)度系數(shù)取值分
30、別是0.1991、0.1953、0.1408。 圖右給出圖右給出Fisher精確檢驗(yàn)結(jié)果,其雙側(cè)檢驗(yàn)精確檢驗(yàn)結(jié)果,其雙側(cè)檢驗(yàn)p值遠(yuǎn)小于值遠(yuǎn)小于 0.05,也應(yīng)拒絕原假設(shè)。,也應(yīng)拒絕原假設(shè)。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 9.2.3 分層列聯(lián)表分析分層列聯(lián)表分析 【例【例9-3】對(duì)】對(duì)294人進(jìn)行性別(人進(jìn)行性別(sex)、飲酒()、飲酒(drink)與)與 抑郁癥(抑郁癥(cases)關(guān)系的調(diào)查,結(jié)果見表)關(guān)系的調(diào)查,結(jié)果見表9-4。要求檢驗(yàn)。要求檢驗(yàn) 三者之間是否存在關(guān)聯(lián)性。三者之間是否存在關(guān)聯(lián)性。 表9-4 性別、飲酒與抑郁癥關(guān)系的調(diào)查
31、設(shè)表設(shè)表9-4的數(shù)據(jù)已經(jīng)存放在數(shù)據(jù)集的數(shù)據(jù)已經(jīng)存放在數(shù)據(jù)集mylib.cesd中,形式中,形式 如圖如圖9-15所示。所示。 飲酒不飲 性別正?;疾≌;疾?男878142 女10633377 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 1. 1. 分析步驟分析步驟 1) 在在“分析家分析家”中,中, 打開數(shù)據(jù)集打開數(shù)據(jù)集Mylib.cesd; 2 ) 選 擇 菜 單選 擇 菜 單 “Statistics”“Table Analysis”,打開,打開“Table Analysis”對(duì)話框;對(duì)話框; 3) 選中變量選中變量sex,單擊,單擊“Row”按鈕,將
32、其移到行變量按鈕,將其移到行變量 框中;選中變量框中;選中變量cases,單擊按鈕,單擊按鈕“Column”,將其移到,將其移到 列變量框中;選中變量列變量框中;選中變量drink,單擊按鈕,單擊按鈕“Strata”,將,將 其移到分層變量框中;選中變量其移到分層變量框中;選中變量numcell,單擊按鈕,單擊按鈕 “Cell Counts”,將其移到單元格計(jì)數(shù)框中,如圖所示;,將其移到單元格計(jì)數(shù)框中,如圖所示; STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 4) 單擊單擊“Select Tab(選擇表)(選擇表)”按鈕,打開按鈕,打開“Table Anal
33、ysis:Select Tab”對(duì)話框。在對(duì)話框。在“Select tables(選擇列選擇列 聯(lián)表或分層表聯(lián)表或分層表)”選項(xiàng)區(qū)域中選擇選項(xiàng)區(qū)域中選擇“SEX * CASES, DRINK * SEX * CASES”兩項(xiàng),如圖兩項(xiàng),如圖9-17所示。所示。 單擊單擊“OK”按鈕返回。按鈕返回。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 5) 單擊單擊“Statistics”按鈕,打開按鈕,打開“Table Analysis: Statistics”對(duì)話框,選中對(duì)話框,選中“Statistics”欄下的欄下的“Chi- square Statistic
34、s”復(fù)選框,如圖左所示。單擊復(fù)選框,如圖左所示。單擊“OK”按按 鈕返回。鈕返回。 6) 單擊單擊“Tables”按鈕,打開按鈕,打開“Table Analysis:Tables” 對(duì)話框。選中對(duì)話框。選中“Frequencies”欄下的欄下的“Expected”復(fù)選框,復(fù)選框, 取消取消“Percentages”欄下的復(fù)選框,如圖欄下的復(fù)選框,如圖9-19所示。所示。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 2. 2. 結(jié)果分析結(jié)果分析 結(jié)果分為三個(gè)部分:不論飲酒與否、只考慮飲酒者、結(jié)果分為三個(gè)部分:不論飲酒與否、只考慮飲酒者、 只考慮不飲酒者。只考
35、慮不飲酒者。 1) 不論飲酒與否:不論飲酒與否: 列聯(lián)表(圖列聯(lián)表(圖9-20左)列出了表格單元的觀測(cè)頻數(shù)(上左)列出了表格單元的觀測(cè)頻數(shù)(上 一行)和在原假設(shè)下的期望頻數(shù)(下一行)??梢钥闯鲆恍校┖驮谠僭O(shè)下的期望頻數(shù)(下一行)??梢钥闯?女性患抑郁癥的頻數(shù)大于期望頻數(shù),因此有可能女性比女性患抑郁癥的頻數(shù)大于期望頻數(shù),因此有可能女性比 男性更易患抑郁癥。男性更易患抑郁癥。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 進(jìn)一步檢驗(yàn)的結(jié)果要看進(jìn)一步檢驗(yàn)的結(jié)果要看 2檢驗(yàn)與檢驗(yàn)與Fisher精確檢驗(yàn)結(jié)果。精確檢驗(yàn)結(jié)果。 由圖看出由圖看出 2統(tǒng)計(jì)量的值為統(tǒng)計(jì)量的值
36、為8.0815,p值為值為0.0045;Fisher 精確檢驗(yàn)的雙側(cè)檢驗(yàn)精確檢驗(yàn)的雙側(cè)檢驗(yàn)p值為值為0.040,所以應(yīng)拒絕原假設(shè),所以應(yīng)拒絕原假設(shè), 作出結(jié)論:男女性別與患抑郁癥與否是有關(guān)聯(lián)的。但是,作出結(jié)論:男女性別與患抑郁癥與否是有關(guān)聯(lián)的。但是, 對(duì)于對(duì)于2 2表來(lái)說(shuō),這里的表來(lái)說(shuō),這里的系數(shù)為系數(shù)為-0.1658,說(shuō)明性別與,說(shuō)明性別與 患抑郁癥的關(guān)聯(lián)度不是很大。患抑郁癥的關(guān)聯(lián)度不是很大。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 2) 只考慮不飲酒者只考慮不飲酒者(Controlling for DRINK = 不飲不飲): 從列聯(lián)表(圖左)和檢
37、驗(yàn)統(tǒng)計(jì)量(圖右)可以看出雖從列聯(lián)表(圖左)和檢驗(yàn)統(tǒng)計(jì)量(圖右)可以看出雖 然女性患抑郁癥的頻數(shù)略大于期望頻數(shù),但然女性患抑郁癥的頻數(shù)略大于期望頻數(shù),但 2統(tǒng)計(jì)量的統(tǒng)計(jì)量的 值為值為0.1070,p值為值為0.7436;Fisher精確檢驗(yàn)的雙側(cè)檢驗(yàn)精確檢驗(yàn)的雙側(cè)檢驗(yàn)p 值為值為1.0000,所以無(wú)法拒絕原假設(shè),即對(duì)于不飲酒者來(lái),所以無(wú)法拒絕原假設(shè),即對(duì)于不飲酒者來(lái) 說(shuō),患抑郁癥與性別因素?zé)o關(guān)聯(lián)。說(shuō),患抑郁癥與性別因素?zé)o關(guān)聯(lián)。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 3) 只考慮飲酒者只考慮飲酒者(Controlling for DRINK = 飲酒飲酒
38、): 從列聯(lián)表(圖左)和檢驗(yàn)統(tǒng)計(jì)量(圖右)可以看出女從列聯(lián)表(圖左)和檢驗(yàn)統(tǒng)計(jì)量(圖右)可以看出女 性患抑郁癥的頻數(shù)大于期望頻數(shù),因此有可能女性比男性患抑郁癥的頻數(shù)大于期望頻數(shù),因此有可能女性比男 性更易患抑郁癥。性更易患抑郁癥。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 進(jìn)一步檢驗(yàn)的結(jié)果圖進(jìn)一步檢驗(yàn)的結(jié)果圖9-22右看出右看出 2統(tǒng)計(jì)量的值為統(tǒng)計(jì)量的值為9.1649, p值為值為0.0025;Fisher精確檢驗(yàn)的雙側(cè)檢驗(yàn)精確檢驗(yàn)的雙側(cè)檢驗(yàn)p值為值為0.0027, 所以應(yīng)拒絕原假設(shè),作出結(jié)論:對(duì)于飲酒者來(lái)說(shuō),男女所以應(yīng)拒絕原假設(shè),作出結(jié)論:對(duì)于飲酒者來(lái)
39、說(shuō),男女 性別與患抑郁癥與否是有關(guān)聯(lián)的,女性飲酒者更容易患性別與患抑郁癥與否是有關(guān)聯(lián)的,女性飲酒者更容易患 抑郁癥。抑郁癥。 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程 9.2.4 有序變量的關(guān)聯(lián)性分析有序變量的關(guān)聯(lián)性分析 【例【例9-4】研究奶牛種群大小與其患某種細(xì)菌性疾病的】研究奶牛種群大小與其患某種細(xì)菌性疾病的 關(guān)系。牛的患病程度關(guān)系。牛的患病程度(disease)分為沒(méi)有分為沒(méi)有(0)、低、低(1)、高、高(2), 牛群大小牛群大小(herdsize)分為小分為小(1)、中、中(2)、大、大(3)。根據(jù)患病。根據(jù)患病 程度和牛群大小記錄的九個(gè)類中動(dòng)物的頭數(shù)見表。程度和牛群大小記錄的九個(gè)類中動(dòng)物的頭數(shù)見表。 表9-5 奶牛疾病與牛群大小的數(shù)據(jù) 設(shè)表設(shè)表9-5的數(shù)據(jù)已經(jīng)存放在數(shù)據(jù)集的數(shù)據(jù)已經(jīng)存放在數(shù)據(jù)集mylib.cows中,形式如中,形式如 圖圖9-23所示。所示。 沒(méi)有(0)低(1)高(2) 小959 中18419 大1188136 STATSTATSTATSTATSASSAS軟件與統(tǒng)計(jì)應(yīng)用教程軟件與統(tǒng)計(jì)應(yīng)用教程
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國(guó)多面液壓抽芯模具數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)內(nèi)置式閘門開度傳感器數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年無(wú)堿玻璃纖維無(wú)捻粗紗噴射紗項(xiàng)目可行性研究報(bào)告
- 2025年中國(guó)早早孕檢測(cè)試紙市場(chǎng)調(diào)查研究報(bào)告
- 三年級(jí)數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)附答案集錦
- 四年級(jí)數(shù)學(xué)(三位數(shù)乘兩位數(shù))計(jì)算題專項(xiàng)練習(xí)及答案
- 《新生兒常見病》課件
- 航空航天項(xiàng)目居間存款合同
- 水產(chǎn)冷鏈物流中介協(xié)議
- 《扁平化商務(wù)圖表》課件
- 第22單元(二次函數(shù))-單元測(cè)試卷(2)-2024-2025學(xué)年數(shù)學(xué)人教版九年級(jí)上冊(cè)(含答案解析)
- 藍(lán)色3D風(fēng)工作總結(jié)匯報(bào)模板
- 安全常識(shí)課件
- 河北省石家莊市2023-2024學(xué)年高一上學(xué)期期末聯(lián)考化學(xué)試題(含答案)
- 2024年江蘇省導(dǎo)游服務(wù)技能大賽理論考試題庫(kù)(含答案)
- 2024年中考英語(yǔ)閱讀理解表格型解題技巧講解(含練習(xí)題及答案)
- 新版中國(guó)食物成分表
- 浙江省溫州市溫州中學(xué)2025屆數(shù)學(xué)高二上期末綜合測(cè)試試題含解析
- 2024年山東省青島市中考生物試題(含答案)
- 保安公司市場(chǎng)拓展方案-保安拓展工作方案
- GB/T 15843.2-2024網(wǎng)絡(luò)安全技術(shù)實(shí)體鑒別第2部分:采用鑒別式加密的機(jī)制
評(píng)論
0/150
提交評(píng)論