版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第1章 導(dǎo) 言本章內(nèi)容:一、測(cè)量的層次二、統(tǒng)計(jì)檢驗(yàn)基本思想回顧三、非參數(shù)統(tǒng)計(jì)方法四、經(jīng)驗(yàn)分布函數(shù)五、大樣本近似時(shí)的連續(xù)性修正六、功效函數(shù)和檢驗(yàn)的漸近相對(duì)效率一、測(cè)量的層次所謂測(cè)量,就是根據(jù)一定的法則,給事物或事件分配一定的數(shù)字或符號(hào)。數(shù)據(jù)屬于何種測(cè)量層次,決定該數(shù)據(jù)能夠使用何種類型的方法進(jìn)行分析。廣泛采用的測(cè)量層次為四種類型的尺度:定類尺度、定序尺度、定距尺度、定比尺度。測(cè)量時(shí),無論哪一種測(cè)量層次,都必須具有完備性和互斥性。(不重不漏)(一)定類尺度定類尺度是按照事物的某些特征辨別和劃分的一種測(cè)量層次,也被稱作類別尺度、名義尺度。如性別、職業(yè)、民族等。定類尺度只能將事物分類,不能用以反映事物的
2、數(shù)量狀況。如性別這一變量,用“1”表示男性,“0”表示女性;職工對(duì)所從事的職業(yè)是否滿意,用“0”表示不滿意、用“1”表示滿意等,這里的“0”和“1”僅僅是人們賦予的識(shí)別標(biāo)志,并不說明事物的數(shù)量,有時(shí)也稱這樣的變量為虛擬變量。定類尺度是最低一個(gè)層次的測(cè)量,它只能進(jìn)行“=”或“”的邏輯運(yùn)算。定類測(cè)量數(shù)據(jù)常用的描述統(tǒng)計(jì)量有:眾數(shù)、頻數(shù)、異眾比率等。(二)定序尺度定序尺度是按照事物的某種特征依大小、高低順序或級(jí)別進(jìn)行排列的一種測(cè)量層次,也稱作順序尺度、等級(jí)尺度。例如,測(cè)量職工的文化程度可以分為:碩士研究生及以上、本科、大專、中學(xué)及以下。定序尺度是比定類尺度高一層次的測(cè)量,它不僅能進(jìn)行“=”或“”的運(yùn)算
3、,還能進(jìn)行“”、“”的運(yùn)算。描述定序測(cè)量數(shù)據(jù)集中趨勢(shì)的統(tǒng)計(jì)量除了眾數(shù)還有中位數(shù),反映離散程度的除了異眾比率還有分位數(shù)。(三)定距尺度定距尺度是不僅能將事物區(qū)分類別和等級(jí),還可以確定不同類別或等級(jí)之間的數(shù)量差別、間隔距離的一種測(cè)量層次,也稱作間隔尺度、區(qū)間尺度。例如,職工對(duì)自己職業(yè)的滿意程度測(cè)量,1分表示很不滿意,10分表示很滿意;對(duì)學(xué)生學(xué)習(xí)考試成績(jī)的測(cè)量,0表示試卷中沒有一個(gè)對(duì)的,100表示試卷中全部答對(duì)。定距尺度是一種定量的測(cè)量層次,它不僅能反映事物的類別和順序,而且能反映事物數(shù)量之間的距離。它是比定序尺度又高一層次的測(cè)量,不僅能進(jìn)行“=”和“”,“”和“”的運(yùn)算,還能進(jìn)行“+”、 “-”的
4、運(yùn)算。但是定距尺度沒有絕對(duì)“0”。例如,某門課程成績(jī)的百分制測(cè)量,0分不表示某考生沒有這門課方面的知識(shí)。甲考試成績(jī)?yōu)?0分,乙為85分,90-85=5分,只表明甲比乙在這門課考試成績(jī)中多5分,不能說明甲掌握的這方面知識(shí)是乙的大約1.06倍(90/85)。(四)定比尺度定比尺度是在定距尺度的基礎(chǔ)上增加絕對(duì)零點(diǎn)的一種測(cè)量層次,也稱作等比尺度、比率尺度。是否具有實(shí)際意義的零點(diǎn)存在,是定比尺度與定距尺度的唯一區(qū)別。例如對(duì)職工年齡的測(cè)量,“0”歲是絕對(duì)的,對(duì)所有人都一樣,若甲為40歲,乙為20歲,可知甲的年齡是乙的2倍。定比尺度由于有一絕對(duì)零點(diǎn)存在,因而比定距尺度更利于反映事物之間的比例或比率關(guān)系,是所
5、有測(cè)量層次中最高一層次的測(cè)量,不僅能進(jìn)行“”、“”,“”、“”,“+”、“-”的運(yùn)算,而且能進(jìn)行“”、“”的運(yùn)算。在定比測(cè)量中,除了使用定距測(cè)量數(shù)據(jù)所有描述性統(tǒng)計(jì)量,還有幾何平均數(shù)、變異系數(shù)等。(五)四種測(cè)量尺度的關(guān)系首先,這些測(cè)量尺度之間有著包含關(guān)系,即高一層次的測(cè)量總是包含低層次的測(cè)量。定序尺度包含了定類尺度所有運(yùn)算性質(zhì),定距尺度包含了定序、定類尺度所有運(yùn)算性質(zhì),而定比尺度則包含了所有測(cè)量層次的運(yùn)算性質(zhì)。其次,四種測(cè)量尺度之間,低級(jí)的測(cè)量尺度往往能用較高級(jí)的測(cè)量尺度形式表示。例如,對(duì)學(xué)生考試成績(jī)的測(cè)量,進(jìn)行定類測(cè)量可分為及格、不及格:若將及格的成績(jī)高低排序,可分為優(yōu)、良、中、及格,這是定序
6、尺度;若再將各順序等級(jí)給出等級(jí)分,即按百分制測(cè)量,優(yōu):90分以上,良:80-90分,中:70-80分,及格:60-70分。數(shù)據(jù)的測(cè)量層次和數(shù)據(jù)中蘊(yùn)含的信息相關(guān),對(duì)于相同的樣本容量,越高層次的測(cè)量,意味著數(shù)據(jù)中有越豐富的信息,往往可使用更加復(fù)雜的統(tǒng)計(jì)方法進(jìn)行分析。二、統(tǒng)計(jì)檢驗(yàn)基本思想回顧 三、非參數(shù)統(tǒng)計(jì)方法非參數(shù)問題是指總體分布形式未知或雖已知卻不能用有限個(gè)參數(shù)刻畫的統(tǒng)計(jì)問題。當(dāng)總體分布不能由有限個(gè)實(shí)參數(shù)所刻劃或并不知曉總體分布或不關(guān)心總體分布時(shí)的統(tǒng)計(jì)方法,稱為非參數(shù)統(tǒng)計(jì)方法。非參數(shù)統(tǒng)計(jì)方法不依賴總體的具體分布形式,構(gòu)造的統(tǒng)計(jì)量以及估計(jì)常與具體分布無關(guān),故又稱非參數(shù)方法為自由分布方法。非參數(shù)統(tǒng)計(jì)
7、包含兩大方面的問題:一是較為經(jīng)典的以檢驗(yàn)為主的統(tǒng)計(jì)推斷,如基于秩統(tǒng)計(jì)量的方法、列聯(lián)分析等 。另一方面是從無窮維的函數(shù)空間尋找恰當(dāng)?shù)目傮w分布或條件分布,如核密度估計(jì)、局部多項(xiàng)式回歸、樣條、可加模型等,這類方法與基于秩的方法有很大的不同,但同樣都不依賴于對(duì)總體分布所做的確定的假定、不依賴有限個(gè)參數(shù),被稱為現(xiàn)代非參數(shù)統(tǒng)計(jì) 。非參數(shù)檢驗(yàn)在以下情形常為使用:待分析數(shù)據(jù)不滿足參數(shù)檢驗(yàn)所要求的假定例如,非正態(tài)總體小樣本,t-檢驗(yàn)不適用時(shí),作為替代方法,可以采用非參數(shù)檢驗(yàn)。僅由一些等級(jí)構(gòu)成的數(shù)據(jù)例如,消費(fèi)者可能被問及對(duì)幾種不同商標(biāo)的飲料的喜歡程度,他們不能對(duì)每種商標(biāo)都指定一個(gè)數(shù)字來表示對(duì)該商標(biāo)的喜歡程度,卻能
8、將幾種商標(biāo)按喜歡的順序分成等級(jí),如十分喜歡、比較喜歡、喜歡、不大喜歡、不喜歡等,無法采用參數(shù)檢驗(yàn),宜采用非參數(shù)檢驗(yàn)。討論的問題中不包含參數(shù)例如,要判斷一個(gè)樣本是否為隨機(jī)樣本,采用非參數(shù)檢驗(yàn)法是適當(dāng)?shù)摹y(cè)量層次數(shù)學(xué)性質(zhì)描述統(tǒng)計(jì)量適合的統(tǒng)計(jì)方法定類尺度眾數(shù)頻率列聯(lián)系數(shù)非參數(shù)方法定序尺度中位數(shù)分位數(shù)肯德爾秩相關(guān)系數(shù)斯皮爾曼秩相關(guān)系數(shù)定距尺度平均值方差皮爾遜相關(guān)系數(shù)參數(shù)和非參數(shù)方法定比尺度幾何均值標(biāo)準(zhǔn)差系數(shù)多重相關(guān)系數(shù)四、經(jīng)驗(yàn)分布函數(shù)【例1.2】分別產(chǎn)生10、20、50、100個(gè)標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)數(shù),比較不同樣本量經(jīng)驗(yàn)分布函數(shù)與總體分布函數(shù)的差異。五、大樣本近似時(shí)的連續(xù)性修正問題的提出:在非參數(shù)統(tǒng)計(jì)中
9、,統(tǒng)計(jì)量的抽樣分布一般很難求,也有一些統(tǒng)計(jì)量沒有精確的分布;當(dāng)樣本量較大時(shí),即使統(tǒng)計(jì)量有精確分布,計(jì)算量會(huì)很大,導(dǎo)致計(jì)算時(shí)間過長(zhǎng),此時(shí)需要利用統(tǒng)計(jì)量的漸近分布進(jìn)行大樣本近似,例如正態(tài)近似、卡方近似等。精確分布是離散分布,但是漸近分布是連續(xù)分布,兩者存在差異。六、功效函數(shù)和檢驗(yàn)的漸近相對(duì)效率為了達(dá)到犯兩類錯(cuò)誤的概率盡可能小,理論上可以尋找到合適的樣本量,盡可能滿足事先規(guī)定的犯第一類和第二類錯(cuò)誤的概率。非參數(shù)檢驗(yàn)的功效函數(shù)在大多數(shù)情況下都很難求出精確表達(dá)式,研究功效時(shí),常將不同的檢驗(yàn)做相對(duì)比較,比較的途徑基本兩條,一是對(duì)各種備擇假設(shè)做統(tǒng)計(jì)模擬,另一是求漸近相對(duì)效率。關(guān)于不同分布下各種檢驗(yàn)的漸近相對(duì)
10、效率可參考孫山澤,非參數(shù)統(tǒng)計(jì)講義,北京大學(xué)出版社。第2章 單樣本非參數(shù)檢驗(yàn)2.1 符號(hào)檢驗(yàn)符號(hào)檢驗(yàn)(Sign Test)是利用正,負(fù)號(hào)的數(shù)目對(duì)某種假設(shè)作出判定的非參數(shù)統(tǒng)計(jì)方法。本質(zhì)上而言,符號(hào)檢驗(yàn)是基于二項(xiàng)分布構(gòu)造的檢驗(yàn)方法,應(yīng)視為參數(shù)方法。但它與秩方法關(guān)系密切,所以作為最簡(jiǎn)單的非參數(shù)檢驗(yàn)也是合適的。2.1.1 普通的符號(hào)檢驗(yàn)備擇假設(shè)備擇假設(shè)普通的符號(hào)檢驗(yàn)p值計(jì)算方法:【例2.1】女性在對(duì)事物的看法上是否傾向于比男性保守?一些社會(huì)科學(xué)家對(duì)這樣的事實(shí)很感興趣,當(dāng)夫婦倆人有一個(gè)類似的觀點(diǎn)時(shí),妻子可能比丈夫要保守。為了驗(yàn)證這一事實(shí)是否成立,隨機(jī)選取了50對(duì)夫婦進(jìn)行調(diào)查。按預(yù)先制定的問題每人分別被詢問
11、,結(jié)果只有10對(duì)夫婦的看法傾向性差異較大,而其中9對(duì)夫婦的妻子確實(shí)比丈夫保守?!纠?.2】為了解顧客對(duì)咖啡、茶的喜好情況,在某商店隨機(jī)抽取15名顧客進(jìn)行調(diào)查,結(jié)果有12名顧客更喜歡茶,2名顧客更喜歡咖啡,1名對(duì)兩者同樣愛好。請(qǐng)問顧客對(duì)咖啡、茶的喜好是否有顯著差異?若有差異,是否更喜歡茶。注意:(1)本例的數(shù)據(jù)中,有一個(gè)樣本是對(duì)茶和咖啡同樣愛好,在非參數(shù)統(tǒng)計(jì)中經(jīng)常遇到。本例的處理方法是不考慮這個(gè)樣本。(2)p值什么時(shí)候可以被認(rèn)為充分?。恳话銇碚f,0.05作為一個(gè)標(biāo)準(zhǔn),如果p值小于0.05被認(rèn)為是一個(gè)小概率事件,本例和前一例都以顯著性水平0.05作為“小”的標(biāo)準(zhǔn),實(shí)際問題處理中可能會(huì)將p定得更小,
12、如0.01或者0.001,當(dāng)然有時(shí)也會(huì)將標(biāo)準(zhǔn)定為0.10,這時(shí)必須有充分理由認(rèn)為0.10是一個(gè)發(fā)生事件很小的概率。2.1.2 位置的符號(hào)檢驗(yàn)【例2.3】生產(chǎn)過程是否需要調(diào)整?某企業(yè)生產(chǎn)一種鋼管,規(guī)定長(zhǎng)度的中位數(shù)是10米。現(xiàn)隨機(jī)地從正在生產(chǎn)的生產(chǎn)線上選取10根進(jìn)行測(cè)量,結(jié)果為:9.8, 10.1, 9.7, 9.9, 9.8, 10.0, 9.7, 10.0, 9.9, 9.8。請(qǐng)問生產(chǎn)過程是否需要調(diào)整?配對(duì)樣本位置的符號(hào)檢驗(yàn)【例2.4】領(lǐng)導(dǎo)者的領(lǐng)導(dǎo)水平是否是可以訓(xùn)練的?為驗(yàn)證領(lǐng)導(dǎo)水平是可以訓(xùn)練的,根據(jù)人的聰明程度、人品、受教育狀況等,隨機(jī)抽選出12個(gè)人配成6對(duì),每對(duì)中有一人隨機(jī)選擇受訓(xùn),記作T
13、,另一人則不受訓(xùn)記作C。經(jīng)過一段時(shí)間后,按被設(shè)計(jì)好的問題評(píng)價(jià)他們的領(lǐng)導(dǎo)水平,結(jié)果如表2-2。編號(hào)T的評(píng)價(jià)(x)C的評(píng)價(jià)(y)x-y的符號(hào)11310+2197+33420+42438-54022+63915+表2-2 配對(duì)樣本評(píng)價(jià)表2.1.3 二項(xiàng)式檢驗(yàn)和分位數(shù)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量及其抽樣分布:備擇假設(shè)p值(精確方法)二項(xiàng)檢驗(yàn)p值確定方法【例2.5】高中生晚自習(xí)是否應(yīng)延長(zhǎng)時(shí)間?某高中每晚8:30結(jié)束晚自習(xí),有人建議應(yīng)延長(zhǎng)至10:00。為作出決定,現(xiàn)對(duì)該高中學(xué)生做一調(diào)查,若學(xué)生中有25%以上說應(yīng)該延長(zhǎng)晚自習(xí)時(shí)間,則延長(zhǎng)時(shí)間。隨機(jī)選取18個(gè)學(xué)生進(jìn)行調(diào)查,有7個(gè)學(xué)生表示應(yīng)該延長(zhǎng)晚自習(xí)時(shí)間。2. 分位數(shù)檢驗(yàn)備
14、擇假設(shè)p值(精確方法)【例2.6】今天成年人的睡眠量是否少于5年前?5年前某地區(qū)的調(diào)查表明,成年人在每日24小時(shí)中的睡眠量中位數(shù)是7.5小時(shí),每日睡眠量為6小時(shí)或少于6小時(shí)的占調(diào)查總數(shù)的5%,9小時(shí)和9小時(shí)以上的也占5%, 現(xiàn)對(duì)隨機(jī)抽取的8個(gè)普通成年人的調(diào)查結(jié)果為,每日24小時(shí)中睡眠量分為7.2, 8.3, 5.6, 7.4, 7.8, 5.2, 9.1, 5.8小時(shí)。2.2 Wilcoxon 符號(hào)秩檢驗(yàn)Wilcoxon符號(hào)秩檢驗(yàn)(Wilcoxon Signed Rank Test) 亦稱威爾科克森帶符號(hào)的等級(jí)檢驗(yàn)。它是對(duì)符號(hào)檢驗(yàn)的一種改進(jìn)。符號(hào)檢驗(yàn)只利用關(guān)于樣本的差異方向上的信息,并未考慮差
15、別的大小。Wilcoxon符號(hào)秩檢驗(yàn)彌補(bǔ)了符號(hào)檢驗(yàn)的這點(diǎn)不足。下面的例子很能說明問題。【例2.7】設(shè)想請(qǐng)13個(gè)人品嘗了甲、乙兩種酒,評(píng)分結(jié)果見表2-5。品酒人12345678910111213甲55324150.560483945484652.24544乙353743.1553450.34346.15147.35546.544符號(hào)+-+-0此處得分差為甲得分減去乙得分。問甲乙哪種酒好?分析:如果僅看得分差的符號(hào),12個(gè)非0符號(hào)中,只有2個(gè)+,利用符號(hào)檢驗(yàn)不難得出乙種酒好的結(jié)論。但是進(jìn)一步思考會(huì)發(fā)現(xiàn),認(rèn)為“乙種酒好”的10人中,給出的得分其實(shí)相差無幾,而認(rèn)為“甲種酒”好的2人中,給出的得分是甲遠(yuǎn)
16、高于乙。這說明認(rèn)為“乙種酒好”的人心目中其實(shí)甲乙差不多,有可能是隨機(jī)因素造成了乙得分高。Wilcoxon符號(hào)秩檢驗(yàn)在符號(hào)的基礎(chǔ)上進(jìn)一步考慮了差異的大小,以消除隨機(jī)性帶來的影響。2.2.1 位置的Wilcoxon符號(hào)秩檢驗(yàn)1. 基本方法Wilcoxon符號(hào)秩檢驗(yàn)p值的計(jì)算方法:備擇假設(shè)p值(精確方法)p值(正態(tài)近似方法)【例2.8】鑄件的機(jī)加工是否應(yīng)轉(zhuǎn)包出去? 某鋼鐵公司訂購了一批鑄件,在使用前需進(jìn)行機(jī)加工。這一任務(wù)可由公司承擔(dān),也可以轉(zhuǎn)包給他人。公司為減少加工費(fèi)用,所確定原則是:若鑄件重量的中位數(shù)超過25公斤,就包出去;等于或小于25公斤則不轉(zhuǎn)包。從這批100件鑄件中隨機(jī)抽取8件進(jìn)行測(cè)量,每件
17、重量分別為:24.3,25.8,25.4,24.8,25.2,25.1,25.0,25.5。使用這些數(shù)據(jù),能否作出這批鑄件是否轉(zhuǎn)包的決定。編號(hào)重量差值D|D|D|的秩D的符號(hào)124.3-0.70.76-225.80.80.87+325.40.40.44+424.8-0.20.22.5-525.20.20.22.5+625.10.10.11+725.000825.50.50.55+例2.8秩計(jì)算的全部結(jié)果(平均秩法):在配對(duì)樣本中的應(yīng)用【例2.9】 新配方是否有助于防曬黑?某防曬霜制造者,欲了解一種新配方是否有助于防曬黑,對(duì)7個(gè)志愿者進(jìn)行了試驗(yàn)。在每人脊椎一側(cè)涂原配方的防曬霜,另一側(cè)涂新配方的防
18、曬霜。背部在太陽下暴曬后,按預(yù)先給定的標(biāo)準(zhǔn)測(cè)定曬黑程度如下表。表中數(shù)值越大,表明曬黑程度越高。編號(hào)1234567原配方42513161445548新配方38533652334936得到p值為0.055。這個(gè)概率對(duì)于顯著性水平0.05來說剛剛不能拒絕原假設(shè)。2.3 游程檢驗(yàn)1.游程的含義一個(gè)可以兩分的總體,如按性別區(qū)分的人群,按產(chǎn)品是否有缺陷區(qū)分的總體等等,隨機(jī)從中抽取一個(gè)樣本,樣本也可以分為兩類;類型和類型。若凡屬類型的給以符號(hào)A, 類型的給以符號(hào)B, 則當(dāng)樣本按某種順序排列(如按抽取時(shí)間先后排列)時(shí),一個(gè)或者一個(gè)以上相同符號(hào)連續(xù)出現(xiàn)的段,就被稱作游程,也就是說,游程是在一個(gè)兩種類型符號(hào)的有序
19、排列中,相同符號(hào)連續(xù)出現(xiàn)的段。例如,將某售票處排隊(duì)等候購票的人按性別區(qū)分,男以A表示,女以B表示。按到來的時(shí)間先后觀測(cè)序列為:AABABB。在這個(gè)序列中,AA為一個(gè)游程,連續(xù)出現(xiàn)兩個(gè)A;跟隨它的符號(hào)B是一個(gè)游程;BB也是一個(gè)游程,領(lǐng)先于它的A也是一個(gè)游程。在這個(gè)序列中,A的游程有2個(gè),B的游程也有2個(gè),序列共有4個(gè)游程。每一個(gè)游程所包含符號(hào)的個(gè)數(shù),稱為游程的長(zhǎng)度。如上面的序列中,有一個(gè)長(zhǎng)度為2的A游程、一個(gè)長(zhǎng)度為2的B游程,長(zhǎng)度為1的A游程、B游程各有1個(gè)。2.基本方法隨機(jī)抽取一個(gè)樣本,觀測(cè)值按某種順序排列,如果研究所關(guān)心的問題是:被有序排列的兩種類型符號(hào)是否隨機(jī)排列,則可以建立雙側(cè)備擇,假設(shè)
20、組為:為了對(duì)假設(shè)作出判定,被收集的樣本數(shù)據(jù)僅需定類尺度測(cè)量,但要求進(jìn)行有意義的排序,按一定次序排列的樣本觀測(cè)值能夠被變換為兩種類型的符號(hào)。備擇假設(shè)p值(精確方法)U的右尾概率U的左尾概率U較小尾部概率的2倍備擇假設(shè)p值(正態(tài)近似)Z較小尾部概率的2倍【例2.10】 某旅游點(diǎn)該年氣溫偏差是否隨機(jī)?某旅游點(diǎn)該年二月份的氣溫,連續(xù)10天被記錄,每天的最高氣溫與歷史上同期最高氣溫平均值比較,高于均值記作A,低于均值記錄作B,結(jié)果10天的氣溫依次記錄為AABABBAAAB, 使用=0.05的顯著性水平,檢驗(yàn)高溫的偏差是否隨機(jī)。得到p值為0.888。結(jié)果表明在0.05的水平上,不能拒絕氣溫偏差是隨機(jī)的原假
21、設(shè)。011101011101011101011111111111【例2.11】 從生產(chǎn)線上抽取產(chǎn)品檢驗(yàn),是否應(yīng)采用頻繁抽取小樣本的方法?在一個(gè)剛建成的制造廠內(nèi),質(zhì)量控制員需要設(shè)計(jì)一個(gè)抽樣方法,以保證質(zhì)量檢查的可靠。生產(chǎn)線上抽取的產(chǎn)品檢查結(jié)果可簡(jiǎn)單地分為兩類:有毛病、無毛病,檢驗(yàn)費(fèi)用與受檢產(chǎn)品總數(shù)有關(guān),而與每次抽檢產(chǎn)品數(shù)量關(guān)系不大。一般來說,有毛病的產(chǎn)品似乎是成群的,則每天應(yīng)頻繁抽取小樣本,以保證估計(jì)可靠;若有毛病的產(chǎn)品隨機(jī)產(chǎn)生,則每天以間隔較長(zhǎng)地抽取大樣本,就可以得到一個(gè)比較好的估計(jì)?,F(xiàn)隨機(jī)抽取30個(gè)產(chǎn)品,有毛病的編碼為0, 好的編碼為1,按從生產(chǎn)線抽取順序排列(下面是按列的順序排),結(jié)果為1
22、. 基本方法2. 應(yīng)用(1)理論頻數(shù)完全已知【例2.12】某金融機(jī)構(gòu)的貸款償還類型有A、B、C、D四種,各種的預(yù)期償還率為80%、12%、7%和1%,在一段時(shí)間的觀察記錄中,A型按時(shí)償還的有380第,B型有69筆,C型有43筆,D型有8筆。問在5%顯著性水平上,這些結(jié)果與預(yù)期的是否一致?類型A380400-204001.00B69609811.35C43358641.83D85391.80合計(jì)5005005.98計(jì)算細(xì)節(jié):(2)理論頻數(shù)不完全已知【例2.13】從1500到1931年的432年間,每年爆發(fā)戰(zhàn)爭(zhēng)的次數(shù)可以看作一個(gè)隨機(jī)變量,椐統(tǒng)計(jì)這432年間共爆發(fā)了299次戰(zhàn)爭(zhēng),具體數(shù)據(jù)如下表。戰(zhàn)爭(zhēng)
23、次數(shù)年數(shù)0223114224831544問戰(zhàn)爭(zhēng)爆發(fā)的次數(shù)是否近似服從泊松分布?如果原假設(shè)成立,則理論期望頻率為223216.220142149.6524851.7891511.94842.390第3章 兩樣本非參數(shù)檢驗(yàn)本章內(nèi)容:3.1 兩個(gè)相關(guān)樣本的非參數(shù)檢驗(yàn)3.2 兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)3.3 尺度檢驗(yàn)3.1 兩個(gè)相關(guān)樣本的非參數(shù)檢驗(yàn)兩個(gè)相關(guān)樣本的定義:若一次抽樣的測(cè)量結(jié)果影響另一次抽樣測(cè)量結(jié)果,則這種抽樣是相關(guān)的。例如,對(duì)照實(shí)驗(yàn)得到的樣本就是相關(guān)樣本。在接受兩種不同訓(xùn)練方法的人員中,由于智力、接受能力、耐力等方面的不同,會(huì)導(dǎo)致不同處理的結(jié)果產(chǎn)生差異,這不是所要研究的問題,而是其它因素影響
24、產(chǎn)生的附加差異,這些其它影響因素也稱為混雜因素。這些因素在實(shí)施不同處理前必須排除。為獲取相關(guān)樣本,常應(yīng)用兩種方式。一是讓每一研究對(duì)象作為自身的對(duì)照者,另一是將研究對(duì)象兩兩配對(duì),分別給每一對(duì)兩個(gè)成員以不同處理。3.1.1 兩個(gè)相關(guān)樣本的符號(hào)檢驗(yàn)1. 基本方法配對(duì)是處理相關(guān)樣本的基本手段。如果關(guān)心的是某一總體中位數(shù)是否大于另一總體中位數(shù),則可建立單側(cè)備擇,假設(shè)組為2. 應(yīng)用【例3.1】教學(xué)參考資料對(duì)于指導(dǎo)學(xué)生自學(xué)是否有效?為幫助學(xué)生通過自學(xué)提高對(duì)知識(shí)的掌握,編輯了符合教學(xué)大綱的教學(xué)參考資料。針對(duì)某一概念的掌握進(jìn)行實(shí)驗(yàn),隨機(jī)選取15名學(xué)生,他們?cè)谑褂脜⒖假Y料之前的得分(5分制)如下表。學(xué)習(xí)參考資料后
25、,重新對(duì)這一概念進(jìn)行測(cè)試,得分也列在表中。檢驗(yàn)這部參考資料是否促進(jìn)學(xué)生掌握知識(shí)。學(xué)生編號(hào)123456789101112131415第一次成績(jī)222233333323323第二次成績(jī)342323442443444編號(hào)編號(hào)編號(hào)124735135423483314253359211555435103516355331125171563212253.1.2 兩個(gè)相關(guān)樣本的Wilcoxon符號(hào)秩檢驗(yàn)1. 基本方法兩個(gè)相關(guān)樣本的Wilcoxon符號(hào)秩檢驗(yàn)也是用來檢驗(yàn)配對(duì)樣本是否有顯著差異的方法。它不僅借助于兩個(gè)樣本差值的符號(hào),而且利用差值的大小,因此它比符號(hào)檢驗(yàn)有更精確的判斷。建立假設(shè)組,當(dāng)研究的問題僅關(guān)
26、心兩個(gè)總體的分布是否相同,或說兩個(gè)總體中位數(shù)是否相同時(shí),采用雙側(cè)檢驗(yàn)為2應(yīng)用【例3.3】幼兒園的生活對(duì)孩子的社會(huì)知識(shí)是否有影響?有人認(rèn)為兒童上幼兒園有助于其認(rèn)識(shí)社會(huì),有人則認(rèn)為兒童在家一樣可以獲得社會(huì)知識(shí)。為了解它們是否存在顯著差異,對(duì)8個(gè)同性孿生兒童進(jìn)行實(shí)驗(yàn),隨機(jī)指定8對(duì)中一個(gè)上幼兒園,另一個(gè)則在家。經(jīng)過一段時(shí)間后,通過對(duì)他們的詢問,分別作出相應(yīng)的評(píng)價(jià),評(píng)分越高,表明社會(huì)知識(shí)越多,結(jié)果見下表。配對(duì)編號(hào)12345678上幼兒園兒童7870678176728583在家兒童6258637780738278分析:雖然可以相信得分多的孩子比得分少的孩子社會(huì)知識(shí)要多,但由于是定距尺度測(cè)量,無絕對(duì)零值,因
27、此不能認(rèn)為得80分的孩子社會(huì)知識(shí)是得40分的孩子的2倍,也不能認(rèn)為80分與60分的社會(huì)知識(shí)之差一定是60分與50分之差的2倍。但是,可以肯定,80分與60分所代表的社會(huì)知識(shí)之差一定大于60分和50分之間的差。所以將分?jǐn)?shù)差值的絕對(duì)值排序是有意義的,這樣就有能夠運(yùn)用Wilcoxon符號(hào)秩檢驗(yàn)判定在家和上幼兒園對(duì)孩子的社會(huì)知識(shí)是否有顯著影響。3.2 兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)若第一次抽樣的所有樣本某一屬性的測(cè)量結(jié)果,不影響第二次抽樣的所有樣本同一屬性的測(cè)量結(jié)果,則這種抽樣是獨(dú)立的,得到的兩個(gè)樣本為獨(dú)立樣本。適用于獨(dú)立樣本的情況:樣本配對(duì)不當(dāng)、無法配對(duì)等,即不適宜視為相關(guān)樣本的情形。3.2.1 Mann
28、-Whitney-Wilcoxon檢驗(yàn)Mann-Whitney-Wilcoxon檢驗(yàn),常譯為曼-惠特尼-維爾科克森檢驗(yàn),簡(jiǎn)寫為M-W-W檢驗(yàn),亦稱Wilcoxon秩和檢驗(yàn)。1. 基本方法若大部分的Y大于X 或大部分的X大于Y將不能證實(shí)這個(gè)有序的序列是一個(gè)隨機(jī)的混合,將拒絕X和Y來自一個(gè)相同總體的原假設(shè)?!纠?.4】一種藥物有效性的試驗(yàn),一組為試驗(yàn)組,一組為對(duì)照組。試驗(yàn)結(jié)果評(píng)分如下表:試驗(yàn)組(X)81218對(duì)照組(Y)691113將表中評(píng)分按從小到大的順序排列,并注意哪一個(gè)評(píng)分為X組的,哪一個(gè)為Y組的,同時(shí)給出秩,結(jié)果如下:排序68911121318秩1234567組別YXYYXYX備擇假設(shè)p值
29、備擇假設(shè)p值 2. 應(yīng)用【例3.5】某種藥物對(duì)治療腫瘤是否有效?選擇9只白鼠,作為抗癌藥物篩選的對(duì)象,9只白鼠的基本條件相同,同時(shí)注射致癌物。然后隨機(jī)選取其中3只進(jìn)行抗癌藥物處理。腫瘤的重量是檢驗(yàn)藥物有效性的一個(gè)指標(biāo)。經(jīng)過一個(gè)固定的時(shí)間周期后,將9只白鼠的腫瘤割除稱重,結(jié)果如下(重量單位是克)。 處理組(X):0.94, 1.56, 1.15 控制組(Y):1.20, 1.63, 2.26, 1.87, 2.20, 1.30 分析:若該種抗癌藥物有效,處理組白鼠腫瘤的重量應(yīng)該小于控制組的平均重量。由于這個(gè)試驗(yàn)采用的是小樣本,且為兩個(gè)獨(dú)立樣本,數(shù)據(jù)測(cè)量為定比尺度,可運(yùn)用Mann-Whitney-
30、Wilcoxon檢驗(yàn),建立的假設(shè)組為將腫瘤重量從小到大排序并計(jì)算秩和組別得到下表結(jié)果:腫瘤重量0.941.151.201.301.561.631.872.202.26秩123456789組別XXYYXYYYY3. 同分的處理【例3.6】問題按難易次序提問是否影響學(xué)生正確回答的能力?從心理學(xué)的角度看,按問題的難易程度順序提問會(huì)影響學(xué)生正確回答的能力,從而影響他們的總分?jǐn)?shù)。為檢驗(yàn)這種觀點(diǎn),隨機(jī)地將一班學(xué)生20人分成兩組,每組10人。設(shè)計(jì)一組問題,分成A和B卷,A卷是問題按從易到難的次序安排。B卷相反,從最難到最易。兩組學(xué)生分別回答A和B卷,考試被控制在完相同的條件下進(jìn)行,評(píng)分結(jié)果如下:A: 83,
31、 82, 84, 96, 90, 64, 91, 71, 75, 72B: 42, 61, 52, 78, 69, 81, 75, 78, 78, 65分析:這一問題可以考慮按考試分?jǐn)?shù)的中位數(shù)來研究。若兩組成績(jī)的中位數(shù)相等,提問的次序?qū)W(xué)生的成績(jī)無顯著影響,若中位數(shù)不相等則不能認(rèn)為沒有顯著影響。由于是小樣本,并且為兩個(gè)獨(dú)立樣本,因而可以運(yùn)用M-W-W檢驗(yàn),這是一個(gè)單側(cè)檢驗(yàn),單側(cè)備擇應(yīng)是A組的成績(jī)平均高于B組。因?yàn)閮蓚€(gè)樣本的觀測(cè)值數(shù)目相同,無論哪組都可以記作X。若以X代表A組。則假設(shè)組為4. 移位參數(shù)的Mann-Whitney-Wilcoxon檢驗(yàn)3.2.2 Wald-Wolfowitz游程檢驗(yàn)
32、Wald-Wolfowitz Runs Test常譯為沃爾德-沃爾福威茨連串檢驗(yàn)或游程檢驗(yàn),簡(jiǎn)寫為W-W串檢驗(yàn)。1. 基本方法思想方法:分析合并樣本的游程。例如,觀察兩組學(xué)生的考試成績(jī),將7個(gè)分?jǐn)?shù)排列成一個(gè)從小到大的序列如下:第一組(X)727863第二組(Y)65798285觀察X和Y出現(xiàn)的次序以確定游程數(shù)。序列中有4個(gè)游程,一個(gè)由來自X的63分構(gòu)成的游程,隨后是一個(gè)由來自Y的65分構(gòu)成的游程,再后是由來自X的兩個(gè)分?jǐn)?shù)72和78構(gòu)成的游程,最后是三個(gè)來自Y的分?jǐn)?shù)構(gòu)成的1個(gè)游程。排序63657278798285組別XYXXYYY可以用序列的游程數(shù)作為檢驗(yàn)統(tǒng)計(jì)量,定義U為Wald-Wolfowi
33、tz檢驗(yàn)的統(tǒng)計(jì)量U = 游程的總數(shù)目2. 應(yīng)用【例3.7】問題的提問順序是否對(duì)學(xué)生正確回答的能力有影響?沿用例3.6的資料,考察問題的提問順序是否對(duì)學(xué)生成績(jī)產(chǎn)生影響。分析:由于只考察問題從易到排序和從難到易排序是否會(huì)影響學(xué)生的成績(jī),且相互獨(dú)立,因此可以用Wald-Wolfowitez游程檢驗(yàn)。假設(shè)組為將試驗(yàn)數(shù)據(jù)即學(xué)生考試成績(jī)從小到大排序得到下表:42526164656971727575YYYXYYXXXY78787881828384909196YYYYXXXXXX3.3 尺度檢驗(yàn)尺度檢驗(yàn)用于考察兩個(gè)總體的分散程度是否一致。在總體分布為正態(tài)分布時(shí),尺度檢驗(yàn)可以通過F檢驗(yàn)完成。但是在實(shí)際中,總體的
34、正態(tài)性假設(shè)往往不能滿足,需要用適用范圍更廣的尺度檢驗(yàn)。下面介紹兩種基于秩方法的尺度檢驗(yàn):安薩里-布拉德利(Ansari-Bradley)檢驗(yàn)和平方秩檢驗(yàn)。3.3.1 安薩里-布拉德利(Ansari-Bradley)檢驗(yàn)1. 基本方法備擇假設(shè)p值計(jì)算方法(R語言命令)ansari.test(x,y,alternative=greater)ansari.test(x,y,alternative=less)ansari.test(x,y,alternative= two.sided)當(dāng)每個(gè)總體的樣本量都小于50個(gè)時(shí),可以用精確檢驗(yàn),此時(shí),數(shù)據(jù)有同分(打結(jié))對(duì)結(jié)果影響很小。當(dāng)每個(gè)總體的樣本量都大于50
35、時(shí),可以用正態(tài)近似,只要在R命令中添加exact = F即可。此時(shí),數(shù)據(jù)同分(打結(jié))需要調(diào)整,R語言在計(jì)算時(shí)會(huì)自動(dòng)完成調(diào)整。2. 應(yīng)用【例3.8】?jī)蓚€(gè)經(jīng)銷商的鉛錠重量是否有相同的可靠度??jī)蓚€(gè)經(jīng)銷商的鉛錠重量有相同的中位數(shù),但是懷疑第一個(gè)經(jīng)銷商的重量變化幅度比第二個(gè)的大。隨機(jī)抽取了兩個(gè)經(jīng)銷商的22個(gè)鉛錠如下表(單位:千克)。經(jīng)銷商115.41615.615.716.616.316.416.815.216.915.1經(jīng)銷商215.716.115.916.215.91615.816.116.316.515.53.3.2 平方秩檢驗(yàn)Ansari-Bradley檢驗(yàn)要求待檢驗(yàn)的兩總體尺度參數(shù)(中位數(shù))相
36、等或已知。但是實(shí)際問題中,有時(shí)候這樣的要求不能滿足。此時(shí)要檢驗(yàn)總體的分散程度可以選擇平方秩檢驗(yàn)。1. 基本方法備擇假設(shè)p值計(jì)算(正態(tài)近似)Z的右尾概率Z的左尾概率Z的小尾概率的2倍2. 應(yīng)用【例3.9】已知有兩群人的心率數(shù)據(jù)如下,請(qǐng)問兩群人的心率波動(dòng)大小是否相同?群體1:58, 76, 82, 74, 79, 65, 74, 86群體2:66, 74, 69, 76, 72, 73, 75, 67, 68分析:可以算出,兩個(gè)群體的平均心率分別是74.25和71.11,并且數(shù)據(jù)有同分,故采用正態(tài)近似的平方秩檢驗(yàn)。第4章 多樣本非參數(shù)檢驗(yàn)本章內(nèi)容:4.1 Cochran Q檢驗(yàn)及多重比較4.2 F
37、riedman 檢驗(yàn)及多重比較4.3 Kruskal-Wallis檢驗(yàn)及多重比較4.1 Cochran Q檢驗(yàn)及多重比較1. 基本方法為對(duì)假設(shè)作出判定,所分析的數(shù)據(jù)測(cè)量層次為定類尺度即可。獲得的數(shù)據(jù)可排成一個(gè)n行k列的表。例如教材例4.1中表4-1呈現(xiàn)的樣子。(1)檢驗(yàn)的基本思想(2)多重比較具體可通過相關(guān)樣本符號(hào)檢驗(yàn)實(shí)現(xiàn),或者M(jìn)cNemar檢驗(yàn)實(shí)現(xiàn),其中后者是Cochran Q檢驗(yàn)在兩樣本情形的特例。1(成功)0(失?。?(成功)0(失?。㎝cNemar檢驗(yàn)的基本思想:檢驗(yàn)統(tǒng)計(jì)量為在進(jìn)行多次兩兩配對(duì)檢驗(yàn)時(shí),需要對(duì)p值進(jìn)行調(diào)整,以防止犯第一類錯(cuò)誤過大。調(diào)整p值的方法與方差分析中多重比較時(shí)采用的
38、調(diào)整方法相同。無論用符號(hào)檢驗(yàn)還是用McNemar檢驗(yàn)做多重比較,檢驗(yàn)最終的p值都需要通過多重比較的調(diào)整方法算出。2. 應(yīng)用【例4.1】消費(fèi)者對(duì)飲料的愛好是否存在顯著差異?某飲料經(jīng)銷商為決定經(jīng)營(yíng)飲料的品種、數(shù)量,對(duì)消費(fèi)者的愛好進(jìn)行了一次調(diào)查。隨機(jī)抽取18個(gè)消費(fèi)者,請(qǐng)他們對(duì)四種飲料:奶茶、果茶、可樂、礦泉水的喜好作出評(píng)價(jià),凡喜歡的記作1,不喜歡記作0。調(diào)查結(jié)果如教材表4-1(囿于篇幅不在此展示表格)。分析:在這個(gè)例子中,被調(diào)查的消費(fèi)者是同一批人,所以是相關(guān)樣本。并且所有的數(shù)據(jù)都表示兩種結(jié)果,1代表“成功”(喜歡),0代表“失敗”(不喜歡)。對(duì)這種來自k個(gè)總體的二元響應(yīng)數(shù)據(jù)進(jìn)行差異性檢驗(yàn),可以選擇C
39、ochran Q檢驗(yàn)。在R語言中,程序包RVAideMemoire中的函數(shù)cochran.qtest可以做Cochran Q檢驗(yàn),并且輸出基于配對(duì)符號(hào)檢驗(yàn)的多重比較結(jié)果。輸出結(jié)果表明,p=0.914,對(duì)于顯著性水平0.05,p值足夠大。不能拒絕原假設(shè),即這個(gè)調(diào)查結(jié)果不足以推翻消費(fèi)者對(duì)幾種飲料同樣喜歡的假設(shè)。從輸出結(jié)果還可以看到總體的比例估計(jì),喜歡奶茶和果茶的比例都是0.444,喜歡可樂的比例為0.389,喜歡礦泉水的比例是0.333。從比例上看確實(shí)差不多。注:利用R程序包RVAideMemoire的cochran.qtest函數(shù)進(jìn)行檢驗(yàn),如果拒絕原假設(shè),則可以自動(dòng)輸出基于符號(hào)檢驗(yàn)的多重比較結(jié)果
40、,本例沒有輸出多重比較的原因是本例沒有拒絕原假設(shè)。【例4.2】三種不同教學(xué)方法的效果是否有顯著差異三種不同教學(xué)方法:網(wǎng)絡(luò)教學(xué)、課堂講授、課堂討論,對(duì)學(xué)生掌握知識(shí)的效果是否有所不同。為檢驗(yàn)這一問題,抽選部分學(xué)生分為18組,每組3名匹配的學(xué)生,他們的有關(guān)情況類似。各組中3名學(xué)生被隨機(jī)地置于3種條件下,即隨機(jī)地指定接受某種教學(xué)方法。實(shí)施不同教學(xué)方法后進(jìn)行測(cè)驗(yàn),成績(jī)合格為有效,記作1; 成績(jī)不合格為無效,記作0。結(jié)果如教材表4-3。本例采用R語言兩種方法實(shí)現(xiàn)。方法1。采用R程序包RVAideMemoire的cochran.qtest函數(shù)進(jìn)行檢驗(yàn),并輸出基于符號(hào)檢驗(yàn)的多重比較結(jié)果。輸出結(jié)果表明,p=0.
41、0015,對(duì)于顯著性水平0.01,這個(gè)p值足夠小,拒絕原假設(shè),即可以認(rèn)為,該調(diào)查說明三種教學(xué)方法的效果有顯著差異。方法2。采用程序包DescTools的CochranQTest函數(shù)完成檢驗(yàn),并用程序包rcompanion的pairwiseMcnemar完成基于McNemar檢驗(yàn)的多重比較。輸出結(jié)果表明,p=0.0015,對(duì)于顯著性水平0.01,這個(gè)p值足夠小,拒絕原假設(shè),即可以認(rèn)為,該調(diào)查說明三種教學(xué)方法的效果有顯著差異。兩種方法的多重比較結(jié)果:樣本配對(duì)符號(hào)檢驗(yàn)多重比較p值(BH調(diào)整)0.0340.0061.000樣本配對(duì)McNemar檢驗(yàn)多重比較p值(BH調(diào)整)0.0340.0061.000
42、兩種方法的檢驗(yàn)結(jié)果一致,在顯著性水平0.05下,網(wǎng)絡(luò)教學(xué)與課堂討論、網(wǎng)絡(luò)教學(xué)和課堂教學(xué)都有顯著不同,課堂教學(xué)和課堂討論效果差不多。這個(gè)結(jié)果與比例估計(jì)的結(jié)果也是吻合的。4.2 Friedman 檢驗(yàn)及多重比較k個(gè)樣本是匹配的(相關(guān)樣本),實(shí)現(xiàn)匹配的方法與前面類似??梢允莐個(gè)條件下同一組受試者構(gòu)成,即受試對(duì)象作為自身的對(duì)照者,也可以將受試者分為n個(gè)組、每組均有k個(gè)匹配的受試者,隨機(jī)地將k個(gè)受試者置于k個(gè)條件之下形成。在不同受試者匹配的樣本中,應(yīng)盡量使不同受試者的有關(guān)因素匹配即相似。1. 基本方法(1)檢驗(yàn)的基本思想與Cochran Q檢驗(yàn)相似,F(xiàn)riedman檢驗(yàn)也是用來檢驗(yàn)各個(gè)樣本所得的結(jié)果在整
43、體上是否存在顯著差異。因此建立的也是雙側(cè)備擇,假設(shè)組為為對(duì)假設(shè)作出判定,所分析的數(shù)據(jù)應(yīng)是定序尺度測(cè)量。獲得的數(shù)據(jù)排成一個(gè)n行k列的表,如教材表4-5,行代表不同的受試者或匹配的受試小組,列代表各種條件。用方差分析的語言來講,就是因子的k個(gè)水平有n個(gè)區(qū)組。檢驗(yàn)統(tǒng)計(jì)量:由于是定序尺度測(cè)量的數(shù)據(jù),因此,可以對(duì)每一行的觀測(cè)結(jié)果分別評(píng)秩,即評(píng)等級(jí),等級(jí)1是最小的,依次排序,秩從1到k。(2)多重比較可以通過多種檢驗(yàn)方法實(shí)現(xiàn)(例如配對(duì)的wilcoxon符號(hào)秩檢驗(yàn)),并結(jié)合多重比較的p值調(diào)整方法得到最終的p值。本章采用基于Nemenyi檢驗(yàn)和基于Conover檢驗(yàn)實(shí)現(xiàn)多重比較。2. 應(yīng)用【例4.3】三種不同
44、教學(xué)方法的效果是否有顯著差異 三種不同教學(xué)方法同例4.2, 抽選的學(xué)生也分為18組,每組3名匹配的學(xué)生,其有關(guān)情況類似。各組中3名學(xué)生被隨機(jī)地安排接受某種教學(xué)方法。實(shí)施不同教學(xué)方法后,進(jìn)行測(cè)驗(yàn),按成績(jī)高低對(duì)3名匹配學(xué)生的成績(jī)排列等級(jí)即評(píng)秩,結(jié)果如教材表4-6。分析:這個(gè)問題與例4.2類似,也是檢驗(yàn)三種教學(xué)方法的效果有無差異,因而應(yīng)建立雙側(cè)備擇,假設(shè)組為由于數(shù)據(jù)的測(cè)量已轉(zhuǎn)化為定序尺度,且是兩個(gè)以上相關(guān)樣本,可以采用Friedman檢驗(yàn)??梢钥闯龅?5個(gè)觀測(cè)存在同分,R語言會(huì)自動(dòng)對(duì)同分情況修正p值,利用R函數(shù)friedman.test即可。輸出結(jié)果表明,p=0.006。對(duì)于顯著性水平0.01,該值
45、足夠小。拒絕原假設(shè),說明三種教學(xué)方法的效果存在差異。三種教學(xué)方法的效果差異具體是誰和誰的差異?差異多大?需要進(jìn)一步通過多重比較分析得到。R程序包PMCMRplus中提供多種多重比較的函數(shù),這里介紹兩種:基于Nemenyi檢驗(yàn)和基于Conover檢驗(yàn)的多重比較。結(jié)果如下:樣本配對(duì)Nemenyi多重比較p值(BH調(diào)整)0.0270.0100.941樣本配對(duì)Conover多重比較p值(BH調(diào)整)0.0000.0000.3803. Kendall協(xié)同系數(shù)Kendall協(xié)同系數(shù)在理論上與Friedman檢驗(yàn)完全等價(jià),在應(yīng)用中,兩者的分析角度不一樣,可以互為補(bǔ)充。設(shè)對(duì)k個(gè)對(duì)象(總體)進(jìn)行n次評(píng)價(jià),這種評(píng)價(jià)
46、可以是打分,可以是排序等。比如在例4.3中,相當(dāng)于n(=18)個(gè)學(xué)生(被動(dòng)地)對(duì)k(=3)種教學(xué)方式進(jìn)行了打分。這樣就得到的數(shù)據(jù)形成n行k列的評(píng)價(jià)結(jié)果(n行k列的數(shù)據(jù)陣)。研究想知道,n次評(píng)價(jià)在多大程度上是一致的?如果n次評(píng)價(jià)是隨機(jī)的,沒有必要做進(jìn)一步分析。Kendall協(xié)同系數(shù)可以回答這個(gè)問題??梢姡琄endall協(xié)同系數(shù)與Friedman檢驗(yàn)是對(duì)同一個(gè)對(duì)象的兩種分析思路。沿用Friedman檢驗(yàn)統(tǒng)計(jì)量中的記號(hào),Kendall協(xié)同系數(shù)定義為W的取值在0到1之間,若W=0,則表明對(duì)k個(gè)對(duì)象的n次評(píng)價(jià)是完全隨機(jī)的;若W=1,則表明對(duì)k個(gè)對(duì)象的n次評(píng)價(jià)是完全一致的。如果出現(xiàn)同分,則與Friedma
47、n檢驗(yàn)統(tǒng)計(jì)量的修正方式完全類似,修正的W為【例4.4】以例4.3用Kendall協(xié)同系數(shù)進(jìn)行分析。這個(gè)分析角度是從學(xué)生考試成績(jī)的角度分析3種教學(xué)方法的效果是否有顯著差異,如果學(xué)生考試成績(jī)對(duì)不同教學(xué)方法而言都有好有壞,呈現(xiàn)隨機(jī)性,則教學(xué)方法沒有顯著差異。否則,就是教學(xué)方法的效果有差異。R程序包DescTools中的KendallW函數(shù)可以輸出Kendall協(xié)同系數(shù)。例4.3的Kendall協(xié)同系數(shù)為0.287。關(guān)于Kendall協(xié)同系數(shù)大小與評(píng)價(jià)一致性的關(guān)系,有經(jīng)驗(yàn)法則見下表。一致性強(qiáng)度弱中等強(qiáng)K=3K=5K=7K=9根據(jù)經(jīng)驗(yàn)法則,學(xué)生的成績(jī)呈現(xiàn)較強(qiáng)的一致性,說明3種教學(xué)方法的教學(xué)效果是不一樣的
48、。Kendall協(xié)同系數(shù)的顯著性檢驗(yàn)對(duì)例4.4進(jìn)行W的顯著性檢驗(yàn),得到p值為0.006,拒絕評(píng)價(jià)是隨機(jī)的原假設(shè),此結(jié)果與經(jīng)驗(yàn)法則得到結(jié)論是一致的。4.3 Kruskal-Wallis檢驗(yàn)及多重比較Kruskal-Wallis檢驗(yàn)是適用于檢驗(yàn)k個(gè)獨(dú)立樣本是否來自同一總體的非參數(shù)方法。Kruskal-Wallis檢驗(yàn)亦有譯為克拉夏爾-瓦里斯檢驗(yàn),或簡(jiǎn)稱為克氏檢驗(yàn)。它是兩個(gè)獨(dú)立樣本Mann-Whitney-Wilcoxon檢驗(yàn)的一種推廣。1. 基本方法(1)檢驗(yàn)的基本思想注意,k個(gè)相關(guān)樣本情形是不能這么做的,因?yàn)楹喜⒑蟮臉颖军c(diǎn)將不再獨(dú)立,這是獨(dú)立樣本和相關(guān)樣本處理數(shù)據(jù)的本質(zhì)差異。對(duì)得到的單一樣本按從
49、小到大排序,將每一個(gè)觀測(cè)值給出一個(gè)等級(jí)即評(píng)秩,秩為整數(shù),從1到N。對(duì)于N個(gè)觀測(cè)值來說,平均秩是可以看出,H的分子是每個(gè)樣本實(shí)際等級(jí)和與期望等級(jí)和的偏差平方和,如果原假設(shè)為真,該H的值應(yīng)該傾向很小,如果H的值過大,就有理由懷疑原假設(shè)不真。p值的計(jì)算(2)多重比較檢驗(yàn)統(tǒng)計(jì)量為2. 應(yīng)用【例4.5】四種不同類型治療的有效性是否有顯著不同 對(duì)于精神錯(cuò)亂有4種不同的手段:電擊、心理療法,電擊加心理療法、無任何治療。為檢驗(yàn)這幾種不同手段對(duì)精神錯(cuò)亂治療的有效性是否有顯著不同,選取40個(gè)患者。他們?cè)谥橇Α⑵返?、心理等因素方面相差不多。隨機(jī)地將40人分成4個(gè)組,每組10人。4個(gè)組分別接受不同方法的治療。一個(gè)周期
50、后,對(duì)每個(gè)患者相對(duì)改善程度進(jìn)行測(cè)量,依改善高低程度給40人分等級(jí),等級(jí)1是改善的最高水平,依次排序,直至等級(jí)40是改善最小的水平。評(píng)秩結(jié)果如教材表4-10。分析:對(duì)任何一種方法判定其有效的標(biāo)志是患者分?jǐn)?shù)的中位數(shù),若4種方法效果差異不大,則各總體的中位數(shù)應(yīng)相等。為檢驗(yàn)4種方法有效性是否有顯著差異,建立假設(shè)組為由于數(shù)據(jù)是定序尺度測(cè)量,有兩個(gè)以上獨(dú)立樣本,可以采用Kruskal-Wallis檢驗(yàn),R函數(shù)為kruskal.test。利用多重比較進(jìn)一步分析各種治療方法之間的具體差異,利用R程序包FSA中的dunnTest函數(shù)可以實(shí)現(xiàn)。多重比較結(jié)果整理如下表:療法配對(duì)p值(基于Dunn檢驗(yàn)和BH法)3.
51、同分的處理多重比較的檢驗(yàn)統(tǒng)計(jì)量也要作相應(yīng)的修正,修正后的檢驗(yàn)統(tǒng)計(jì)量為【例4.6】三種不同教學(xué)方法的有效性是否有顯著差異 某大學(xué)制定三種不同的教學(xué)方法:大班講授、小班講授、小組討論。為檢驗(yàn)三種方法對(duì)學(xué)生掌握知識(shí)的有效性是否有顯著相同,進(jìn)行了一次試驗(yàn)。選取二年級(jí)大學(xué)生50名,隨機(jī)地分為三組,分別接受三種不同方法教學(xué)。由同一教師按不同方法分別講授同一方面的知識(shí),規(guī)定的內(nèi)容講授完后,對(duì)學(xué)生進(jìn)行統(tǒng)一考試,成績(jī)?nèi)缃滩谋?-12。 分析:學(xué)生成績(jī)?yōu)槎ň喑叨葴y(cè)量,但為了避免作出某些假設(shè),以使結(jié)論更具普遍性,不準(zhǔn)備采用參數(shù)檢驗(yàn)方法,而選用非參數(shù)檢驗(yàn)。由于三種不同教學(xué)方法是獨(dú)立的,故應(yīng)采用k個(gè)獨(dú)立樣本的統(tǒng)計(jì)檢驗(yàn)。
52、對(duì)于三組學(xué)生成績(jī)集中趨勢(shì)的一個(gè)很好的度量指標(biāo)是中位數(shù),成績(jī)由小到大排序給出等級(jí),能夠采用Kruskal-Wallis檢驗(yàn)。建立假設(shè)組為為采用Kruskal-Wallis檢驗(yàn)對(duì)假設(shè)作出判定,將教材表4-12中的所有學(xué)生成績(jī)排序,最低分秩評(píng)為1,最高分秩評(píng)為50。由于50名學(xué)生中有不少是同分,需要用調(diào)整過后的檢驗(yàn)統(tǒng)計(jì)量計(jì)算p值。R中函數(shù)kruskal.test可以自動(dòng)計(jì)算出調(diào)整后的統(tǒng)計(jì)量值。雖然不能拒絕原假設(shè),但是p值離0.05相差不遠(yuǎn),可以做多重比較進(jìn)行更加細(xì)致的比較。結(jié)果整理如下表:教學(xué)方法配對(duì)p值(基于Dunn檢驗(yàn)和BH法)從表可知,調(diào)整的p值都大于0.05,不能拒絕原假設(shè),表明數(shù)據(jù)無法拒絕
53、各種教學(xué)方法之間存在顯著差別,即三種教學(xué)方法的學(xué)生平均成績(jī)沒有顯著差異。第5章 非參數(shù)相關(guān)性度量本章內(nèi)容:5.1 斯皮爾曼(Spearman)秩相關(guān)5.2 肯德爾(Kendall)秩相關(guān)5.3 霍夫?。℉oeffding)獨(dú)立性檢驗(yàn)5.1 斯皮爾曼(Spearman)秩相關(guān)秩相關(guān)(Rank Correlation) 也稱作級(jí)序相關(guān)或等級(jí)相關(guān),用于兩個(gè)至少是定序尺度測(cè)量的樣本間相關(guān)程度的測(cè)定。1. 基本方法X和Y的評(píng)秩完全相同(完全正相關(guān))X和Y的評(píng)秩完全相反(完全負(fù)相關(guān))X的秩Y的秩X的秩Y的秩111n222n-1n-1n-1n-12nnn1上面的式子取值在0到1之間。當(dāng)X和Y完全正相關(guān)時(shí),取
54、值為0;當(dāng)X和Y完全負(fù)相關(guān)時(shí),取值為1。當(dāng)數(shù)據(jù)沒有同分時(shí),為了與皮爾遜相關(guān)相統(tǒng)一,定義斯皮爾曼秩相關(guān)系數(shù)為這樣定義可以讓R的取值從-1到+1。其中,R=1表明X和Y完全相關(guān),R=1為完全正相關(guān),R=-1為完全負(fù)相關(guān)。R越接近于1, 表明相關(guān)程度越高。反之,R越接近于零,表明相關(guān)程度越低,R=0為完全不相關(guān)。通過一些代數(shù)運(yùn)算,可以得到這說明,斯皮爾曼秩相關(guān)系數(shù)本質(zhì)是用秩替換原始數(shù)據(jù)的皮爾遜相關(guān)系數(shù)。2. 應(yīng)用【例5.1】2位教授對(duì)本科畢業(yè)設(shè)計(jì)評(píng)分的相關(guān)分析。數(shù)據(jù)如下表:畢業(yè)生編號(hào)A教授B教授115223359496548664732871910710810分析:由于例5.1給出的數(shù)據(jù)為評(píng)分等級(jí),
55、兩個(gè)定序數(shù)據(jù)間的相關(guān)程度測(cè)定可以采用斯皮爾曼秩相關(guān)系數(shù)。利用R語言的函數(shù)cor可直接算出需要的數(shù)值。結(jié)果表明R=0.32120.8, 兩位教授對(duì)10名本科生畢業(yè)設(shè)計(jì)評(píng)分的相關(guān)程度不高。注:斯皮爾曼秩相關(guān)系數(shù)不僅可以直接用等級(jí)來進(jìn)行計(jì)算,也可以將高于定序尺度測(cè)量的數(shù)據(jù)轉(zhuǎn)換為秩次進(jìn)行計(jì)算。其使用范圍比皮爾遜相關(guān)系數(shù)廣?!纠?.2】經(jīng)濟(jì)發(fā)展水平和衛(wèi)生水平之間的相關(guān)分析。 對(duì)某地區(qū)12個(gè)街道進(jìn)行調(diào)查,并對(duì)經(jīng)濟(jì)發(fā)展水平和衛(wèi)生水平按規(guī)定的標(biāo)準(zhǔn)打分,并按從小到大的順序排等級(jí),得到評(píng)分的秩,評(píng)定結(jié)果如下表。街道編號(hào)經(jīng)濟(jì)水平及秩衛(wèi)生水平及秩街道編號(hào)經(jīng)濟(jì)水平及秩衛(wèi)生水平及秩18268697847807287978
56、6878477536016529805764498128810109411961257536411185885868910901112682703結(jié)果表明,R=0.8880.8,該地區(qū)的經(jīng)濟(jì)發(fā)展水平和衛(wèi)生水平存在著正相關(guān),相關(guān)程度較高,為88.8%。3. 同分的處理公式中,u是X中同分的觀測(cè)值數(shù)目,v是Y中同分的觀測(cè)值數(shù)目?!纠?.3】經(jīng)濟(jì)發(fā)展水平和衛(wèi)生水平間的相關(guān)分析某地區(qū)對(duì)24個(gè)地區(qū)進(jìn)行調(diào)查,并對(duì)各地區(qū)的經(jīng)濟(jì)發(fā)展水平和衛(wèi)生水平按規(guī)定標(biāo)準(zhǔn)評(píng)分,結(jié)果如下表。地區(qū)編號(hào)經(jīng)濟(jì)水平衛(wèi)生水平地區(qū)編號(hào)經(jīng)濟(jì)水平衛(wèi)生水平192561368552907014676639071156559487761664585
57、816917615068068186054779621959438777020554597664214634107663224232117454233930126865243831利用R語言的函數(shù)輸出結(jié)果表明,R=0.84900.8,說明經(jīng)濟(jì)水平和衛(wèi)生水平之間存在較高的相關(guān)性。如果不對(duì)同分進(jìn)行修正,強(qiáng)行利用不修正的公式計(jì)算斯皮爾曼秩相關(guān)系數(shù)為0.8491。數(shù)值上與修正結(jié)果有細(xì)微差別,但也是大于0.8的。對(duì)比兩個(gè)R值可知,由于同分的觀測(cè)值數(shù)目占觀測(cè)值總數(shù)目的比例不是很大,因而校正后的R與校正前的R變化不大。校正前的R略大于校正后的R,這說明同分對(duì)R的影響雖然很小,但同分的影響是夸大R值。因此,在
58、X與Y中至少有一個(gè)存在大量同分時(shí),應(yīng)進(jìn)行校正。4. 斯皮爾曼秩相關(guān)的顯著性檢驗(yàn)對(duì)兩個(gè)樣本X和Y計(jì)算斯皮爾曼秩相關(guān)系數(shù)之后,可以根據(jù)相關(guān)系數(shù)的大小,推斷總體秩相關(guān)的方向,并用顯著性檢驗(yàn)進(jìn)行回答。針對(duì)研究問題的不同,可以建立不同的假設(shè)組:為對(duì)假設(shè)作出判定,所需數(shù)據(jù)至少是定序尺度測(cè)量的。檢驗(yàn)統(tǒng)計(jì)量就是斯皮爾曼秩相關(guān)的公式(有同分時(shí)用修正公式),p值為相應(yīng)情況的尾部概率。當(dāng)原假設(shè)為真且樣本量比較大時(shí)備擇假設(shè)精確p值正態(tài)近似p值R的右尾概率Z的右尾概率R的左尾概率Z的左尾概率R的小尾概率的2倍Z的小尾概率的2倍【例5.4】對(duì)例5.3作顯著性檢驗(yàn)。5.2 肯德爾(Kendall)秩相關(guān)肯德爾秩相關(guān)與斯皮爾
59、曼秩相關(guān)一樣,也是用于兩個(gè)樣本相關(guān)程度的測(cè)量,要求數(shù)據(jù)至少是定序尺度的。它也是利用兩組秩次測(cè)定兩個(gè)樣本間相關(guān)程度的一種非參數(shù)統(tǒng)計(jì)方法。1. 基本方法例如,X、Y的秩分別為X:2, 4, 3, 5, 1; Y:3 ,4, 1, 5, 2。 將X的秩按從小到大順序排列后,則X和Y的秩則為下面的形式:X:1,2, 3, 4, 5;Y:2,3, 1, 4, 5。 稱秩的大小方向一致的對(duì)為協(xié)同(concordant)對(duì)或一致對(duì)。由于X的秩次已經(jīng)按自然順序由小到大排列,因此,X的觀測(cè)值每?jī)蓚€(gè)之間都是一致對(duì)??疾靁的秩次情況,第一個(gè)秩為2,第二個(gè)為3,因?yàn)?小于3,是按自然順序增加,因此,這是一個(gè)一致對(duì)。再
60、考察2和1, 因?yàn)?大于1, 不是按自然順序增加排列,所以這是一個(gè)非一致對(duì)。依次考察下去,凡一致對(duì)記為+1分,非一致對(duì)記為-1分。Y的數(shù)對(duì)分?jǐn)?shù)總和2,318個(gè)+2個(gè)-2,1-12,412,513,1-13,413,511,411,514,51若以U表示Y的一致對(duì)數(shù)目,V表示Y的非一致對(duì)數(shù)目,則一致對(duì)評(píng)分與最大可能總評(píng)分之比為當(dāng)X和Y的順序完全一致時(shí),上式的值為1;當(dāng)兩者順序完全相反時(shí),上式值為0;當(dāng)X和Y之間的順序關(guān)系不確定時(shí),該式取值在0和1之間。顯然,X和Y的這種順序關(guān)系反映出兩個(gè)總體之間的某種關(guān)聯(lián)性??系聽栔认嚓P(guān)系數(shù)定義為當(dāng)X和Y的順序關(guān)系完全一致時(shí),T為1;順序關(guān)系完全相反時(shí),T為-1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《眾人行管理咨詢網(wǎng)》課件
- 運(yùn)動(dòng)器材銷售工作總結(jié)
- 2013年高考語文試卷(湖北)(空白卷)
- 租車服務(wù)員工作總結(jié)
- 2006年江西高考語文真題及答案
- 驅(qū)動(dòng)未來新型汽車
- 2023年-2024年項(xiàng)目管理人員安全培訓(xùn)考試題附解析答案可打印
- 2023年-2024年項(xiàng)目部管理人員安全教育培訓(xùn)試題及參考答案【A卷】
- 2023-2024安全培訓(xùn)考試題及答案【名校卷】
- 2023年-2024年項(xiàng)目部安全培訓(xùn)考試題答案完美
- 學(xué)術(shù)不端行為治理研究
- 企業(yè)文化、戰(zhàn)略與電力能源知識(shí)參考題庫練習(xí)卷含答案(一)
- 福建南平武夷高新技術(shù)產(chǎn)業(yè)控股集團(tuán)有限公司招聘筆試沖刺題2024
- 2024年設(shè)備維修部管理制度(6篇)
- GB/T 45083-2024再生資源分揀中心建設(shè)和管理規(guī)范
- 精神科護(hù)理工作計(jì)劃例文
- 2024山地買賣合同模板
- 河北省承德市2023-2024學(xué)年高一上學(xué)期期末物理試卷(含答案)
- 【初中化學(xué)】二氧化碳的實(shí)驗(yàn)室制取教學(xué)課件-2024-2025學(xué)年九年級(jí)化學(xué)人教版上冊(cè)
- 出租車行業(yè)服務(wù)質(zhì)量提升方案
- 景區(qū)安全管理教育培訓(xùn)
評(píng)論
0/150
提交評(píng)論