第8章非參數檢驗_第1頁
第8章非參數檢驗_第2頁
第8章非參數檢驗_第3頁
第8章非參數檢驗_第4頁
第8章非參數檢驗_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

會計學1第8章非參數檢驗8-2第八章非參數檢驗第一節(jié)非參數檢驗概述第二節(jié)符號檢驗與符秩檢驗第三節(jié)秩和檢驗與檢驗第四節(jié)等級相關檢驗第五節(jié)EXCEL在非參數檢驗中的應用第1頁/共60頁8-3第一節(jié)非參數檢驗概述一、什么是非參數檢驗二、非參數檢驗的優(yōu)缺點第2頁/共60頁8-4一、什么是非參數檢驗

所謂非參數檢驗,又被稱為自由分布檢驗,它是一種不需要事先對總體分布的形狀加以限制而進行的假設檢驗。應當指出,這里所謂的“非參數”,只是指在檢驗的過程中,未對檢驗統計量服從的分布及參數做出限制,并不意味著在檢驗中“不涉及參數”或“不對參數進行檢驗”。第3頁/共60頁8-5二、非參數檢驗的優(yōu)缺點優(yōu)點:首先,檢驗條件比較寬松,適應性強。非參數檢驗對資料的要求不像參數檢驗那樣嚴格,它適合于處理諸如非正態(tài)的、方差不等的或分布形狀未知的資料。其次,自由分布檢驗的方法比較靈活,用途廣泛。它不但可以應用于處理測量層次較高的定距、定比數據,也適用于處理層次較低的定類、定序數據。對于那些不能進行加、減、乘、除運算的定類數據與定序數據,也可進行檢驗。再次,自由分布檢驗的計算相對簡單。由于自由分布的檢驗方法不用復雜計算,一般使用計數方法就可以了,它的計數過程與結果都比較簡單、直觀與明顯。第4頁/共60頁8-6缺點:它對原始數據中包含的信息利用得不夠充分,檢驗的功效相對較弱。

結論:參數檢驗與非參數檢驗是針對不同情況提出的兩種統計方法,它們各有優(yōu)缺點,可互為補充。

第5頁/共60頁8-7第二節(jié)符號檢驗與符秩檢驗一、單總體問題的符號檢驗二、兩總體問題的符號檢驗三、威爾科克森配對符號秩檢驗第6頁/共60頁8-8一、單總體問題的符號檢驗單總體符號檢驗適用于檢驗總體中位數是否在某一指定位置。第7頁/共60頁8-9第8頁/共60頁8-10二、兩總體問題的符號檢驗兩總體符號檢驗適用于檢驗配對樣本情形下,兩總體分布在位置特征上是否有差異。所謂配對樣本,是指對每一個觀測單元(個體)作兩次觀測。第9頁/共60頁8-11第10頁/共60頁8-12第11頁/共60頁8-13第12頁/共60頁8-14三、威爾科克森配對符號秩檢驗

以上所介紹的兩總體情形下符號檢驗方法,僅僅用配對觀測之間差別的符號進行檢驗,而不注重差別的大小,因此對資料的利用不夠充分。當配對觀測之間的差別可以從數量上來測定時,威爾科克森(Wilcoxon)配對符號秩檢驗比符號檢驗更有效。第13頁/共60頁8-15第14頁/共60頁8-16第15頁/共60頁8-17第16頁/共60頁8-18第三節(jié)秩和檢驗與檢驗一、秩和檢驗二、皮爾遜統計量三、分布擬合檢驗第17頁/共60頁8-19一、秩和檢驗

秩和檢驗可用于檢驗兩個獨立樣本是否來自具有相同位置特征的總體。這里要求兩個總體具有相同的分布形狀(不論是何種分布形狀)。第18頁/共60頁8-20第19頁/共60頁8-21第20頁/共60頁8-22第21頁/共60頁8-23第22頁/共60頁8-24二、皮爾遜統計量第23頁/共60頁8-25第24頁/共60頁8-26第25頁/共60頁8-27三、分布擬合檢驗

在理論研究和實際應用中,常常根據所作隨機試驗的特點,認定無限總體的分布符合某種概率分布模型,這時,說該無限總體具有已知的分布。但是,有許多時候,無法根據所作隨機試驗認定無限總體符合何種概率分布模型。這時,便需要根據統計數據提供的信息,為總體選配一個合適的概率分布模型。第26頁/共60頁8-28一般作法是:首先,對樣本數據作分組整理,計算各組的頻率,稱所得到的分布列為經驗分布;其次,根據有關理論和實際知識以及經驗分布的特點,猜測無限總體的分布符合某種概率模型,稱所選擇的概率模型為理論分布;然后,用顯著性檢驗的方法,將經驗分布與理論分布作比較,檢驗觀察到的差異能否顯著地表明兩種分布的真實差異存在,如果表明真實差異存在的證據不足,則可以期望所選理論分布能較好地描述所研究的無限總體的分布規(guī)律。這類顯著性檢驗稱作分布擬合檢驗。分布擬合檢驗的方法很多,我們只介紹分布擬合的皮爾遜檢驗。第27頁/共60頁8-29第28頁/共60頁8-30第29頁/共60頁8-31表8-1 鐘表走時誤差的經驗分布與理論分布的比較第30頁/共60頁8-32第31頁/共60頁8-33第32頁/共60頁8-34第四節(jié)等級相關檢驗一、斯皮爾曼等級相關系數二、斯皮爾曼等級相關系數的統計檢驗三、兩點說明第33頁/共60頁8-35一、斯皮爾曼等級相關系數

第七章所討論的兩變量之間相關系數的前提是:兩隨機變量的聯合分布是二維正態(tài)分布。當隨機變量的分布不能滿足正態(tài)性要求時,或者所要研究的變量不是數量型變量時,通常的相關分析方法不宜使用,而需要利用斯皮爾曼等級相關系數進行考察。第34頁/共60頁8-36第35頁/共60頁8-37第36頁/共60頁8-38二、斯皮爾曼等級相關系數的統計檢驗第37頁/共60頁8-39第38頁/共60頁8-40三、兩點說明(一)等級相關檢驗適用于變量值表現為等級的變量。不過,對于變量值表現為數值而不是等級的變量,有時也可以把它劃分為若干等級,用等級相關的方法來研究。這樣做是出于下面的一些理由:(1)無法假定總體的分布;(2)其中有一個變量是只能用等級來反映的;(3)把測量值劃分為等級更能反映事物的本質(例如,把年齡按生命過程階段劃分比用實際年齡更便于研究生命過程的統計規(guī)律)。把測量值轉換為等級的方法是:首先,按實際觀察值大小排序,并賦予每個觀察值秩次;其次,把測量值的取值范圍劃分為若干等級區(qū)間。第39頁/共60頁8-41(二)斯皮爾曼等級相關系數是以變量沒有相同等級為前提的。但有時,觀察結果出現了相同的等級,這時,須計算這幾個觀察結果所在位置秩次的簡單算術平均數作為它們相應的等級。在這種情形下應用斯皮爾曼等級相關系數計算公式所得之結果顯然只是近似的。若相同等級不是太多,可以近似應用上述公式,否則應加以修正。第40頁/共60頁8-42第五節(jié)EXCEL在非參數檢驗中的應用一、符號檢驗二、威爾科克森配對符號秩檢驗三、分布擬合的皮爾遜卡方檢驗第41頁/共60頁8-43一、符號檢驗第42頁/共60頁8-44利用Excel求解步驟如下:(一)輸入數據,見圖8-1。A、B列為原始輸入數據,樣本數據存放在A2:A29單元格區(qū)域,圖中未完全顯示出來,D、E列為計算得出的結果。(二)計算樣本觀察值大于中位數的個數(即正號的個數)。在E1中輸入公式如下的公式=COUNTIF(A2:A29,">90")COUNTIF函數計算區(qū)域中滿足給定條件的單元格的個數。(三)計算樣本容量n(不含0差數)。在E2中輸入公式=COUNT(A2:A29)-COUNTIF(A2:A29,"=90")第43頁/共60頁8-45(四)使用公式8.1計算檢驗統計量Z。在E3中輸入公式=(E1-0.5*E2)/SQRT(0.25*E2)(五)計算臨界值Zα/2。在E4中輸入公式“=ABS(NORMSINV(B2/2))”。圖8-1(六)結論。由于-4.54<-1.96,檢驗統計量的樣本值落在拒絕域,故否定原假設。總體中位數不是90。第44頁/共60頁8-46二、威爾科克森配對符號秩檢驗【例8-4】從某專業(yè)學生中簡單隨機抽取20人,先后兩次組織某種測驗。兩次測驗結果如下:試用威爾科克森配對符號秩檢驗法檢驗,該專業(yè)學生在兩次測驗的時間上,該項成績水平有無改變。(顯著水平0.05)

第一次3271353142101764410264第二次685717524781624311870第一次21484557723587507238第二次40303980796477368938第45頁/共60頁8-47第46頁/共60頁8-48第47頁/共60頁8-49圖8-2第48頁/共60頁8-50(二)計算|di|的秩。

1.按|di|大小進行升序排位(由于第20個學生的成績差為0,所以該同學的|di|不參加排位)。在F2中輸入公式“=RANK(E2,E$2:E$20,1)”,再次公式復制到F3:F20區(qū)域即可。

RANK函數返回一個數字在數字列表中的排位,第2個參數指定參與排位的所有數字,第1個參數則是數字列表中需要找到排位的某個數字,第3個參數指定數字列表排序的方式,1為升序,0為降序。

RANK函數對重復數的排位相同。但重復數的存在將影響后續(xù)數值的排位。例如,本例是升序排位,6出現兩次,其排位為3,則大于6的最小的數字7的排位是5(沒有排位為4的數字)。

第49頁/共60頁8-512.求重復數字的秩次。此處需要考慮重復數字的排位次序。如本例,有兩個同學的|di|為6,其秩次應是3.5。此時,必須計算一個修正數。在G2單元格中輸入如下公式:

=(COUNT(F$2:F$20)+1-RANK(F2,F$2:F$20)-RANK(F2,F$2:F$20,1))/2

并將該公式復制到G3:G20區(qū)域即可。從計算結果可以看出,如果某個數字是唯一的,則它的修正數為0。第50頁/共60頁8-523.求秩。將F列與G列相加即可。在H2中輸入公式“=F2+G2”,并將公式復制到H3:H20區(qū)域。最終結果見圖8-2。第51頁/共60頁8-53(三)計算正秩與負秩的和。在圖8-2所示的工作表上繼續(xù)這一工作,后續(xù)的工作表見圖

8-3。圖中L1、M1中的內容就是D1的內容(即成績差的字段名),只要在L1、M1中輸入公式“=D1”即可。在J2和K2分別輸入如下公式,便可得到正秩和與負秩和。

=DSUM(D1:H20,"秩",L1:L2)=DSUM(D1:H20,"秩",M1:M2)第52頁/共60頁8-54DSUM是數據庫函數,第一個函數指定數據庫區(qū)域,第二個參數指定是對哪一列數據進行求和,最后一個參數指定求和的條件。具體用法請查閱Excel幫助。圖8-3第53頁/共60頁8-55(四)結論。檢驗統計量T=74.5,查附表知,n=19,單側0.025顯著水平的臨界值為T0.025=46,由于74.5>46,檢驗統計量的樣本值落在拒絕域,故否定原假設。所以說,該專業(yè)學生在兩次測驗的時間上,該項成績水平有改變。第54頁/共60頁8-56三、分布擬合的皮爾遜卡方檢驗【例8-5】用Excel實現本章例8-1的計算過程。解:主要操作步驟如下。(一)構造工作表,見圖8-4。圖中方框之內為計算所得結果,方框之外為原始的輸入數據。圖8-4第55頁/共60頁8-57第56頁/共60頁8-58第57頁/共60頁8-59

本章小結1.非參數

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論