




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第七章 非參數(shù)方法,非參數(shù)方法(亦稱非參數(shù)檢驗(yàn)),是根據(jù)樣本資料對總體的某種性質(zhì)或關(guān)系進(jìn)行假設(shè)檢驗(yàn)的統(tǒng)計(jì)推斷方法。,主要特點(diǎn),不要求總體分布已知或?qū)傮w分布作任何限制性假定; 不以估計(jì)總體參數(shù)為目的; 能適用于定性變量中的定類數(shù)據(jù)或定序數(shù)據(jù) ,也能適用于定距數(shù)據(jù)和定比數(shù)據(jù)這種定量變量 方法直觀,易于理解,運(yùn)算比較簡單。 缺點(diǎn)是檢驗(yàn)的功效不如參數(shù)檢驗(yàn)方法。,非參數(shù)統(tǒng)計(jì)與傳統(tǒng)的參數(shù)統(tǒng)計(jì)相比,有以下優(yōu)點(diǎn):,非參數(shù)統(tǒng)計(jì)方法要求的假定條件比較少,因而它的適用范圍比較廣泛。 多數(shù)非參數(shù)統(tǒng)計(jì)方法要求的運(yùn)算比較簡單,可以迅速完成計(jì)算取得結(jié)果,因而比較節(jié)約時(shí)間。 大多數(shù)非參數(shù)統(tǒng)計(jì)方法在直觀上比較容易理解,不需要
2、太多的數(shù)學(xué)基礎(chǔ)知識和統(tǒng)計(jì)學(xué)知識。 大多數(shù)非參數(shù)統(tǒng)計(jì)方法可用來分析如象由等級構(gòu)成的數(shù)據(jù)資料,而對計(jì)量水準(zhǔn)較低的數(shù)據(jù)資料,參數(shù)統(tǒng)計(jì)方法卻不適用。 當(dāng)推論多達(dá)3個(gè)以上時(shí),非參數(shù)統(tǒng)計(jì)方法尤具優(yōu)越性。,非參數(shù)統(tǒng)計(jì)方法也有以下缺點(diǎn):,在給定的顯著性水平下進(jìn)行檢驗(yàn)時(shí),非參數(shù)統(tǒng)計(jì)方法與參數(shù)統(tǒng)計(jì)方法相比,第類錯(cuò)誤的概率要大些。 對于大樣本,如不采用適當(dāng)?shù)慕疲?jì)算可能變得十分復(fù)雜。,主要內(nèi)容,成對比較檢驗(yàn),曼惠特尼U檢驗(yàn),游程檢驗(yàn),等級相關(guān)檢驗(yàn),成對比較檢驗(yàn),是對兩個(gè)相關(guān)樣本的比較分析。有符號檢驗(yàn)和威爾科克森符號秩檢驗(yàn)兩種方法。,符號檢驗(yàn),也稱正負(fù)號檢驗(yàn),其基本思想是分析正負(fù)號出現(xiàn)的頻率而忽略具體量的差異,以確
3、定他們是否有顯著差異的一種檢驗(yàn)方法。,符號檢驗(yàn),涉及由n名潛在顧客組成的樣本來確定對某種產(chǎn)品的兩種品牌之一的偏好。 其實(shí)質(zhì)是檢驗(yàn)顧客是否對所比較的兩種品牌存在偏好上的差異。 符號檢驗(yàn)根據(jù)樣本量的不同(小樣本、大樣本),采取不同的檢驗(yàn)方法。 符號檢驗(yàn)的小樣本情形是指n20,作為二項(xiàng)分布處理。 符號檢驗(yàn)的大樣本情形是指n20,作為正態(tài)近似處理。,小樣本情形,P523:陽光海岸農(nóng)場生產(chǎn)一種在市場上名為“柑桔谷”的桔汁,競爭對手生產(chǎn)一種新的名為“熱帶桔”的桔汁飲品,研究人員隨機(jī)調(diào)查了12名消費(fèi)者,結(jié)果如下(“”表示對柑桔谷的偏好,“”表示對熱帶桔的偏好):,解: H0: p=0.5 ; H1:p0.5
4、(雙尾檢驗(yàn),P(0)=0.0002,(BINOMDIST(0,12,0.5,FALSE) P(1)=0.0029, (BINOMDIST(1,12,0.5,FALSE) P(2)=0.0161, (BINOMDIST(2,12,0.5,FALSE),2(P(0)+P(1)+P(2))=0.03840.05,0,1,2,3,4,5,6,可見,拒絕域應(yīng)為0,1,2。,7,8,9,10,11,12,拒絕域,現(xiàn)檢驗(yàn)統(tǒng)計(jì)量()=2 (即2個(gè)加號), 0.03840.05所以,原假設(shè)H0:P=0.5在5%顯著性水平上被拒絕。此研究提供的證據(jù)表明,消費(fèi)者對兩種品牌的桔汁的偏好存在差異。,例 2:隨機(jī)抽取12
5、個(gè)單位,放映一部描述吸煙有害健康的影片, 并調(diào)查得到觀看電影前后各單位職工認(rèn)為吸煙有害的人 數(shù)的百分比。檢驗(yàn)該電影宣傳是否有效果(=0.05)。,解:H0:P=0.5 H1:P 0.5,P(0)=0.0002, P(1)=0.0030, P(2)=0.0161, P(3)=0.0537,P(0)+P(1)+P(2)=0.01930.05,P(3)+0.01930.05370.0193=0.0730.05,0,1,2,3,4,5,6,可見,拒絕域應(yīng)為0,1,2。,7,8,9,10,11,12,拒絕域,現(xiàn)檢驗(yàn)統(tǒng)計(jì)量(-)=3 (即3個(gè)負(fù)號),0.0730.05所以,原假設(shè)H0:P=0.5在5%顯著
6、性水平上不能被拒絕。也即不能認(rèn)為職工在觀看影片前后的認(rèn)識有顯著提高。,大樣本情形,使用零假設(shè)H0:P=0.5和樣本容量n 20,則可以用正態(tài)分布來近似加號個(gè)數(shù)的抽樣分布。 在假設(shè)H0:P=0.5的條件下,加號個(gè)數(shù)的抽樣分布的正態(tài)近似: 均值:u=0.5n 標(biāo)準(zhǔn)差: 檢驗(yàn)統(tǒng)計(jì)量,或:,P524政治民意測驗(yàn)問題,n=200-25=175 U=0.5n=87.5,=6.6,Z=(72-87.5)/6.6=-2.35,2.351.96,所以,拒絕原假設(shè)。認(rèn)為公眾對候選人的對外政策評價(jià)時(shí)有差異的。,例2:隨機(jī)抽取60名消費(fèi)者對甲、乙兩種品牌的飲料評分,甲、乙得分之差為“+”號者35個(gè),“-”號15 個(gè),
7、“0”號10個(gè)。以顯著性水平=0.05檢驗(yàn)兩種飲料是否同等受歡迎。,解:H0:P=0.5, H1:P0.5,n20,按正態(tài)分布近似處理,該成數(shù)抽樣分布的均值和標(biāo)準(zhǔn)差分別為,2.821.96,所以,拒絕原假設(shè)。認(rèn)為兩種飲料并不受到同等歡迎。且乙種優(yōu)于甲種。,檢驗(yàn)步驟,1.確定配對樣本,分別計(jì)算差異正與負(fù)的數(shù)目,無差異則記為0,將它從樣本中剔除,并相應(yīng)地減少樣本容量n,把正負(fù)號數(shù)目之和視為樣本總個(gè)數(shù)(n) 。,2.建立假設(shè):H0: p=0.5 ; H1:p0.5,3.觀察樣本容量,如果n20,則作為二項(xiàng)分布處理 如果n20,則作為正態(tài)近似處理。,4.設(shè)定顯著性水平,并查表確定臨界值,進(jìn)行比較和作出
8、判斷。,威爾科克森符號的等級檢驗(yàn),這種檢驗(yàn)方法不僅考慮了兩組數(shù)據(jù)差異的正、負(fù)號,而且還利用了其差異大小的信息。因此,是一種更為有效的檢驗(yàn)方法。,1、應(yīng)用條件和檢驗(yàn)內(nèi)容與符號檢驗(yàn)相同。,2、方法思想:若關(guān)聯(lián)樣本(匹配樣本)的兩組數(shù)據(jù)沒有顯著差異,則不僅其差異的正、負(fù)符號應(yīng)大致相等,而且將其差的數(shù)值按大小順序排列編自然序號(即秩)后,它們的正號(+)的秩和(記為T+)與負(fù)號(-)的秩和(記為T-)也應(yīng)該大致相等,因此正秩與負(fù)秩將相互抵消,符號秩之和的數(shù)值將接近于零。威爾科克森符號秩檢驗(yàn)就是確定符號秩之和是否顯著地不等于零。,令T表示威爾科克森符號秩檢驗(yàn)中的符號秩之和。如果兩個(gè)總體相同,并且匹配數(shù)據(jù)
9、對的個(gè)數(shù)為10或者更多時(shí), T的抽樣分布近似于如下的正態(tài)分布。,=,檢驗(yàn)統(tǒng)計(jì)量:,標(biāo)準(zhǔn)差:,均值:u=0,檢驗(yàn)步驟,將樣本數(shù)據(jù)配對并計(jì)算各對正負(fù)差值,將差數(shù)取絕對值按從小到大順序排列并編上等級,即確定順序號1、2、3等。對于相等的值,則取其位序的平均數(shù)為等級,建立假設(shè):H0:T+= T- ; H1 : T+ T-(雙側(cè)) H1 :T+T-或T+T-(單側(cè)),計(jì)算檢驗(yàn)統(tǒng)計(jì)量:,設(shè)定,并查表確定臨界值T(或Z/2),比較檢驗(yàn)值與臨界值 作出判斷,TT, 拒絕H0; TT, 接受H0,P527兩種不同的方法完成生產(chǎn)任務(wù)的時(shí)間是否存在顯著差異,2.241.96,所以,拒絕原假設(shè)。認(rèn)為兩種方法在完成任務(wù)
10、的時(shí)間上存在差異。且方法2優(yōu)于方法1。,曼惠特尼U檢驗(yàn),曼惠特尼U檢驗(yàn)適用于從兩個(gè)總體中分別獨(dú)立抽取兩個(gè)樣本的檢驗(yàn),方法思想與威爾科克森秩和檢驗(yàn)相同。,檢驗(yàn)步驟:,從總體A、B中分別獨(dú)立抽取樣本nA和nB,將(nA+nB)個(gè)觀察值從小到大編序,分別計(jì)算兩個(gè)樣本,的秩和TA和TB,建立假設(shè)H0:兩總體A和B相對次數(shù)分布相同 H1:兩總體相對次數(shù)分布不同,當(dāng)n1、n2均大于等于10時(shí), T的抽樣分布近似于如下的正態(tài)分布。,=,檢驗(yàn)統(tǒng)計(jì)量:,標(biāo)準(zhǔn)差:,均值:u=n1(n1+n2+1)/2,P532兩個(gè)分行的支票的賬戶余額是否相同,n1、n2均大于10, T的抽樣分布近似于如下的正態(tài)分布。,檢驗(yàn)統(tǒng)計(jì)量
11、:,標(biāo)準(zhǔn)差:,均值:u=n1(n1+n2+1)/2=12(12+10+1)/2=138,2.081.96,所以,拒絕原假設(shè)。認(rèn)為兩個(gè)分行的賬戶余額存在差異。,克魯斯卡爾-沃利斯檢驗(yàn),MWW檢驗(yàn)是用于檢驗(yàn)兩個(gè)總體是否相同 克魯斯卡爾和沃利斯將其擴(kuò)展到更多總體的情形。(總體K3) 方差分析(AVOVA)可以對多個(gè)總體均值是否相等進(jìn)行檢驗(yàn)。 AVOVA的適用條件是所有總體都服從正態(tài)分布,并要求是定距數(shù)據(jù)或定比數(shù)據(jù)。,檢驗(yàn)步驟,1.從總體A、B、C(K=3)中分別獨(dú)立抽取樣本n1、n2和 n3,將(nT=n1+n2+n3)個(gè)觀察值從小到大編序,分別計(jì)算三個(gè)樣本的秩和R1、R2、R3,2.建立假設(shè):H0
12、: 所有總體相同; H1:并非所有總體都相同,3.觀察樣本容量,如果每個(gè)樣本量都大于5,克魯斯卡爾和沃利斯已經(jīng)證明,統(tǒng)計(jì)量W(卡魯斯卡爾沃利斯檢驗(yàn)統(tǒng)計(jì)量近似服從自由度為(K-1)的X2分布。,4.設(shè)定顯著性水平,并查表確定臨界值,進(jìn)行比較和作出判斷。,W=,P536:威廉姆斯制造公司招聘問題。(從三所大學(xué)招聘來的管理人員是否有差別),W=,nT=7+6+7=20,=,W=8.92臨界值CHIINV(0.025,2)=7.378,P值 CHIDIST(8.92,2)=0.011560.05,結(jié)論:3個(gè)總體不相同,游程檢驗(yàn),一、什么是游程檢驗(yàn),游程檢驗(yàn)(亦稱連貫檢驗(yàn))是根據(jù)樣本標(biāo)志表現(xiàn)排列所形成的
13、游程的多少進(jìn)行判斷的檢驗(yàn)方法。,設(shè)某樣本n=12人的標(biāo)志表現(xiàn)為男、女,有以下三種排列。,(i) 男,男,女,女,女,男,女,女,男,男,男,男 (ii) 男,男,男,男,男,男,男,女,女,女,女,女 (iii) 男,女,男,女,男,女,男,女,男,女,男,男,連續(xù)出現(xiàn)男或女的區(qū)段稱為游程。每個(gè)游程包含的個(gè)數(shù)為游程長度。以r表示序列中游程的個(gè)數(shù):,(i)r=5, (ii)r=2, (iii) r=11,(i)是隨機(jī)性序列;(ii)(iii)是非隨機(jī)性序列,所以,可以用游程的個(gè)數(shù)來檢驗(yàn)樣本的隨機(jī)性,或總體的分布特征。,二、游程檢驗(yàn)方法,1檢驗(yàn)總體分布是否相同。,將從兩個(gè)總體中獨(dú)立抽取的兩個(gè)樣本的
14、觀察值混合有序后,觀察游程個(gè)數(shù),進(jìn)行比較。,2檢驗(yàn)樣本的隨機(jī)性,將取自某一總體的樣本的觀察值按從小到大順序排列,找出中位數(shù)(或平均數(shù)),分為大于中位數(shù)的小于中位數(shù)的兩個(gè)部分。用上下交錯(cuò)形成的游程個(gè)數(shù)來檢驗(yàn)樣本是否是隨機(jī)的。,3檢驗(yàn)規(guī)則(小樣本,n1與n2都小于20),應(yīng)用表La和Lb,(=0.05,r為臨界值),(1)單側(cè)檢驗(yàn):,觀察到的游程個(gè)數(shù) ro臨界值(La表),或ro臨界值(Lb表),反之,接受Ho。,(2)雙側(cè)檢驗(yàn):,觀察到的游程個(gè)數(shù)ro,r(La)ror(Lb) 接受Ho 下限 上限,反之,拒絕Ho,否定Ho,4大樣本(n1或n2大于20),游程個(gè)數(shù)r近似正態(tài)分布,檢驗(yàn)統(tǒng)計(jì)量,其中
15、:,例1:對某校16名學(xué)生進(jìn)行口試測試,按他們進(jìn)入試場的先后次序,將成績記錄如下:,61,74,70,63,64,58,82,78,60,76,85,72,68,54,62,56,試問:該樣本在0.05的顯著水平下是否具有隨機(jī)性?,解:(1)建立假設(shè): H0:該樣本具有隨機(jī)性;H1:該樣本不具有隨機(jī)性。,(2)將成績按大小順序排列,計(jì)算中位數(shù)為: (64+68)/2=66 (3)按原記錄的順序,用x表示小于66分的成績,用y表示大于66分的成績,得到如下序列:,x,y,y,x,x,x,y,y,x,y,y,y,y,x,x,x,游程個(gè)數(shù):r=7 查表得:r(la)=4;r(lb)=14 4714
16、故:不能拒絕原假設(shè),認(rèn)為該樣本具有隨機(jī)性。,例2:某汽油站有兩種商標(biāo)的汽油A和B,某天售出的50桶汽油可按商標(biāo)A和商標(biāo)B排成以下的順序:,AABAABABBAAABBABBABBABBABBAABBBBAABABABAAABAAAAABB,試問:這一序列在0.05的顯著水平下是否具有隨機(jī)性?,解:(1)建立假設(shè): H0:該序列具有隨機(jī)性;H1:該序列不具有隨機(jī)性。,(2)A的數(shù)目:n1=26, B的數(shù)目:n2=24,游程個(gè)數(shù):r=7,顯著性水平為0.05時(shí),z的臨界值為1.96,0.580.05 故:不能拒絕原假設(shè),認(rèn)為該序列具有隨機(jī)性,等級相關(guān)檢驗(yàn),將兩組變量按順序等級排列,在等級的基礎(chǔ)上計(jì)
17、算等級相關(guān)系數(shù),從而反映兩組變量之間聯(lián)系的密切程度。,等級相關(guān)系數(shù)的計(jì)算公式,其中di為兩變量每一對樣本的等級之差,n為樣本容量。,等級相關(guān)系數(shù)與相關(guān)系數(shù)一樣,取值-1到+1之間,區(qū)別是它是建立在等級的基礎(chǔ)上計(jì)算的,較適用于反映序列變量的相關(guān)。,一、等級相關(guān)檢驗(yàn)的基本原理,二、等級相關(guān)系數(shù)的應(yīng)用,利用斯皮爾曼等級相關(guān)系數(shù),可以對兩序列變量是否相關(guān)進(jìn)行檢驗(yàn)。,(一)檢驗(yàn)的假設(shè),(1)H0:rs=0 , Xi和Yi 相互獨(dú)立;,H1:Xi和Yi不獨(dú)立。(此為雙側(cè)檢驗(yàn)),(2)H0: rs=0 ,Xi和Yi相互獨(dú)立; H1: Xi和Yi是正相關(guān)。(即Xi的大值與Yi的大值相配對),(3)H0: rs=0 ,Xi和Yi相互獨(dú)立; H1:Xi和Yi是負(fù)相關(guān)。(即
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 衛(wèi)星遙感數(shù)據(jù)分析師崗位面試問題及答案
- 2025屆湖南省瀏陽一中、株洲二中等湘東五校高二下化學(xué)期末教學(xué)質(zhì)量檢測試題含解析
- 2025屆遼寧省本溪市高一化學(xué)第二學(xué)期期末教學(xué)質(zhì)量檢測模擬試題含解析
- 2025屆廣東省河源市連平縣連平中學(xué)高一下化學(xué)期末教學(xué)質(zhì)量檢測試題含解析
- 2025屆河北省石家莊市新樂培英中學(xué)高一化學(xué)第二學(xué)期期末綜合測試試題含解析
- 園區(qū)管理辦法教案小班
- 機(jī)場應(yīng)急預(yù)案管理辦法
- 智能投顧技術(shù)演進(jìn)-洞察及研究
- 建筑文明施工方案
- 發(fā)票管理辦法發(fā)票使用
- 2025年入黨培訓(xùn)測試題庫及答案
- 科創(chuàng)板開戶測試題及答案
- 內(nèi)科護(hù)理學(xué)消化性潰瘍
- 北京市第一零一中學(xué)2023-2024學(xué)年高一下學(xué)期期末考試地理試題(解析版)
- 中小學(xué)暑期安全教育班會課件
- DB43-T 2988-2024 再生稻高產(chǎn)栽培技術(shù)規(guī)程
- 2024年荊州市荊發(fā)控股集團(tuán)招聘考試真題
- 慢病智能監(jiān)測-洞察及研究
- 部門預(yù)算支出經(jīng)濟(jì)分類科目
- 2025年內(nèi)蒙古呼倫貝爾農(nóng)墾集團(tuán)有限公司招聘筆試沖刺題(帶答案解析)
- 《健康管理師》職業(yè)技能競賽考試題(附答案)
評論
0/150
提交評論