版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
非參數(shù)統(tǒng)計(jì)非參數(shù)統(tǒng)計(jì)講義一緒論教學(xué)要求
本課程的目的是使學(xué)生認(rèn)識(shí)到非參數(shù)統(tǒng)計(jì)方法是統(tǒng)計(jì)中最常用的推斷方法之一,理解非參數(shù)統(tǒng)計(jì)方法和參數(shù)統(tǒng)計(jì)方法的區(qū)別,理解非參數(shù)統(tǒng)計(jì)的基本概念,掌握非參數(shù)統(tǒng)計(jì)的基本理論和計(jì)算,能應(yīng)用統(tǒng)計(jì)軟件和非參數(shù)統(tǒng)計(jì)方法分析解決實(shí)際問(wèn)題。非參數(shù)統(tǒng)計(jì)講義一緒論統(tǒng)計(jì)是分析數(shù)據(jù)信息的科學(xué)
這個(gè)定義決定了統(tǒng)計(jì)的命運(yùn):和數(shù)學(xué)不同,統(tǒng)計(jì)不能欣賞自己,它不為實(shí)際服務(wù)就沒(méi)有存在必要統(tǒng)計(jì)必須為各個(gè)領(lǐng)域服務(wù)統(tǒng)計(jì)必須和數(shù)據(jù)打交道因此,統(tǒng)計(jì)必須和計(jì)算機(jī)結(jié)合非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)產(chǎn)生的背景問(wèn)題學(xué)生請(qǐng)假與星期幾有關(guān)嗎?股票漲跌與星期幾有關(guān)嗎?夫妻的審美觀(guān)有差異嗎?廣告的播出時(shí)間與電腦銷(xiāo)量有關(guān)嗎?嬰兒出生數(shù)白天與晚上有明顯差異嗎非參數(shù)統(tǒng)計(jì)講義一緒論
用實(shí)例說(shuō)明非參數(shù)統(tǒng)計(jì)方法和參數(shù)統(tǒng)計(jì)方法的區(qū)別,使學(xué)生認(rèn)識(shí)到學(xué)習(xí)非參數(shù)統(tǒng)計(jì)方法的必要性。第一講非參數(shù)統(tǒng)計(jì)概論非參數(shù)統(tǒng)計(jì)講義一緒論參數(shù)統(tǒng)計(jì)與非參數(shù)統(tǒng)計(jì)的比較經(jīng)典統(tǒng)計(jì)的多數(shù)檢驗(yàn)都假定了總體的背景分布。分布由參數(shù)決定的,期望與方差總體的分布形式或分布族往往是給定的或者是假定了的,所不知道的僅僅是一些參數(shù)得知或它們的范圍。人們的主要任務(wù)就是對(duì)一些參數(shù),比如均值和方差(或標(biāo)準(zhǔn)差)進(jìn)行估計(jì)或檢驗(yàn)。非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)非參數(shù)統(tǒng)計(jì)方法(NonparametricStatisticalmethod)對(duì)總體的概率分布假定以及測(cè)量尺度的要求即使有也很少的統(tǒng)計(jì)方法。當(dāng)能夠得到分類(lèi)數(shù)據(jù)和順序數(shù)據(jù)時(shí)可以使用的方法。也稱(chēng)為無(wú)分布方法(Distribution-freeStatisticsmethods),也稱(chēng)自由分布統(tǒng)計(jì)學(xué)。表示無(wú)需對(duì)總體概率分布做出假定。因常按大小或出現(xiàn)先后次序排列資料進(jìn)行分析,故又稱(chēng)次序統(tǒng)計(jì)學(xué)(OrderStatistics)非參數(shù)統(tǒng)計(jì)講義一緒論什么是非參數(shù)檢驗(yàn)?不假定了總體的具體背景分布形式。這些檢驗(yàn)多根據(jù)數(shù)據(jù)觀(guān)測(cè)值的相對(duì)大小建立檢驗(yàn)統(tǒng)計(jì)量,然后找到在零假設(shè)下這些統(tǒng)計(jì)量的分布??催@些統(tǒng)計(jì)量的數(shù)據(jù)實(shí)現(xiàn)是否在零假設(shè)下屬于小概率事件。這種和數(shù)據(jù)本身的總體分布無(wú)關(guān)的檢驗(yàn)稱(chēng)為非參數(shù)檢驗(yàn)。非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)檢驗(yàn)有什么優(yōu)越性?在總體分布未知時(shí),如果還假定總體有諸如正態(tài)分布那樣的已知分布,在進(jìn)行統(tǒng)計(jì)推斷就可能產(chǎn)生錯(cuò)誤甚至災(zāi)難。非參數(shù)檢驗(yàn)總是比傳統(tǒng)檢驗(yàn)安全。但是在總體分布形式已知時(shí),非參數(shù)檢驗(yàn)就不如傳統(tǒng)方法效率高。但非參數(shù)統(tǒng)計(jì)在總體分布未知時(shí)效率要比假定了錯(cuò)誤總體分布時(shí)的傳統(tǒng)方法要高,有時(shí)要高很多。非參數(shù)統(tǒng)計(jì)講義一緒論哪個(gè)好?非參數(shù)統(tǒng)計(jì)講義一緒論選擇飛機(jī)與選擇用參數(shù)與非參數(shù)方法的思路相同。大型飛機(jī)很好,但對(duì)機(jī)場(chǎng)的要求很高。參數(shù)統(tǒng)計(jì)對(duì)數(shù)據(jù)要求很高。小型飛機(jī)不一定舒適,但起降時(shí)對(duì)機(jī)場(chǎng)的要求很低。同理非參數(shù)統(tǒng)計(jì)對(duì)數(shù)據(jù)要求較低。非參數(shù)統(tǒng)計(jì)講義一緒論統(tǒng)計(jì)方法的選擇:用參數(shù)統(tǒng)計(jì)方法與非參數(shù)統(tǒng)計(jì)方法1、考慮對(duì)總體的假定。對(duì)總體有假定時(shí)用參數(shù),已具備使用參數(shù)統(tǒng)計(jì)方法時(shí)一般不用非參數(shù)統(tǒng)計(jì)。2、數(shù)據(jù)的度量尺度。定距與定比可以用參數(shù)。非參數(shù)統(tǒng)計(jì)方法的應(yīng)用條件:1、用于分析定類(lèi)數(shù)據(jù)2、用于分析定序數(shù)據(jù)3、用于分析定距、定比數(shù)據(jù)時(shí)總體分布未做假定。非參數(shù)統(tǒng)計(jì)講義一緒論參數(shù)統(tǒng)計(jì)(ParametricStatisticalmethod)有兩個(gè)特點(diǎn):1、以推斷某特定參數(shù)為對(duì)象。如總體均值μ,總體比例P,總體方差,兩個(gè)總體殫值的差等。2、常需要假定總體的分布是已知的,有的要假設(shè)總體是服從正態(tài)分布的,才能作出推斷。非參數(shù)統(tǒng)計(jì)講義一緒論數(shù)據(jù)的四種尺度:定類(lèi)、定序、定距、定比對(duì)定類(lèi)和定序的只能用非參數(shù)統(tǒng)計(jì)分析方法非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)檢驗(yàn)的特點(diǎn)1、非參數(shù)統(tǒng)計(jì)方法應(yīng)用廣泛。2、它對(duì)資料的要求易于得到滿(mǎn)足。3、當(dāng)總體分布有具體形式未知,而且樣本容量很小時(shí),無(wú)法用參數(shù)統(tǒng)計(jì)方法,只能用非參數(shù)方法。4、大多數(shù)非參數(shù)統(tǒng)計(jì)方法簡(jiǎn)單、直觀(guān)、易于掌握和應(yīng)用。5、總體分布形式已知時(shí),非參數(shù)統(tǒng)計(jì)的方法的檢驗(yàn)功效不如假定總體已知的各種參數(shù)統(tǒng)計(jì)方法。非參數(shù)統(tǒng)計(jì)講義一緒論6、非參數(shù)統(tǒng)計(jì)方法所推斷的通常不是總體參數(shù)7、其通常按大小或出現(xiàn)先后順序排列的資料進(jìn)行分析。8、通常以中位數(shù)代表分布的中心,以極差代表離散程度。非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)的主要內(nèi)容內(nèi)容非參數(shù)檢驗(yàn)相應(yīng)的參數(shù)檢驗(yàn)2獨(dú)立樣本中位數(shù)檢驗(yàn)秩和檢驗(yàn)獨(dú)立樣本t檢驗(yàn)2配對(duì)樣本/單一樣本符號(hào)檢驗(yàn)Wilcoxon檢驗(yàn)成對(duì)樣本t-檢驗(yàn)>2獨(dú)立樣本Kruskal-Wallis檢驗(yàn)單一因素ANOVA兩因素Friedman檢驗(yàn)雙因素ANOVA相關(guān)性檢驗(yàn)Spearman秩相關(guān)Pearson相關(guān)性檢驗(yàn)分布的檢驗(yàn)Kolmogorov-Smirnov非參數(shù)統(tǒng)計(jì)講義一緒論MatrixofNonparametricStatisticsLevelofMeasurementNonparametricTestNonparametricCorrelationOneSampleTwoSamplesKSamplesRelatedUnrelatedRelatedUnrelatedNominalBinomialTestChi-SquareTestMcNemarChangeTestFisherExactTestfor2x2TablesChi-SquareTestforrx2TablesCochranQTestChi-SquareTestforrxkTablesCramerCoefficientPhiCoefficientKappaCoefficientAsymmetricalLambdaStatisticOrdinalKolmogorov-SmirnovOne-SampleTestOne-SampleRunsTestChange-PointTestSignTestWilcoxonSignedRanksTestMedianTestMann-WhitneyUTestRobustRank-OrderTestKolmogorov-SmirnovTwo-SampleTestSiegel-TukeyTestforScaleDifferencesFriedmanTwo-WayANOVAbyRanksPageTestforOrderedAlternativesExtensionoftheMedianTestKruskal-WallisOne-WayANOVAJonckheereTestforOrderedAlternativesSpearmanRank-OrderCoefficientKendallRank-OrderCoefficientKendallPartialRank-OrderCoefficientKendallCoefficientofConcordanceKendallCoefficientofAgreementCorrelationBetweenkJudgesandaCriterionTestGammaStatisticSomer’sIndexofAsymmetricAssociation非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)的歷史非參數(shù)統(tǒng)計(jì)的形成主要?dú)w功于20世紀(jì)40年代~50年代化學(xué)家F.Wilcoxon等人的工作。Wilcoxon于1945年提出兩樣本秩和檢驗(yàn),1947年Mann和Whitney二人將結(jié)果推廣到兩組樣本量不等的一般情況;Pitman于1948年回答了非參數(shù)統(tǒng)計(jì)方法相對(duì)于參數(shù)方法來(lái)說(shuō)的相對(duì)效率方面的問(wèn)題;非參數(shù)統(tǒng)計(jì)講義一緒論60年代中后期,Cox和Ferguson最早將非參數(shù)方法應(yīng)用于生存分析。70年代到80年代,非參數(shù)統(tǒng)計(jì)借助計(jì)算機(jī)技術(shù)和大量計(jì)算獲得更穩(wěn)健的估計(jì)和預(yù)測(cè),以P.J.Huber以及F.Hampel為代表的統(tǒng)計(jì)學(xué)家從計(jì)算技術(shù)的實(shí)現(xiàn)角度,為衡量估計(jì)量的穩(wěn)定性提出了新準(zhǔn)則。非參數(shù)統(tǒng)計(jì)講義一緒論90年代有關(guān)非參數(shù)統(tǒng)計(jì)的研究和應(yīng)用主要集中在非參數(shù)回歸和非參數(shù)密度估計(jì)領(lǐng)域,其中較有代表性的人物是Silverman和J.Fan。非參數(shù)統(tǒng)計(jì)分為廣義的和狹義的兩種狹義的非參數(shù)統(tǒng)計(jì)主要研究假設(shè)檢驗(yàn),本課程研究狹義的。廣義的非參數(shù)統(tǒng)計(jì)只要不考慮總體的分布的統(tǒng)計(jì)分析方法非參數(shù)統(tǒng)計(jì)講義一緒論但是在總體分布形式已知時(shí),非參數(shù)檢驗(yàn)就不如傳統(tǒng)方法效率高。這是因?yàn)榉菂?shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗(yàn)無(wú)法拒絕。但非參數(shù)統(tǒng)計(jì)在總體未知時(shí)效率要比傳統(tǒng)方法要高,有時(shí)要高很多。是否用非參數(shù)統(tǒng)計(jì)方法,要根據(jù)對(duì)總體分布的了解程度來(lái)確定。
非參數(shù)統(tǒng)計(jì)講義一緒論
因?yàn)榉菂?shù)統(tǒng)計(jì)方法不利用關(guān)于總體分布的知識(shí),所以,就是在對(duì)總體的任何知識(shí)都沒(méi)有的情況下,它也能很容易而又很可靠地獲得結(jié)論。這時(shí)非參數(shù)方法往往優(yōu)于參數(shù)方法,并且非參數(shù)檢驗(yàn)總是比傳統(tǒng)檢驗(yàn)安全。非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論數(shù)據(jù)的秩秩(rank)利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是大多數(shù)非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)。多數(shù)非參數(shù)檢驗(yàn)明顯地或隱含地利用了秩的性質(zhì);但也有一些非參數(shù)方法沒(méi)有涉及秩的性質(zhì)。非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)檢驗(yàn)中秩是最常使用的概念。什么是一個(gè)數(shù)據(jù)的秩呢?一般來(lái)說(shuō),秩就是該數(shù)據(jù)按照升冪排列之后,每個(gè)觀(guān)測(cè)值的位置。
非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論秩(rank)
非參數(shù)檢驗(yàn)中秩是最常使用的概念。什么是一個(gè)數(shù)據(jù)的秩呢?一般來(lái)說(shuō),秩就是該數(shù)據(jù)按照升冪排列之后,每個(gè)觀(guān)測(cè)值的位置。例如我們有下面數(shù)據(jù)Xi159183178513719Ri75918426310這下面一行(記為Ri)就是上面一行數(shù)據(jù)Xi的秩。
非參數(shù)統(tǒng)計(jì)講義一緒論159183178513719數(shù)據(jù)輸入SPSS非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論例題:某學(xué)院本科三年級(jí)有9個(gè)專(zhuān)業(yè)組成,統(tǒng)計(jì)每個(gè)專(zhuān)業(yè)學(xué)生每月消費(fèi)數(shù)據(jù)如下,用SPSS求消費(fèi)數(shù)據(jù)的秩和順序統(tǒng)計(jì)量的現(xiàn)值:
300230208580690200263215520非參數(shù)統(tǒng)計(jì)講義一緒論2.有結(jié)數(shù)據(jù)的秩設(shè)樣本X1,X2,…,XN取自總體X的簡(jiǎn)單隨機(jī)抽樣,將數(shù)據(jù)排序后,相同的數(shù)據(jù)點(diǎn)組成一個(gè)“結(jié)”,稱(chēng)重復(fù)數(shù)據(jù)的個(gè)數(shù)為結(jié)長(zhǎng)。例1:3.83.21.21.23.43.23.2解:結(jié)長(zhǎng)為3。非參數(shù)統(tǒng)計(jì)講義一緒論統(tǒng)計(jì)推斷:假設(shè)檢驗(yàn)假設(shè)檢驗(yàn):假設(shè)檢驗(yàn)是指我們可以對(duì)某一參數(shù)的假定值進(jìn)行先驗(yàn)判斷或預(yù)期,然后利用小概率原理對(duì)其進(jìn)行檢驗(yàn),得到接受或拒絕原假設(shè)的結(jié)論。小概率原理:我們認(rèn)為小概率事件由于發(fā)生的可能性很小,在一次試驗(yàn)中它幾乎是不會(huì)發(fā)生的。如果發(fā)生了,說(shuō)明我們的假設(shè)有問(wèn)題,所以我們將拒絕原來(lái)的假設(shè)。非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論參數(shù)統(tǒng)計(jì)的假設(shè)檢驗(yàn)如:檢驗(yàn)正態(tài)分布的均值是否相等H0:u1=u2;H1:u1≠u(mài)2檢驗(yàn)均值是否等于零H0:u=0;H1:u≠0
非參數(shù)統(tǒng)計(jì)講義一緒論例8-5
用自動(dòng)裝袋機(jī)裝葡萄糖,每袋標(biāo)準(zhǔn)重500克,每隔一定時(shí)間需檢查機(jī)器工作是否正常.現(xiàn)抽得10袋,測(cè)得其重量為(單位:克)495,510,505,498,503,492,502,512,497,506,假定重量服從正態(tài)分布,問(wèn)機(jī)器是否正常?解由于
2未知,所以用T檢驗(yàn)法提出假設(shè)非參數(shù)統(tǒng)計(jì)講義一緒論所以應(yīng)接受H0,可以認(rèn)為,機(jī)器工作正常.對(duì)拒絕域P值,由T=0.9733,df=9,可得(EXCEL函數(shù)=TDIST(0.9733,9,2)=0.35583559非參數(shù)統(tǒng)計(jì)講義一緒論假定甲、乙兩機(jī)床截下的長(zhǎng)度方差相等,問(wèn)長(zhǎng)度的期望值是否一樣?例8-8從兩臺(tái)切斷機(jī)所截下的坯料(長(zhǎng)度按正態(tài)分布)中,分別抽?。?jìng)€(gè)和9個(gè)產(chǎn)品,測(cè)得長(zhǎng)度如下(單位:mm):甲:150,145,152,155,148,151,
152,148乙:152,150,148,152,150,150,
148,151,148非參數(shù)統(tǒng)計(jì)講義一緒論設(shè)甲床截下的長(zhǎng)度為X;乙床截下的長(zhǎng)度為Y,由假定知
21=22=2檢驗(yàn)假設(shè)
解非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論對(duì)查表得拒絕域?yàn)樗詰?yīng)接受非參數(shù)統(tǒng)計(jì)講義一緒論參數(shù)方法定義:樣本被視為從分布族的某個(gè)參數(shù)族抽取出來(lái)的總體的代表,而未知的僅僅是總體分布具體的參數(shù)值,推斷問(wèn)題就轉(zhuǎn)化為對(duì)分布族的若干個(gè)未知參數(shù)的估計(jì)問(wèn)題,用樣本對(duì)這些參數(shù)做出估計(jì)或者進(jìn)行某種形式的假設(shè)檢驗(yàn),這類(lèi)推斷方法稱(chēng)為參數(shù)方法。比如:(1)研究保險(xiǎn)公司的索賠請(qǐng)求數(shù)時(shí),可能假定索賠請(qǐng)求數(shù)來(lái)自泊松分布P(a);(2)研究化肥對(duì)農(nóng)作物產(chǎn)量的影響效果時(shí),平均意義之下,每測(cè)量單元(可能是)產(chǎn)量服從正態(tài)分布N(a,b).非參數(shù)統(tǒng)計(jì)講義一緒論接受域置信區(qū)間假設(shè)檢驗(yàn)區(qū)間估計(jì)統(tǒng)計(jì)量
樞軸量對(duì)偶關(guān)系同一函數(shù)假設(shè)檢驗(yàn)與區(qū)間估計(jì)的聯(lián)系非參數(shù)統(tǒng)計(jì)講義一緒論假設(shè)檢驗(yàn)的基本概念若對(duì)參數(shù)有所了解但有猜測(cè)懷疑,需要證實(shí)之時(shí)用假設(shè)檢驗(yàn)的方法來(lái)處理若對(duì)參數(shù)一無(wú)所知用參數(shù)估計(jì)的方法處理非參數(shù)統(tǒng)計(jì)講義一緒論接受域置信區(qū)間檢驗(yàn)統(tǒng)計(jì)量及其在H0為真時(shí)的分布樞軸量及其分布原假設(shè)
H0備擇假設(shè)
H1待估參數(shù)
0
0
(
2未知)(
2未知)非參數(shù)統(tǒng)計(jì)講義一緒論一個(gè)典型的參數(shù)檢驗(yàn)過(guò)程1.總體參數(shù)Example:PopulationMean2.假定數(shù)據(jù)的形態(tài)為
WholeNumbersorFractions
Example:HeightinInches(72,60.5,54.7)3.有很強(qiáng)的假定Example:正態(tài)分布4.例子:ZTest,tTest,
2Test非參數(shù)統(tǒng)計(jì)講義一緒論一個(gè)例子:對(duì)兩組學(xué)生進(jìn)行語(yǔ)法測(cè)試,如何比較兩組學(xué)生的成績(jī)是否存在差異?組1組244253330222983447243125401330323324353018322137352822非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論原始數(shù)據(jù)秩2530293424251332243032379.514.012.021.07.59.52.017.57.514.017.524.04433228473140303335182135282226.019.55.51.027.016.025.014.019.522.53.04.022.511.05.5非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論假設(shè)檢驗(yàn)的基本思想...因此我們拒絕假設(shè)
=50...如果這是總體的真實(shí)均值樣本均值m=50抽樣分布H0這個(gè)值不像我們應(yīng)該得到的樣本均值...20非參數(shù)統(tǒng)計(jì)講義一緒論單邊備擇單邊備擇雙邊備擇零假設(shè)(原假設(shè))與備擇假設(shè):例:非參數(shù)統(tǒng)計(jì)講義一緒論假設(shè)檢驗(yàn)的方法1.置信區(qū)間法
置信區(qū)間提供了在某一置信度(例如95%)下真實(shí)參數(shù)值的取值范圍。
如果零假設(shè)中的值未落入該區(qū)間,也就是說(shuō)小概率事件發(fā)生了,我們認(rèn)為小概率事件由于發(fā)生的可能性很小,在一次試驗(yàn)中它幾乎是不會(huì)發(fā)生的。如果發(fā)生了,說(shuō)明我們的假設(shè)有問(wèn)題,所以我們將拒絕該零假設(shè)。概念:接受域(置信區(qū)間)、拒絕域、臨界值
非參數(shù)統(tǒng)計(jì)講義一緒論第一類(lèi)錯(cuò)誤和第二類(lèi)錯(cuò)誤:一個(gè)偏離
由小概率原理我們可以看出,我們的這種判斷是有可能犯錯(cuò)誤的。我們把可能犯的錯(cuò)誤分為兩類(lèi):第一類(lèi)錯(cuò)誤和第二類(lèi)錯(cuò)誤。第一類(lèi)錯(cuò)誤:零假設(shè)是正確的,卻做出拒絕零假設(shè)的判斷,此為棄真錯(cuò)誤。第二類(lèi)錯(cuò)誤:零假設(shè)是錯(cuò)誤的,卻做出接受零假設(shè)的判斷,此為取偽錯(cuò)誤。非參數(shù)統(tǒng)計(jì)講義一緒論假設(shè)檢驗(yàn)不可能完全避免這兩類(lèi)錯(cuò)誤,我們只能想辦法使犯錯(cuò)誤的概率盡量減小。1-置信水平,也稱(chēng)顯著性水平犯第一類(lèi)錯(cuò)誤的概率=犯棄真錯(cuò)誤的概率犯第二類(lèi)錯(cuò)誤的概率=犯取偽錯(cuò)誤的概率非參數(shù)統(tǒng)計(jì)講義一緒論
兩類(lèi)錯(cuò)誤
假設(shè)檢驗(yàn)存在著接受錯(cuò)誤的假設(shè)和拒絕正確假設(shè)的可能性.正確拒絕H0正確接受H0決策行動(dòng)H0
為非真H0為真假設(shè)的真實(shí)狀態(tài)檢驗(yàn)結(jié)果假設(shè)檢驗(yàn)的各種可能結(jié)果1-a1-β非參數(shù)統(tǒng)計(jì)講義一緒論H0:無(wú)罪假設(shè)檢驗(yàn)中的兩類(lèi)錯(cuò)誤(決策結(jié)果)陪審團(tuán)審判裁決實(shí)際情況無(wú)罪有罪無(wú)罪正確錯(cuò)誤有罪錯(cuò)誤正確H0檢驗(yàn)決策實(shí)際情況H0為真H0為假接受H01-a第二類(lèi)錯(cuò)誤(b)拒絕H0第一類(lèi)錯(cuò)誤(a)功效(1-b)假設(shè)檢驗(yàn)就好像一場(chǎng)審判過(guò)程統(tǒng)計(jì)檢驗(yàn)過(guò)程非參數(shù)統(tǒng)計(jì)講義一緒論
錯(cuò)誤和
錯(cuò)誤的關(guān)系
你不能同時(shí)減少兩類(lèi)錯(cuò)誤!
和的關(guān)系就像翹翹板,小就大,大就小非參數(shù)統(tǒng)計(jì)講義一緒論非參數(shù)統(tǒng)計(jì)講義一緒論2.顯著性檢驗(yàn)
顯著性檢驗(yàn):在給定顯著性水平下,為考察樣本值的顯著性而進(jìn)行的假設(shè)檢驗(yàn)。檢驗(yàn)是統(tǒng)計(jì)顯著的:能夠拒絕零假設(shè),即觀(guān)察到的樣本值落入拒絕域。檢驗(yàn)是統(tǒng)計(jì)不顯著的:不能夠拒絕零假設(shè),即觀(guān)察到的樣本值落入接受域。非參數(shù)統(tǒng)計(jì)講義一緒論
確定顯著性水平,求臨界值.
在假設(shè)檢驗(yàn)中,認(rèn)為零假設(shè)代表的事件概率很大,備擇假設(shè)代表的對(duì)立事件概率很小.
根據(jù)實(shí)際推斷原理(小概率原理),規(guī)定一個(gè)界限,當(dāng)某事件的概率,就認(rèn)為該事件是實(shí)際不可能事件.顯著性水平.
如果在一次檢驗(yàn)中,備擇假設(shè)代表的小概率事件居然發(fā)生了,就有理由懷疑零假設(shè)的正確性.
這就是假設(shè)檢驗(yàn)的基本原理.非參數(shù)統(tǒng)計(jì)講義一緒論顯著水平的選擇與P值P值(概率值)也稱(chēng)為統(tǒng)計(jì)量的精確顯著性水平。它可定義為拒絕零假設(shè)的最小的顯著性水平。一般規(guī)律:
P值越小,越能拒絕零假設(shè)。某一點(diǎn)對(duì)應(yīng)的p值指的是以該值為臨界點(diǎn)確定的拒絕域的概率。非參數(shù)統(tǒng)計(jì)講義一緒論統(tǒng)計(jì)檢驗(yàn)的步驟總結(jié):第一步:表述零假設(shè)H0和備擇假設(shè)H1;第二步:選擇檢驗(yàn)統(tǒng)計(jì)量;第三步:確定檢驗(yàn)統(tǒng)計(jì)量的概率分布;第四步:選擇顯著性水平,即犯第一類(lèi)錯(cuò)誤的概率;第五步:選擇置信區(qū)間法或顯著檢驗(yàn)方法。非參數(shù)統(tǒng)計(jì)講義一緒論置信區(qū)間法:根據(jù)檢驗(yàn)統(tǒng)計(jì)量的概率分布,建立一個(gè)置信區(qū)間(也即接受域),如果該區(qū)間包括零假設(shè)值,則接受零假設(shè),否則拒絕零假設(shè)。顯著檢驗(yàn)法:在零假設(shè)下,得到相關(guān)統(tǒng)計(jì)量,并根據(jù)相應(yīng)的概率分布及事先給定的顯著性水平計(jì)算相應(yīng)的接受域(拒絕域),根據(jù)計(jì)算得到的值是否落入接受域(拒絕域)來(lái)決定是否接受(拒絕)零假設(shè)。如果不想事先選擇顯著性水平,則可依據(jù)該統(tǒng)計(jì)量的p值進(jìn)行判斷。計(jì)算該統(tǒng)計(jì)量取某一特殊值的概率。如果這一概率值較小,則拒絕零假設(shè),否則,接受零假設(shè)。非參數(shù)統(tǒng)計(jì)講義一緒論什么是P值?
(P-Value)是一個(gè)概率值如果我們假設(shè)原假設(shè)為真,P-值是觀(guān)測(cè)到的樣本均值不同于(<或>實(shí)測(cè)值的概率左側(cè)檢驗(yàn)時(shí),P-值為曲線(xiàn)上方小于等于檢驗(yàn)統(tǒng)計(jì)量部分的面積右側(cè)檢驗(yàn)時(shí),P-值為曲線(xiàn)上方大于等于檢驗(yàn)統(tǒng)計(jì)量部分的面積被稱(chēng)為觀(guān)察到的(或?qū)崪y(cè)的)顯著性水平H0
能被拒絕的
的最小值非參數(shù)統(tǒng)計(jì)講義一緒論利用P值進(jìn)行決策單側(cè)檢驗(yàn)若p-值
,不能拒絕H0若p-值<
,拒絕H0雙側(cè)檢驗(yàn)若p-值
/2,不能拒絕H0若p-值</2,拒絕H0非參數(shù)統(tǒng)計(jì)講義一緒論雙尾Z檢驗(yàn)
(P-值計(jì)算實(shí)例)
【例】欣欣兒童食品廠(chǎng)生產(chǎn)的盒裝兒童食品每盒的標(biāo)準(zhǔn)重量為368克?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取25盒進(jìn)行檢查
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國(guó)MLCC行業(yè)資本規(guī)劃與股權(quán)融資戰(zhàn)略制定與實(shí)施研究報(bào)告
- 新形勢(shì)下川菜餐飲行業(yè)可持續(xù)發(fā)展戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國(guó)月子中心行業(yè)全國(guó)市場(chǎng)開(kāi)拓戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國(guó)酒店管理服務(wù)行業(yè)營(yíng)銷(xiāo)創(chuàng)新戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國(guó)標(biāo)識(shí)設(shè)計(jì)制作行業(yè)營(yíng)銷(xiāo)創(chuàng)新戰(zhàn)略制定與實(shí)施研究報(bào)告
- 織物設(shè)計(jì)與思考
- 關(guān)于進(jìn)一步健全和完善城市社區(qū)治理體系建設(shè)的工作方案
- 2019-2025年中國(guó)養(yǎng)雞場(chǎng)行業(yè)市場(chǎng)深度分析及發(fā)展前景預(yù)測(cè)報(bào)告
- 湖北省襄陽(yáng)市谷城縣石花三中2023-2024學(xué)年九年級(jí)上學(xué)期期末化學(xué)試卷
- 雪茄基礎(chǔ)知識(shí)培訓(xùn)課件
- 混凝土澆筑申請(qǐng)表
- 企業(yè)培訓(xùn)5W2H分析法(31P PPT)
- DB13T 2802-2018 水利工程鑄鐵閘門(mén)技術(shù)規(guī)范
- 必修二unit4History and Traditions重點(diǎn)短語(yǔ)梳理
- 食堂改造與裝修設(shè)計(jì)方案
- 德國(guó)Lurgi公司低壓回轉(zhuǎn)脈沖袋除塵器技術(shù)
- Q∕GDW 12147-2021 電網(wǎng)智能業(yè)務(wù)終端接入規(guī)范
- 塑料件缺陷匯總
- 跌落測(cè)試(中文版)-ISTA-2A-2006
- ppt魚(yú)骨圖模板圖
- 右心導(dǎo)管檢查及心血管造影ppt課件
評(píng)論
0/150
提交評(píng)論