




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1MPA定量分析方法
2引言1.為什么學定量分析方法?(1)實踐的需要; 社會科學領(lǐng)域,環(huán)境生態(tài)與水資源問題,能源問題,信息網(wǎng)絡(luò)與用戶,農(nóng)業(yè)問題,交通運輸問題,科技教育與工程項目管理(2)理論研究的需要。32.學什么?(1)統(tǒng)計學①社會經(jīng)濟統(tǒng)計學:綜合指標,動態(tài)數(shù)列,統(tǒng)計指數(shù),②數(shù)理統(tǒng)計學:基本概念(樣本,總體etc),參數(shù)估計,如估計一批產(chǎn)品合格率假設(shè)檢驗。如從一批產(chǎn)品中抽取200件,有次品兩件,則產(chǎn)品合格率的估計值是99%。現(xiàn)在規(guī)定一批產(chǎn)品的合格率若低于95%,則這批產(chǎn)品就不合格。提出假設(shè)合格率≥95%,那么如何判定這個假設(shè)正確,有多大把握,這即為假設(shè)檢驗問題!4回歸分析:確定變量的相互關(guān)系和相關(guān)程度,建立相關(guān)模型,檢驗變量間的相關(guān)程度并應(yīng)用相關(guān)模型進行預(yù)測etc函數(shù)關(guān)系(特殊相關(guān)關(guān)系)。線性相關(guān)與非線性相關(guān)。如:年齡與體重,銷售額與廣告費用etc都具有一定的相關(guān)關(guān)系。方差分析影響產(chǎn)品質(zhì)量的因素很多:操作不當,設(shè)備磨損,潮濕etc。分析哪些因素對產(chǎn)品質(zhì)量起顯著作用,并了解什么時候最起作用,方差分析就是解決這一個問題的一種有效方法。5其他:多元統(tǒng)計分析,時間序列法,正交實驗法etc。
主成分分析:在實際問題中,常遇到多指標問題,不同指標之間具有一定的相關(guān)性,增加了分析問題的難度。設(shè)法將原有指標重新組合成一組相互獨立的少數(shù)幾個綜合指標來代替原有指標,并且反映指標的主要信息。將多指標化為少數(shù)獨立的綜合指標的統(tǒng)計方法即為主成分分析法!
6(2)決策學概論(3)經(jīng)濟預(yù)測數(shù)量方法①時間序列法;②回歸分析法;③馬爾可夫法;④灰色模型法7(4)系統(tǒng)評價方法①模糊綜合評價法;②層次分析法(5)效用理論及應(yīng)用(6)基本決策方法貝葉斯決策法8(7)多目標決策目標規(guī)劃法、主成分法、因子分析法(8)博弈論初步及其應(yīng)用3.怎樣學?(1)了解基本思想(2)必要的數(shù)學基礎(chǔ)94.參考書(1)決策理論與方法岳超源,科學出版社,1987年9月第1版(2)決策分析陳珽,科學出版社(3)商務(wù)決策數(shù)量方法李一智,徐選華,經(jīng)濟科學出版社(4)決策分析張家琦,首都師范大學出版社10(5)管理科學定量分析引論侯定丕,中國科學技術(shù)大學出版社(6)灰色系統(tǒng)理論及其應(yīng)用劉思峰等,科學出版社(7)多元統(tǒng)計分析于秀林等,中國統(tǒng)計出版社(8)數(shù)理經(jīng)濟學方法——線性和非線性規(guī)劃、不動點理論.富蘭克林著,俞建等譯,198511(9)工商業(yè)和經(jīng)濟學中應(yīng)用的統(tǒng)計方法〔美〕羅伯特·D·梅森著人大出版社(10)管理研究應(yīng)用統(tǒng)計學歐陽文安etc譯北京科學技術(shù)出版社(11)應(yīng)用統(tǒng)計學袁衛(wèi)etc編著人大出版社12(12)應(yīng)用數(shù)理統(tǒng)計孫榮恒編著科學出版社(13)實用多元統(tǒng)計分析方開泰編著華東師范大學出版社(14)多元統(tǒng)計數(shù)據(jù)分析——理論·方法·實例任若恩、王惠文著國防工業(yè)出版社13第一章數(shù)據(jù)的整理與抽樣14一、統(tǒng)計學中的基本概念(一)統(tǒng)計資料1.統(tǒng)計資料的定義、分類與性質(zhì)可以推導出某項論斷的事實或數(shù)字都稱為統(tǒng)計資料。統(tǒng)計資料是統(tǒng)計分析、統(tǒng)計推斷和預(yù)測的基礎(chǔ)。統(tǒng)計資料分為原始(初級)資料(未加工)與次級資料(加工過)如:統(tǒng)計年鑒etc。統(tǒng)計數(shù)據(jù)可分:度量數(shù)據(jù)(如銷量等)和品質(zhì)數(shù)據(jù)(性別、民族etc)152.統(tǒng)計資料收集的方法間接引用或直接收集3.統(tǒng)計資料收集的途徑直接觀察、訪問、問卷調(diào)查4.統(tǒng)計資料收集的組織方式可分:專門調(diào)查(普查,重點調(diào)查,抽樣調(diào)查,典型調(diào)查)和統(tǒng)計報表(自上而下地逐級提供統(tǒng)計資料的一種調(diào)查方法)16
(二)總體與個體1.定義凡是客觀存在的、具有統(tǒng)一性質(zhì)的若干個別事物的集合體,就稱為統(tǒng)計總體。構(gòu)成總體的個別事物稱為個體(總體單位)考察一批10000件產(chǎn)品的質(zhì)量情況,10000件產(chǎn)品=總體,每一件產(chǎn)品=一個個體。172.總體和個體的必備條件(1)客觀性總體和個體必須是客觀存在的具體事物。如:工業(yè)企業(yè)是總體(客觀存在),自然數(shù)(集合體)但非總體,因1,2,3,……是抽象的
“產(chǎn)品”,“糧食”非總體(2)大量性總體的個體須是大量的(足夠多)因為統(tǒng)計的目的是反映大量現(xiàn)象的規(guī)律和特點。18(3)同質(zhì)性總體的個體在性質(zhì)上須相同,因為統(tǒng)計研究的目的是反映總體的特性。例如,將機械零件與書本放在一起,就不會得出整個總體的任何結(jié)論。(4)差異性如10000件產(chǎn)品雖屬同一種產(chǎn)品,但在質(zhì)量、顏色、尺寸等方面不盡相同。若所有個體都完全相同的話,就無必要進行統(tǒng)計研究了。如:同一種郵票800枚(同時出版)要研究這種郵票的面值、版面設(shè)計、圖案花紋etc,只需任取一枚郵票進行鑒賞,就能通曉800枚郵票。這種研究方法不是統(tǒng)計方法。193.總體的分類按其包含的個體數(shù)目可分:有限總體與無限總體。按其個體的時間分:空間總體(個體處于同一時間的不同空間),如人口普查,全國總?cè)丝诩礊榭臻g總體,時間總體(個體處于同一空間的不同時間),如某商店一年的銷售情況,即是時間總體??傮w與個體的概念是相對的!20(三)樣本1.定義樣本,是從總體中抽取出來進行調(diào)查并據(jù)以推斷總體的那部分個體。樣本中包含的個體數(shù)目稱為樣本容量,用n表示,n>30,大樣本,反之,小樣本。樣本容量n與總體容量N的比,n/N稱為抽樣比,用f表示。212.樣本的類型(1)代表性樣本樣本單位頻數(shù)是某種特征的樣本占總樣本數(shù)的比例。總體的頻數(shù)是某種特征的個體占總體的比例若樣本單位頻數(shù)與總體的頻數(shù)成正比,則這種樣本稱之為代表性樣本。22(2)有偏樣本人為因素的影響,這種情況下的樣本稱為有偏樣本,是產(chǎn)生抽樣偏差的來源。(3)隨機樣本按隨機原則抽取的樣本。23(4)分層樣本(類型樣本)①將總體按某一標志分成若干組。②再從各組中隨機抽樣??疾烊珖ど唐髽I(yè)時,先按行業(yè)分組,再抽樣,以避免所選出的樣本集中在某一行業(yè)。代表性高。24(5)整群樣本按群抽樣的樣本。如:考察某市小學生身體發(fā)育情況,隨機抽取若干小學,對抽中小學的全體學生逐一考察。(省力省時)(6)系統(tǒng)抽樣按某種規(guī)律(如固定的間隔)在總體中抽取樣本的方法。如:按身份證的編號抽取尾數(shù),為了進行居民收入狀況調(diào)查。但當總體呈現(xiàn)某種系統(tǒng)規(guī)律時(周期律)則不能采用,否則有系統(tǒng)誤差。25(四)標志標志是一種名稱,不是具體數(shù)字,是對個體某一特征質(zhì)的規(guī)定。標志在個體的不同取值叫標志值。其具體表現(xiàn)是文字值或數(shù)值。學習成績分別為80,98,91,86等成績=標志分數(shù)是標志值26
標志可分為:數(shù)量標志:表明個體數(shù)量方面的特征(如成績)品質(zhì)標志:個體屬性方面的特征(性別)不變標志(性別)可變標志(成績)27二、抽樣方法1.簡單隨機抽樣(樣本同分布,抽樣相互獨立)每個個體被抽中的可能性相等。如:抽簽。2.分層隨機抽樣先分組,在分別從各組中簡單隨機抽樣,可增大樣本代表性,推斷結(jié)果準確性高,層內(nèi)差異小,層間差異大。283.整群抽樣將總體分成若干群,在隨機抽一部分群體做樣本,并對這些群體的所有個體全面調(diào)查,隨機抽組法與組內(nèi)普查法的結(jié)合。4.系統(tǒng)隨機抽樣法(等距抽樣或機械抽樣)基本思想:對于容量為N的總體,將個體編號從1到N。若要抽取容量為n的樣本,則應(yīng)先從編號為1到K(K=[N/n])的K個個體中,隨機抽取一個,然后,按照一定的規(guī)律,抽取個體,順次得到容量為n的樣本。舉例(略)29三、數(shù)據(jù)的整理與圖形表示。(一)分組按一定的變異標志,將總體分成若干部分,統(tǒng)計分組是分組整理的基礎(chǔ)。可劃分社會經(jīng)濟現(xiàn)象的類型,研究現(xiàn)象的內(nèi)部結(jié)構(gòu)及分析現(xiàn)象之間的依存關(guān)系。統(tǒng)計分組的要求和基本原則(略)。(二)數(shù)據(jù)的圖形表示餅圖、直方圖、尋形圖、柱狀圖etc表示統(tǒng)計數(shù)據(jù),顯直觀。30四、數(shù)據(jù)的描述性指標(一)集中趨勢
1.均值,是算術(shù)平均數(shù),是數(shù)據(jù)集中趨勢的最重要測度值。(1)原始數(shù)據(jù):
31(2)分組后的數(shù)據(jù):xi表示第i組的組中值,fi表示第i組數(shù)據(jù)的個數(shù)均值反映了數(shù)據(jù)的數(shù)量集中的特征,是數(shù)據(jù)偶然性、隨機性特征相互抵消后的穩(wěn)定數(shù)值,反映了一些數(shù)據(jù)必然的特點。
32(3)幾何平均數(shù)G=ai為第i期發(fā)展速度或各個比率。332.中位數(shù)(中數(shù))中位數(shù)是將數(shù)據(jù)按大小順序排隊后,位置處在最中間的那個數(shù)。不受極端值(大、?。┑挠绊?。如數(shù)據(jù)個數(shù)為偶數(shù),則最中間兩數(shù)的平均數(shù)為中位數(shù)。343.上四分位數(shù)(設(shè)為xi),則i=[]xi
表示約有1/4的數(shù)據(jù)比xi
大,3/4的數(shù)據(jù)比xi小4.下是分位數(shù)(設(shè)為x)其中j=[]
表示約有3/4的數(shù)據(jù)比xj
大,1/4的數(shù)據(jù)比xj小。355、眾數(shù),出現(xiàn)次數(shù)最多的數(shù)值(可能有多個),均值是計算的測度值,其它從位置考慮。例:某班30MBA學生的年齡按上升順序排序為:24、24、25、25、25、25、26、26、26、26、27、27、27、27、27、28、28、28、28、28、29、29、30、30、30、30、31、31、31、32
眾數(shù)為27和28(5次),中數(shù)==27.5
平均數(shù)為27.67,上四分位數(shù)為x23=30,下四分位數(shù)x8=26,36(二)離散趨勢,1.極差(全距)R=max(Xi)-min(Xi)只利用了數(shù)據(jù)兩端的信息。372、方差和標準差:
標準差=σ2大反映均值的代表性差,反之,強。383.四分位差即上四分位數(shù)與下四分位數(shù)的差39五、統(tǒng)計量的分布(一)統(tǒng)計量的定義設(shè)X1、X2、……、Xn是來自總體X的一個樣本,g(X1、X2、……、Xn)是X1、X2、……、Xn的函數(shù),若g是連續(xù)函數(shù),且不含任何未知參數(shù),則g(X1、X2、……、Xn)是一個統(tǒng)計量。40(二)常用統(tǒng)計量設(shè)X1、X2、……、Xn是來自總體X的一個樣本,x1、x2、……、xn是這一樣本的觀測值,則1.樣本平均值:2.樣本方差:413.樣本標準差:4.樣本k階(原點)矩:,k=1,2,……5.樣本k階中心矩:,k=1,2,……用xi代替Xi,相應(yīng)得到觀察值,s2,s,ak,bk(名稱不變)42(三)幾種常用的分布1.χ2分布設(shè)x1,x2,……,xn是來自總體
N(0,1)的樣本,則稱隨機變量=x12+x22+……+xn243
服從自由度為n的χ2分布,記為χ2~χ2(n),χ2(n)分布的概率密度為:
44χ2分布的性質(zhì):
(1)可加性:設(shè)χ12
~χ2(n1),χ22
~χ2(n2),且χ12
與χ22相互獨立,則有:
χ12+χ22~χ2(n1+n2)
(2)若χ2~χ2(n),則有:
E(χ2)=n,D(χ2)=2n45(3)對于給定的正數(shù),0<<1,若則為χ2(n)分布的上分布點46如查表知χ0.012(10)=2.558當n充分大時,有其中是標準正態(tài)分布的上分位點。
47附:若Z~N(0,1),則Z為標準正態(tài)變量,其密度函數(shù)為:
48(1)若對,有,則為N(0,1)分布的上點
49(2)若對,有,則為N(0,1)的雙側(cè)分位點50(3)上點的求法∵,又∴φ()=1-,反查表,得512.t分布設(shè)χ~N(0,1),Y~χ2(n),且χ,Y相互獨立,則稱隨機變量
服從自由度為n的t-分布,記為t~t(n)52其密度函數(shù)為:53對給定,若則點為t(n)分布的上分位點54顯然(n)=-(n)(WHY)t0.95(8)=-t0.05(8)=-1.8595當n充分大的時候,有(n)=553、F分布設(shè)U~2(n1),V~2(n2),且U,V相互獨立,則稱隨機變量服從自由度為(n1,n2)的F分布,記為F~F(n1,n2).56其密度函數(shù)為:顯然,若F~F(n1,n2),則~F(n2,n1)(定義知)57對于結(jié)果0<α<1,若則稱F(n1,n2)為F(n1,n2)分布的上分位點。
58顯然有(n1,n2)=(定義知)F0.9(5,10)==0.3030594.正態(tài)總體的樣本均值和樣本方差的分布(1)設(shè)總體X的均值為μ,方差為σ2,x1,x2,……,xn是X的一個樣本,則有,(2)設(shè)x1,x2,……,xn為來自總體X~N(μ,σ2)的一個樣本,則,60(3)設(shè)x1,x2,……,xn為來自總體X~N(μ,σ2)的一個樣本,則有①②與S2相互獨立
61(4)x1,x2,……,xn為來自總體X~N(μ,σ2)的一個樣本,與S2分別是樣本均值和樣本方差,則有:
62(5)設(shè)x1,x2,……,xn1與Y1,Y2,……,Yn2分別是具有相同方差的兩個正態(tài)總體N(μ1,σ2),N(μ2,σ2)的樣本,且這兩個樣本相互獨立。設(shè),,分別是這兩個樣本的均值
63
,分別是這兩個樣本的方差,則有其中64(6)(獨立同分布的)中心極限定理設(shè)隨機變量x1,x2,……,xn相互獨立,服從同一分布,且具有數(shù)學期望和方差:,,k=1,2,……,n)則(樣本均值)65將其標準化:66設(shè)Zn分布函數(shù)為Fn(x),則有即Yn極限分布為標準正態(tài)分布。推論:不論總體是什么分布,只要μ和σ2存在,則樣本容量為n的樣本均值近似~(n足夠大時)。67
第3章
參數(shù)估計§3.1參數(shù)估計概述
參數(shù)估計是統(tǒng)計推斷的基本方法之一。我們把刻劃總體X的某些特征的常數(shù)稱為參數(shù),最常用的參數(shù)是總體X的數(shù)學期望和方差。假如總體X~N(),則X的分布是由參數(shù)μ和σ2確定的,其中,μ=E(X),σ2=D(X)。
在實際問題中,總體X的參數(shù)是未知的,例如紗廠細紗機上的斷頭次數(shù)X~P(λ),如果求每只紗綻在某一時間間隔內(nèi)斷頭的次數(shù)為K的概率,就需要先確定參數(shù)λ,才能求出所求的概率。又如,燈泡廠生產(chǎn)的燈泡,由經(jīng)驗知其壽命X~N(),但是由于生產(chǎn)過程中各種隨機因素的影響,生產(chǎn)出來的燈泡的壽命是不一致的,為了保證燈泡的質(zhì)量,必須進行抽樣檢查,根據(jù)樣本所提供的信息,對總體X的分布做出估計,也即對參數(shù)μ,σ2做出估計。這類問題稱為參數(shù)估計問題。
參數(shù)估計問題,就是要從樣本出發(fā)構(gòu)造一些統(tǒng)計量作為總體某些參數(shù)的估計量,當取得一個樣本值時,就以相應(yīng)的統(tǒng)計量的值作為總體參數(shù)的估計值。例如,常以統(tǒng)計量作為總體數(shù)學期望的估計量。當要估計某批燈泡的平均壽命時,就從該批燈泡中隨機地抽取若干個,分別測出其壽命,以這些測量數(shù)據(jù)的平均值作為該批燈泡的平均壽命的估計值。
設(shè)總體X的分布函數(shù)的類型已知,但是其中有一個或多個參數(shù)未知,設(shè)X1,X2,X3,……,Xn為總體X的容量為n的樣本。參數(shù)估計就是討論如何由樣本X1,X2,X3,……,Xn提供的信息對未知參數(shù)作出估計,以及討論如何建立一些準則對所作出的估計進行評價。一般是建立適當?shù)慕y(tǒng)計量(X1,X2,X3,……,Xn),當樣本觀察值為x1,x2,x3,……,xn時,如果以(x1,x2,x3,……,xn)作為總體分布中未知參數(shù)的估計值,這樣的估計方法叫做點估計,如果總體分布函數(shù)中有t個未知參數(shù),則要建立t個估計量作為t個未知參數(shù)的估計量。
參數(shù)估計的形式分為兩類:點估計和區(qū)間估計。由估計量的觀察值作為未知參數(shù)的估計值,這種作法稱為點估計或定值估計。而有時并不要求對參數(shù)作定值估計,只要求估計出未知參數(shù)的一個所在范圍,并指出參數(shù)被包含在該范圍的概率,這種方法稱為區(qū)間估計,進行參數(shù)估計并不一定要預(yù)先知道總體的分布類型。有時,雖然未知總體的分布類型,但仍可對總體的某些數(shù)字特征作出估計。
§3.2參數(shù)的點估計
點估計方法很多,本節(jié)介紹最常見的矩估計法和極大似然法。一、矩估計法
由大數(shù)定律可知,樣本分布函數(shù)依概率收斂于總體分布函數(shù),樣本均值依概率收斂于總體均值,我們自然會想到,是否能用有關(guān)的樣本矩來估計總體分布的相應(yīng)矩呢?統(tǒng)計實踐表明,這個方法是可取的,這種用樣本矩來估計總體分布參數(shù)的方法稱為矩估計法,通常,用樣本均值來估計總體的均值,用樣本方差S2來估計總體的方差。
【例3.1】試用矩估計法對總體X~N()的參數(shù)μ,σ2作出估計。
解:因E(X)=μ,D(X)=σ2設(shè)X1,X2,……,Xn為X的一個樣本,其樣本均值為,樣本方差為S2。令E(X)=,D(X)=S2,即得的估計量為,。
【例5.2】設(shè)X1,X2,……,Xn是取自總體X的樣本,已知X的概率密度為:
試用矩估計法估計總體參數(shù)。解:
由于
樣本均值為,令E(X)=,得:,
從而總體參數(shù)的矩估計為,其
中。
【例5.3】X1,X2,……,Xn為總體X~B(N,P)的樣本,其中N,P為未知參數(shù),試用矩估計法估計參數(shù)N及P。
解:∵
E(X)=NPD(X)=NP(1-P)樣本均值與方差分別為,S2。令
E(X)=D(X)=S2
即
解得N、P的矩估計量為
,其中,。
二、極大似然估計法
先考察兩個簡單的例子。
【例3.4】某同學與一位男獵人一起外出打獵,只見一只野雞在前方竄過,只聽一聲槍響,野雞被他們兩人中某一位一槍命中,試推測這一發(fā)命中的子彈是誰打的,答案是簡單的,既然只發(fā)一槍且命中,而男獵人的命中的概率一般大于這位同學命中的概率,因此可以認為這一槍是男獵人射中的。
【例3.5】假定在一個箱子里放著黑、白兩種球共4只,且知道這兩種球的數(shù)目之比為1∶3,但不知道究竟哪一種顏色的球多。
設(shè)黑球所占的比例為P,由上述假定推知P僅可能取1/4和3/4這兩個值,現(xiàn)在采用有放回抽樣的方法,從箱子中隨機地抽取三個球,觀察到球的顏色為黑、白、黑,你會對箱子中的黑球數(shù)作出什么推斷呢?即你認為P的值是1/4,還是3/4?直觀上覺得P=3/4(即箱子中黑球數(shù)為3)更可信,因為當P=1/4時抽到這樣一個具體樣本的概率為1/4
3/4
1/4=3/64,當P=3/4時,抽到這樣一個具體樣本的概率為3/4
1/4
3/4=9/64,由于9/64>3/64,因此在觀察到上述樣本中的三個球的顏色之后,覺得P=3/4更可信,即你傾向于認為箱子中放有三個黑球,這里體現(xiàn)了極大似然法的基本思想。
現(xiàn)在我們來闡明極大似然法的基本原理。
設(shè)總體X的概率密度為,它只含一個未知參數(shù)(若X是離散型,表示概率),X1,X2,X3,……,Xn是取自X的樣本,x1,x2,x3,……,xn為樣本觀察值。X1,X2,X3,……,Xn的聯(lián)合密度等于,顯然,對于樣本的一組觀察值x1,x2,x3,……,xn,它是的函數(shù),記作
并稱為似然函數(shù)
當已知時,似然函數(shù)描述了樣本取得樣本觀察值x1,x2,x3,……,xn的可能性。同樣,當一組樣本觀察值取定時(即抽樣完成時),要問它最大可能取自什么樣的總體(即總體的參數(shù)應(yīng)等于什么時的可能性最大),也要從似然函數(shù)的極大化中求出相應(yīng)的值來,這個值就是的一個估計值。于是,我們可以給出極大似然估計的定義。
定義3.1設(shè)總體的概率密度為,其中是未知參數(shù),x1,x2,…,xn為X的一組樣本觀察值。若能求得觀察值的某個函數(shù),使得似然函數(shù)取極大值,即,則稱為的一個極大似然估計值,其相應(yīng)的統(tǒng)計量,稱為參數(shù)的極大似然估計量。
由定義3.1可知,求總體參數(shù)的極大似然估計值的問題,就是求似然函數(shù)L()的極大值問題。在L()可微時,要使L()取極大值必須滿足(3.1)從上式可解得的極大似然估計值。
由于lnL()與L()有相同的極值點,而且,求lnL()的極值點更為容易,所以常用下式
(3.2)來代替(3.1)式。方程(3.1)或(3.2)都稱為似然方程。
當似然函數(shù)包含多個參數(shù)時,即:
若L關(guān)于各參數(shù)的偏導數(shù)存在,則j的極大似然估計
一般可由方程組:或解得。上面方程組稱為似然方程組。
[注意]上面的討論中,我們沒有提到似函數(shù)取極大值的充分條件,對于具體的函數(shù)可作驗證。
【例3.6】設(shè)總體X服從參數(shù)為的泊松分布,求參數(shù)的極大似然估計量。
解
設(shè)X1,X2,X3,……,Xn是來自X的樣本,則
∴
令
∴
的極大似然估計量為。其中
為樣本均值。
【例3.7】設(shè)總體X~N,其中及是未知參數(shù),如果取得樣本觀測值為x1,x2,…,xn,求參數(shù)及的極大似然估計值。
解:
似然函數(shù)為:∴
對及求偏導數(shù),并讓它們等于零,得:
解此方程組,即得及的極大似然估計值為:
【例3.8】設(shè)總體X服從均勻分布,求參數(shù)與的極大似然估計量
解
設(shè)X1,X2,…,Xn是X的樣本,則
∴從而有
顯然由此方程組解不出
1與
2,現(xiàn)利用定義求
1與
2的極大似然估計量,因為:
又
∵
,即∴
的極大似然估計量分別為。三、估計量的優(yōu)良標準
在對總體參數(shù)做出估計時并非所有的估計量都是優(yōu)良的,從而產(chǎn)生了評價估計量是否優(yōu)良的標準。對于點估計量來說,一個好的估計量有如下三個標準:
1.無偏性如果樣本統(tǒng)計量的期望值等于該統(tǒng)計量所估計的總體參數(shù),則這個估計量叫做無偏估計量。這是一個好的估計量的一個重要條件。用樣本平均數(shù)作為總體平均數(shù)的點估計量,就符合這一要求。無偏性也就是沒有系統(tǒng)的偏差,它是從平均意義講的,即如果這種估計方法重復進行,則從估計量所獲得的平均數(shù)等于總體參數(shù)。顯然,如果說一個估計量是無偏的,并不是保證用于單獨一次估計中沒有隨機性誤差,只是沒有系統(tǒng)性的偏差而已。若以代表被估計的總體參數(shù),代表的無偏估計量,則用數(shù)學式表示為:
我們知道,總體參數(shù)中最重要的一個參數(shù)是總體平均數(shù),樣本平均數(shù)是它的一個無偏估計量,即。另外,樣本方差也是總體方差的無偏估計量。
2.一致性當樣本容量n增大時,如果估計量越來越接近總體參數(shù)的真值時,就稱這個估計量為一致估計量。估計量的一致性是從極限意義上講的,它適用于大樣本的情況。如果一個估計量是一致估計量,那么,采用大樣本就更加可靠。當然,在樣本容量n增大時,估計量的一致性會增強,但調(diào)查所需的人力、物力也相應(yīng)增加。
3.有效性有效性的概念是指估計量的離散程度。如果兩個估計量都是無偏的,其中方差較小的(對給定的樣本容量而言)就可認為相對來說是更有效的。嚴格地說,如果和是的兩個無偏估計量,它們的相對有效性按下述比率決定:其中,是較小的方差。
以上這三個標準并不是孤立的,而應(yīng)該聯(lián)系起來看。如果一個估計量滿足這三個標準,這個估計量就是一個好的估計量。數(shù)理統(tǒng)計已證明,用樣本平均數(shù)來估計總體平均數(shù)和用樣本比率來估計總體比率時,它們是無偏的,一致的和有效的?!?.3參數(shù)的區(qū)間估計一、區(qū)間估計的概念
對未知參數(shù)來說,我們除了關(guān)心它的點估計外,往往還希望估計出它的一個范圍,以及這個范圍覆蓋參數(shù)真值的可靠程度,這種范圍通常用區(qū)間的形式給出,這種區(qū)間就叫參數(shù)的置信區(qū)間。
定義3.2設(shè)總體分布含有一個未知參數(shù)
,若由樣本確定的兩個統(tǒng)計量
(X1,X2,X3,…,Xn)與(X1,X2,X3,…,Xn),對于給定數(shù)值,滿足
(3.3)
則稱隨機區(qū)間為
的一個雙側(cè)置信區(qū)間,稱為雙側(cè)置信下(上)限,1-稱為置信水平或置信度。
(3.3)式表示置信區(qū)間包含未知參數(shù)
真值的概率是1-,若反復抽樣多次(每次樣本容量相等),每組樣本觀察值確定一個區(qū)間,每個這樣的區(qū)間或者包含
的真值,或者不包含
的真值,按貝努利定理,在所有這些區(qū)間中,包含
真值的約占,不包含
真值的僅占左右。
當和時,稱為置信區(qū)間觀察值,也稱為置信區(qū)間。
在有些問題中,我們關(guān)心的是未知參數(shù)至少有多大(如設(shè)備元件使用的壽命),或不超過多大(如產(chǎn)品的次品率),因此下面給出單側(cè)置信區(qū)間的概念。定義3.4在定義3.3中,如果將(3.3)式改成
則稱或為單側(cè)置信區(qū)間,和分別稱為單側(cè)置信下限與單側(cè)置信上限。
評價一個置信區(qū)間的好與壞有兩個標準,一是精度,即越小精度越高,也就越好。另一個是置信度,即越大越好。我們當然希望盡可能地小,同時希望盡可能地大,但是當樣本容量n固定時,精度與置信度不可能同時提高。
因為當精度提高時即變小時,()覆蓋真值
的可能性也變小,從而降低了置信度,相反,當置信度增大時,必然也增大,從而降低了精度,在實際問題中,一般是根據(jù)實際問題的需要,先選定置信度為1-,然后再通過增加樣本容量n提高精度。
二、區(qū)間估計的步驟
(1)構(gòu)造一個隨機變量g(
)(含待估計的未知參數(shù),分布已知);
(2)給定置信水平,使;
(3)從不等式
中解出即
得的置信區(qū)間;(4)將xi代替中的xi,即得觀察區(qū)間。
§3.4單正態(tài)總值均值與方差的區(qū)間估計
假設(shè)總體X~N(),構(gòu)造與的置信區(qū)間有重要的實用意義,而且有關(guān)結(jié)果是完滿的。
一、均值的置信區(qū)間
從總體X中取樣本(X1,X2,…,Xn),設(shè)樣本值為(x1,x2,x3,…,xn)由于
隨機變量很明顯,統(tǒng)計量Z的分布函數(shù)不依賴于未知參數(shù)μ。
設(shè)已給定對μ的區(qū)間估計置信度為1-令
為Z的雙側(cè)點)解不等式(關(guān)于μ):
得從而所求的100(1-)%置信區(qū)間為將樣本平均值取其觀察值,則100(1-)%的置信區(qū)間為
【例3.9】某廠質(zhì)量管理部門的負責人希望估計移交給接受部門的5500包原材料的平均重量,一個由250包原材料組成的隨機樣本所給出的平均值=65千克??傮w標準差
=15千克。試構(gòu)造總體未知的平均值的μ置信區(qū)間,假定95%的置信區(qū)間已能令人滿意,并假定總體為正態(tài)分布
解:(1)樣本平均值=65千克
(2)由1-
=0.95,/2=0.025,查標準正態(tài)分布表得
(3)寫出置信區(qū)間==
=(63.14,66.86)于是,我們有95%的把握說總體平均值μ介于63.14和66.86千克之間。
[注意]在很多情況下,我們遇到的總體為非正態(tài)分布,但中心極限定理告訴我們,當樣本容量n足夠大,無論總體服從什么分布,的柚樣分布將近似地服從正態(tài)分布,因此當樣本取自總體方差已知的非正態(tài)分布時,我們?nèi)钥梢杂?/p>
公式來近似求出總體平均值μ的置信區(qū)間。
2.未知時,求μ的置信區(qū)間
稍微留意上述求得的μ的置信區(qū)間,不難發(fā)現(xiàn)只有在已知時方法才可行。如果未知,則可用樣本方差S2代替總體方差,從而根據(jù)統(tǒng)計量:
對給定的置信水平1-,令可解得μ的1-置信區(qū)間為將、S2分別取其觀察值則μ的1-置信區(qū)間為例3.10為了估計一分鐘一次廣告的平均費用,抽出了15電視臺的隨機樣本。樣本的平均值=2000元,其中標準差S=1000元。假定所有被抽樣的這類電視臺服從正態(tài)分布,試構(gòu)造總體平均值μ的95%的置信區(qū)間。解:(1)樣本均值與方差分別為=2000元,S=1000元
(2)由1-
=0.95,得/2=0.025,n-1=14,查t分布表,得
(3)寫出置信區(qū)間:顯然我們有95%的把握說明,總體平均數(shù)處在1447.5元和2552.5元之間。
=(1447.5,2552.5)[注意]當
未知但樣本容量n>30,即大樣本時,可用標準正態(tài)分布近似地當作t分布。因此,在實際工作中,只有在小樣本的情況下,即樣本容量n<30時,才應(yīng)用t分布,而對于大樣本,則通常采用正態(tài)分布來構(gòu)造總體平均數(shù)的置信區(qū)間。另外,根據(jù)中心極限定理,從非正態(tài)總體中抽樣時,只要能夠抽取大樣本,那么,樣本平均數(shù)的抽樣分布就會服從正態(tài)分布。這時,我們也就能夠用來構(gòu)造置信區(qū)間,但由于
是未知的,因此,只能用來構(gòu)造置信區(qū)間。
二、方差
2的置信區(qū)間設(shè)X1,X2,X3,…,Xn是總體X~N(
,
2)的一個樣本,其觀察值為x1,x2,x3,…,xn。因為在一般情況下,總體的均值是未知的,所以我們只討論均值
未知時,對
2的區(qū)間估計。要對
2進行區(qū)間估計,須考慮樣本方差S2,由分布理論知隨機變量對于給定的置信水平1-,有
由此得
2的置信水平為1-的置信區(qū)間為而
標準差的置信水平為1-的置信區(qū)間是例3.11某制造廠的一名生產(chǎn)管理人員需要知道完成某件工作所需的時間。為此他進行了一項研究,得出一個適于分析的31個觀察值組成的隨機樣本,從樣本數(shù)據(jù)算出的方差為0.3小時,試問:(1)構(gòu)造方差
2的95%的置信區(qū)間(2)構(gòu)造
的95%的置信區(qū)間(3)構(gòu)造置信區(qū)間時作了何種假定?解:(1)S2=0.3,自由度=n-1=31-1=30查分布表得:從而求得0.1916<
2
<0.5360因此,我們有95%的把握說
2落在0.1916和0.5360之間的范圍內(nèi)。(2)其總體標準差的置信區(qū)間為:0.4377<
<0.7321(3)被抽樣的總體服從或近似服從正態(tài)分布是置信區(qū)間估計的假定條件。上面我們討論了正態(tài)總體的兩個參數(shù)
與
2的雙側(cè)置信區(qū)間,至于單側(cè)置信區(qū)間的求法完全類同,只是所用的百分位點不同,舉例說明如下。例3.12從某一批燈泡中隨機地抽取5只作壽命試驗,測得壽命(以小時計)如下:10501100112012501280設(shè)壽命X~N(
,
2),
2未知,求壽命X的均值
的置信水平為95%的單側(cè)置信下限和單側(cè)置信區(qū)間。155解:∵X~N(
,
2),
2未知∴隨機變量其中,S分別為總體X的樣本均值與樣本方差。對于給定的置信水平1-,有由不等式,可解得
的1-單側(cè)置信下限與單側(cè)置信區(qū)間分別為:
根據(jù)本題所給數(shù)據(jù),具體計算(1050+1100+1120+1250+1=1160查t分布表得
故所求單側(cè)置信下限是
單側(cè)置信區(qū)間為(1065,+∞)。
§3.5兩個正態(tài)總體均值差與方差比的區(qū)間估計
在實際應(yīng)用中常有這樣的問題,如已知某種產(chǎn)品的質(zhì)量指標X服從正態(tài)分布,但由于設(shè)備改善,工藝改革或原料改變等因素,使得總體X的均值和方差有所改變,對于這種情況,就需要知道均值和方差的改變情況,因此,需要考慮二正態(tài)均值差和方差比的區(qū)間估計問題。
一、二正態(tài)總體均值差的置信區(qū)間
設(shè)和S12
是總體X~N(
1,
12
)的容量為n1的樣均值和樣本方差;和S22是總體Y~N(
2,
22
)的容量為n2的樣本均值和樣本方差,并設(shè)這兩個總體相互獨立?,F(xiàn)在考慮二正態(tài)總體均值差的區(qū)間估計。因為分別是的點估計量,故服從正態(tài)分布,而且
所以
1.已知
12,
22時,求的
1-2置信區(qū)間
由于隨機變量
所以對于給定的置信水平1-,有
從不等式中解出
1-
2,即得
1-
2的置信水平為1-的置信區(qū)間為將取其觀察值,得置信區(qū)間為2.
12,
22都未知時,求
1-2的置信區(qū)間當樣本容量n1,n2都很大時(>30),可用S12,S22、分別代替
12、
22,于是可用區(qū)間作為
1-
2的近似的1-置信區(qū)間。
3.未知時,求
1-
2的置信區(qū)間,則t分布理論知其中
在給定的置信水平1-的條件下,有由此可得
1-
2的置信水平為1-的置信區(qū)間當及Sw取樣本觀察值時,置信區(qū)間為
【例3.13】某銀行負責人想知道存戶存入兩家銀行的錢數(shù),他從每一家銀行各抽選了一個由25個存戶組成的隨機樣本。樣本平均值如下:銀行A:=450元;銀行B:
=325元。兩個總體均服從方差分別為
A2=750和
B2=850的正態(tài)分布。試構(gòu)造
A-
B的95%的置信區(qū)間。
解
由于兩個總體均服從正態(tài)分布,因此也服從正態(tài)分布,從而計算總體均值之差的置信區(qū)間可用:
這個公式。
已知
12=750,
22=850,=450,=325,所以所求的置信區(qū)間為:這意味著有95%的把握認為總體均值之差在109.32元和140.68元之間。:
【例3.14】某工廠中有兩臺生產(chǎn)金屬棒的機器。一個隨機樣本由機器A生產(chǎn)的11根金屬棒組成,另一個隨機樣本由機器B生產(chǎn)的21根金屬棒組成。兩個樣本分別給出兩臺機器所生產(chǎn)金屬棒的長度數(shù)據(jù)如下: =6.10英寸,=5.95英寸,SA2=0.018,SB2=0.020。假定兩個總體近似服從正態(tài)分布,且總體方差相等,試構(gòu)造
A-
B的95%的置信區(qū)間。解
1-=95%,=0.05,查t分布表得t/2=t0.025(30)=2.042所以所求置信區(qū)間為:
=(0.05,0.25)4.兩個總體均不服從正態(tài)分布且方差未知對于一般不服從正態(tài)分布的兩個總體,我們往往根據(jù)中心極限定理采用大樣本抽樣方法。如果兩個總體方差未知,就用S1和S2分別作為
1和
2的估計值,當n1和n2足夠大時,
1-
2的置信水平為1-的近似置信區(qū)間為:
【例3.15】東大和西大兩所大學某學期期末英語考試采用同一試題,東大認為該校學生英語考試成績能比西大高出10分,為了證實這一說法,主管部門從兩校各抽取一個隨機樣本并得到如下數(shù)據(jù):n東=75人,n西=80人,東=78.6分,
西=73.8分,S東=8.2分,S西=7.4分。試在95%的置信度下確定兩校平均分數(shù)之差的置信區(qū)間。
解:
分1-=0.95,=0.025,查標準正態(tài)分布表得,從而其置信區(qū)間為:(78.6–73.8±1.96×1.26)=(2.3,7.3)
因此,我們有95%的把握說東大、西大兩校英語考試成績之差在2.3分和7.3分之間。這一結(jié)果說明東大的平均成績確實高于西大,但并未高出10分。二、二正態(tài)總體方差比的置信區(qū)間
在實際工作中還常常需要比較兩個總體的方差。例如,在選擇產(chǎn)品時,我們通常需要方差較小的產(chǎn)品,因為方差較小的產(chǎn)品的質(zhì)量比較均勻。比較兩個總體方差的大小,可以將兩個方差相比,當兩個方差相等時其比值為1。但兩個總體方差
12和
22都是未知的,所以需要通過兩個樣本方差來加以比較推斷。設(shè)二正態(tài)總體X~N(
1,
12)與Y~N(
2,
22),其中的參數(shù)均未知,它們相互獨立的兩個樣本的容量分別為n1,n2,樣本方差為S12與S22,現(xiàn)在求其方差比
12/
22的置信區(qū)間由分布理論知
從而
于是,對給定的置信水平為1-,有:
所以
12/
22的置信水平為1-的置信區(qū)間為:
(此處利用了公式:)
【例3.16】為了比較用兩種不同方法生產(chǎn)的某種產(chǎn)品的壽命,進行一項試驗。試驗中抽選了由方法1生產(chǎn)的16個產(chǎn)品組成一個隨機樣本,其方差為1200小時。又抽選了用方法2生產(chǎn)的21個產(chǎn)品組成另一個隨機樣本,得出的方差為800小時。試以95%的置信度估計
12/
22的置信區(qū)間解:由于S12=1200,S22=800,S12>S22從而所求的置信區(qū)間為:即:0.58<
12/
22<4014
也就是(0.58,4.14)§3.6關(guān)于比例的區(qū)間估計一、一個總體比例的區(qū)間估計
我們在實際工作中時常會碰到對總體比例的估計問題。例如,企業(yè)領(lǐng)導想知道本企業(yè)生產(chǎn)中合格品率是多少?商店經(jīng)理想了解對他們服務(wù)滿意的顧客在全部顧客中所占的比率等等。我們知道樣本比例的抽樣分布,當nP和n(1-P)兩者皆大于5時(P為總體比例),的分布近似服從平均值為P,標準差
p為的正態(tài)分布。但是,在實際工作中P往往是未知的,我們所要估計的也正是這個總體比例P,所以,就需要用樣本比例來代替P。這樣,我們就得到了標準差的估計值:因此,可對總體比例的區(qū)間估計作表述如下:如果nP和n(1-P)兩者皆大于5,并且n相對總體容量來說很小,則P的近似100(1-)%的置信區(qū)間由下式給出:如果我們研究的總體是有限的,尤其是抽樣比重較大時,即n/N>0.05,就要采用有限總體修正系數(shù),從而P的區(qū)間估計公式為:【例3.17】某一大公司的人事處長希望知道本公司內(nèi)專業(yè)不對口的職員究竟占多大比例。于是,他從2000名具有大專以上學歷的職員中隨機抽取了一個由150人組成的樣本進行研究,結(jié)果表明,其中有45人說他們從事的工作與所學專業(yè)不對口。試在95.5%的置信度下構(gòu)造出專業(yè)不對口人員所占真正比例的置信區(qū)間。解:由于樣本容量很大,n=150,
=45/150=0.3,和都大于5,故可用正態(tài)分布逼近。但又由于抽樣比重,故需用有限總體修正系數(shù)計算Sp,則
=(0.228,0.372)
計算結(jié)果表明,我們有95.5%的把握說,該公司具有大專以上學歷的人員中,有22.8%~37.2%的
人專業(yè)不對口。
二、兩個總體比例之差的區(qū)間估計
為了估計兩個總體比例之差P1-P2,我們可從每一個總體中各抽一個隨機樣本,并利用兩個樣本比例之差。這樣就可以按通常的方式構(gòu)造出一個區(qū)間的估計值。我們知道,當n1和n2都很大,即大樣本,而且總體比例不太接近0或1時,兩個獨立樣本的抽樣分布近似服從正態(tài)分布,其平均值為P1-P2,標準差為:
因為P1和P2皆未知,所以標準差應(yīng)通過下式來估計:于是上述條件下P1-P2的100(1-)%的置信區(qū)間由下式給出:
【例3.18】某企業(yè)有兩個車間,分別用A和B表示。為了降低廢品率,該企業(yè)對車間B的工人首先進行業(yè)務(wù)培訓。3個月后,該企業(yè)負責人對兩個車間的產(chǎn)品質(zhì)量進行了檢驗。從車間A抽取了200件產(chǎn)品,從車間B抽取了220件產(chǎn)品。查得廢品率A車間為,B車間為,試在95%的把握程度下,構(gòu)造兩個廢品率之間的置信區(qū)間。解:
Z
/2=Z0.025=1.96,從而其區(qū)間估計為:(0.15-0.03±1.96×0.0277)=(0.066,0.174)
根據(jù)這一結(jié)果,我們有95%的把握說,車間A和車間B的廢品率之差為6.6%~17.4%。這說明,車間B人員的業(yè)務(wù)培訓收到了效果?!?.7樣本容量的確定
以上所舉的例子中,都假定樣本容量已定。在實際設(shè)計抽樣方案中有一個重要的問題,就是在特定的情況下,應(yīng)該用多大的樣本?如果使用一個比需要大的樣本,就會浪費資料;如果樣本太小,就不能達到分析的目的。
事實上,決定樣本大小的因素有以下三點:(1)受總體方差
2數(shù)值大小的影響??傮w方差大,抽樣誤差大,則應(yīng)多抽一些樣本容量,反之,則可少抽一些。當然,當總體方差為0時,那么只需抽出其中一個就能代表總體。問題是實際工作中我們往往不知道總體方差,因而必須作試驗性調(diào)查,或以過去的歷史資料作參考。
(2)可靠性程度的高低。要求可靠性越高,所必需的樣本容量就越大,也就是說,為獲得所需精度而指定的概率越大,所需要的樣本容量就越大。
(3)允許誤差的大小。這主要由研究目的而定。若要求推斷比較精確,允許誤差應(yīng)該低一些,隨之抽取的樣本容量也要求多一些。反之,若允許誤差可以大一些,樣本容量也可以少一些。
一、估計總體平均數(shù)樣本容量的確定
在重復抽樣的條件下,我們用△表示允許誤差,用
表示總體標準差,用1-表示可靠性,用Z/2表示相應(yīng)的概率度,那么,允許誤差的公式可表述如下:
∴
這就是在重復抽樣條件下確定樣本容量的計算公式。當我們采用不重復抽樣時,就要采用有限總體修正系數(shù)。這時∴
這就是不重復抽樣條件下確定樣本容量的計算公式。
【例3.19】某批產(chǎn)品的平均重量=70千克,總體標準差
=5千克。現(xiàn)準備對這批產(chǎn)品采用重復抽樣方式進行簡單隨機抽樣檢驗,要求可靠程度達到95%,允許誤差不超過0.9千克。試問需要抽多少樣本容量?解:
=5,Z/2=1.96,(件)即應(yīng)抽取樣本容量119件。在實際工作中,總體標準可能是未知的,因此必須通過某種途徑來估計
,主要有:(1)當以前有過類似的抽樣,并且總體變動又不太大時,便可用以往的資料來估計,總體標準差
。(2)在正式抽樣研究之前,先抽出一個實驗樣本,算出其標準差S,并用它來代替
。(3)當總體近似服從正態(tài)分布時,便可根據(jù)全距來估計標準差S。二、估計總體比例時樣本容量的確定估計總體比例時,其樣本容量的確定類似Z于估計總體平均數(shù)時樣本容量的確定。在重復抽樣時,由于
∴
在不重復抽樣時,由于∴
上述兩個公式的計算都需要知道總體比例P,但一般情況下P是未知的。因此,要想確定其樣本容量,必須首先尋找P的估計值,一般有以下幾種方式:(1)用以往的資料估計P。(2)在正式抽樣之前,先抽一個實驗樣本,用此樣本比例來代替P。(3)當研究者對某一總體比例有很大把握時,則可用它作為P的估計值。(4)如果什么資料也沒有,那么可以令P=0.5,因為此時,P(1-P)最大,從而所需的樣本也比較多,推斷也就比較可靠?!纠?.20】一家市場調(diào)查公司希望估計某地區(qū)有25英寸彩色電視機的家庭所占的比例。該公司希望對P的估計誤差不超過0.07,置信度為95.5%,但沒有可利用的P的估計值。試問應(yīng)抽取多大容量的樣本?解:
由于沒有較好的P的估計值可供利用,因此只能取P=0.5,從而即應(yīng)抽取容量為204的樣本。215第四章假設(shè)檢驗216§4.1假設(shè)檢驗的基本概念
對總體的概率分布或分布參數(shù)作出某種“假設(shè)”,根據(jù)抽樣得到的樣本觀測值,運用數(shù)理統(tǒng)計的分析方法,檢驗這種“假設(shè)”是否正確,從而決定接受或拒絕“假設(shè)”,這就是本章要討論的假設(shè)檢驗問題。2171、小概率原理小概率原理是假設(shè)檢驗的基本依據(jù),即認為小概率事件在一次試驗中幾乎是不可能發(fā)生的。當進行假設(shè)檢驗時,先假設(shè)H0正確,在此假設(shè)下,若小概率事件A出現(xiàn)的概率很小,例如P(A)=0.01,經(jīng)過取樣試驗后,A出現(xiàn)了,則違反了上述原理,我們認為這是一個不合理的結(jié)果。218
這時,我們只能懷疑作為小概率事件A的前提假設(shè)H0的正確性,于是否定H0。反之,如果試驗中A沒有出現(xiàn),我們就沒有理由否定假設(shè)H0,從而做出接受H0的結(jié)論。下面我們通過實例來說明假設(shè)檢驗的基本思想及推理方法。2192、假設(shè)檢驗的基本思想及推理方法例1某車間為了提高零件的強度進行了技改,已知零件強度X(單位:kg/mm)服從正態(tài)分布N(52.8,0.8),其中μ0=52.8kg/mm是零件強度,現(xiàn)進行了技改后,抽取n=16的樣本,測得強度為:(kg/mm)
51.953.452.954.353.852.453.754.052.452.553.551.354.952.854.552.9
假設(shè)=0.8不變,試問技改后零件強度是否發(fā)生了實質(zhì)性變化?2
2
2
2
2
2
220
我們的問題就是:已知總體X~N(),且要求檢驗下面的假設(shè):(4-1)通常把H0稱為原假設(shè)或零假設(shè),把H1稱為備擇假設(shè)或?qū)α⒓僭O(shè)。從取樣結(jié)果看,樣本均值與總體均值之間存在差異,這種差異是因為抽樣的隨機性導致的不可避免的誤差,還是因為技改而導致的實質(zhì)性差異?
221
為了回答這個問題,首先給定一個小概率,稱為顯著性水平,通常取較小的值,如0.05,0.01。在本例中,我們選取。選取統(tǒng)計量,它包含待檢驗參數(shù),當H0為真時,它的分布是已知的,本例中,選取(4-2)于是有
222
其中,為臨界值,查表得。
|μ|的拒絕域為:()將抽樣值代入4-1式得:
落入拒絕域中,即小概率事件竟然出現(xiàn),于是否定假設(shè)H0,認為技改后零件強度發(fā)生了變化。223
應(yīng)當注意的是,上面例1的結(jié)論是在顯著性水平的情況下得出的,如果,則,代入觀察值,則會得出,技改后零件強度無實質(zhì)變化的相反結(jié)論。可見,原假設(shè)取舍與否與的取值直接相關(guān),當我們傾向于不要輕易否H0時,可取小一些,反之,取大一些。2243、單邊檢驗在上面例中,我們關(guān)心的是總體均值μ是否比μ0大,我們要確定是接受假設(shè),還是接受另一假設(shè),即技改后,零件的強度是否得到了提高。這樣,問題就是要檢驗下面的假設(shè):
這一假設(shè)檢驗稱為右邊檢驗,同樣存在左邊檢驗,統(tǒng)稱單邊檢驗。
225
例2在例1中,是否可以認為技改后,零件的強度有明顯的提高?()解:依題意假設(shè):
選擇統(tǒng)計量查表得拒絕域為()將抽樣值代入得226
落入拒絕域中,拒絕H0,接受H1,認為零件的強度技改后有明顯的提高。根據(jù)實際問題可以進行不同形式的假設(shè),歸納如下:右邊檢驗,假設(shè)形式為:左邊檢驗,假設(shè)形式為:
2274、兩類錯誤小概率原理是假設(shè)檢驗的基本依據(jù),然而,對于小概率事件,無論其概率多么小,還是可能發(fā)生的,所以,利用小概率原理為基礎(chǔ)的假設(shè)檢驗方法進行檢驗,可能會做出錯誤的判斷,主要有以下兩種形式228(1)原假設(shè)H0實際是正確的,但卻錯誤地拒絕了H0,這樣就犯了“棄真”的錯誤,通常稱為第一類錯誤。由于僅當所考慮的小概率事件A發(fā)生時才拒絕H0,所以犯第一類錯誤的概率就是條件概率。229
(2)原假設(shè)A0實際是不正確的,但是卻錯誤地接受了H0,這樣就犯了“取偽”的錯誤,通常稱為第二類錯誤。犯第二類錯誤的概率記為。我們自然希望犯這兩類錯誤的概率越小越好。但當樣本容量n確定后,犯這兩類錯誤的概率不可能同時被控制,通常在我們根據(jù)歷史經(jīng)驗選取恰當?shù)娘@著性水平后,通過擴大樣本容量n的方式來使第二類錯誤的概率減小。2305、假設(shè)檢驗的基本步驟(1)根據(jù)實際問題提出基本假設(shè)H0和備擇假設(shè)H1。(2)選取適當?shù)娘@著性水平,通常等。(3)根據(jù)H0選取適當?shù)慕y(tǒng)計量,當H0為真時,該統(tǒng)計量的分布應(yīng)為已知。(4)求出此檢驗的拒絕域,記作w。(5)根據(jù)樣本觀察值,計算統(tǒng)計量的觀察值。(6)作出判斷,若0落在拒絕域內(nèi),則拒絕H0,接受H1,否則接受H0。。231§4.2單個正態(tài)總體均值和方差的檢驗
我們首先討論單個正態(tài)總體中參數(shù)的假設(shè)檢驗問題。設(shè)從總體抽取樣本容量為n的樣本,其中2321、已知,關(guān)于的檢驗(z檢驗)在上一節(jié)例1中,已討論過正態(tài)總體,當已知時,關(guān)于=0的檢驗問題。在這些問題中,我們都是利用H0為真時服從N(0,1)分布的統(tǒng)計量來確定拒絕域的,這種檢驗法常稱為z檢驗法。2
2
233
下面我們再來簡單介紹其步驟:已知=0,假設(shè)
易知統(tǒng)計量對于給定的顯著性水平,
234
查正態(tài)分布表得拒絕域?qū)颖居^察值代入,如果,
則否定H0,接受H1,否則接受H1。其單邊檢驗參照有關(guān)內(nèi)容,在此不再敘述。
235
2、未知,關(guān)于的檢驗(t檢驗)設(shè)總體,其中未知,是來自總體x的樣本。因為已知,不能用統(tǒng)計量進行檢驗,當H0成立時,我們可以使用此統(tǒng)計量來進行在未知的情況下的檢驗。2
2
236
具體檢驗過程如下: 未知,假設(shè)
選取統(tǒng)計量(4-3)對于給定的,查表得臨界值確定拒絕域
237
代入樣本觀察值,如果則否定H0,接受H1,否則,接受H0。其單邊檢驗過程如下:右邊檢驗:假設(shè)
拒絕域:
238
例3某種電子元件壽命x(以小時計)服從正態(tài)分布,,未知,現(xiàn)抽取9只元件測得壽命如下:
10599971009698103104107
問:是否可以認為元件的壽命大于100小時?解:依題意假設(shè):
選取統(tǒng)計量n=9。
2
239
對于給定的,查表得臨界值,拒絕域為(1.753,)計算代入(4-3)式
t沒有落入拒絕域,故接受H0,認為元件的壽命不超過100小時。
2403、未知,檢驗關(guān)于的假設(shè)(檢驗法)設(shè)總體,其中未知,是來自等于總體x的樣本。假設(shè),,0為已知常數(shù)當H0成立時,統(tǒng)計量
241對于給定的顯著性水平,查表得:拒絕域為242
其單邊檢驗情況如下:右邊檢驗:假設(shè)
拒絕域:
243
左邊檢驗:假設(shè)
拒絕域:
計算s代入得,如果落入拒絕域,則否定H0,否則接受H0。244例4假設(shè)鋼板重量總體近似服從正態(tài)分布,按照規(guī)定,這種鋼板的方差不得超過0.016kg,現(xiàn)隨機抽取n=25的鋼板樣本,測得其樣本,試問:是否可以認為這批鋼板不合規(guī)格?2
245
解:依題意,假設(shè)選取統(tǒng)計量對于給定的顯著性水平,查表得將樣本值代入得:
落入拒絕域中,拒絕假設(shè)H0,即鋼板的方差不合格。
246§4.2兩個正態(tài)總體均值與方差的檢驗
1、關(guān)于兩個正態(tài)總體均值的檢驗(t檢驗)設(shè)總體,,與分別是來自總體x與Y的樣本,且兩樣本獨立。均未知,但要注意在這里,假設(shè)兩總體的方差是相等的。247
檢驗假設(shè)
當H0成立時,統(tǒng)計量
其中
248
對于給定的顯著性水平,查表得
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030中國板藍根顆粒市場行情監(jiān)測及未來前景趨勢預(yù)測研究報告
- 2025-2030中國智能疏導系統(tǒng)行業(yè)市場發(fā)展現(xiàn)狀及發(fā)展趨勢與投資前景研究報告
- 文獻版權(quán)保護與合理使用-洞察闡釋
- 滬粵版八年級物理下冊課程創(chuàng)新與改進計劃
- 紅樓夢經(jīng)典閱讀計劃
- 聲音與敘事記憶-洞察闡釋
- 動態(tài)優(yōu)化方法與風險管理結(jié)合的創(chuàng)新生態(tài)系統(tǒng)管理-第1篇-洞察闡釋
- 三臺縣事業(yè)單位招聘工作人員筆試真題2024
- 2024化學檢驗工理論高級工練習卷附答案
- 天臺縣紀委縣監(jiān)委下屬事業(yè)單位選聘考試真題2024
- 2025年財務(wù)管理全球經(jīng)濟試題及答案
- 2025-2030年芳綸纖維行業(yè)市場深度調(diào)研及發(fā)展趨勢與投資研究報告
- 2024年濱州市沾化區(qū)區(qū)屬國有企業(yè)招聘考試真題
- 紡織機械操作知識掌握策略試題及答案
- 煙臺科目一試題及答案
- 2025年廣東佛山市三水海江建設(shè)投資有限公司招聘筆試參考題庫含答案解析
- 【高中英語】2025年高考英語作文預(yù)測(10大主題+55篇范文)下
- (完整)北京版小學英語1至6年級詞匯(帶音標)
- DL∕T 1901-2018 水電站大壩運行安全應(yīng)急預(yù)案編制導則
- 檢驗員標準培訓記錄
- 中國市場橄欖油與消費者健康及使用需求聯(lián)合調(diào)研報告(共46頁).docx
評論
0/150
提交評論