緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)_第1頁(yè)
緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)_第2頁(yè)
緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)_第3頁(yè)
緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)_第4頁(yè)
緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩50頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)§1、估計(jì)和假設(shè)檢驗(yàn):統(tǒng)計(jì)推斷的兩個(gè)孿生分支§2、

參數(shù)估計(jì)§3、點(diǎn)估計(jì)量的性質(zhì)§4、假設(shè)檢驗(yàn)緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第1頁(yè)!統(tǒng)計(jì)推斷的含義:我們知道,總體是指我們所關(guān)注現(xiàn)象出現(xiàn)的可能結(jié)果的全體,樣本是總體的一個(gè)子集。統(tǒng)計(jì)推斷研究的是總體與來(lái)自總體的樣本之間的關(guān)系。一般地說,統(tǒng)計(jì)推斷是根據(jù)來(lái)自總體的樣本對(duì)總體(概率密度函數(shù))的種種統(tǒng)計(jì)特征作出判斷。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第2頁(yè)!§1、估計(jì)和假設(shè)檢驗(yàn):統(tǒng)計(jì)推斷的兩個(gè)孿生分支統(tǒng)計(jì)推斷的主要步驟(舉例說明):首先,關(guān)注某一總體,如紐約股票交易市場(chǎng)的1758支(90年9月4日)股票,想要研究該總體某一方面的統(tǒng)計(jì)特征,比如說股票價(jià)格與收入比(P/E)的平均值。在總體中抽取隨機(jī)樣本,如50支股票,求樣本中每一支股票的P/E值,然后再計(jì)算平均P/E值,即,就稱為總體平均P/E的估計(jì)量(也即E(X)的估計(jì)量,E(X)為總體的一個(gè)參數(shù))。從而完成統(tǒng)計(jì)推斷的步:參數(shù)估計(jì)。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第3頁(yè)!其次,判斷估計(jì)值的“優(yōu)度”,主要因?yàn)楣烙?jì)值很可能不等于真實(shí)的參數(shù)值。如果有兩個(gè)或更多個(gè)隨機(jī)樣本,計(jì)算這些樣本的均值,則得到的估計(jì)值很可能不相同。我們把不同樣本估計(jì)值的差異稱為抽樣誤差,從而引入一些判定估計(jì)量?jī)?yōu)劣的常用標(biāo)準(zhǔn)。再次,進(jìn)行假設(shè)檢驗(yàn)。假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的另一個(gè)重要方面。在假設(shè)檢驗(yàn)中,可以對(duì)某參數(shù)的假定值進(jìn)行先驗(yàn)判斷或預(yù)期。如以往的經(jīng)驗(yàn)或?qū)<乙庖娭С?758值股票總體的平均P/E值為12,若隨機(jī)樣本計(jì)算出的值為11,則根據(jù)假設(shè)檢驗(yàn)的內(nèi)容接受假設(shè)或者拒絕假設(shè)。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第4頁(yè)!

67891011121314151618P/E頻數(shù)225657543461均值=11.5樣本方差=9.2755樣本標(biāo)準(zhǔn)差=3.0456中位數(shù)=眾位數(shù)=11總計(jì):50假設(shè)的樣本(50值股票的P/E值)緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第5頁(yè)!若x2未知,可用其估計(jì)量S2來(lái)替代,則有:服從自由度為(n-1)的t分布。在上里中,由50個(gè)樣本觀察值,故自由度為49。查t分布表得到:P(-2.0096≦t≦2.0096)=0.95即區(qū)間[-2.0096,2.0096]包括t的概率為95%。將t變量公式帶入,經(jīng)整理得:

10.63≦x≦12.36,即為x的95%的置信區(qū)間。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第6頁(yè)!由計(jì)算式P(-2.0096≦t≦2.0096)=0.95可得出:整理得:在統(tǒng)計(jì)學(xué)中,上述公式稱為未知的總體均值x的一個(gè)95%的置信區(qū)間。0.95稱為置信系數(shù)。表示隨機(jī)區(qū)間包括真實(shí)x的概率為0.95。區(qū)間下限區(qū)間上限緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第7頁(yè)!歸納區(qū)間估計(jì)概念假定隨機(jī)變量X服從某一概率分布,若要對(duì)其參數(shù)(如x)進(jìn)行估計(jì)。選取容量為n的隨機(jī)樣本,X1,X2,…,Xn,并根據(jù)樣本計(jì)算兩個(gè)估計(jì)量L和U:P(L≦x

≦U)=1-0<<1即從L到U的隨機(jī)區(qū)間包括真實(shí)x的概率為(1-)。L稱為區(qū)間下限,U稱為區(qū)間上限。該區(qū)間稱為x的置信區(qū)間。(1-)稱為置信系數(shù),稱為顯著水平,或犯類錯(cuò)誤的概率。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第8頁(yè)!3.1線性線性估計(jì)量:若估計(jì)量是樣本觀察值的線性函數(shù),則稱該估計(jì)量是線性估計(jì)量。上式看出,樣本均值是樣本觀察值Xs的線性函數(shù),即Xs僅以一次冪的形式出現(xiàn)。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第9頁(yè)!例1:若Xi~N(x,2),假定從該正態(tài)總體中隨機(jī)抽取容量為n的樣本。則樣本均值是真實(shí)x的無(wú)偏估計(jì)量。(參考樣本均值的抽樣分布或概率分布)。例2:若Xi~N(x,2),假定從該正態(tài)總體中隨機(jī)抽取容量為n的樣本。Xmed表示樣本中位數(shù),可以證明E(Xmed)=x,即樣本中位數(shù)也是真實(shí)均值的無(wú)偏估計(jì)量。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第10頁(yè)!即對(duì)大樣本而言,樣本均值和樣本中位數(shù)均服從均值為x

的正態(tài)分布,但樣本中位數(shù)的方差是樣本均值的方差的(/2)倍。根據(jù)有效性的性質(zhì),用樣本均值估計(jì)x比用樣本中位數(shù)Xmed更準(zhǔn)確,即樣本均值提供了一個(gè)比樣本中位數(shù)更為準(zhǔn)確的總體均值的估計(jì)值。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第11頁(yè)!3.5一致性假定X~N(x,2),從該正態(tài)總體中抽取一容量為n的隨機(jī)樣本?,F(xiàn)考慮x的兩個(gè)估計(jì)量:個(gè)估計(jì)量是常用的樣本均值,則E()=

x

。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第12頁(yè)!xn=100n=80n=50n=25概率密度f(wàn)(X*)隨著樣本容量的增大,總體均值估計(jì)量X*的變化示意圖緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第13頁(yè)!§4、假設(shè)檢驗(yàn)在股票的P/E一例中,上一節(jié)我們根據(jù)50個(gè)P/E值組成的隨機(jī)樣本,建立了x的一個(gè)95%的置信區(qū)間。即在該區(qū)間內(nèi)包括x的概率為95%?,F(xiàn)在改變策略,不是建立一個(gè)置信區(qū)間,而是假設(shè)真實(shí)的x取某一特定值,如x=13。然后去檢驗(yàn)這個(gè)假設(shè),檢驗(yàn)結(jié)果是接受或拒絕該假設(shè)?下面以此為例說明。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第14頁(yè)!用假設(shè)的語(yǔ)言,將x=13稱為零假設(shè),用符號(hào)H0表示。即,H0:x=13與零假設(shè)相對(duì)應(yīng)的是備擇假設(shè),用符號(hào)H1表示,備擇假設(shè)有以下幾種形式:H1:x>13稱為單邊備擇假設(shè);H1:x<13稱為單邊備擇假設(shè);H1:x≠13稱為雙邊備擇假設(shè)。為了檢驗(yàn)零假設(shè)(和備擇假設(shè)),根據(jù)樣本數(shù)據(jù)及統(tǒng)計(jì)理論建立判定規(guī)則來(lái)判斷樣本信息是否支持零假設(shè)。若支持,不拒絕零假設(shè),反之拒絕零假設(shè),接受備擇假設(shè)。建立判定規(guī)則有兩種方法:置信區(qū)間法、顯著性檢驗(yàn)法。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第15頁(yè)!接受區(qū)域:上述不等式所描述的置信區(qū)間稱為接受區(qū)域。零假設(shè)的臨界區(qū)域(或拒絕區(qū)域):接受區(qū)域以外的稱為零假設(shè)的臨界區(qū)域或拒絕區(qū)域。臨界值:接受區(qū)域的上界和下界稱為臨界值。它們是接受或拒絕零假設(shè)的分界線。歸納:如果參數(shù)值在零假設(shè)下位于接受區(qū)域內(nèi),則不拒絕零假設(shè),若落在接受區(qū)域以外(即落在拒絕區(qū)域內(nèi)),則拒絕零假設(shè)。10.6312.36P/E值P/E總體均值的95%的置信區(qū)間緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第16頁(yè)!類錯(cuò)誤:亦稱棄真錯(cuò)誤。在上述P/E例子中,我們以95%的置信度拒絕了零假設(shè):x=13,那么是否就意味著上表中所給出的樣本就不是來(lái)自均值為13的正態(tài)總體呢?或許事實(shí)的確如此。但是由于不等式給出的置信區(qū)間的置信度是95%,而非100%,故x有2.5%的可能性取值為13。如果真是這樣,則拒絕H0:x=13,就可能犯錯(cuò)誤,這種情況下,我們說犯了類錯(cuò)誤(也稱棄真錯(cuò)誤)。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第17頁(yè)!第二類錯(cuò)誤:亦稱取偽錯(cuò)誤。在上述例子中,假定零假設(shè)H0:x=12,在這種情況下,根據(jù)上述置信區(qū)間,我們應(yīng)該不拒絕零假設(shè)。但是上表中的數(shù)據(jù)很可能不是來(lái)自均值為12的正態(tài)總體,此時(shí)我們會(huì)犯第二類錯(cuò)誤,也即取偽錯(cuò)誤。在研究中,我們想盡可能減小這兩種錯(cuò)誤。但是,對(duì)于任一給定的樣本,我們不可能同時(shí)做到犯這兩種錯(cuò)誤的概率都很小。其解決方法為:先固定犯類錯(cuò)誤的概率在一很低水平上,再考慮如何減小犯第二類錯(cuò)誤的概率。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第18頁(yè)!置信系數(shù)(1-)就是1減去“犯類錯(cuò)誤的概率”,因此,95%的置信系數(shù)表示接受零假設(shè)犯類錯(cuò)誤的概率至多為5%。以下用實(shí)例來(lái)進(jìn)一步闡明假設(shè)檢驗(yàn)的置信區(qū)間法。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第19頁(yè)!查t分布表得:當(dāng)自由度為19時(shí),P(-2.861≦t≦2.861)=0.99整理得出:將已知條件代入,得:5.22≦x≦7.78(近似值)由于該區(qū)間包括了零假設(shè)值7.5,因此,我們不拒絕零假設(shè):真實(shí)的x=7.5。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第20頁(yè)!5.227.78b)x的95%的置信區(qū)間7.50.5%99%0.5%H0:x=7.595%2.5%2.5%5.567.447.5a)x的99%的置信區(qū)間緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第21頁(yè)!在零假設(shè)下設(shè)定x

為一給定值,從而求出t值。由于該式中的t值服從自由度為(n-1)的t分布,根據(jù)t分布很容易求出獲此t值的概率。如果與x的差別不大(絕對(duì)值形式),則根據(jù)上式,t值為0,在這種情況下,我們接受零假設(shè)。隨著t的絕對(duì)值的增大,逐漸趨于拒絕零假設(shè)。在能拒絕零假設(shè)之前,最大的t的絕對(duì)值是多少呢?它直接取決于置信水平(犯類錯(cuò)誤的概率)和自由度。顯著性檢驗(yàn)方法的關(guān)鍵之處是檢驗(yàn)統(tǒng)計(jì)量(t統(tǒng)計(jì)量)以及在假定x

為一給定值下該t統(tǒng)計(jì)量的概率分布。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第22頁(yè)!當(dāng)自由度為49時(shí),在5%的顯著水平下,查表得臨界的t值為-2.0096和2.0096(見下圖),獲此t值小于或等于-2.0096的概率為2.5%,獲得此t值大于或等于2.0096的概率也為2.5%。95%=2.5%=2.5%t=-3.5-2.00962.00960t檢驗(yàn)的顯著性:雙邊檢驗(yàn)緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第23頁(yè)!單邊檢驗(yàn)當(dāng)備擇假設(shè)為單邊假設(shè)時(shí),則檢驗(yàn)這個(gè)假設(shè)為單邊假設(shè)。如在P/E以利中,H0:x=13,H1:x

<13。單邊檢驗(yàn)與雙邊檢驗(yàn)相類似,只是在單邊檢驗(yàn)中,僅僅需要決定統(tǒng)計(jì)量單一的臨界值,而不是兩個(gè)臨界值。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第24頁(yè)!95%=5%01.68t檢驗(yàn)的顯著性:左側(cè)單邊檢驗(yàn)t=-3.5緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第25頁(yè)!零H0備擇假設(shè)臨界區(qū)域,拒絕H0,若x=0x>0x=0x<0x=0x≠0t檢驗(yàn)小結(jié)最后一列給出了t臨界值,個(gè)下標(biāo)表示顯著水平,d.t代表自由度。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第26頁(yè)!如果已知樣本容量n及樣本方差S2,總體方差2未知,則根據(jù)2分布可對(duì)未知的總體方差2建立一個(gè)(1-)的置信區(qū)間,其機(jī)制與t檢驗(yàn)類似。在零假設(shè)H0下,給定2一個(gè)具體的值,則可利用上述公式直接計(jì)算出2的值,并根據(jù)2分布表進(jìn)行顯著性檢驗(yàn)。例:假定隨機(jī)樣本來(lái)自正態(tài)總體,樣本容量為31,樣本方差為12。檢驗(yàn)零假設(shè):真實(shí)的方差為9;備擇假設(shè):真實(shí)的方差不等于9。給定顯著性水平=5%。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第27頁(yè)!2.F檢驗(yàn)在講F分布時(shí),我們討論過,如果X、Y是來(lái)自兩正態(tài)總體的隨機(jī)樣本,自由度分別為m和n,則變量:服從自由度為(m-1)和(n-1)的F分布。假定兩正態(tài)總體同方差(H0:x2=y2),用上式的F檢驗(yàn)檢驗(yàn)該零假設(shè)。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第28頁(yè)!根據(jù)F分布表,自由度為30、24,在1%的顯著水平下,臨界的F值為2.58。由于計(jì)算的F值為1.32,小于2.58,故不能拒絕零假設(shè):兩總體同方差。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第29頁(yè)!§2、

參數(shù)估計(jì)點(diǎn)估計(jì):假定隨機(jī)變量X(P/E)服從某一未知均值和方差的正態(tài)分布。并且有來(lái)自該正態(tài)總體的一個(gè)隨機(jī)樣本(50個(gè)P/E值),見下表。如何根據(jù)這些樣本數(shù)據(jù)計(jì)算總體的均值和方差呢?先假設(shè)只關(guān)注總體均值x=E(X)。根據(jù)表中數(shù)據(jù),50個(gè)P/E的樣本均值為11.4,顯然我們可以選擇11.4作為x的估計(jì)值,稱這個(gè)單一數(shù)值為x的點(diǎn)估計(jì)值,稱計(jì)算公式為x的點(diǎn)估計(jì)量緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第30頁(yè)!注意:點(diǎn)估計(jì)是一個(gè)隨機(jī)變量,因?yàn)槠渲惦S樣本的不同而不同,那么,某一特殊的估計(jì)值的可信度有多大呢?為了更好地估計(jì)總體特征,引入?yún)^(qū)間估計(jì)。區(qū)間估計(jì):區(qū)間估計(jì)的主要思想源于估計(jì)量抽樣分布(概率分布)的概念。我們知道,如果隨機(jī)變量X~N(x,x2),則,或緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第31頁(yè)!自由度為49的t分布2.5%95%2.5%02.0096-2.0096緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第32頁(yè)!需要特別強(qiáng)調(diào)一點(diǎn):上式給出的區(qū)間是隨機(jī)的區(qū)間,它依賴于樣本值的變化而變化,盡管總體均值x是未知的,但它是固定值,而非隨機(jī)量。由此,我們不能說x位于上述區(qū)間的概率為0.95,只能說該區(qū)間包括真實(shí)的x的概率為0.95。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第33頁(yè)!§3、點(diǎn)估計(jì)量的性質(zhì)在P/E一例中,用樣本均值作為x的點(diǎn)估計(jì)量,滿足了以下性質(zhì):⑴線性⑵無(wú)偏性⑶有效性⑷最優(yōu)線性無(wú)偏估計(jì)量⑸一致性緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第34頁(yè)!3.2無(wú)偏性無(wú)偏估計(jì)量:如果重復(fù)使用某種方法,得到的估計(jì)量的均值(如E())與真實(shí)參數(shù)值x一致,該估計(jì)量就是無(wú)偏估計(jì)量。即如果二者不相等,則稱該估計(jì)量是有偏的估計(jì)量。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第35頁(yè)!3.3有效性有效估計(jì)量:若僅考慮唯一一個(gè)參數(shù)估計(jì)量,則方差最小的估計(jì)量是最好的或稱為有效的估計(jì)量。對(duì)比樣本均值和樣本中位數(shù)。假定隨機(jī)變量X的取值構(gòu)成一隨機(jī)樣本,樣本容量為n,并且每個(gè)X~N(x,2),令、Xmed分別表示樣本均值和樣本中位數(shù)。已知:~N(x,2/n)若樣本容量足夠大,可以證明,

Xmed~N(x,(/2)(2/n))緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第36頁(yè)!3.4最優(yōu)線性無(wú)偏估計(jì)量最優(yōu)線性無(wú)偏估計(jì)量:如果一個(gè)估計(jì)量是線性的和無(wú)偏的,并且在參數(shù)的所有線性無(wú)偏估計(jì)量中,這個(gè)估計(jì)量的方差最小,則稱這個(gè)估計(jì)量是最優(yōu)線性無(wú)偏估計(jì)量。顯然,該性質(zhì)包括了線性、無(wú)偏性和最小方差性。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第37頁(yè)!可以證明,顯然第二個(gè)估計(jì)量X*是一個(gè)有偏估計(jì)量。兩個(gè)估計(jì)量的差別在于前者的分母是n而后者的分母是n+1。但是,假定我們?cè)龃髽颖救萘?,則隨著樣本容量的增大,第二個(gè)估計(jì)量X*的均值也將近似等于真實(shí)的x,在統(tǒng)計(jì)學(xué)中,我們成這樣的估計(jì)量(如X*)為一致估計(jì)量。有時(shí)得不到無(wú)偏估計(jì)量,但卻可以得到一個(gè)一致估計(jì)量。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第38頁(yè)!統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)§1、估計(jì)和假設(shè)檢驗(yàn):統(tǒng)計(jì)推斷的兩個(gè)孿生分支§2、

參數(shù)估計(jì)§3、點(diǎn)估計(jì)量的性質(zhì)§4、假設(shè)檢驗(yàn)緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第39頁(yè)!

67891011121314151618P/E頻數(shù)225657543461均值=11.5樣本方差=9.2755樣本標(biāo)準(zhǔn)差=3.0456中位數(shù)=眾位數(shù)=11總計(jì):50假設(shè)的樣本(50支股票的P/E值)緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第40頁(yè)!4.1置信區(qū)間法在上述例子中,我們知道樣本均值服從均值為x,方差為2/n的正態(tài)分布,由于真實(shí)的方差未知,以樣本方差代替。在這種情況下,樣本均值服從t分布,從而得到x

的一個(gè)95%的置信區(qū)間:10.63≦x≦12.36(近似值)置信區(qū)間提供了在某一置信度下(如95%)真實(shí)的x

的取值范圍。因此,如果這個(gè)區(qū)間不包括零假設(shè)中的值,如x=13,則拒絕零假設(shè),即我們以95%的置信度拒絕零假設(shè)。反之,接受零假設(shè)。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第41頁(yè)!10.6312.36P/E值P/E總體均值的95%的置信區(qū)間132.5%95%2.5%4.2類錯(cuò)誤和第二類錯(cuò)誤H0:x=13緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第42頁(yè)!10.6312.36P/E值P/E總體均值的95%的置信區(qū)間122.5%95%2.5%H0:x=12緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第43頁(yè)!犯類錯(cuò)誤的概率通常用符號(hào)表示,稱為顯著水平;犯第二類錯(cuò)誤的概率通常用符號(hào)表示。則:類錯(cuò)誤==犯棄真錯(cuò)誤的概率;第二類錯(cuò)誤==犯取偽錯(cuò)誤的概率。不犯第二類錯(cuò)誤的概率=(1-)。當(dāng)H0為假時(shí),拒絕H0,稱為檢驗(yàn)的功效。假設(shè)檢驗(yàn)的標(biāo)準(zhǔn)做法是:給定某一顯著水平的,如=0.01(或0.05),然后使檢驗(yàn)的功效最大,即使最小。由于求解過程比較復(fù)雜,在實(shí)際中,僅僅給出值,而沒有過多考慮值。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第44頁(yè)!例:壇子里的花生的重量服從正態(tài)分布,但均值和方差是未知的。隨機(jī)選取20個(gè)壇子,發(fā)現(xiàn)其樣本均值和樣本方差分別為6.5和4。檢驗(yàn)零假設(shè):真實(shí)均值為7.5;備則假設(shè):真實(shí)均值不是7.5。給定顯著水平1%。若顯著水平為5%,又會(huì)如何?分析:令X代表壇子中花生的重量,因此,X~N(x,2),兩個(gè)參數(shù)x

和2均是未知的。由于知道樣本方差,故設(shè)計(jì)t變量,它服從自由度為19的t分布。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第45頁(yè)!若置信水平為5%,也就意味著決定冒更大的風(fēng)險(xiǎn)犯類錯(cuò)誤。分析如下:根據(jù)t分布表,當(dāng)=5%,自由度為19時(shí),t的臨界值為-2.093和+2.093,即P(-2.093≦t≦2.093)=0.95按照上述步驟,求得:5.56≦x≦7.44(近似值)由于該區(qū)間不包括7.5,因此,拒絕零假設(shè):真實(shí)的x=7.5。后者和前者的不同之處在于后者的置信區(qū)間比前者略窄一些,反映了不同的顯著水平下置信區(qū)間有所區(qū)別。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第46頁(yè)!4.3顯著性檢驗(yàn)顯著性檢驗(yàn)是一種兩者擇一的假設(shè)檢驗(yàn),但它卻是完備的。現(xiàn)通過P/E一例加以說明。根據(jù)以下公式可知:服從自由度為(n-1)的t分布。在具體應(yīng)用中,、S、n已知,x

未知。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第47頁(yè)!在P/E例子中,=11.5,S=3.0456,n=50。令H0:x=13,H1:x

≠13,則有:t=(11.5-13)/(3.0456/√50)=-3.4826根據(jù)該t值能否拒絕零假設(shè)呢?在沒有設(shè)定置信水平之前,無(wú)法回答這個(gè)問題?,F(xiàn)假定置信水平為5%,即=5%。由于備擇假設(shè)是雙邊假設(shè),因此,可以將犯類錯(cuò)誤的風(fēng)險(xiǎn)均分在t分布的兩側(cè)——兩個(gè)拒絕區(qū)域(計(jì)算的t值位于任何一個(gè)拒絕區(qū)域,都能夠拒絕零假設(shè))。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第48頁(yè)!顯然,t值位于t分布的左側(cè)拒絕區(qū)域。因此,拒絕零假設(shè)。在顯著性檢驗(yàn)時(shí),經(jīng)常遇到的兩個(gè)術(shù)語(yǔ):檢驗(yàn)(統(tǒng)計(jì)量)是顯著的:當(dāng)能夠拒絕零假設(shè)時(shí),認(rèn)為檢驗(yàn)是顯著的。檢驗(yàn)(統(tǒng)計(jì)量)是統(tǒng)計(jì)不顯著的:當(dāng)不能拒絕零假設(shè)時(shí),就說不是統(tǒng)計(jì)顯著的。緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第49頁(yè)!95%=5%01.68t檢驗(yàn)的顯著性:右側(cè)單邊檢驗(yàn)緒論四統(tǒng)計(jì)推斷:估計(jì)與假設(shè)檢驗(yàn)共55頁(yè),您現(xiàn)在瀏覽的是第50頁(yè)!從上圖可以看出,現(xiàn)在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論