




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第五章 數(shù)理統(tǒng)計(jì)的基本概念內(nèi)容提要本章主要講述樣本,總體,參數(shù)與參數(shù)空間;直方圖與經(jīng)驗(yàn)分布函數(shù);統(tǒng)計(jì)量,分布,分布和分布;分位數(shù);正態(tài)總體的抽樣分布等內(nèi)容重點(diǎn)分析1、 理解總體、個(gè)體、樣本和統(tǒng)計(jì)量的概念。2、 了解直方圖的作法。3、 掌握樣本均值、樣本方差的計(jì)算。4、 了解分布、分布、分布的定義,并會(huì)查表計(jì)算。5、 了解分位數(shù)的概念,并會(huì)查表計(jì)算。6、 了解正態(tài)總體的某些常用統(tǒng)計(jì)量的分布。難點(diǎn)分析1、 統(tǒng)計(jì)量、分位數(shù)的概念2、 分布、分布、分布的定義與性質(zhì)。3、 正態(tài)總體的抽樣分布。習(xí)題布置習(xí)題5 (1,3,5,9)備注教 學(xué) 內(nèi) 容 ( Contents )Chapter Five 數(shù)理統(tǒng)計(jì)
2、的基本概念(Basic Concept of Mathematical Statistics)5.1 樣本和總體(Sample and Collectivity)一、 樣本(Sample)數(shù)理統(tǒng)計(jì)的研究對(duì)象是受隨機(jī)性影響的數(shù)據(jù),這些通過觀察或試驗(yàn)得到的數(shù)據(jù)稱為樣本或子樣(Sample),這些觀察或試驗(yàn)過程稱為抽樣(Sample)。例如用同一架天平稱某重物次,得到一組個(gè)數(shù)據(jù) (5.1)就稱它們是一個(gè)樣本,其中稱為樣本容量。每個(gè)容量為的樣本都可稱為維空間的一個(gè)點(diǎn),樣本所有可能的取值構(gòu)成了維空間的一個(gè)子集,稱為樣本空間(Sample space),記作注意“數(shù)據(jù)”一詞在這里是廣義的。它可以是實(shí)數(shù)值,
3、例如表示稱得某重物的重量;也可以是事物的屬性,例如=“正品”,(或“廢品”)等等,通常為了方便研究,也常將這些屬性數(shù)量化,例如用“”表示“廢品”,“”表示“正品”,當(dāng)然這不是本質(zhì)的問題。有時(shí)數(shù)據(jù)也可以是一組向量,例如武器試驗(yàn)中給出一組彈著點(diǎn)的坐標(biāo)即為二維向量的一組樣本,在多元統(tǒng)計(jì)分析中,將專門研究這種情形。對(duì)于樣本需要強(qiáng)調(diào)兩點(diǎn):)樣本并非一堆雜亂無章無規(guī)律可循的數(shù)據(jù),它是受隨機(jī)性影響的一組數(shù)據(jù),因此,用概率論的話說,就是每個(gè)樣本既可以視為一組數(shù)據(jù),又可視為一組隨機(jī)變量,這就是所謂樣本的二重性。當(dāng)通過一次具體的試驗(yàn),得到一組觀測(cè)值,這時(shí)樣本表現(xiàn)為一組數(shù)據(jù);但這組數(shù)據(jù)的出現(xiàn)并非是必然的,它只能以一
4、定的概率(或概率密度)出現(xiàn),這就是說,當(dāng)考察一個(gè)統(tǒng)計(jì)方法是否具有某種普遍意義下的效果時(shí),又需要將其樣本視為隨機(jī)變量,而一次具體試驗(yàn)得到的數(shù)據(jù),則可視為隨機(jī)變量的一個(gè)實(shí)現(xiàn)值。今后為行文方便,我們常交替使用上述兩種觀點(diǎn)來看待樣本,而不去每次聲明此處樣本是指隨機(jī)變量還是其實(shí)現(xiàn)值,同時(shí)一律采用記號(hào)(5.1)來表示它。)樣本(5.1)也不是任意一組隨機(jī)變量,我們要求它是一組獨(dú)立同分布的隨機(jī)變量。同分布就是要求樣本具有代表性,獨(dú)立是要求樣本中各數(shù)據(jù)的出現(xiàn)互不影響,就是說,抽取樣本時(shí)應(yīng)該是在相同條件下獨(dú)立重復(fù)地進(jìn)行。如Example 5.1 設(shè)一組抽獎(jiǎng)券共10000張,其中有5張有獎(jiǎng)。問連續(xù)抽取3張均有獎(jiǎng)的
5、概率為多少?為了討論這個(gè)問題,不妨設(shè)要求該事件的概率,實(shí)際上即是求聯(lián)合概率分布在處的值。但題中沒有說明“連續(xù)抽取”是“有放回的”還是“無放回的”,我們不妨都計(jì)算一下:()無放回時(shí):()有放回時(shí):顯然()中的抽樣方式不是獨(dú)立的,每次抽樣的結(jié)果都將影響下一次抽樣的分布,這種抽樣不是我們通常研究的抽樣。而()中的抽樣,則是多次獨(dú)立的抽樣,它們是同分布的,即我們通常稱為的隨機(jī)抽樣(Random sample)。這樣得到的數(shù)據(jù),即是我們常研究的簡(jiǎn)單隨機(jī)樣本(Simple random sample),或就直接稱為樣本。由此可以看出,對(duì)于樣本(5.1),如果每個(gè)的共同分布為,則樣本(5.1)的分布為 (5
6、.2)相應(yīng)地,若有共同概率密度,則(5.1)的概率密度為 (5.3)二、 總體(Collectivity)總體(Collectivity)或母體在許多教科書上通常被定義為研究對(duì)象全體的集合。其含義是,我們觀察到的樣本總是由某個(gè)具體事物產(chǎn)生,并反映該事物的特征,這時(shí),可以把樣本視為一些被抽取的該事物的個(gè)體,而將該事物本身視為所有個(gè)體的集合即總體。但這樣說多少有點(diǎn)模糊。如在例5.1中,我們自然可以將10000張抽獎(jiǎng)券視為總體,但如果是用一架天平去重復(fù)稱同一重物,得到重物的重量,在這種事中,什么是研究對(duì)象的全體呢?因此,我們寧愿采用另一種說法,即總體是一個(gè)隨機(jī)變量,它的分布即為(5.1)中每個(gè)的共同
7、分布,或者可以看作樣本容量時(shí)的樣本的分布。用這個(gè)觀點(diǎn)敘述一些問題就顯得很方便,例如樣本(5.1)就可視為由總體獨(dú)立“拷貝”出來的同分布的個(gè)隨機(jī)變量。又如Example 5.2 用兩臺(tái)車床車同一批產(chǎn)品,分別車及件,尺寸為及這時(shí),我們得到的樣本是, (5.4)它們顯然通常不會(huì)是同分布的,但這種樣本在我們的研究中經(jīng)常出現(xiàn)。為此我們用總體的觀點(diǎn),可以很方便地視它為出自兩個(gè)總體,的樣本。有了總體這個(gè)概念,我們就可以將統(tǒng)計(jì)推斷的基本任務(wù)概括為由樣本推斷總體。如在例5.2中,我們就可以從樣本(5.4)中推斷出總體與是否有顯著差別。關(guān)于這一基本任務(wù),我們今后可以慢慢體會(huì)到。由于推斷總體實(shí)質(zhì)上是推斷總體的分布,
8、即解決一個(gè)實(shí)際統(tǒng)計(jì)問題,往往歸結(jié)為總體分布的確定,所以我們也常稱總體的分布是該問題的統(tǒng)計(jì)模型(Statistics model)。三、 參數(shù)與參數(shù)空間(Parameter and parameter space)如前所述,數(shù)理統(tǒng)計(jì)問題的分布一般來說是未知的,需要通過樣本來推斷。但如果對(duì)總體絕對(duì)地一無所知,那么,所能做出的推斷的可信度一般也極為有限。在很多情況下,往往是知道總體所具有的分布形式,而不知道的僅僅是分布中的參數(shù)。這在實(shí)際中是大量能見到的,因?yàn)?,分布的總體形式我們往往可以通過具體的應(yīng)用背景或以往的經(jīng)驗(yàn)加以確定。Example 5.3 考慮如何由樣本的實(shí)際背景確定統(tǒng)計(jì)模型,即總體的分布:
9、() 樣本記錄隨機(jī)抽取的件產(chǎn)品的正品、廢品情況。() 樣本表示同一批個(gè)電子元件的壽命(小時(shí))。() 樣本表示同一批件產(chǎn)品某一尺寸(mm)。通過分析或經(jīng)驗(yàn),我們?nèi)菀字溃?) 服從兩點(diǎn)分布,其概率分布為=0,1,所需確定的是參數(shù).() 通常服從指數(shù)分布,其密度函數(shù)所需確定的是參數(shù)0() 通常服從正態(tài)分布,其密度函數(shù)所需確定的是參數(shù),其中,對(duì)于每個(gè)總體,我們稱其分布中參數(shù)的一切可能取值的集合為參數(shù)空間(Parameter space),記為,如在例5.3中,(),(),()。其中今后對(duì)于統(tǒng)計(jì)推斷,如果總體的分布為形式已知,僅對(duì)參數(shù)進(jìn)行推斷,我們就稱之為參數(shù)推斷(Parameter deduce)(
10、估計(jì),檢驗(yàn));否則,稱為非參數(shù)推斷(Non-parameter deduce)5.2 直方圖與經(jīng)驗(yàn)分布函數(shù)(Vertical Grapy and Empirical Distribution Function)一、 直方圖(Vertical Grapy)設(shè)是總體的一個(gè)樣本,又設(shè)總體具有概率密度,如何用樣本來推斷?注意到現(xiàn)在的樣本是一組實(shí)數(shù),因此,一個(gè)直觀的辦法是將實(shí)軸劃分為若干小區(qū)間,記下諸觀察值落在每個(gè)小區(qū)間中的個(gè)數(shù),根據(jù)大數(shù)定律中頻率近似概率的原理,從這些個(gè)數(shù)來推斷總體在每一小區(qū)間上的密度。具體做法如下:10 找出,。取略小于,略大于;20 將分成個(gè)小區(qū)間,小區(qū)間長(zhǎng)度可以不等,設(shè)分點(diǎn)為在分
11、小區(qū)間時(shí),注意每個(gè)小區(qū)間中都要有若干觀察值,而且觀察值不要落在分點(diǎn)上。30 記=落在小區(qū)間中觀察值的個(gè)數(shù)(頻數(shù)),計(jì)算頻率,列表分別記下各小區(qū)間的頻數(shù)、頻率。40 在直角坐標(biāo)系的橫軸上,標(biāo)出各點(diǎn),分別以為底邊,作高為的矩形,即得直方圖5-1圖5-1實(shí)際上,我們就是用直方圖對(duì)應(yīng)的分段函數(shù)來近似總體的密度函數(shù)這樣做為什么合理?我們引進(jìn)“唱票隨機(jī)變量”,對(duì)每個(gè)小區(qū)間,定義則是獨(dú)立同分布于兩點(diǎn)分布:其中,由柯爾莫哥洛夫強(qiáng)大數(shù)定律,我們有以概率為成立,于是當(dāng)充分大時(shí),就可用來近似代替上式右邊以()為曲邊的曲邊梯形的面積,而且若充分大,較小時(shí),我們就可用小矩形的高度來近似取代.二、 經(jīng)驗(yàn)分布函數(shù)(Empi
12、rical distribution function)對(duì)于總體的分布函數(shù)(未知),設(shè)有它的樣本,我們同樣可以從樣本出發(fā),找到一個(gè)已知量來近似它,這就是經(jīng)驗(yàn)分布函數(shù).它的構(gòu)造方法是這樣的,設(shè)諸觀察值按從小到大可排成 (5.5)定義只在,處有躍度為的間斷點(diǎn),若有個(gè)觀察值相同,則在此觀察值處的躍度為對(duì)于固定的,即表示事件在次試驗(yàn)中出現(xiàn)的頻率,即落在中的個(gè)數(shù)。用與直方圖分析相同的方法可以論證,以概率為成立。經(jīng)驗(yàn)分布函數(shù)的圖形如圖5-2圖5-2實(shí)際上,還一致地收斂于,所謂格里文科定理指出了這一更深刻的結(jié)論,即其中.5.3 統(tǒng)計(jì)量及其分布(Statistic and Distribution)一、 統(tǒng)計(jì)
13、量(Statistic)在利用樣本推斷總體時(shí),往往不能直接利用樣本,而需要對(duì)它進(jìn)行一定的加工,這樣才能有效地利用其中的信息,否則,樣本只是呈現(xiàn)為一堆“雜亂無章”的數(shù)據(jù)。Example 5.4 從某地區(qū)隨機(jī)抽取50戶農(nóng)民,調(diào)查其年收入情況,得到下列數(shù)據(jù)(每戶人均元):924 800 916 704 870 1040 824 690 574 490972 988 1266 684 764 940 408 804 610 852602 754 788 962 704 712 854 888 768 848882 1192 820 878 614 846 746 828 792 872696 644
14、926 808 1010 728 742 850 864 738試對(duì)該地區(qū)農(nóng)民收入的水平和貧富懸殊程度做個(gè)大致分析。顯然,如果不進(jìn)行加工,面對(duì)這大堆大小參差不齊的數(shù)據(jù),你很難得出什么印象。但是只要對(duì)這些數(shù)據(jù)稍事加工,便能作出大致分析:如記各農(nóng)戶的年收入數(shù)為,則考慮這樣,我們可以從得出該地區(qū)農(nóng)民平均人均收人水平屬中等,從可以得出該地區(qū)農(nóng)民貧富懸殊不大的結(jié)論。(當(dāng)然還需要一些參照資料)由此可見對(duì)樣本的加工是十分重要的。對(duì)樣本加工,主要就是構(gòu)造統(tǒng)計(jì)量。用數(shù)學(xué)的語言說,所謂統(tǒng)計(jì)量(Statistic)是一個(gè)不含未知參數(shù)的樣本的已知函數(shù)。設(shè)樣本為,則統(tǒng)計(jì)量通常記為Example 5.5 設(shè)為總體的樣本,
15、則下列各量均是統(tǒng)計(jì)量,它們今后要經(jīng)常被用到。(),稱為樣本均值(Sample Average)。(ii),稱為樣本方差(Sample Variance)。(iii),稱為樣本標(biāo)準(zhǔn)差(Sample standard variance )。(iv),稱為樣本階原點(diǎn)矩(Sample order origin moment)。(v),稱為樣本階中心矩(Sample order central moment)。Example 5.6 設(shè)為二維總體的樣本,則下列各量為統(tǒng)計(jì)量:()稱為樣本協(xié)方差(Sample covariance)。()稱為樣本相關(guān)系數(shù)(Sample correlation coeffic
16、ient),其中,類似。Example 5.7 設(shè)是出自總體的樣本,其中為未知參數(shù),則是統(tǒng)計(jì)量,但諸如等均不是統(tǒng)計(jì)量,因它含有未知參數(shù)或Example 5.8 將中觀察值按式(5.5)排列,則為一組統(tǒng)計(jì)量,它們稱為一組順序統(tǒng)計(jì)量(Order Statistic),稱為第個(gè)順序統(tǒng)計(jì)量( No. Order Statistic),其中特別地稱 為最小順序統(tǒng)計(jì)量(Minimum order Statistic); 為最大順序統(tǒng)計(jì)量(Maximum order Statistic);為樣本中位數(shù)(Sample median)。為了研究統(tǒng)計(jì)量的分布,我們先研究三種重要概率分布。二、分布(distribu
17、tion)Definition 5.1 設(shè)為相互獨(dú)立的隨機(jī)變量,它們都服從標(biāo)準(zhǔn)正態(tài)分布,則稱隨機(jī)變量服從自由度為的分布(distribution),記作下面的定理稱為分布的可加性定理Theorem 5.1 設(shè)是個(gè)相互獨(dú)立的隨機(jī)變量,,,則Proof: 不妨設(shè),其余情況易由歸納法推得。考慮一組獨(dú)立同分布于的隨機(jī)變量,則與同分布,與同分布,而與獨(dú)立,與獨(dú)立,故它們各自的和相應(yīng)同分布,即與同分布,而后者服從證畢。分布有下列基本性質(zhì)。Theorem 5.2 設(shè),則(),()的密度函數(shù)為 (5.6)其中稱為伽馬函數(shù),定義為Proof: ()設(shè)為獨(dú)立同分布于的隨機(jī)變量,則與同分布,且又由獨(dú)立并注意到的四階
18、矩為,可得()證明略。圖5-3描繪了分布密度函數(shù)在時(shí)的圖形。可以看出,隨著的增大,的圖形趨于“平緩”,其圖形下面積的重心亦逐步往右下移動(dòng)。另外,費(fèi)歇(R.A.Fisher)曾證明,當(dāng)較大時(shí),近似服從.圖5-3三、 分布和分布( distribution and distribution)Definition 5.2 設(shè),與獨(dú)立,則稱隨機(jī)變量服從自由度為的分布( distribution),又稱學(xué)生氏分布,記成利用獨(dú)立隨機(jī)變量商的密度公式,不難由已知的,的密度公式得到的密度:顯然它是的偶函數(shù),圖5-4描繪了時(shí)的概率密度曲線,作為比較,還描繪了的密度曲線。圖5-4利用伽馬函數(shù)的斯特林公式可以證明從
19、圖形我們也可看出,隨著的增大,的密度曲線與的密度曲線越來越接近,一般若,就可認(rèn)為它基本與相差無幾了。Definition 5.3 設(shè),與獨(dú)立,則稱隨機(jī)變量服從自由度為(,)的分布(distribution),記成類似可得,的密度函數(shù)為圖5-5描繪了幾種分布的密度曲線。由分布的定義容易看出,若,則圖5-5四、 分位數(shù)設(shè)為一隨機(jī)變量,為其分布函數(shù),我們知道對(duì)于給定的實(shí)數(shù),給出了事件的概率。在統(tǒng)計(jì)中,我們常常需要考慮上述問題的逆問題:就是若已給定分布函數(shù)的值,亦即已給定事件的概率,要確定取什么值。易知,對(duì)通常連續(xù)型隨機(jī)變量,實(shí)際上就是求的反函數(shù),準(zhǔn)確地說,有如下定義:Definition 5.4 設(shè)
20、的分布函數(shù)為,滿足則稱為的分位數(shù)(點(diǎn))。若有密度,則分位數(shù)表示以左的一塊陰影面積(如圖5-6)為圖5-6幾種常用分布的分位點(diǎn)都在書后附表中可以查到。其中是分布函數(shù)表反過來查,而其它幾個(gè)分布,則是分別對(duì)給出的幾個(gè)的常用值,如=0,0.25,0.05,0.1,0.9,0.95,0.975等等,列出相應(yīng)分布對(duì)應(yīng)值的分位點(diǎn)。圖5-7給出了四種常用分布的分位點(diǎn)表示方法,其中的分位點(diǎn)通常記成.圖5-7這里要注意到如下幾個(gè)有用的事實(shí)。) 若,要求的分位數(shù)可化成求的分位數(shù):此時(shí),故,即) 對(duì)于,由密度函數(shù)的對(duì)稱性可知即 .c) 對(duì)于,即 ) 對(duì)于較大的,由,的漸近性質(zhì),可得或 (5.7)利用這些事實(shí)可以擴(kuò)展分位數(shù)表。Example 5.9 求下列分位數(shù):(i) ;(ii) ;(iii) ;(iv) .Solution ()從表中,查不到,取表中接近的數(shù)應(yīng)在0.8997與0.9015之間,從表頭查出相應(yīng)的為1.28與1.29,故取()分布表沒有但利用對(duì)稱性,可查出,故()從分布表中,查不到,可查出,故()表上查不到,需利用式(5.7)查出,五、 正態(tài)總體的抽樣分布(Sample distribution of normal collectivity)在概率統(tǒng)計(jì)問題中,正態(tài)分布占據(jù)著十分重要的位置,這
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 年產(chǎn)35萬噸汽油調(diào)和項(xiàng)目可行性研究報(bào)告申請(qǐng)備案
- 2025年中國(guó)蒸餾設(shè)備行業(yè)發(fā)展?jié)摿︻A(yù)測(cè)及投資戰(zhàn)略研究報(bào)告
- 國(guó)際現(xiàn)代物流園區(qū)項(xiàng)目可行性研究報(bào)告申請(qǐng)建議書
- 2020-2025年中國(guó)卷閘門電機(jī)行業(yè)市場(chǎng)調(diào)查研究及投資前景預(yù)測(cè)報(bào)告
- 2021-2026年中國(guó)蒸汽電磁閥市場(chǎng)全面調(diào)研及行業(yè)投資潛力預(yù)測(cè)報(bào)告
- 2022-2027年中國(guó)旅游酒店行業(yè)市場(chǎng)全景評(píng)估及投資方向研究報(bào)告
- 營(yíng)銷網(wǎng)絡(luò)建設(shè)項(xiàng)目可行性研究報(bào)告建議書
- 油料電導(dǎo)率儀行業(yè)行業(yè)發(fā)展趨勢(shì)及投資戰(zhàn)略研究分析報(bào)告
- 2025年中國(guó)煤炭物流行業(yè)市場(chǎng)深度分析及投資策略咨詢報(bào)告
- 建筑材料添加劑行業(yè)行業(yè)發(fā)展趨勢(shì)及投資戰(zhàn)略研究分析報(bào)告
- 高分子材料完整版課件
- excel表格水池側(cè)壁及底板配筋計(jì)算程序(自動(dòng)版)
- DB1301∕T 369-2021 設(shè)施蔬菜有機(jī)肥替代化肥技術(shù)規(guī)程
- 商業(yè)寫字樓運(yùn)營(yíng)費(fèi)用
- 完整版:美制螺紋尺寸對(duì)照表(牙數(shù)、牙高、螺距、小徑、中徑外徑、鉆孔)
- FEMA:潛在的失效模式及影響分析解析課件
- 三腔二囊管的應(yīng)用和護(hù)理--PPT課件 (3)
- 流體力學(xué)第二版蔡增基課件
- 英語書寫模板
- 湖北省機(jī)關(guān)事業(yè)單位勞動(dòng)合同制工人
- 云南省普通初中學(xué)生成長(zhǎng)記錄.doc
評(píng)論
0/150
提交評(píng)論