第五章數(shù)理統(tǒng)計(jì)的基本知識(shí)_第1頁(yè)
第五章數(shù)理統(tǒng)計(jì)的基本知識(shí)_第2頁(yè)
第五章數(shù)理統(tǒng)計(jì)的基本知識(shí)_第3頁(yè)
第五章數(shù)理統(tǒng)計(jì)的基本知識(shí)_第4頁(yè)
第五章數(shù)理統(tǒng)計(jì)的基本知識(shí)_第5頁(yè)
已閱讀5頁(yè),還剩39頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章數(shù)理統(tǒng)計(jì)的基本知識(shí)第一節(jié)數(shù)理統(tǒng)計(jì)的基本概念一、總體與總體分布總體是具有一定共性的研究對(duì)象的全體,其大小與范圍隨具體研究與考察的目的而確定.總體確定后,我們稱總體的每一個(gè)成員為個(gè)體.定義1:統(tǒng)計(jì)學(xué)中稱隨機(jī)變量(或向量)為總體,并把隨機(jī)變量(或向量)的分布稱為總體分布.注:(1)有時(shí)個(gè)體的特性的直接描述并非是數(shù)量指標(biāo),但總可將其數(shù)量化,如檢驗(yàn)?zāi)硨W(xué)校全體學(xué)生的血型,試驗(yàn)的結(jié)果有型、型、型、型4種,若分別以1,2,3,4依次記這4種血型,則試驗(yàn)的結(jié)果就可以用數(shù)量表示了;(2)總體的分布一般來(lái)說(shuō)是未知的,有時(shí)即使知道其分布的類(lèi)型(如正態(tài)分布、二項(xiàng)分布等),但不知這些分不中所含的參數(shù)等(如等),數(shù)理統(tǒng)計(jì)的任務(wù)就是根據(jù)總體中部分個(gè)體的數(shù)據(jù)資料對(duì)總體的未知分布進(jìn)行統(tǒng)計(jì)推斷.按一定規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察,通過(guò)觀察可得到關(guān)于總體的一組數(shù)值其中每一是從總體中抽取的某一個(gè)體的數(shù)量指標(biāo)的觀察值,上述抽取過(guò)程稱為抽樣,所抽取的部分個(gè)體稱為樣本,樣本中所含個(gè)體數(shù)目稱為樣本的容量.樣本是一個(gè)隨機(jī)變量(或向量).容量為的樣本可視為維隨機(jī)向量一旦具體取定一組樣本,便得到樣本的一次具體的觀察值稱其為樣本值.二、樣本與樣本分布例1樣本及觀察值的表示方法:(1)某食品廠用自動(dòng)裝罐機(jī)生產(chǎn)凈重為345克的午餐`肉罐頭,由于隨機(jī)性,每個(gè)罐頭的凈重都有差別,現(xiàn)在從生產(chǎn)線上隨機(jī)抽取10個(gè)罐頭,秤其凈重,得如下結(jié)果:344336345342340338344343344343這是一個(gè)容量為10的樣本的觀察值,它是來(lái)自該生產(chǎn)線罐頭凈重這一總體的一個(gè)樣本的觀察值.最常用的一種抽樣方法稱為簡(jiǎn)單隨機(jī)抽樣,它要求抽取的樣本滿足下面兩個(gè)條件:注:今后假定所考慮的樣本均為簡(jiǎn)單隨機(jī)樣本,簡(jiǎn)稱為樣本.1.代表性:與所考察的總體具有相同的分布;2.獨(dú)立性:是相互獨(dú)立的隨機(jī)變量.由簡(jiǎn)單隨機(jī)抽樣得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,它可用與總體獨(dú)立同分布的個(gè)相表示.互獨(dú)立的隨機(jī)變量設(shè)總體的分布函數(shù)為則簡(jiǎn)單隨機(jī)樣本的聯(lián)合分布函數(shù)為并稱其為樣本分布.特別地,若總體為連續(xù)型隨機(jī)變量,其概率密度為則樣本的概率密度為分別稱與為連續(xù)總體密度若總體為離散型隨機(jī)變量,其概率分布為取遍所有可能取值,則樣本的概率分布為分別稱與為離散總體密度與離散樣本密度.例2如果總體服從正態(tài)分布,則稱總體為正態(tài)總體.正態(tài)總體是統(tǒng)計(jì)應(yīng)用中最常見(jiàn)的總體,現(xiàn)設(shè)總體服從正態(tài)分布則其樣本密度由下式給出:例3設(shè)總體服從參數(shù)為的泊松分布,為其樣本,則樣本的概率分布為其中取非負(fù)整數(shù),而三、統(tǒng)計(jì)推斷問(wèn)題簡(jiǎn)述通過(guò)總體的一個(gè)樣本分布進(jìn)行推斷,此即為統(tǒng)計(jì)推斷問(wèn)題.樣本值的關(guān)系:總體推斷(個(gè)體)樣本樣本值樣抽對(duì)總體的總體、樣本、在實(shí)際應(yīng)用中,總體的分布一般是未知的,或雖然知道總體分布所屬的類(lèi)型,但其中包含有未知參數(shù).為對(duì)總體分布進(jìn)行推斷,可對(duì)總體進(jìn)行抽樣研究,對(duì)總體的每次抽樣,均得到樣本的一組確定的值——樣本值,統(tǒng)計(jì)推斷就是利用通過(guò)大量抽樣得到的樣本值,反過(guò)來(lái)對(duì)總體分布的屬的類(lèi)型,分布中所含的未知參數(shù)進(jìn)行推斷.或總體四、分組數(shù)據(jù)統(tǒng)計(jì)表和頻率直方圖1.分組數(shù)據(jù)表:若樣本值較多時(shí),組,分組的組數(shù)應(yīng)與樣本容量相適應(yīng).可將其分成若干區(qū)間所含的樣本值個(gè)數(shù)稱為該區(qū)間的組頻數(shù).組頻數(shù)與總的樣本容量之比稱為組2.頻率直方圖:頻率直方圖能直觀地表示出組頻率數(shù)的分布.其步驟如下:(1)設(shè)是樣本個(gè)觀察值.的中求出和最的最小者大者將區(qū)間等分成個(gè)小區(qū)間使(一般取(2)(略小于)和(略大于),選取常數(shù)并在左右,且小區(qū)間不包含右端點(diǎn)):(3)組頻率及求組頻數(shù)(4)在上以為高,為寬作小矩形,其面積恰為所有小矩形合在一起就構(gòu)成了頻率直方圖.典型的頻率直方圖如下圖所示.參考教材P129,例4五、經(jīng)驗(yàn)分布函數(shù)定義2設(shè)總體的一個(gè)容量為的樣本的樣本值可按大小次序排列成若則不大于的樣本值的頻率為因而函數(shù)與事件在獨(dú)立重復(fù)試驗(yàn)中的頻率相同的,稱為經(jīng)驗(yàn)分布函數(shù).例5隨機(jī)觀察總體得到一個(gè)容量為10的樣本值:求經(jīng)驗(yàn)分布函數(shù).解把樣本值按從小到大的順序排列為于是得經(jīng)驗(yàn)分布函數(shù)為其中如時(shí),因事件包含樣本值個(gè)數(shù)故事件發(fā)生的頻率為從而六、統(tǒng)計(jì)量與常用的統(tǒng)計(jì)量定義3:設(shè)為總體的一個(gè)樣本,樣本的任一不含總體分布未知參數(shù)的函數(shù)為該樣本的統(tǒng)計(jì)量.例如,設(shè)總體服從正態(tài)分布,未知.為總體的一個(gè)樣令稱此本,則與均為該樣本的統(tǒng)計(jì)量,但不是統(tǒng)計(jì)量.常用統(tǒng)計(jì)量以下設(shè)為總體的一個(gè)樣本.1.樣本均值2.樣本方差3.樣本標(biāo)準(zhǔn)差4.樣本(k階)原點(diǎn)矩5.樣本(k階)中心矩6.順序統(tǒng)計(jì)量將樣本中的各分量按由小到大的次序排列成則稱為樣本的一組順序統(tǒng)計(jì)量,稱為樣本的第個(gè)順序統(tǒng)計(jì)量.特別地,與分別為樣本極小值與樣本極大值,并稱為樣本的極差.稱例6某廠實(shí)行計(jì)件工資制,為及時(shí)了解情況,隨機(jī)抽取30名工人,調(diào)查各自在一周內(nèi)加工的零件數(shù),然后按規(guī)定算出每名工人的周工資如下:(單位:元)其樣本均值它反映了該廠工人周工資的一般水平.為:這便是一個(gè)容量為30的樣本觀察值,所以樣本方差為進(jìn)一步我們計(jì)算樣本方差及樣本標(biāo)準(zhǔn)差由于樣本標(biāo)準(zhǔn)差為例7(分組樣本均值與方差的近似計(jì)算)如果在例中收集得到的樣本觀察值用分組樣本形式給出6(見(jiàn)表A),此時(shí)樣本均值可用下面方法近似計(jì)算:以表示第個(gè)組的組中值(即區(qū)間的中點(diǎn)),為第組的組頻數(shù),則這與例7的結(jié)果差不多.再求樣本方差的近似值,時(shí)有而樣本標(biāo)準(zhǔn)差為例7的結(jié)果相差也不大.其結(jié)果與此例8設(shè)我們獲得了如下三個(gè)樣本:樣本樣本樣本如果將它們畫(huà)在數(shù)軸上(如圖),明顯可見(jiàn)它們的“分散”程度是不同的:樣本在這三個(gè)樣本中比較密集,而樣本比較分散.這一直覺(jué)可以用樣本方差來(lái)表示.這三個(gè)樣本的均值都是5,即而樣本容量易得同理易得由此可見(jiàn)這與直覺(jué)是一致的.由于樣本方差的量綱與樣品的量綱不一致,故常用樣本標(biāo)準(zhǔn)差表示分散程度,易求出同樣有第二節(jié)常用的統(tǒng)計(jì)分布一、分位數(shù)設(shè)隨機(jī)變量的分布函數(shù)為對(duì)給定的實(shí)數(shù)若實(shí)數(shù)滿足不等式(1)則稱為隨機(jī)變量的分布的水平為的上側(cè)分位數(shù).若實(shí)數(shù)滿足不等式(2)分位數(shù).則稱為隨機(jī)變量的分布的水平為的雙側(cè)例如,標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位數(shù)和雙側(cè)分位數(shù)分別如下圖:分位數(shù)的性質(zhì):通常,直接求解分位數(shù)是很困難的,對(duì)常用的統(tǒng)計(jì)分布,可利用附錄中給出的分布函數(shù)值表來(lái)得到分位數(shù)的值.例1設(shè)求標(biāo)準(zhǔn)正態(tài)分布的水平0.05的上側(cè)分位數(shù)和雙側(cè)分位數(shù).解由于查標(biāo)準(zhǔn)正態(tài)分布函數(shù)值表可得而水平0.05的雙側(cè)分位數(shù)為它滿足:查標(biāo)準(zhǔn)正態(tài)分布函數(shù)值表可得今后,分別記與為標(biāo)準(zhǔn)正態(tài)分布的上側(cè)注:分位數(shù)與雙側(cè)分位數(shù).分布定義1:設(shè)是取自總體的樣本,則稱統(tǒng)計(jì)量(1)服從自由度為的分布,記為這里,自由度是指(1)式右端所包含的獨(dú)立變量的個(gè)分布的概率密度:數(shù).二、其中G(.)為Gamma函數(shù),G()(1)分布的數(shù)學(xué)期望與方差:若則分布的性質(zhì):分布的可加性:若且與相互獨(dú)立,則(2)分布的分位數(shù):(3)設(shè)對(duì)給定的實(shí)數(shù)足條件的數(shù)為分布的水平的上側(cè)分位數(shù).稱滿對(duì)不同的與分位數(shù)的值已經(jīng)編制成表供查用(參見(jiàn)附表5).例如,查表得:例2設(shè)是來(lái)自總體的樣本,又設(shè)試求常數(shù)使服從分布.解因?yàn)樗郧蚁嗷オ?dú)立,于是故應(yīng)取則有定義2:設(shè)且與相互獨(dú)立,則稱服從自由度為的分布,記為分布三、分布的概率密度:(1)的圖形關(guān)于軸對(duì)稱,且即有但較小時(shí),兩者相差較大;(2)當(dāng)充分大時(shí),分布近似于標(biāo)準(zhǔn)正態(tài)分布,(3)分布的分位數(shù)對(duì)給定的實(shí)數(shù)稱滿足條件的點(diǎn)為分布的水平的上側(cè)分位數(shù).似地,可給出分布的雙由的對(duì)稱性及定義有類(lèi)側(cè)分位數(shù)對(duì)不同的與分布的上側(cè)分位數(shù)可自附表4查得.例3設(shè)隨機(jī)變量隨機(jī)變量均服從且都相互獨(dú)立,令試求的分布,并確定的值,使解由于定義3:設(shè)立,則稱

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論