




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、6 數(shù)理統(tǒng)計(jì)的基本概念6.1 基本要求1 理解總體、樣本(品)、樣本容量、簡(jiǎn)單隨機(jī)樣本的概念。能在總體分布給定情況下,正確無(wú)誤地寫(xiě)出樣本的聯(lián)合分布,這是本章的難點(diǎn)。2* 該部分內(nèi)容考研不作要求。 了解樣本的頻率分布、經(jīng)驗(yàn)分布函數(shù)的定義,了解頻率直方圖的作法。3 了解c2分布、t分布和F分布的概念及性質(zhì),了解臨界值的概念并會(huì)查表計(jì)算。4 理解樣本均值、樣本方差及樣本矩的概念。了解樣本矩的性質(zhì),能借助計(jì)算器快速完成樣本均值、樣本方差觀察值的計(jì)算。了解正態(tài)總體的某些常用抽樣分布。6.2 內(nèi)容提要6.2.1 總體和樣本1 總體和個(gè)體 研究對(duì)象的某項(xiàng)特征指標(biāo)值的全體稱(chēng)為總體(或母體),組成總體的每個(gè)元素
2、稱(chēng)為個(gè)體??傮w是一個(gè)隨機(jī)變量,常用X,Y等來(lái)表示。2 樣本 從總體中隨機(jī)抽出n個(gè)個(gè)體稱(chēng)為容量為n的樣本,其中每個(gè)個(gè)體稱(chēng)為樣品,它們都是隨機(jī)變量。3 簡(jiǎn)單隨機(jī)樣本 設(shè)X1,X2,Xn是來(lái)自總體X的容量為n的樣本,如果這n個(gè)隨機(jī)變量X1,X2,Xn相互獨(dú)立且每個(gè)樣品Xi與總體X具有相同的分布,則稱(chēng)X1,X2,Xn為總體X的簡(jiǎn)單隨機(jī)樣本。4 樣本的聯(lián)合分布若總體X具有分布函數(shù)F(x),則樣本(X1,X2,Xn)的聯(lián)合分布函數(shù)為若總體X為連續(xù)型隨機(jī)變量,其概率密度函數(shù)為f(x),則樣本的聯(lián)合概率密度為 (6.1)若總體X為離散型隨機(jī)變量,其分布律為PX=ai=pi (i=1,2,n),則樣本的聯(lián)合分布
3、為 (6.2)其中為的任一組可能的觀察值。6.2.2 樣本分布1 頻率分布 設(shè)樣本值(x1,x2,xn)中不同的數(shù)值是x1*,x2*,xl*,記相應(yīng)的頻數(shù)分別為n1,n2,nl,其中x1*< x2*<< xl*且。則樣本的頻數(shù)分布及頻率分布可由表6-1給出。表6-1指標(biāo)Xx1*x2*xl*頻數(shù)nin1n2nl頻率2 經(jīng)驗(yàn)分布函數(shù)定義 設(shè)(X1,X2,Xn)為總體X的一個(gè)樣本,其樣本值為(x1,x2,xn),則稱(chēng)函數(shù)為樣本值(x1,x2,xn)的經(jīng)驗(yàn)分布函數(shù)。若已知樣本值(x1,x2,xn)的頻數(shù)、頻率分布表為指標(biāo)Xx1*x2*xl*頻數(shù)nin1n2nl 頻率則經(jīng)驗(yàn)分布函數(shù) (
4、6.3)6.2.3 幾個(gè)重要分布及臨界值1分布 設(shè)X1,X2,Xn是相互獨(dú)立的隨機(jī)變量,且XiN (0,1) (i=1,2,n),則稱(chēng)隨機(jī)變量服從自由度為n的分布,簡(jiǎn)記為(n)。2 分布的性質(zhì):(1)設(shè)(n),則, (2)設(shè),且Y1,Y2相互獨(dú)立,則有3t分布 設(shè),且X,Y相互獨(dú)立,則稱(chēng)隨機(jī)變量服從自由度為n的t分布,或稱(chēng)學(xué)生氏(Student)分布,簡(jiǎn)記為T(mén)t(n)。4t分布的性質(zhì)(1) (2) ;這里f (x)為t分布的概率密度函數(shù)。5F分布 設(shè),且X,Y相互獨(dú)立,則稱(chēng)隨機(jī)變量所服從的分布是自由度為m,n的F分布,簡(jiǎn)記為FF(m,n)。6F分布的性質(zhì)(1) 若則 (2) 若FF(m,n),
5、則。7臨界值(1) 標(biāo)準(zhǔn)正態(tài)分布的臨界值 設(shè)XN(0,1),對(duì)給定的正數(shù),若存在實(shí)數(shù)滿(mǎn)足則稱(chēng)點(diǎn)為標(biāo)準(zhǔn)正態(tài)分布X的臨界值 (或稱(chēng)上分位點(diǎn)或分位數(shù))。由,若已知,可通過(guò)反查標(biāo)準(zhǔn)正態(tài)分布表,求出臨界值。當(dāng)時(shí),表中無(wú)法查出,此時(shí)查表,再由可求得臨界值。(2)分布的臨界值 設(shè),概率密度為f(x)。對(duì)給定的數(shù)(01),若存在實(shí)數(shù)滿(mǎn)足則稱(chēng)數(shù)為分布的臨界值。已知n,通過(guò)查分布表可求得。當(dāng)n45時(shí),可利用近似公式: 這里是標(biāo)準(zhǔn)正態(tài)分布的臨界值。(3) t分布的臨界值 設(shè)Tt(n),概率密度為f(x)。對(duì)給定的(01。若存在實(shí)數(shù)滿(mǎn)足則稱(chēng)點(diǎn)為t分布的臨界值。已知n,通過(guò)查t分布表可求得。注:1) 類(lèi)似標(biāo)準(zhǔn)正態(tài)分布臨
6、界值的性質(zhì),對(duì)t分布亦有:;2) 當(dāng)n45時(shí),可用正態(tài)分布近似 。(4) F分布的臨界值 設(shè)FF(m, n),概率密度為f(x)。對(duì)給定的(01,若存在實(shí)數(shù)(m,n)滿(mǎn)足則稱(chēng)數(shù)(m,n)為F分布的臨界值。注意公式6.2.4 統(tǒng)計(jì)量及樣本矩1統(tǒng)計(jì)量 設(shè)(X1,X2,Xn)為總體X的一個(gè)樣本,(X1,X2,Xn)是X1,X2,Xn的函數(shù),若是連續(xù)函數(shù)且不含末知參數(shù),則稱(chēng)(X1,X2,Xn)是一個(gè)統(tǒng)計(jì)量。2幾個(gè)常用的統(tǒng)計(jì)量樣本矩(1)樣本均值。(2)樣本方差。(3)樣本標(biāo)準(zhǔn)差。(4)樣本k階原點(diǎn)矩。(5)樣本k階中心矩。3 樣本矩與總體矩的關(guān)系由樣本的獨(dú)立性及與總體同分布這一特性出發(fā),運(yùn)用數(shù)字特征的
7、運(yùn)算法則,可得:若總體X的期望、方差存在,即,又(X1,X2,Xn)是取自總體X的一個(gè)樣本,則,;,。 (6.4)上述結(jié)論無(wú)論總體服從什么樣的分布都正確,故它是計(jì)算任意總體,特別是非正態(tài)總體的樣本均值和樣本方差的期望、方差的常用結(jié)論。6.2.5 正態(tài)總體樣本均值和樣本方差的分布1 設(shè)總體XN(),()為樣本,為樣本均值,為樣本方差(1) ,或 N (0,1); (6.5)(2) (6.6)(3) (6.7)(4) 樣本均值與樣本方差相互獨(dú)立;(5) (6.8)2設(shè)()是取自總體X的一個(gè)樣本,()是取自總體Y的一個(gè)樣本,且這兩個(gè)樣本相互獨(dú)立,即假定,是n1+n2個(gè)相互獨(dú)立的隨機(jī)變量。若總體XN(
8、),YN(),則有1)N(0,1); (6.9)2)F(n11,n21); (6.10)3)當(dāng)時(shí),有 t(n1+n22); (6.11)其中,。6.3 典型例題分析已知總體,求樣本的聯(lián)合分布例1.設(shè)(X1,X2,Xn)是取自總體X的一個(gè)樣本。試在下列三種情況下,分別寫(xiě)出樣本(X1,X2,Xn)的聯(lián)合分布律或聯(lián)合概率密度。(1)XB(1,p);(2)X服從參數(shù)為的指數(shù)分布;(3)X服從(0,)(>0)上的均勻分布。分析: 解此類(lèi)題先寫(xiě)出總體X的分布律(或概率密度);再由Xi與X有相同的分布以及Xi之間的相互獨(dú)立性,由式(6.1),(6.2)即可寫(xiě)出樣本(X1,X2,Xn)的聯(lián)合分布律或聯(lián)合
9、概率密度。解:(1) 因?yàn)榭傮w分布律為于是樣本的聯(lián)合分布律為:(2) 因?yàn)榭傮w概率密度函數(shù)為: 所以,每一個(gè)樣本的概率密度為:故樣本的聯(lián)合概率密度為:(3)因?yàn)榭傮w概率密度函數(shù)為:所以樣本Xi的概率密度為故,樣本的聯(lián)合概率密度為:例2設(shè)XN(),(X1,X2,X3)為來(lái)自總體X的一個(gè)樣本。試求樣本(X1,X2,X3)的聯(lián)合概率密度和樣本均值的概率密度函數(shù)。解: 由于故又因?yàn)?,所以,的概率密度函?shù)為:注: 此題用到結(jié)論:若,則。這一結(jié)果有十分廣泛的應(yīng)用。例3.設(shè)總體服從泊松分布,是來(lái)自總體的簡(jiǎn)單隨機(jī)樣本(1) 計(jì)算;(2) 若容量為10的一組樣本觀察值為(1,2,4,3,3,4,5,6,4,8)
10、,試計(jì)算樣本均值,樣本方差和經(jīng)驗(yàn)分布函數(shù)。解: (1)解法一 由(6.4)式,因?yàn)?,于是,故,解法?故 (2),又X的頻率分布表為指標(biāo)X1234568頻數(shù)ni1123111頻率1/101/102/103/101/101/101/10所以,經(jīng)驗(yàn)分布函數(shù)為注: (1)解法一直接運(yùn)用樣本矩與總體矩之間的關(guān)系,即(6.4)式求得; 解法二運(yùn)用樣本與總體同分布的特性及數(shù)字特征的運(yùn)算法則求得。(2)寫(xiě)經(jīng)驗(yàn)分布函數(shù),可先列出頻率分布表,這樣不至遺漏或出錯(cuò)。例4 設(shè)總體為樣本。試求:(1)數(shù)學(xué)期望與方差,的數(shù)學(xué)期望;(2)。解: 計(jì)算總體X的數(shù)學(xué)期望和方差故(1),。(2)因?yàn)?,所以注:?dāng)總體的期望和方差不
11、能直接寫(xiě)出時(shí),要先求總體的期望和方差,再求樣本均值、樣本方差及樣本二階中心矩的期望和方差。另外,要注意與之間的差異。由于,即是總體方差的無(wú)偏估計(jì),而不是總體方差的無(wú)偏估計(jì),因此,一般都是以作為方差的估計(jì)量。但,故當(dāng)樣本容量很大時(shí),和兩者相差很小,此時(shí)亦可用來(lái)估計(jì)總體方差。因此,有時(shí)把稱(chēng)為大樣本方差,而有的書(shū)上也稱(chēng)為樣本修正方差。本題(2)的解答用到了中心極限定理。由中心極限定理可得,不論總體服從什么分布,只要知道總體的數(shù)學(xué)期望,方差,則樣本均值的漸近分布就為正態(tài)分布。即由此可知求樣本均值落在某個(gè)區(qū)間內(nèi)的概率,就可以利用上述結(jié)論近似計(jì)算,這是很重要的結(jié)論。*例5 設(shè)是來(lái)自正態(tài)總體的簡(jiǎn)單樣本,且則
12、當(dāng)時(shí),統(tǒng)計(jì)量h服從c2-分布,其自由度為( )。解:解法1 令則欲使,就必須使,由于于是令,則 ,此時(shí)。解法2 由于且相互獨(dú)立,則從而所以為使必須使同上面兩個(gè)服從正態(tài)分布的隨機(jī)變量比較可知 即 。注:本題雖用了兩種不同的解法,但目的相同且明確,即由分布的定義并由h構(gòu)成的特點(diǎn),應(yīng)選擇恰當(dāng)?shù)腶,b使h恰為兩個(gè)標(biāo)準(zhǔn)正態(tài)分布的平方和。*例6 設(shè)是來(lái)自正態(tài)總體X的一個(gè)簡(jiǎn)單隨機(jī)樣本,證明:統(tǒng)計(jì)量T服從自由度為2的t-分布.。證明: 由于從而所以故 于是 又因?yàn)?,?從而與獨(dú)立。于是由t分布的定義知注: 本題的關(guān)鍵是熟練掌握t分布的定義及正態(tài)總體下樣本均值、樣本方差的分布: N(0,1), 。例7已知X。證
13、明F(1,n)。證明: 因?yàn)?, 即 , 其中 ,又, 而 故由F-分布的定義知: 注: 本題解答看似簡(jiǎn)單,但本章所學(xué)的三個(gè)分布都涉及到。因而了解證明過(guò)程中每一步的來(lái)龍去脈,對(duì)于熟悉、掌握有關(guān)隨機(jī)變量及其分布是一項(xiàng)基礎(chǔ)性訓(xùn)練。例8設(shè)(X1,X2,Xn)是來(lái)自正態(tài)總體N(0,1)的樣本。試求統(tǒng)計(jì)量(m<n)的抽樣分布。解 因?yàn)樗?, 故 同理 于是 例9設(shè)(X1,X5)是來(lái)自正態(tài)總體N()的一個(gè)樣本。試證:(1)當(dāng)時(shí),F(xiàn)(1,3);(2)當(dāng)時(shí),t(3)。解 (1) 于是由F-分布的定義,即得:(2) 據(jù)(1)的分析,由t-分布的定義即得結(jié)論。注: 本題仍是關(guān)于F-分布和t-分布的基礎(chǔ)訓(xùn)練
14、題。例10 設(shè)為總體的一個(gè)樣本,求。解: 因?yàn)橛谑?,由分布臨界值的定義,查表可知,故。注: 本題由于出現(xiàn)了隨機(jī)變量的平方和,故在尋找的分布時(shí)自然想到分布。但分布中的均服從N (0,1),所以只要將此處的標(biāo)準(zhǔn)化即可。由臨界值的定義,一般查表是已知a,找臨界值,而此處則相反,是已知臨界值找a,故得到的是近似值。*例11 從正態(tài)總體中抽取容量為n的樣本,如果要求其樣本均值位于區(qū)間(1.4,5.4)內(nèi)的概率不小于0.95,問(wèn)樣本容量n至少應(yīng)取多少?Z1.281.6451.962.33F(z)0.9000.9500.9750.990解 : 設(shè)正態(tài)總體為X,則,從而由(6.5)式得所以即。由此可得,即n
15、³(1.96´3)2»34.57,故n至少應(yīng)取35。例12設(shè)X1,X2,Xn為相互獨(dú)立且分別服從正態(tài)分布N()的隨機(jī)變量。設(shè)證明:。特別地,若N() i=1,2,n,則。證明 相互獨(dú)立故 同理可證若N() i=1,2,n,則。注: 本例說(shuō)明n個(gè)相互獨(dú)立正態(tài)分布隨機(jī)變量的線(xiàn)性組合仍服從正態(tài)分布。特殊情形:若取,則結(jié)論正是正態(tài)總體下樣本均值的分布(6.5)式。該題結(jié)果可作為一般結(jié)論直接引用。例13設(shè)總體XN ()。現(xiàn)抽取容量為9的樣本,得到,問(wèn)是多少?解 :而服從自由度為n-1=8的t分布,又由于t分布的對(duì)稱(chēng)性,有令,查表知,由插值可求得,即。注: 本題的關(guān)鍵是尋找含
16、有統(tǒng)計(jì)量的分布。由于s2未知,故不能用來(lái)解題,但S已知,由(6.8)式得,于是由t分布臨界值的定義即可順利求得相應(yīng)的概率。例14 設(shè)是來(lái)自總體X的隨機(jī)樣本,求下列概率。(1)(2)解 (1)由內(nèi)容提要知»0.98-0.02=0.96(2)利用(6.7)式得注: 本題關(guān)鍵是要注意這兩個(gè)統(tǒng)計(jì)量的差異。它們雖然都服從分布,但由于與的不同使其自由度也不同。查表時(shí),上述兩個(gè)隨機(jī)變量的自由度分別是10和9。同例10由于是反查表,得到的仍是近似值。例15 求總體N(20,3)的容量分別為10,15的兩個(gè)獨(dú)立樣本均值差的絕對(duì)值大于0.3的概率。解 設(shè)兩獨(dú)立樣本分別為X,Y,其樣本均值分別為,則由內(nèi)容
17、提要中(6.9)式知即 故 注 :以上各題(例11-15),是掌握正態(tài)總體下幾種常用統(tǒng)計(jì)量分布的基礎(chǔ)訓(xùn)練題。例16 :;.證: 。注: 本題是一道綜合題,所述結(jié)果很重要。它說(shuō)明,如果樣本增加一個(gè),其n+1個(gè)數(shù)據(jù)構(gòu)成新樣本的均值和方差的求法無(wú)需從頭做起,只要根據(jù)前n個(gè)數(shù)據(jù)求出的均值和方差,加上新的這個(gè)數(shù)據(jù)便可由1)和2)計(jì)算出來(lái)。證明最后一步時(shí)用到結(jié)論。6.4 練習(xí)與測(cè)試1* 本題為1997年考研數(shù)學(xué)(四)試題。 設(shè)隨機(jī)變量X和Y相互獨(dú)立,且都服從正態(tài)分布,而和是分別來(lái)自總體X和Y的簡(jiǎn)單隨機(jī)樣本,則統(tǒng)計(jì)量服從 分布,參數(shù)(自由度)為 。2 設(shè)是來(lái)自總體的容量為n+m的樣本,則(1)統(tǒng)計(jì)量服從 分
18、布。(2)統(tǒng)計(jì)量服從 分布。(3)統(tǒng)計(jì)量服從 分布。3 X服從正態(tài)分布且則服從 分布。4設(shè)為10個(gè)樣本的均值,則。5 設(shè)隨機(jī)變量,則T服從 分布。6 設(shè)是來(lái)自具有分布的總體的樣本,則7 設(shè)分別來(lái)自?xún)蓚€(gè)正態(tài)總體的樣本,且相互獨(dú)立,分別為兩個(gè)樣本的樣本方差,則。8* 本題選自1994年考研數(shù)學(xué)試題(四) 設(shè)是來(lái)自正態(tài)總體的樣本,為樣本均值,記則服從自由度為n-1的t-分布的隨機(jī)變量是。9 已知總體X有概率密度試求樣本的聯(lián)合概率密度,并求10 設(shè)是總體X的樣本,而X服從區(qū)間a,b上的均勻分布,試求。11 在總體中隨機(jī)地抽取一個(gè)容量為5的樣本。(1) 求樣本均值在11到15之間取值的概率;(2) 求概率;(3) 求概率。12 隨機(jī)觀察總體X,取得10個(gè)數(shù)據(jù)如下 3.2,2.5,-4,2.5,0,3,2,2.5,4,2求樣本均值、樣本方差及經(jīng)驗(yàn)分布函數(shù)。13 已知,從中隨機(jī)抽取n=14的樣本,試分別由以下條件求樣本均值與總體均值之差的絕對(duì)值小于1.5的概率。(1);(2)。14 某廠(chǎng)生產(chǎn)的燈泡使用壽命?,F(xiàn)進(jìn)行質(zhì)量檢查,方法如下:任選若干個(gè)燈泡,若這些燈泡的平均壽命超過(guò)2200個(gè)小時(shí),就認(rèn)為該廠(chǎng)生產(chǎn)的燈泡質(zhì)量合格。若要使檢查能通過(guò)的概率超過(guò)0.997,問(wèn)至少應(yīng)檢查多少個(gè)燈泡?15 設(shè)在總體中抽取一容量為16的樣本,這里
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣告設(shè)計(jì)師考試社會(huì)影響評(píng)估題型及答案
- 廣告設(shè)計(jì)師考試2024年商品設(shè)計(jì)能力提升試題及答案
- 急救護(hù)理崗試題及答案
- 在線(xiàn)學(xué)習(xí)紡織工程師試題及答案
- 2024年紡織科技前沿試題及答案
- 服裝行業(yè)的質(zhì)量保護(hù)機(jī)制試題及答案
- 助理廣告師考試2024年基礎(chǔ)知識(shí)技能試題及答案
- 宜賓遴選筆試試題及答案
- 助理廣告師考試品牌傳播效果試題及答案
- 客服考試題目及答案
- 歷史一戰(zhàn)二戰(zhàn)試卷及答案
- 2025年導(dǎo)游從業(yè)資格知識(shí)點(diǎn)合輯
- (三診)成都市2022級(jí)高中高三畢業(yè)班第三次診斷性檢物理試卷(含答案)
- 四川省成都市蓉城名校聯(lián)盟2024-2025學(xué)年高一下學(xué)期期中考試英語(yǔ)(含答案)
- 2025-2030中國(guó)戶(hù)外背包行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025廣東二模語(yǔ)文(含答案)
- 建投國(guó)電準(zhǔn)格爾旗能源有限公司招聘考試真題2024
- 農(nóng)行反洗錢(qián)與制裁合規(guī)知識(shí)競(jìng)賽考試題庫(kù)大全-上下
- 2025年上半年陜西西安閻良區(qū)事業(yè)單位招聘高層次及緊缺特殊專(zhuān)業(yè)人才9人重點(diǎn)基礎(chǔ)提升(共500題)附帶答案詳解
- 2025年中考數(shù)學(xué)幾何模型綜合訓(xùn)練專(zhuān)題16全等三角形模型之婆羅摩笈多模型解讀與提分精練(教師版)
- 2025年浙江溫州市公用事業(yè)發(fā)展集團(tuán)有限公司招聘筆試參考題庫(kù)附帶答案詳解
評(píng)論
0/150
提交評(píng)論