版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、概率論第五章統(tǒng)計(jì)量及其分布第1頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四例 某公司要采購(gòu)一批產(chǎn)品,每件產(chǎn)品不 是合格品就是不合格品,但該批產(chǎn)品總有一 個(gè)不合格品率 p 。由此,若從該批產(chǎn)品中隨 機(jī)抽取一件,用 x 表示這一批產(chǎn)品的不合格 數(shù),不難看出 x 服從一個(gè)二點(diǎn)分布b(1 , p), 但分布中的參數(shù) p 是不知道的。一些問(wèn)題: 第2頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 p 的大小如何; p 大概落在什么范圍內(nèi); 能否認(rèn)為 p 滿足設(shè)定要求(如 p 0.05)。 第3頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四5.1 總體與個(gè)體總體的三層含義:
2、 研究對(duì)象的全體; 數(shù)據(jù); 分布第4頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 考察某廠的產(chǎn)品質(zhì)量,以0記合格品,以1記不合格品,則 總體 = 該廠生產(chǎn)的全部合格品與不合格品 = 由0或1組成的一堆數(shù)若以 p 表示這堆數(shù)中1的比例(不合格品率),則該總體可由一個(gè)二點(diǎn)分布表示:X 0 1P 1 p p第5頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四比如:兩個(gè)生產(chǎn)同類產(chǎn)品的工廠的產(chǎn)品的總體 分布:X01p0.9830.017X01p0.9150.085第6頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四例 在二十世紀(jì)七十年代后期,美國(guó)消費(fèi) 者購(gòu)買日產(chǎn)SONY彩電的
3、熱情高于購(gòu)買美產(chǎn) SONY彩電,原因何在? 1979年4月17日日本朝日新聞刊登調(diào)查報(bào) 告指出N(m, (5/3)2),日產(chǎn)SONY彩電的彩色濃 度服從正態(tài)分布,而美產(chǎn)SONY彩電的彩色濃 度服從(m5 , m+5)上的均勻分布。原因在于總體的差異上!第7頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四圖5.1.1 SONY彩電彩色濃度分布圖第8頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四等級(jí) I II III IV美產(chǎn) 33.3 33.3 33.3 0 日產(chǎn) 68.3 27.1 4.3 0.3表 各等級(jí)彩電的比例(%)第9頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,
4、星期四 樣本樣品、樣本、樣本量:樣本具有兩重性 一方面,由于樣本是從總體中隨機(jī)抽取的,抽 取前無(wú)法預(yù)知它們的數(shù)值,因此,樣本是隨機(jī) 變量,用大寫字母 X1, X2, , Xn 表示; 另一方面,樣本在抽取以后經(jīng)觀測(cè)就有確定的 觀測(cè)值,因此,樣本又是一組數(shù)值。此時(shí)用小 寫字母 x1, x2, , xn 表示是恰當(dāng)?shù)?。?jiǎn)單起見(jiàn),無(wú)論是樣本還是其觀測(cè)值,樣本一般均用 x1, x2, xn 表示,應(yīng)能從上下文中加以區(qū)別。第10頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四例 啤酒廠生產(chǎn)的瓶裝啤酒規(guī)定凈含量為640 克。由于隨機(jī)性,事實(shí)上不可能使得所有的啤酒 凈含量均為640克?,F(xiàn)從某廠生產(chǎn)的
5、啤酒中隨機(jī) 抽取10瓶測(cè)定其凈含量,得到如下結(jié)果:641, 635, 640, 637, 642, 638, 645, 643, 639, 640這是一個(gè)容量為10的樣本的觀測(cè)值,對(duì)應(yīng)的總體為該廠生產(chǎn)的瓶裝啤酒的凈含量。這樣的樣本稱為完全樣本。第11頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四例 考察某廠生產(chǎn)的某種電子元件的 壽命,選了100只進(jìn)行壽命試驗(yàn),得到 如下數(shù)據(jù):第12頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四表 100只元件的壽命數(shù)據(jù)表5.1.2中的樣本觀測(cè)值沒(méi)有具體的數(shù)值,只有一個(gè)范圍,這樣的樣本稱為分組樣本。 壽命范圍 元件數(shù) 壽命范圍 元件數(shù) 壽命范
6、圍 元件數(shù) ( 0 24 4 (192 216 6 (384 408 4 (24 48 8 (216 240 3 (408 432 4 (48 72 6 (240 264 3 (432 456 1 (72 96 5 (264 288 5 (456 480 2 (96 120 3 (288 312 5 (480 504 2 (120 144 4 (312 336 3 (504 528 3 (144 168 5 (336 360 5 (528 552 1 (168 192 4 (360 184 1 552 13第13頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 獨(dú)立性: 樣本中每一樣品
7、的取值不影響其 它樣品的取值 - x1, x2, , xn 相互獨(dú)立。要使得推斷可靠,對(duì)樣本就有要求,使樣本能很好地代表總體。通常有如下兩個(gè)要求: 隨機(jī)性: 總體中每一個(gè)個(gè)體都有同等機(jī)會(huì) 被選入樣本 - xi 與總體X有相同的分布。樣本的要求:簡(jiǎn)單隨機(jī)樣本第14頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四設(shè)總體X具有分布函數(shù)F(x), x1, x2, , xn 為取自該總體的容量為n的樣本,則樣本聯(lián)合分布函數(shù)為用簡(jiǎn)單隨機(jī)抽樣方法得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,也簡(jiǎn)稱樣本。于是,樣本 x1, x2, , xn 可以看成是獨(dú)立同分布( iid ) 的隨機(jī)變量,其共同分布即為總體分布。第15
8、頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四總體分為有限總體與無(wú)限總體實(shí)際中總體中的個(gè)體數(shù)大多是有限的。當(dāng)個(gè)體數(shù)充分大時(shí),將有限總體看作無(wú)限總體是一種合理的抽象。對(duì)無(wú)限總體,隨機(jī)性與獨(dú)立性容易實(shí)現(xiàn),困難在于排除有意或無(wú)意的人為干擾。對(duì)有限總體,只要總體所含個(gè)體數(shù)很大,特別是與樣本量相比很大,則獨(dú)立性也可基本得到滿足。第16頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四例 設(shè)有一批產(chǎn)品共N個(gè),需要進(jìn)行抽樣檢 驗(yàn)以了解其不合格品率p?,F(xiàn)從中采取不放回 抽樣抽出2個(gè)產(chǎn)品,這時(shí),第二次抽到不合格 品的概率依賴于第一次抽到的是否是不合格 品,如果第一次抽到不合格品,則而若第一次抽到
9、的是合格品,則第二次抽到不合格品的概率為P(x2 = 1 | x1 = 1) = (Np1)/(N1)P(x2 = 1 | x1 = 0) = (Np)(N1)第17頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四顯然,如此得到的樣本不是簡(jiǎn)單隨機(jī)樣本。但是,當(dāng)N 很大時(shí),我們可以看到上述兩種情形的概率都近似等于p 。所以當(dāng)N 很大,而n不大(一個(gè)經(jīng)驗(yàn)法則是 n N 0.1)時(shí)可以把該樣本近似地看成簡(jiǎn)單隨機(jī)樣本。思考: 若總體的密度函數(shù)為p(x),則其樣本的(聯(lián) 合)密度函數(shù)是什么?第18頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四5.2.1 經(jīng)驗(yàn)分布函數(shù)5.2 樣本數(shù)據(jù)的整
10、理與顯示設(shè) x1, x2, , xn 是取自總體分布函數(shù)為F(x)的樣本,若將樣本觀測(cè)值由小到大進(jìn)行排列,為 x(1), x(2), , x(n),則稱 x(1), x(2), , x(n) 為有序樣本,用有序樣本定義如下函數(shù) 第19頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四則Fn(x)是一非減右連續(xù)函數(shù),且滿足Fn() = 0 和 Fn() = 1由此可見(jiàn),F(xiàn)n(x)是一個(gè)分布函數(shù),并稱Fn(x)為經(jīng)驗(yàn)分布函數(shù)。第20頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四例 某食品廠生產(chǎn)聽(tīng)裝飲料,現(xiàn)從生產(chǎn)線上 隨機(jī)抽取5聽(tīng)飲料,稱得其凈重(單位:克) 351 347 355
11、344 351x(1)= 344, x(2)= 347, x(3)= 351, x(4)= 354, x(5)= 355這是一個(gè)容量為5的樣本,經(jīng)排序可得有序樣本:第21頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四其經(jīng)驗(yàn)分布函數(shù)為由伯努里大數(shù)定律:只要 n 相當(dāng)大,F(xiàn)n(x)依概率收斂于F(x) 。 0 , x 344 0.2, 344 x 347Fn(x) = 0.4, 347 x 351 0.8, 344 x 347 1, x 355第22頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四更深刻的結(jié)果也是存在的,這就是格里紋科定理。定理(格里紋科定理) 設(shè)x1,x2,xn
12、是取自 總體分布函數(shù)為F(x)的樣本, Fn(x) 是其經(jīng)驗(yàn)分 布函數(shù),當(dāng)n時(shí),有PsupFn(x) F(x)0 = 1格里紋科定理表明:當(dāng)n 相當(dāng)大時(shí),經(jīng)驗(yàn)分布函數(shù)是總體分布函數(shù)F(x)的一個(gè)良好的近似。經(jīng)典的統(tǒng)計(jì)學(xué)中一切統(tǒng)計(jì)推斷都以樣本為依據(jù),其理由就在于此。第23頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 160 196 164 148 170 175 178 166 181 162 161 168 166 162 172 156 170 157 162 1545.2.2 頻數(shù)-頻率分布表樣本數(shù)據(jù)的整理是統(tǒng)計(jì)研究的基礎(chǔ),整理數(shù)據(jù)的最常用方法之一是給出其頻數(shù)分布表或頻率分布表
13、。 為研究某廠工人生產(chǎn)某種產(chǎn)品的能力, 我們隨機(jī)調(diào)查了20位工人某天生產(chǎn)的該種產(chǎn)品 的數(shù)量,數(shù)據(jù)如下第24頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四(1) 對(duì)樣本進(jìn)行分組:作為一般性的原則,組數(shù)通 常在520個(gè),對(duì)容量較小的樣本;(2) 確定每組組距:近似公式為組距d = (最大觀測(cè)值 最小觀測(cè)值)/組數(shù);(3) 確定每組組限: 各組區(qū)間端點(diǎn)為a0, a1=a0+d, a2=a0+2d, , ak=a0+kd, 形成如下的分組區(qū)間(a0 , a1 , (a1, a2, , (ak-1 , ak對(duì)這20個(gè)數(shù)據(jù)(樣本)進(jìn)行整理,具體步驟如下:其中a0 略小于最小觀測(cè)值, ak 略大于
14、最大觀測(cè)值.第25頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四(4) 統(tǒng)計(jì)樣本數(shù)據(jù)落入每個(gè)區(qū)間的個(gè)數(shù)頻數(shù), 并列出其頻數(shù)頻率分布表。 例5.2.2 的頻數(shù)頻率分布表 組序 分組區(qū)間 組中值 頻數(shù) 頻率 累計(jì)頻率(%) 1 (147,157 152 4 0.20 20 2 (157,167 162 8 0.40 60 3 (167,177 172 5 0.25 85 4 (177,187 182 2 0.10 95 5 (187,197 192 1 0.05 100合計(jì) 20 1第26頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四5.2.3 樣本數(shù)據(jù)的圖形顯示一、直方圖直方
15、圖是頻數(shù)分布的圖形表示,它的橫坐標(biāo)表示所關(guān)心變量的取值區(qū)間,縱坐標(biāo)有三種表示方法:頻數(shù),頻率,最準(zhǔn)確的是頻率/組距,它可使得諸長(zhǎng)條矩形面積和為1。凡此三種直方圖的差別僅在于縱軸刻度的選擇,直方圖本身并無(wú)變化。第27頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四把每一個(gè)數(shù)值分為兩部分,前面一部分(百位和十位)稱為莖,后面部分(個(gè)位)稱為葉,然后畫(huà)一條豎線,在豎線的左側(cè)寫上莖,右側(cè)寫上葉,就形成了莖葉圖。如:二、莖葉圖數(shù)值 分開(kāi) 莖 和 葉 112 11 | 2 11 和 2第28頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 某公司對(duì)應(yīng)聘人員進(jìn)行能力測(cè)試,測(cè)試 成績(jī)總分為 1
16、50分。下面是50位應(yīng)聘人員的測(cè) 試成績(jī)(已經(jīng)過(guò)排序):64677072747676798081828283858688919192939393959595979799100100102104106106107108108112112114116118119119122123125126128133我們用這批數(shù)據(jù)給出一個(gè)莖葉圖,見(jiàn)下頁(yè)。第29頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四圖5.2.3 測(cè)試成績(jī)的莖葉圖 4 7 0 2 4 6 6 9 0 1 2 2 3 5 6 8 1 1 2 3 3 3 5 6 6 7 7 9 0 0 2 4 6 6 7 8 8 2 2 4 6 8
17、9 9 2 3 5 6 8 3 第30頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四在要比較兩組樣本時(shí),可畫(huà)出它們的背靠背的莖葉圖。甲車間 6 2 0 5 6 乙車間8 7 7 7 5 5 5 4 2 1 1 6 6 7 7 8 8 8 7 7 6 6 4 4 2 1 7 2 2 4 5 5 5 5 6 6 6 8 8 9 8 7 6 6 5 3 2 8 0 1 1 3 3 3 4 4 4 6 6 7 7 8 7 3 2 1 0 9 0 2 3 5 8 5 3 0 0 10 7 注意:莖葉圖保留數(shù)據(jù)中全部信息。當(dāng)樣本量較 大,數(shù)據(jù)很分散,橫跨二、三個(gè)數(shù)量級(jí)時(shí), 莖葉圖并不適用。第31
18、頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 統(tǒng)計(jì)量與抽樣分布5.3 統(tǒng)計(jì)量及其分布當(dāng)人們需要從樣本獲得對(duì)總體各種參數(shù)的認(rèn)識(shí)時(shí),最好的方法是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同特征。定義 設(shè) x1, x2, , xn 為取自某總體的樣 本,若樣本函數(shù)T = T(x1, x2, , xn)中不含有任 何未知參數(shù)。則稱T為統(tǒng)計(jì)量。統(tǒng)計(jì)量的分布 稱為抽樣分布。第32頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四按照這一定義:若 x1, x2, , xn 為樣本,則 以及經(jīng)驗(yàn)分布函數(shù)Fn(x)都是統(tǒng)計(jì)量。而當(dāng), 2 未知時(shí),x1, x1/ 等均不是統(tǒng)計(jì)量。盡管統(tǒng)計(jì)量不依賴于未
19、知參數(shù),但是它的分布一般是依賴于未知參數(shù)的。下面介紹一些常見(jiàn)的統(tǒng)計(jì)量及其抽樣分布。第33頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 樣本均值及其抽樣分布 定義 設(shè) x1, x2, , xn為取自某總體的樣本,其算術(shù)平均值稱為樣本均值,一般用 表示,即思考:在分組樣本場(chǎng)合,樣本均值如何計(jì)算? 二者結(jié)果相同嗎? xx= (x1+xn)/n第34頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四定理 數(shù)據(jù)觀測(cè)值與均值的偏差平方和 最小,即在形如 (xic)2 的函數(shù)中,樣本均值的基本性質(zhì):定理 若把樣本中的數(shù)據(jù)與樣本均值之差 稱為偏差,則樣本所有偏差之和為0,即 最小,其中c為任
20、意給定常數(shù)。第35頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四樣本均值的抽樣分布:定理 設(shè)x1, x2, , xn 是來(lái)自某個(gè)總體的樣本,x為樣本均值。(1) 若總體分布為N(, 2),則xx的精確分布為N(, 2/n) ; 若總體分布未知或不是正態(tài)分布, 但 E(x)=, Var(x)=2,則n 較大時(shí) 的漸近分 布為N(, 2/n) ,常記為 。xAN(, 2/n)這里漸近分布是指n 較大時(shí)的近似分布.第36頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四5.3.3 樣本方差與樣本標(biāo)準(zhǔn)差稱為樣本標(biāo)準(zhǔn)差。s*= s*2定義稱為樣本方差,其算術(shù)平方根在n 不大時(shí),常用 作為
21、樣本方差,其算術(shù)平方根也稱為樣本標(biāo)準(zhǔn)差。第37頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四在這個(gè)定義中, ( xi x )2n1稱為偏差平方和的自由度。其含義是:x在 確定后, n 個(gè)偏差x1x, x2x, , xnx能自由取值,因?yàn)橹挥衝1個(gè)數(shù)據(jù)可以自由變動(dòng),而第n個(gè)則不 (xi x ) = 0 .稱為偏差平方和,中樣本偏差平方和有三個(gè)不同的表達(dá)式:( xix )2 = xi2 (xi)2/n = xi2 nx它們都可用來(lái)計(jì)算樣本方差。思考:分組樣本如何計(jì)算樣本方差?第38頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四樣本均值的數(shù)學(xué)期望和方差,以及樣本方差的數(shù)學(xué)期望都不
22、依賴于總體的分布形式。定理 設(shè)總體 X 具有二階矩,即 E(x)= , Var(x)=2 , x1, x2, , xn 為從該總體得到的樣本,x和s2 分別是樣本均值和樣本方差,則E( x )=, Var( x )=2 /n, E(s2) =2 第39頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 樣本矩及其函數(shù) 樣本均值和樣本方差的更一般的推廣是樣本矩,這是一類常見(jiàn)的統(tǒng)計(jì)量。定義 ak = (xik)/n 稱為樣本 k 階原點(diǎn)矩, 特別,樣本一階原點(diǎn)矩就是樣本均值。 稱為樣本k階中心矩。 特別,樣本二階中心矩就是樣本方差。 bk = (xi x)k/n第40頁(yè),共76頁(yè),2022年
23、,5月20日,6點(diǎn)12分,星期四當(dāng)總體關(guān)于分布中心對(duì)稱時(shí),我們用x和 s刻畫(huà)樣本特征很有代表性,而當(dāng)其不對(duì)稱時(shí),只用 就顯得很不夠。為此,需要一些刻畫(huà)分布形狀的統(tǒng)計(jì)量,如樣本偏度和樣本峰度,它們都是樣本中心矩的函數(shù)。樣本偏度1反映了總體分布密度曲線的對(duì)稱性信息。樣本峰度2反映了總體分布密度曲線在其峰值附近的陡峭程度。定義: 1 = b3/b23/2 稱為樣本偏度, 2 = b4/b22 稱為樣本峰度。x和 s第41頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四5.3.5 次序統(tǒng)計(jì)量及其分布 另一類常見(jiàn)的統(tǒng)計(jì)量是次序統(tǒng)計(jì)量。一、定義 設(shè) x1, x2, , xn 是取自總體X的樣本,
24、x(i) 稱為該樣本的第i 個(gè)次序統(tǒng)計(jì)量,它的取值 是將樣本觀測(cè)值由小到大排列后得到的第 i 個(gè) 觀測(cè)值。其中x(1)=minx1, x2, xn稱為該樣本 的最小次序統(tǒng)計(jì)量,稱 x(n)=maxx1,x2,xn為 該樣本的最大次序統(tǒng)計(jì)量。第42頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四例 設(shè)總體X 的分布為僅取0,1,2的離散 均勻分布,分布列為0 1 2 1/3 1/3 1/3我們知道,在一個(gè)樣本中,x1, x2,xn 是獨(dú)立同分布的,而次序統(tǒng)計(jì)量 x(1), x(2), x(n) 則既不獨(dú)立,分布也不相同,看下例。現(xiàn)從中抽取容量為3的樣本,其一切可能取值有33=27種,表5
25、.3.6列出了這些值,由此第43頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 0 1 2 0 1 2我們可以清楚地看到這三個(gè)次序統(tǒng)計(jì)量的分布是不相同的。可給出的 x(1) , x(2), x(3) 分布列如下: 0 1 2第44頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四進(jìn)一步,我們可以給出兩個(gè)次序統(tǒng)計(jì)量的聯(lián)合分布,如,x(1) 和x(2) 的聯(lián)合分布列為01207/279/273/27104/273/272001/27x(1)x(2)第45頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四因?yàn)?P(x(1) = 0, x(2) = 0) =7/27 ,二者不等,
26、由此可看出x(1) 和 x(2)是不獨(dú)立的。而 P( x(1) = 0)*P( x(2) = 0) = (19/27)*(7/27),第46頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四二、單個(gè)次序統(tǒng)計(jì)量的分布 設(shè)總體X的密度函數(shù)為p(x),分布 函數(shù)為F(x), x1, x2, xn為樣本,則第k個(gè) 次序統(tǒng)計(jì)量x(k)的密度函數(shù)為第47頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四例 設(shè)總體密度函數(shù)為 p(x)=3x2, 0 x1. 從該總體抽得一個(gè)容量為5的樣本, 試計(jì)算 P(x(2)1/2)。解:有兩種求法:從古典概型出發(fā);從次序統(tǒng) 計(jì)量密度函數(shù)出發(fā)。例 設(shè)總體分布為
27、U(0,1), x1, x2, xn為樣 本,試求第 k 個(gè)次序統(tǒng)計(jì)量的分布。第48頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四三、多個(gè)次序統(tǒng)計(jì)量的聯(lián)合分布對(duì)任意多個(gè)次序統(tǒng)計(jì)量可給出其聯(lián)合分布,以兩個(gè)為例說(shuō)明: 在定理5.3.5的記號(hào)下,次序統(tǒng)計(jì) 量 (x(i), x(j), (i j) 的聯(lián)合分布密度函數(shù)為第49頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四次序統(tǒng)計(jì)量的函數(shù)在實(shí)際中經(jīng)常用到。如 樣本極差 Rn = x(n) x(1), 樣本中程 x(n) x(1)/2。樣本極差是一個(gè)很常用的統(tǒng)計(jì)量,其分布只在很少幾種場(chǎng)合可用初等函數(shù)表示。第50頁(yè),共76頁(yè),2022年,
28、5月20日,6點(diǎn)12分,星期四令 R = x(n) x(1) ,由 R 0, 可以推出0 x(1) = x(n)R 1 R ,則 設(shè)總體分布為U(0,1), x1, x2, xn 為 樣本,則(x(n), x(1)的聯(lián)合密度函數(shù)為p1,n(y,z)=n(n1)(zy)n-2, 0 y z 1這正是參數(shù)為(n1, 2)的貝塔分布。第51頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 樣本分位數(shù)與樣本中位數(shù)樣本中位數(shù)也是一個(gè)很常見(jiàn)的統(tǒng)計(jì)量,它也是次序統(tǒng)計(jì)量的函數(shù),通常如下定義:更一般地,樣本p分位數(shù)mp可如下定義:第52頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四定理 設(shè)總體
29、密度函數(shù)為p(x),xp為其p分 位數(shù), p(x)在xp處連續(xù)且 p(xp) 0,則特別,對(duì)樣本中位數(shù),當(dāng)n時(shí)近似地有當(dāng)n 時(shí)樣本 p 分位數(shù) mp 的漸近分布為第53頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四例 設(shè)總體為柯西分布,密度函數(shù)為p(x,)= 1/(1+(x)2) , x +通常,樣本均值在概括數(shù)據(jù)方面具有一定的優(yōu)勢(shì)。但當(dāng)數(shù)據(jù)中含有極端值時(shí),使用中位數(shù)比使用均值更好,中位數(shù)的這種抗干擾性在統(tǒng)計(jì)中稱為具有穩(wěn)健性。 不難看出是該總體的中位數(shù),即x0.5= 。設(shè) x1, x2, xn 是來(lái)自該總體的樣本,當(dāng)樣本量n 較大時(shí),樣本中位數(shù)m0.5 的漸近分布為m0.5 AN(,
30、 2/4n) .第54頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 五數(shù)概括與箱線圖次序統(tǒng)計(jì)量的應(yīng)用之一是五數(shù)概括與箱線圖。在得到有序樣本后,容易計(jì)算如下五個(gè)值:最小觀測(cè)值 xmin= x(1) , 最大觀測(cè)值 xmax=x(n) ,中位數(shù) m0.5 , 第一4分位數(shù) Q1 = m0.25, 第三4分位數(shù) Q3 = m0.75.所謂五數(shù)概括就是指用這五個(gè)數(shù):xmin , Q1 , m0.5 , Q3 , xmax來(lái)大致描述一批數(shù)據(jù)的輪廓。第55頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四5.4 三大抽樣分布大家很快會(huì)看到,有很多統(tǒng)計(jì)推斷是基于正態(tài)分布的假設(shè)的,以標(biāo)準(zhǔn)正態(tài)
31、變量為基石而構(gòu)造的三個(gè)著名統(tǒng)計(jì)量在實(shí)際中有廣泛的應(yīng)用,這是因?yàn)檫@三個(gè)統(tǒng)計(jì)量不僅有明確背景,而且其抽樣分布的密度函數(shù)有明顯表達(dá)式,它們被稱為統(tǒng)計(jì)中的“ 三大抽樣分布 ” 。第56頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四5.4.1 2 分布(卡方分布)定義 設(shè) X1, X2, Xn, 獨(dú)立同分布于標(biāo)準(zhǔn) 正態(tài)分布N(0,1) ,則2= X12+ Xn2的分布稱 為自由度為n 的2分布,記為 2 2(n) 。當(dāng)隨機(jī)變量 2 2(n) 時(shí),對(duì)給定 (01),稱滿足 P(2 12(n) 的 12(n) 是自由度為n1的卡方分布的1 分位數(shù).分位數(shù) 12(n) 可以從附表3 中查到。第57頁(yè)
32、,共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四該密度函數(shù)的圖像是一只取非負(fù)值的偏態(tài)分布 第58頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四5.4.2 F 分布定義 設(shè)X1 2(m), X2 2(n), X1與X2獨(dú)立, 則稱 F =(X1/m)/(X2/n) 的分布是自由度為 m 與 n 的 F分布,記為F F(m, n),其中m 稱為分子自 由度,n 稱為分母自由度。當(dāng)隨機(jī)變量F F(m,n) 時(shí),對(duì)給定 (01) ,稱滿足 P(F F1(m,n) =1 的F1(m,n) 是自由度為m 與 n 的F 分布的1 分位數(shù)。由 F 分布的構(gòu)造知 F(n,m) = 1/F1(m,
33、n)。第59頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四該密度函數(shù)的圖象也是一只取非負(fù)值的偏態(tài)分布 第60頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四5.4.3 t 分布 定義 設(shè)隨機(jī)變量X1 與X2 獨(dú)立, 且X1 N(0,1), X2 2(n), 則稱t=X1/ X2/n的分布為自由度為n 的t 分布,記為t t(n) 。 第61頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 t 分布的密度函數(shù)的圖象是一個(gè)關(guān)于縱軸對(duì)稱的分布,與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形狀類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些尾部的概率比標(biāo)準(zhǔn)正態(tài)分布的大一些。第62頁(yè),共76頁(yè),2022年,5月2
34、0日,6點(diǎn)12分,星期四 n1時(shí), t 分布的數(shù)學(xué)期望存在且為0; n2時(shí),t 分布的方差存在,且為n/(n2); 當(dāng)自由度較大 (如n30) 時(shí), t 分布可以用 正態(tài)分布 N(0,1)近似。 自由度為1的 t 分布就是標(biāo)準(zhǔn)柯西分布, 它的均值不存在;第63頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四當(dāng)隨機(jī)變量t t(n) 時(shí),稱滿足P(t t1(n) =1的 t1(n) 是自由度為 n 的 t 分布的1分位數(shù).分位數(shù) t1(n) 可以從附表4中查到。譬如 n=10,=0.05,那么從附表4上查得t10.05(10) = t0.95(10)=1.812 .由于 t 分布的密度函數(shù)
35、關(guān)于0 對(duì)稱, 故其分位數(shù)間有如下關(guān)系t(n1)= t1(n1)第64頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四 一些重要結(jié)論定理 設(shè) x1, x2, xn 是來(lái)自N(, 2) 的 樣本,其樣本均值和樣本方差分別為和x = xi/n s2= (xix)2/(n1)(3) (n1) s2/2 2(n1)。 則有(1) x與 s2 相互獨(dú)立;(2) x N(, 2/n) ;第65頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四推論 設(shè) x1, x2, xn 是來(lái)自N(1, 12) 的 樣本,y1, y2, yn 是來(lái)自N(2, 22) 的樣本, 且此兩樣本相互獨(dú)立,則有特別,
36、若12 =22 ,則F=sx2/sy2 F(m1,n1)第66頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四推論 在推論的記號(hào)下,設(shè) 12 =22 = 2 , 并記則第67頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四5.5 充分統(tǒng)計(jì)量5.5.1 充分性的概念例 為研究某個(gè)運(yùn)動(dòng)員的打靶命中率,我們 對(duì)該運(yùn)動(dòng)員進(jìn)行測(cè)試,觀測(cè)其10次,發(fā)現(xiàn)除第 三、六次未命中外,其余8次都命中。這樣的 觀測(cè)結(jié)果包含了兩種信息:(1) 打靶10次命中8次;(2) 2次不命中分別出現(xiàn)在第3次和第6次 打靶上。第68頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分,星期四第二種信息對(duì)了解該運(yùn)動(dòng)員的命中率是沒(méi)有什么幫助的。一般地,設(shè)我們對(duì)該運(yùn)動(dòng)員進(jìn)行n 次觀測(cè),得到 x1, x2, xn,每個(gè)xj 取值非0即1,命中為1,不命中為0。令 T = x1+xn ,T為觀測(cè)到的命中次數(shù)。在這種場(chǎng)合僅僅記錄使用T 不會(huì)丟失任何與命中率 有關(guān)的信息,統(tǒng)計(jì)上將這種“樣本加工不損失信息”稱為“充分性”。樣本 x=(x1,x2,xn) 有一個(gè)樣本分布F (x),這個(gè)分布包含了樣本中一切有關(guān)的信息。第69頁(yè),共76頁(yè),2022年,5月20日,6點(diǎn)12分
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版電商平臺(tái)客戶數(shù)據(jù)保密及隱私保護(hù)合同3篇
- 二零二五版農(nóng)業(yè)產(chǎn)業(yè)化合同管理與農(nóng)產(chǎn)品質(zhì)量安全協(xié)議3篇
- 二零二五版智能廣告終端設(shè)備投放與維護(hù)合同3篇
- 二零二五年綠色環(huán)保抵押貸款合同范本分享3篇
- 二零二五版一期臨床試驗(yàn)統(tǒng)計(jì)分析合同3篇
- 二零二五年度辣椒種植與冷鏈物流運(yùn)輸合同3篇
- 二零二五版餐廳智能點(diǎn)餐系統(tǒng)維護(hù)與升級(jí)合同3篇
- 二零二五年度餐飲企業(yè)承包經(jīng)營(yíng)與品牌升級(jí)合同3篇
- 二零二五版智能簽約二手房購(gòu)房合同范本2篇
- 二零二五版新能源汽車電池購(gòu)銷合同樣本3篇
- 冬春季呼吸道傳染病防控
- 中介費(fèi)合同范本(2025年)
- 《kdigo專家共識(shí):補(bǔ)體系統(tǒng)在腎臟疾病的作用》解讀
- 生產(chǎn)調(diào)度員崗位面試題及答案(經(jīng)典版)
- 【物 理】2024-2025學(xué)年八年級(jí)上冊(cè)物理寒假作業(yè)人教版
- 交通運(yùn)輸安全生產(chǎn)管理規(guī)范
- 電力行業(yè) 電力施工組織設(shè)計(jì)(施工方案)
- 《法制宣傳之盜竊罪》課件
- 通信工程單位勞動(dòng)合同
- 查對(duì)制度 課件
- 2024-2030年中國(guó)豬肉市場(chǎng)銷售規(guī)模及競(jìng)爭(zhēng)前景預(yù)測(cè)報(bào)告~
評(píng)論
0/150
提交評(píng)論