




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第 二 章 統(tǒng)計(jì)概念,2.1 數(shù)理統(tǒng)計(jì)的涵義,數(shù)理統(tǒng)計(jì)學(xué)是一門(mén)應(yīng)用性很強(qiáng)的學(xué)科. 它是研究怎樣以有效的方式收集、 整理和分析帶有隨機(jī)性的數(shù)據(jù),以便對(duì)所考察的問(wèn)題作出推斷和預(yù)測(cè).,由于大量隨機(jī)現(xiàn)象必然呈現(xiàn)它規(guī)律性,只要對(duì)隨機(jī)現(xiàn)象進(jìn)行足夠多次觀察,被研究的規(guī)律性一定能清楚地呈現(xiàn)出來(lái).,客觀上, 只允許我們對(duì)隨機(jī)現(xiàn)象 進(jìn)行次數(shù)不多的觀察試驗(yàn) ,我們只 能獲得局部觀察資料.,數(shù)理統(tǒng)計(jì)的任務(wù)就是研究有效地收集、整理、分析所獲得的有限的資料,對(duì)所研究的問(wèn)題, 盡可能地作出精確而可靠的結(jié)論.,在數(shù)理統(tǒng)計(jì)中,不是對(duì)所研究的對(duì)象全體 ( 稱為總體)進(jìn)行觀察,而是抽取其中的部分(稱為樣本)進(jìn)行觀察獲得數(shù)據(jù)(抽樣)
2、,并通過(guò)這些數(shù)據(jù)對(duì)總體進(jìn)行推斷.,數(shù)理統(tǒng)計(jì)方法具有“部分推斷整體”的 特征 .,在數(shù)理統(tǒng)計(jì)研究中,人們往往研究有關(guān)對(duì)象的某一項(xiàng)(或幾項(xiàng))數(shù)量指標(biāo)和為此,對(duì)這一指標(biāo)進(jìn)行隨機(jī)試驗(yàn),觀察試驗(yàn)結(jié)果全部觀察值,從而考察該數(shù)量指標(biāo)的分布情況.這時(shí),每個(gè)具有的數(shù)量指標(biāo)的全體就是總體.每個(gè)數(shù)量指標(biāo)就是個(gè)體.,數(shù)理統(tǒng)計(jì)任務(wù)、內(nèi)容以及基礎(chǔ),研究對(duì)象:帶隨機(jī)性影響的數(shù)據(jù)(抽樣的隨機(jī)性,實(shí)驗(yàn)過(guò)程的隨機(jī)誤差),研究?jī)?nèi)容: (1)用有效的方法收集數(shù)據(jù)(數(shù)學(xué)上便于處理的模型描述數(shù)據(jù);數(shù)據(jù)中包含盡可能多的有用信息), (2)有效地使用數(shù)據(jù)進(jìn)行統(tǒng)計(jì)推斷, (3)統(tǒng)計(jì)推斷的結(jié)論的可靠性需用概率來(lái)度量。,值得注意的是: 1概率論:
3、分布通常已知,或假設(shè)已知,我們關(guān)心某些概率、數(shù)字特征的計(jì)算以及某些問(wèn)題的判斷、推理。 2數(shù)理統(tǒng)計(jì):實(shí)際中,某隨機(jī)變量的分布可能完全不知道,即使知道某些分布的類型,卻不知道分布函數(shù)的參數(shù)。,為此,從研究對(duì)象的全體中抽取一部分信息進(jìn)行加工,由此對(duì)總體進(jìn)行推斷,即由部分來(lái)推斷總體。 又由抽樣的隨機(jī)性(不確定性)為使作出錯(cuò)誤推斷的概率盡可能小。伴隨著一定概率的推斷(可靠或可性程度)統(tǒng)計(jì)推斷。,數(shù)理統(tǒng)計(jì)的基礎(chǔ): 概率論,數(shù)理統(tǒng)計(jì)的應(yīng)用,由于隨機(jī)影響無(wú)處不在,所以數(shù)理統(tǒng)計(jì)方法應(yīng)用十分廣泛。如 (1)幾乎在人類活動(dòng)的一切領(lǐng)域都能不同程度地找到它的應(yīng)用。 (2)達(dá)爾文進(jìn)化論:創(chuàng)造性地將遺傳變異的隨機(jī)性引入到生
4、物演化的理論中,從而科學(xué)地解釋了生物的適應(yīng)性、多樣性和復(fù)雜性。,(3) 保險(xiǎn)業(yè)中險(xiǎn)種的分布,保率的計(jì)算,交通事故的發(fā)生率,細(xì)菌的分布,產(chǎn)品壽命,藥物療效檢驗(yàn),傳染病分布,地震預(yù)報(bào),電廠里面各區(qū)域電量的分配都要用到數(shù)理統(tǒng)計(jì)方法。,一個(gè)統(tǒng)計(jì)問(wèn)題總有它明確的研究對(duì)象.,1.總體,研究對(duì)象的全體稱為總體,,總體,2.2 總體、樣本與統(tǒng)計(jì)量,總體中所包含的個(gè)體的個(gè)數(shù)稱為總體的容量.,總體中每個(gè)成員稱為個(gè)體,,總體,有限總體,無(wú)限總體,因此在理論上可以把總體與概率分布等同起來(lái).,我們關(guān)心的是總體中的個(gè)體的某項(xiàng)指標(biāo)(如人的身高、燈泡的壽命,汽車(chē)的耗油量) .,由于每個(gè)個(gè)體的出現(xiàn)是隨機(jī)的,所以相應(yīng)的數(shù)量指標(biāo)的
5、出現(xiàn)也帶有隨機(jī)性 . 從而可以把這種數(shù)量指標(biāo)看作一個(gè)隨機(jī)變量X,因此隨機(jī)變量X的分布就是該數(shù)量指標(biāo)在總體中的分布.,總體就可以用一個(gè)隨機(jī)變量及其分布來(lái)描述.,例如:研究某批燈泡的壽命時(shí),關(guān)心的數(shù)量指標(biāo)就是壽命,那么,此總體就可以用隨機(jī)變量X表示,或用其分布函數(shù)F(x)表示.,某批 燈泡的壽命,總體,壽命 X 可用一概率 (指數(shù))分布來(lái)刻劃,鑒于此,常用隨機(jī)變量的記號(hào) 或用其分布函數(shù)表示總體. 如 說(shuō)總體X或總體F(x) .,類似地,在研究某地區(qū)中學(xué)生的營(yíng)養(yǎng)狀況時(shí) ,若關(guān)心的數(shù)量指標(biāo)是身高和體重,我們用X 和Y 分別表示身高和體重,那么此總體就可用二維隨機(jī)變量(X,Y)或其聯(lián)合分布函數(shù) F(x,
6、 y)來(lái)表示.,統(tǒng)計(jì)中,總體這個(gè)概念 的要旨是:總體就是一個(gè)概 率分布.,2. 抽樣:當(dāng)總體X的概率分布是確定的,又是未知的,或參數(shù)未知,為了研究總體,必須在總體中抽取一定數(shù)量的個(gè)體進(jìn)行觀察的過(guò)程。,為什么要抽樣?,破壞性試驗(yàn) 燈泡壽命,由于壽命試驗(yàn)是破壞性的,一旦我們獲得試驗(yàn)的所有結(jié)果,這批燈泡也全燒毀了我們只能從整批燈泡中抽取一些燈泡做壽命試驗(yàn),并記錄其結(jié)果,然后根據(jù)這些數(shù)據(jù)來(lái)推斷整批燈泡的壽命情況. 非破壞性試驗(yàn) 汽水瓶蓋橡皮墊片,盡管只要通過(guò)簡(jiǎn)單的測(cè)量就能確定它是否合格,而且試驗(yàn)不是破壞性的,然而,由于墊片的產(chǎn)量為數(shù)甚多,逐一測(cè)量要花費(fèi)大量人力和時(shí)間因此,我們?nèi)匀恢荒艹槿∩倭繅|片進(jìn)行測(cè)
7、量,并根據(jù)所得數(shù)據(jù)估計(jì)整批墊片的合格率,總體分布一般是未知,或只知道是包含未知參數(shù)的分布,為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察試驗(yàn),以獲得有關(guān)總體的信息 ,這一抽取過(guò)程稱為 “抽樣”,所抽取的部分個(gè)體稱為樣本. 樣本中所包含的個(gè)體數(shù)目稱為樣本容量.(樣本具有二重性),3. 樣本,從國(guó)產(chǎn)轎車(chē)中抽5輛進(jìn)行耗油量試驗(yàn),樣本容量為5,抽到哪5輛是隨機(jī)的,一旦取定一組樣本X1,, Xn ,得到n個(gè)具體的數(shù) (x1,x2,xn),稱為樣本的一次觀察值,簡(jiǎn)稱樣本值 .,n稱為這個(gè)樣本的容量.,最常用的一種抽樣叫作“簡(jiǎn)單隨機(jī)抽樣”,其特點(diǎn):,1. 代表性: X1, X2, , Xn
8、中每一個(gè)與所考察的總體有 相同的分布.,2. 獨(dú)立性: X1, X2, , Xn是相互獨(dú)立的隨機(jī)變量.,定義:,由簡(jiǎn)單隨機(jī)抽樣得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,它可以用與總體獨(dú)立同分布的n個(gè)相互獨(dú)立的隨機(jī)變量X1, X2, , Xn表示.,簡(jiǎn)單隨機(jī)樣本是應(yīng)用中最常見(jiàn)的情形,今后,當(dāng)說(shuō)到“X1, X2, , Xn是取自某總體的樣本”時(shí),若不特別說(shuō)明,就指簡(jiǎn)單隨機(jī)樣本.,=F(x1) F(x2) F(xn),若總體的分布函數(shù)為F(x)、概率密度函數(shù)為f(x),則其簡(jiǎn)單隨機(jī)樣本的聯(lián)合分布函數(shù)為,其簡(jiǎn)單隨機(jī)樣本的聯(lián)合概率密度函數(shù)為,=f(x1) f(x2) f(xn),例 設(shè)( )是取自總體X的樣本,X服從
9、參數(shù)為 的指數(shù)分布,則( )的聯(lián)合分布函數(shù)為,聯(lián)合概率密度函數(shù)為,事實(shí)上我們抽樣后得到的資料都是具體的、確定的值. 如我們從某班大學(xué)生中抽取10人測(cè)量身高,得到10個(gè)數(shù),它們是樣本取到的值而不是樣本. 我們只能觀察到隨機(jī)變量取的值而見(jiàn)不到隨機(jī)變量.,4. 總體、樣本、樣本值的關(guān)系,統(tǒng)計(jì)是從手中已有的資料-樣本值,去推斷總體的情況-總體分布F(x)的性質(zhì).,總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體.,樣本是聯(lián)系二者的橋梁,5.樣本空間:( )的所有可能取值構(gòu)成的集合稱為樣本空間,每一個(gè)樣本觀測(cè)值( ) 樣本空間。,由樣本值去推斷總體情況,需要對(duì)樣本
10、值進(jìn)行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來(lái).,6. 統(tǒng)計(jì)量,這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量. 它是完全由樣本決定的量.,定義,請(qǐng)注意 :,幾個(gè)常見(jiàn)統(tǒng)計(jì)量,樣本平均值,它反映了 總體均值 的信息,樣本方差,它反映了總體 方差的信息,樣本標(biāo)準(zhǔn)差,它反映了總體k 階矩的信息,樣本k階原點(diǎn)矩,樣本k階中心矩,k=1,2,它反映了總體k 階 中心矩的信息,統(tǒng)計(jì)量的觀察值,請(qǐng)注意 :,設(shè) 為取自總體X的一個(gè)樣本,若X的二階矩存在,并記 , 則,證:,定義 2.3.1設(shè) 是取自總體X的一個(gè)樣本,將樣本觀測(cè)值 的各個(gè)分量按大小遞增順序排序,當(dāng) 取值為 時(shí),
11、定義 取值為 ,則稱 為由 導(dǎo)出的一組順序(或次序)統(tǒng)計(jì)量,稱 為第k個(gè)順序統(tǒng)計(jì)量,特別地分別稱,為最小順序統(tǒng)計(jì)量和最大順序統(tǒng)計(jì)量。 統(tǒng)稱為極值統(tǒng)計(jì)量。,2.3 順序統(tǒng)計(jì)量、經(jīng)驗(yàn)分布函數(shù)和直方圖 2.3.1順序統(tǒng)計(jì)量,定理1 設(shè)( )是來(lái)自總體 的一個(gè)樣本,則,i, 的分布函數(shù)是,ii, 的分布函數(shù)是 。,證 i,,ii,,2.3.2 經(jīng)驗(yàn)分布函數(shù),圖 1-1,例 從一個(gè)總體中抽取容量為6的一個(gè)樣本具體觀測(cè)值為-1,1.5,-2.8,2.1,1.5,3.4。求經(jīng)驗(yàn)分布函數(shù)的相應(yīng)觀測(cè)值,并作出它的圖形。,解:先將樣本觀測(cè)值由小到大重排得到 -2.8,-1,1.5,1.5, 2.1, 3.4 則經(jīng)
12、驗(yàn)分布函數(shù)的相應(yīng)觀測(cè)值為,其圖形如圖1-2所示。,2.4 抽樣分布,記為,分布,1、,定義: 設(shè) 相互獨(dú)立, 都服從正態(tài)分布 N(0,1), 則稱隨機(jī)變量: 所服從的分布為自由度為 n 的 分布.,分布是由正態(tài)分布派生出來(lái)的一種分布.,2.4.1 幾個(gè)重要的分布,分布的密度函數(shù)為,來(lái)定義.,其中伽瑪函數(shù) 通過(guò)積分,注,(1). 設(shè) 相互獨(dú)立, 都服從正態(tài)分布,則,這個(gè)性質(zhì)叫 分布的可加性.,(3)若,近似正態(tài)分布N(0,1).,(應(yīng)用中心極限定理可得 ),(2)設(shè) 且X1, X2相互獨(dú)立,,E(X)=n, D(X)=2n.,概率密度函數(shù)為:,2、t 分布,由定義可見(jiàn),,3、F分布,F(n2,n
13、1),即它的數(shù)學(xué)期望并不依賴于第一自由度n1.,F分布的數(shù)學(xué)期望為:,若n22,若FF(n1,n2), F的概率密度為,2.4.2 分位數(shù),定義2.4.1 設(shè)隨機(jī)變量X的分布函數(shù)為F(x),實(shí)數(shù)p滿足0p1,若使 則稱xp為此概率分布的分位數(shù)。,概率分布的分位數(shù)(正態(tài)分布),(1)對(duì)于給定的正數(shù)p,0p1,滿足條件 的點(diǎn)up為正態(tài)分布的p分位點(diǎn)。,如,由正態(tài)分布的密度函數(shù)為偶函數(shù),所以,如,的點(diǎn) 為 分別單位 分位點(diǎn). 如圖所示可通過(guò)查表求, 例,t分布的分位數(shù)可查表求得, 例,(4) F分布的分位數(shù),2.4.3 抽樣分布定理,當(dāng)總體為正態(tài)分布時(shí),給出幾個(gè)重要的抽樣分布定理.,定理 1 (樣本
14、均值的分布),n取不同值時(shí)樣本 均值 的分布,請(qǐng)注意 :,定理 2 (樣本方差的分布),n取不同值時(shí) 的分布,定理 3 (樣本均值的分布),定理 4 (兩總體樣本均值差、樣本方差比的分布),分別是,例 設(shè) 是來(lái)自正態(tài)總體N(0,0.09)的樣本,,(1) 求滿足 的常數(shù),(2) 求 解 因 (1) 由,例 設(shè) 是來(lái)自正態(tài)總體N(0,0.09)的樣本, (1) 求滿足 的常數(shù) (2) 求 解 (2),由 得p=0.9,所以,例 某半導(dǎo)體廠生產(chǎn)的某種零件厚度 ,為保證質(zhì)量,規(guī)定當(dāng) 時(shí),認(rèn)為生產(chǎn)過(guò)程處于良好控制狀態(tài)。為此,每隔一定時(shí)間抽一個(gè)零件測(cè)量它的厚度,共抽取20個(gè)零件作為一個(gè)樣本,并計(jì)算樣本方差 .若 (此時(shí)用 ),則認(rèn)為生產(chǎn)過(guò)程失去控制,必須
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 綏化智能小區(qū)管理辦法
- 繼續(xù)教育學(xué)院管理辦法
- 育嬰師職業(yè)道德培訓(xùn)課件
- 肩周炎中醫(yī)講座課件
- 機(jī)房安全管理培訓(xùn)課件
- 復(fù)印五年級(jí)數(shù)學(xué)試卷
- 阜陽(yáng)一模高三數(shù)學(xué)試卷
- 東營(yíng)三模高考數(shù)學(xué)試卷
- 高三五調(diào)數(shù)學(xué)試卷
- 高起本高等數(shù)學(xué)試卷
- 2025年廣西中考語(yǔ)文試題卷(含答案)
- 2025年南京市中考數(shù)學(xué)真題試卷
- 2024年深圳市中考?xì)v史試卷真題(含答案解析)
- 湖北省 公路工程試驗(yàn)檢測(cè)設(shè)備期間核查規(guī)范DB42∕T 1544-2020
- 基礎(chǔ)會(huì)計(jì)教材電子版
- 四川省地質(zhì)災(zāi)害治理工程常用資料表格
- 患者隱私保護(hù)課件
- RFJ0132010人民防空工程防化設(shè)計(jì)規(guī)范
- CA6140車(chē)床杠桿工藝設(shè)計(jì)說(shuō)明書(shū)完全版
- T_CHES 17-2018 水井報(bào)廢與處理技術(shù)導(dǎo)則
- 酒店住宿賬單模板
評(píng)論
0/150
提交評(píng)論