數(shù)理統(tǒng)計(jì)大作業(yè)_第1頁
數(shù)理統(tǒng)計(jì)大作業(yè)_第2頁
數(shù)理統(tǒng)計(jì)大作業(yè)_第3頁
數(shù)理統(tǒng)計(jì)大作業(yè)_第4頁
數(shù)理統(tǒng)計(jì)大作業(yè)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、數(shù)理統(tǒng)計(jì)學(xué)大作業(yè)學(xué) 院航空航天工程學(xué)部專 業(yè)飛行器設(shè)計(jì)班 級航宇二班學(xué) 號8姓 名張立指導(dǎo)教師姜永負(fù)責(zé)教師沈陽航空航天大學(xué)2021年12月目錄目錄2前言2一、采集樣本數(shù)據(jù)整理及SPSS統(tǒng)計(jì)軟件的實(shí)現(xiàn)31.1、數(shù)據(jù)的收集方法及說明31.2、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及偏度和峰度41.3、畫出直方圖和折線圖51.4、經(jīng)驗(yàn)分布函數(shù)和圖形61.5、各種概率分布7二、給出總體分布的參數(shù)估計(jì)122.1、矩估計(jì)法122.2、最大似然估計(jì)122.3、參數(shù)區(qū)間估計(jì)13三、 參數(shù)的假設(shè)檢驗(yàn)163.1.樣本統(tǒng)計(jì)數(shù)據(jù)的t檢驗(yàn)16檢驗(yàn)17四、非參數(shù)假設(shè)檢驗(yàn)擬合優(yōu)度檢驗(yàn)184.1、擬合優(yōu)度檢驗(yàn)18五、結(jié)論20參考文獻(xiàn)

2、21前言 數(shù)理統(tǒng)計(jì)學(xué)是研究有效地運(yùn)用數(shù)據(jù)收集與數(shù)據(jù)處理、多種模型與技術(shù)分析、社會(huì)調(diào)查與統(tǒng)計(jì)分析等,對科技前沿和國民經(jīng)濟(jì)重大問題和復(fù)雜問題,以及社會(huì)和政府中的大量問題,如何對數(shù)據(jù)進(jìn)行推理,以便對問題進(jìn)行推斷或預(yù)測,從而對決策和行動(dòng)提供依據(jù)和建議的應(yīng)用廣泛的根底性學(xué)科。隨著科學(xué)技術(shù)的開展,數(shù)理統(tǒng)計(jì)的作用在國民生活中越來越重要,特別是現(xiàn)在隨著大數(shù)據(jù)的時(shí)代來臨,迫切的需要我們對大量數(shù)據(jù)的處理能力,當(dāng)然這些大量的數(shù)據(jù)不可能用人工計(jì)算,有很多可以實(shí)際應(yīng)用的數(shù)理統(tǒng)計(jì)軟件,這次大作業(yè)我使用的是SPSS軟件。由于數(shù)理統(tǒng)計(jì)是一門實(shí)用性極強(qiáng)的學(xué)科,在學(xué)習(xí)中要緊扣它的實(shí)際背景,理解統(tǒng)計(jì)方法的直觀含義。了解數(shù)理統(tǒng)計(jì)能解

3、決那些實(shí)際問題。對如何處理抽樣數(shù)據(jù),并根據(jù)處理的結(jié)果作出合理的統(tǒng)計(jì)推斷,該結(jié)論的可靠性有多少要有一個(gè)總體的思維框架,這樣,學(xué)起來就不會(huì)枯燥而且容易記憶。例如估計(jì)未知分布的數(shù)學(xué)期望,就要考慮到:1.如何尋求適宜的估計(jì)量的途徑,2.如何比擬多個(gè)估計(jì)量的優(yōu)劣。這樣,針對1按不同的統(tǒng)計(jì)思想可推出矩估計(jì)和極大似然估計(jì),而針對2又可分為無偏估計(jì)、有效估計(jì)、相合估計(jì),因?yàn)椴煌墓烙?jì)名稱有著不同的含義,一個(gè)具體估計(jì)量可以滿足上面的每一個(gè),也可能不滿足。掌握了尋求估計(jì)的統(tǒng)計(jì)思想,具體尋求估計(jì)的步驟往往是“套路子的,并不困難,然而如果沒有從根本上理解,僅死背套路子往往會(huì)出現(xiàn)各種錯(cuò)誤.一、采集樣本數(shù)據(jù)整理及SPSS

4、統(tǒng)計(jì)軟件的實(shí)現(xiàn)1.1、數(shù)據(jù)的收集方法及說明 我的這次作業(yè)采取的數(shù)據(jù)是機(jī)械加工零件中,車床C6140其中一個(gè)傳動(dòng)軸的長度,由于這零件是大批量生產(chǎn),數(shù)據(jù)很多,我選取了其中的100個(gè)數(shù)據(jù)進(jìn)行計(jì)算,數(shù)據(jù)具體如下:84 69 73 77 88 83 65 74 79 6767 89 74 85 92 80 87 71 80 6777 76 77 73 53 68 79 81 67 7659 88 70 80 92 79 75 88 48 7274 73 83 68 65 78 88 84 58 7470 78 70 69 80 79 76 75 73 7065 81 81 80 76 52 66 69

5、77 7673 65 75 75 79 89 74 88 81 7377 82 74 88 84 82 81 88 90 6584 90 78 89 93 81 85 83 61 701.2、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及偏度和峰度 其中,樣本傳動(dòng)軸長度數(shù)據(jù)最小值為48,最大值為93,取a=40,b=100,全距L=10040=60,把數(shù)據(jù)分布的區(qū)間(40,100等分為6個(gè)子區(qū)間,等組距為ti=100-40/6=10,i=1,2,3,4,5,6。 通過計(jì)數(shù)要求落在子區(qū)間的個(gè)數(shù),那么得樣本傳動(dòng)軸長度的頻數(shù)和頻率分布, 序號 區(qū)間 頻數(shù)ni 頻率fi1 (40,50 1 12 (50,60 3

6、0.033 (60,70 24 0.244 (70,80 43 0.435 (80,90 23 0.236 (90,100 6 偏度是對樣本觀察值分布的偏斜方向和程度的度量,通過樣本數(shù)據(jù)計(jì)算的偏度為: V1 > 0,分布呈右偏態(tài)。 峰度是描述樣本觀察值分布集中趨勢頂峰的程度,通過樣本數(shù)據(jù)計(jì)算的峰度為:V2 > 3,分布為尖峰分布。1.3、畫出直方圖和折線圖圖一、數(shù)據(jù)段的直方圖圖二、數(shù)據(jù)分段的折線圖1.4、經(jīng)驗(yàn)分布函數(shù)和圖形 設(shè)X1,X2,.,Xn 是來自總體X 的樣本,樣本的順序統(tǒng)計(jì)量為X(1)X(2).X(n),當(dāng)固定的一組順序統(tǒng)計(jì)量的觀察值x(1)x(2).x(n)時(shí),對于任何

7、實(shí)數(shù)x 稱下式: 為總體X 的經(jīng)驗(yàn)分布函數(shù)。圖3經(jīng)驗(yàn)分布函數(shù)圖像1.5、各種概率分布 概率分布類型主要分為離散型概率分布和連續(xù)型概率分布,我查閱了圖書館還有專業(yè)參考資料搜集到以下的概率分布,個(gè)別分布還畫出了密度函數(shù)圖像,還對各種概率密度的背景做了簡單的介紹。1. 指數(shù)分布: 指數(shù)函數(shù)的一個(gè)重要特征是無記憶性又稱遺失記憶性。這表示如果一個(gè)隨機(jī)變量呈指數(shù)分布,當(dāng)s,t0時(shí)有P(T>s+t|T>t)=P(T>s)。即,如果T是某一元件的壽命,元件使用了t小時(shí),它總共使用至少s+t小時(shí)的條件概率,與從開始使用時(shí)算起它使用至少s小時(shí)的概率相等。2.威布爾分布: 威布爾分布又稱韋伯,是可

8、靠性分析和壽命檢驗(yàn)的理論根底。在可靠性工程中被廣泛應(yīng)用,尤其適用于機(jī)電類產(chǎn)品的磨損累計(jì)失效的分布形式。由于它可以利用概率值很容易地推斷出它的分布參數(shù),被廣泛應(yīng)用與各種壽命試驗(yàn)的數(shù)據(jù)處理。3.正態(tài)分布 正態(tài)分布是一個(gè)在數(shù)學(xué)、物理及工程等領(lǐng)域都非常重要的概率分布,在統(tǒng)計(jì)學(xué)的許多方面有著重大的影響力。假設(shè)隨機(jī)變量X服從一個(gè)數(shù)學(xué)期望為、方差為的正態(tài)分布,記為N(,)。正態(tài)分布的期望值決定了其位置,其標(biāo)準(zhǔn)差決定了分布的幅度。因其曲線呈鐘形,因此人們又經(jīng)常稱之為鐘形曲線。我們通常所說的標(biāo)準(zhǔn)正態(tài)分布是 = 0, = 1的正態(tài)分布。 t分布曲線形態(tài)與n確切地說與自由度v大小有關(guān)。與標(biāo)準(zhǔn)正態(tài)分布曲線相比,自由度

9、v越小,t分布曲線愈平坦,曲線中間愈低,曲線雙側(cè)尾部翹得愈高;自由度v愈大,t分布曲線愈接近正態(tài)分布曲線,當(dāng)自由度v=時(shí),t分布曲線為標(biāo)準(zhǔn)正態(tài)分布曲線??挛鞣植际且粋€(gè)數(shù)學(xué)期望不存在的連續(xù)型分布函數(shù),它同樣具有自己的分布密度 這說明X落在a,b的子區(qū)間內(nèi)的概率只與子區(qū)間長度有關(guān),而與子區(qū)間位置無關(guān),因此X落在a,b的長度相等的子區(qū)間內(nèi)的可能性是相等的,所謂的均勻指的就是這種等可能性。 伽瑪分布是統(tǒng)計(jì)學(xué)的一種連續(xù)概率函數(shù)。伽瑪分布中的參數(shù),稱為形狀參數(shù),稱為尺度參數(shù)。二、給出總體分布的參數(shù)估計(jì)2.1、矩估計(jì)法矩估計(jì)法是一種相對簡單的估計(jì)方法,其理論依據(jù)是辛欽大數(shù)定律:設(shè)隨機(jī)變量序列X1,X2,獨(dú)立

10、同分布,且數(shù)學(xué)期望E(Xi)=µ>0,有即當(dāng)n時(shí),依概率收斂到。因此當(dāng)樣本很大時(shí)因?yàn)椴杉臉颖敬笥诘扔?00,因此可以看作是大樣本又因?yàn)閺臄?shù)據(jù)分布圖可以看出樣本服從正態(tài)分布,X的概率密度函數(shù)為:,所以令經(jīng)過計(jì)算可得到,樣本均值。所以 a 與 b 的矩估計(jì)量分別為。2.2、最大似然估計(jì) 因?yàn)樽畲笏迫还烙?jì)法有較強(qiáng)的直觀性,又能獲得參數(shù)的合理的估計(jì)量,特別是在大樣本時(shí),最大似然估計(jì)有極好的性質(zhì)。所以他廣泛應(yīng)用于估計(jì)理論中。最大似然估計(jì)的解題原理如下: X的概率密度函數(shù)為:所以,的似然函數(shù)為:取對數(shù)得:令 解得:所以,的極大似然估計(jì)量為:2.3、參數(shù)區(qū)間估計(jì)假設(shè)樣本總體服從正態(tài)分布進(jìn)行

11、計(jì)算。1方差未知,求數(shù)學(xué)期望的置信區(qū)間: 1由于未知,用樣本的標(biāo)準(zhǔn)差代替此時(shí)不再服從標(biāo)準(zhǔn)正態(tài)分布。而是服從自由度為n-1的t函數(shù),其分布記為:2) 查分位數(shù)給定置信水平1-,使:根據(jù)自由度n-1和1-,從t-分布表查出分位數(shù)為式等價(jià)于3的隨機(jī)置信區(qū)間 的置信水平為0.90 的置信區(qū)間為:4確實(shí)定置信區(qū)間 由=74.4,方差S=9.49,那么帶入值可得:置信水平為0.9的區(qū)間為71.6,77.2。2數(shù)學(xué)期望,均未知,求方差的置信區(qū)間 1選取的樣本函數(shù)服從分布,記為: 2給定置信水平1-=0.9,使 從分布表查出分位數(shù)為于是: 由樣本觀察值計(jì)算樣本方差為,那么的置信水平為0.90 確實(shí)定置信區(qū)間為

12、:。三、 參數(shù)的假設(shè)檢驗(yàn)3.1.樣本統(tǒng)計(jì)數(shù)據(jù)的t檢驗(yàn)1假設(shè)樣本總體服從分布N61.5,樣本的均值=74.7,樣本的標(biāo)準(zhǔn)差為s=9.49,當(dāng)在顯著性水平為0.05下,是否可以認(rèn)為每個(gè)人的成績都在70分以上?1原假設(shè)和備擇假設(shè)單邊檢驗(yàn):2) 選取檢驗(yàn)統(tǒng)計(jì)量: 當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量為:3確定拒絕域: 給定顯著水平,使得: 查分布表得臨界值為: 而,那么其拒絕域?yàn)椤?) 計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測值為: 故帶入后得到t=0.2334; 因此作出判斷不能認(rèn)為每個(gè)人的成績都在70分以上。3.2樣本統(tǒng)計(jì)數(shù)據(jù)的檢驗(yàn)1假設(shè)總體服從總體分布 1原假設(shè)和備擇檢驗(yàn): 2選取檢驗(yàn)統(tǒng)計(jì)量: 當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量為:

13、 3確定拒絕域: 給定顯著性水平=0.05 使:, 故而求的其拒絕域?yàn)?0.144,+0,10.177 4計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測值: 而因而可以認(rèn)為新抽取的樣本的標(biāo)準(zhǔn)差比原來的標(biāo)準(zhǔn)差沒有區(qū)別。四、非參數(shù)假設(shè)檢驗(yàn)擬合優(yōu)度檢驗(yàn)4.1、擬合優(yōu)度檢驗(yàn)序號 區(qū)間 頻數(shù)ni 頻率fi1 (40,50 1 12 (50,60 3 0.033 (60,70 24 0.244 (70,80 43 0.435 (80,90 23 0.236 (90,100 6 原假設(shè)和備擇假設(shè)為:其中均為未知參數(shù),的最大似然估計(jì)為: 以表中數(shù)據(jù)為根底,原假設(shè)為真時(shí),計(jì)算隨機(jī)變量X落在個(gè)區(qū)間的概率等價(jià)檢驗(yàn)假設(shè):計(jì)算結(jié)果如下:序號 區(qū)

14、間 頻數(shù) 頻率 1 (40,50 1 1 55.24 2 (50,60 3 0.03 25.52 3 (60,70 24 0.24 20.178 4 (70,80 43 0.43 10.595 5 (80,90 23 0.23 4.649 6 (90,100 6 6.348 13401 給定顯著性水平,使的: 那么拒絕域?yàn)槎^察值為125.1,因而沒落在拒絕域內(nèi),原假設(shè)正確,樣本服從正態(tài)分布N(61.5,318.5)。五、結(jié)論1.由于數(shù)理統(tǒng)計(jì)是一門實(shí)用性極強(qiáng)的學(xué)科,在我們以后的科研生活中不可缺少的。我們在學(xué)習(xí)的工程中要了解數(shù)學(xué)的實(shí)際背景,知道分布背后的數(shù)學(xué)知識,理解統(tǒng)計(jì)方法的直觀含義。了解數(shù)理統(tǒng)計(jì)能解決那些實(shí)際問題。通過這次的數(shù)理統(tǒng)計(jì)大作業(yè)的學(xué)習(xí),我學(xué)會(huì)了如何處理抽樣數(shù)據(jù),并根據(jù)處理的結(jié)果能初步的作出合理的統(tǒng)計(jì)推斷。 2.數(shù)理統(tǒng)計(jì)從數(shù)學(xué)的角度去研究統(tǒng)計(jì)學(xué),為各種應(yīng)用統(tǒng)計(jì)學(xué)提供理論支持。比方以后我們要設(shè)計(jì)新型的飛機(jī)機(jī)翼,可以從根本的數(shù)據(jù)開始試驗(yàn),把這些數(shù)據(jù)整理規(guī)劃,用數(shù)理統(tǒng)計(jì)的知識來分析這些數(shù)據(jù),對我們的設(shè)計(jì)可以起到指導(dǎo)的作用。因此數(shù)理統(tǒng)計(jì)受到了非常大的關(guān)注,特別是在最近幾十年中,數(shù)理統(tǒng)計(jì)在社會(huì)科學(xué)、工農(nóng)業(yè)生產(chǎn)、自然科學(xué)以及醫(yī)療衛(wèi)生等諸多客觀現(xiàn)實(shí)中有著廣泛應(yīng)用。3.通過對數(shù)理統(tǒng)計(jì)學(xué)的學(xué)習(xí)及完本錢次課程作業(yè),初步學(xué)會(huì)了怎樣有效地收集、整理和分析帶有隨機(jī)性的數(shù)據(jù),但研究沒有深入,無

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論