版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
概率與頻率數(shù)學(xué)建模培訓(xùn)第1頁(yè)概率,又稱幾率,或然率,是反應(yīng)某種事件發(fā)生可能性大小一個(gè)數(shù)量指標(biāo),它介于0與1之間。概率論是研究隨機(jī)現(xiàn)象統(tǒng)計(jì)規(guī)律一門數(shù)學(xué)分支學(xué)科,希望經(jīng)過(guò)此次學(xué)習(xí),能加深對(duì)頻率和概率等概念了解和認(rèn)識(shí),并掌握一些概率統(tǒng)計(jì)基本原理。隨機(jī)現(xiàn)象中出現(xiàn)某個(gè)可能結(jié)果基本知識(shí)第2頁(yè)基本知識(shí)
隨機(jī)試驗(yàn):滿足以下三個(gè)條件試驗(yàn)?zāi)軌蛟谙嗤闆r下重復(fù)進(jìn)行;試驗(yàn)全部可能結(jié)果是明確可知,且不止一個(gè);每次試驗(yàn)結(jié)果無(wú)法預(yù)知,但有且只有一個(gè)結(jié)果。
概率與頻率概率是指某個(gè)隨機(jī)事件發(fā)生可能性一個(gè)度量,是該隨機(jī)事件本身屬性。頻率是指某隨機(jī)事件在隨機(jī)試驗(yàn)中實(shí)際出現(xiàn)次數(shù)與隨機(jī)試驗(yàn)進(jìn)行次數(shù)比值。頻率概率隨機(jī)試驗(yàn)進(jìn)行次數(shù)第3頁(yè)隨機(jī)變量基本知識(shí)統(tǒng)計(jì)分析(假設(shè)檢驗(yàn)、相關(guān)分析、回歸分析…)數(shù)字特征(均值、方差、相關(guān)系數(shù)、特征函數(shù)…)第4頁(yè)注:rand(n)=rand(n,n)Matlab中隨機(jī)函數(shù)randperm(m)生成一個(gè)由1:m
組成隨機(jī)排列randn(m,n)生成一個(gè)滿足正態(tài)分布m
n
隨機(jī)矩陣rand(m,n)
生成一個(gè)滿足均勻分布m
n
隨機(jī)矩陣,矩陣每個(gè)元素都在(0,1)
之間。perms(1:n)生成由1:n
組成全排列,共n!
個(gè)第5頁(yè)name
取值能夠是'norm'or'Normal''unif'or'Uniform''poiss'or'Poisson''beta'or'Beta''exp'or'Exponential''gam'or'Gamma''geo'or'Geometric''unid'or'DiscreteUniform'......random('name',A1,A2,A3,M,N)Matlab中隨機(jī)函數(shù)第6頁(yè)繪制直方圖hist(X,M)
%
二維條形直方圖,顯示數(shù)據(jù)分布情形將向量X中元素依據(jù)它們數(shù)值范圍進(jìn)行分組,每一組作為一個(gè)條形進(jìn)行顯示。條形直方圖中x-軸反應(yīng)了向量X
中元素?cái)?shù)值范圍,直方圖y-軸顯示出向量X
中元素落入該組數(shù)目。M
用來(lái)控制條形個(gè)數(shù),缺省為10。x=[1293580235210];hist(x);hist(x,5);hist(x,2);例:x=randn(1000,1);hist(x,100);histfit(x,NBINS)
%
附有正態(tài)密度曲線直方圖
NBINS
指定條形個(gè)數(shù),缺省為x
中數(shù)據(jù)個(gè)數(shù)平方根。第7頁(yè)fix(x):
截尾取整,直接將小數(shù)部分舍去floor(x):
不超出x
最大整數(shù)ceil(x):
大于x
最小整數(shù)round(x):
四舍五入取整Matlab中取整函數(shù)第8頁(yè)x1=fix(3.9);x2=fix(-3.9);x3=floor(3.9);x4=floor(-3.2);x5=ceil(3.1);x6=ceil(-3.9);x7=round(3.9);x8=round(-3.2);x9=round(-3.5);x1=3x2=-3x3=3x4=-4x5=4x6=-3x7=4x8=-3x9=-4取整函數(shù)舉例第9頁(yè)unique(a)合并a
中相同項(xiàng),并按從小到大排序若a是矩陣,則輸出為一個(gè)列向量prod(X)假如X
是向量,則返回其全部元素乘積。假如X
是矩陣,則計(jì)算每一列中全部元素乘積。其它相關(guān)函數(shù)a=[129323];b=unique(a)a=[129;323];b=unique(a)第10頁(yè)依據(jù)表示式不一樣取值,分別執(zhí)行不一樣語(yǔ)句switchexpr
casecase1
statements1
casecase2
statements2
......casecasem
statementsm
otherwise
statements
endswitch選擇語(yǔ)句第11頁(yè)method='Bilinear';switch
lower(method)
case{'linear','bilinear'}disp('Methodislinear')
case'cubic'disp('Methodiscubic')
case'nearest'disp('Methodisnearest')
otherwisedisp('Unknownmethod.')endswitch選擇語(yǔ)句舉例第12頁(yè)
這里我們主要用rand
函數(shù)和randperm
函數(shù)來(lái)模擬滿足均勻分布隨機(jī)試驗(yàn)。
試驗(yàn)方法先設(shè)定進(jìn)行試驗(yàn)總次數(shù)采取循環(huán)結(jié)構(gòu),統(tǒng)計(jì)指定事件發(fā)生次數(shù)計(jì)算該事件發(fā)生次數(shù)與試驗(yàn)總次數(shù)比值試驗(yàn)方法第13頁(yè)
隨機(jī)投擲均勻硬幣,驗(yàn)證國(guó)徽朝上與朝下概率是否都是1/2
n=10000;%
給定試驗(yàn)次數(shù)m=0;fori=1:nx=randperm(2)-1;y=x(1);ify==0%0表示國(guó)徽朝上,1表示國(guó)徽朝下m=m+1;endendfprintf('國(guó)徽朝上頻率為:%f\n',m/n);試驗(yàn)一:投擲硬幣第14頁(yè)隨機(jī)投擲骰子,驗(yàn)證各點(diǎn)出現(xiàn)概率是否為1/6
n=10000;m1=0;m2=0;m3=0;m4=0;m5=0;m6=0;fori=1:nx=randperm(6);y=x(1);switchycase1,m1=m1+1;case2,m2=m2+1;case3,m3=m3+1;case4,m4=m4+1;case5,m5=m5+1;otherwise,m6=m6+1;endend...%
輸出結(jié)果試驗(yàn)二:投擲骰子第15頁(yè)
用蒙特卡羅(MonteCarlo)投點(diǎn)法計(jì)算
值n=100000;a=2;m=0;fori=1:nx=rand(1)*a/2;y=rand(1)*a/2;if(x^2+y^2<=(a/2)^2)m=m+1;endendfprintf('計(jì)算出來(lái)pi為:%f\n',4*m/n);試驗(yàn)三:蒙特卡羅投點(diǎn)法第16頁(yè)
在畫有許多間距為d
等距平行線白紙上,隨機(jī)投擲一根長(zhǎng)為l(l
d)均勻直針,求針與平行線相交概率,并計(jì)算
值。試驗(yàn)四:蒲豐投針試驗(yàn)第17頁(yè)n=100000;l=0.5;d=1;m=0;fori=1:nalpha=rand(1)*pi;y=rand(1)*d/2;ify<=l/2*sin(alpha)m=m+1;endendfprintf('針與平行線相交頻率為:%f\n',m/n);fprintf('計(jì)算出來(lái)pi為:%f\n’,2*n*l/(m*d));試驗(yàn)四源程序第18頁(yè)
設(shè)某班有m
個(gè)學(xué)生,則該班最少有兩人同一天生日概率是多少?試驗(yàn)五:生日問(wèn)題解:設(shè)一年為365天,且某一個(gè)學(xué)生生日出現(xiàn)在一年中每一天都是等可能,則班上任意兩個(gè)學(xué)生生日都不相同概率為:所以,最少有兩個(gè)學(xué)生同一天生日概率為:第19頁(yè)n=1000;p=0;m=50;%
設(shè)該班人數(shù)為50fort=1:na=[];q=0;fork=1:mb=randperm(365);a=[a,b(1)];endc=unique(a);iflength(a)~=length(c)p=p+1;endendfprintf(‘任兩人不在同一天生日頻率為:%f\n',p/n);試驗(yàn)五源程序第20頁(yè)clear;m=50;p1=1:365;p2=[1:365-m,365*ones(1,m)];p=p1./p2;p=1-prod(p);fprintf('最少兩人同一天生日概率為:%f\n',p);試驗(yàn)五理論值計(jì)算第21頁(yè)
彩票箱內(nèi)有m
張彩票,其中只有一張能中彩。
問(wèn)m
個(gè)人依次摸彩,第k(k
≤
m)個(gè)人中彩概率是多少?你能得出什么結(jié)論?第一個(gè)人中彩概率為:推知第k個(gè)人中彩概率為:第三個(gè)人中彩概率為:第二個(gè)人中彩概率為:試驗(yàn)六:摸彩問(wèn)題第22頁(yè)n=10000;m=10;p=0;k=5;%
計(jì)算第5個(gè)人中彩頻率fort=1:nx=randperm(m);y=x(1);ify==kp=p+1;endendfprintf('第%d
個(gè)人中彩頻率為:%f\n',p/n);試驗(yàn)六源程序第23頁(yè)概率與統(tǒng)計(jì)概率論中所研究隨機(jī)變量分布都是已知。統(tǒng)計(jì)學(xué)中所研究隨機(jī)變量分布是未知或部分未知,必須經(jīng)過(guò)對(duì)所研究隨機(jī)變量進(jìn)行重復(fù)獨(dú)立觀察和試驗(yàn),得到所需觀察值(數(shù)據(jù)),對(duì)這些數(shù)據(jù)分析后才能對(duì)其分布做出種種判斷,即“從局部推斷總體”。第24頁(yè)統(tǒng)計(jì)學(xué)給定一組數(shù)據(jù),統(tǒng)計(jì)學(xué)能夠摘要而且描述這份數(shù)據(jù),這個(gè)使用方法稱作為描述統(tǒng)計(jì)學(xué)。觀察者以數(shù)據(jù)形態(tài)建立出一個(gè)用以解釋其隨機(jī)性和不確定性數(shù)學(xué)模型,以之來(lái)推論研究中步驟及母體,這種使用方法被稱做推論統(tǒng)計(jì)學(xué)。數(shù)理統(tǒng)計(jì)學(xué)專門用來(lái)討論這門科目背后理論基礎(chǔ)。
第25頁(yè)數(shù)據(jù)統(tǒng)計(jì)分析第26頁(yè)現(xiàn)實(shí)生活中許多數(shù)據(jù)都是隨機(jī)產(chǎn)生,如考試分?jǐn)?shù)、月降雨量、燈泡壽命等。從數(shù)理統(tǒng)計(jì)角度來(lái)看,這些數(shù)據(jù)其實(shí)都是符合某種分布,這種規(guī)律就是統(tǒng)計(jì)規(guī)律。經(jīng)過(guò)對(duì)概率密度函數(shù)曲線直觀認(rèn)識(shí)和數(shù)據(jù)分布形態(tài)猜測(cè),以及密度函數(shù)參數(shù)預(yù)計(jì),進(jìn)行簡(jiǎn)單分布假設(shè)檢驗(yàn),揭示日常生活中隨機(jī)數(shù)據(jù)一些統(tǒng)計(jì)規(guī)律。背景和目標(biāo)第27頁(yè)Matlab相關(guān)命令介紹
pdf概率密度函數(shù)y=pdf(name,x,A)y=pdf(name,x,A,B)或
y=pdf(name,x,A,B,C)返回由name
指定單參數(shù)分布概率密度,x為樣本數(shù)據(jù)
name
用來(lái)指定分布類型,其取值能夠是:
'beta'、'bino'、'chi2'、'exp'、'ev'、'f'、
'gam'、'gev'、'gp'、'geo'、'hyge'、'logn'、
'nbin'、'ncf'、'nct'、'ncx2'、'norm'、
'poiss'、'rayl'、't'、'unif'、'unid'、'wbl'。返回由name
指定雙參數(shù)或三參數(shù)分布概率密度第28頁(yè)Matlab相關(guān)命令介紹例:x=-8:0.1:8;y=pdf('norm',x,0,1);y1=pdf('norm',x,1,2);plot(x,y,x,y1,':')注:
y=pdf('norm',x,0,1)
y=normpdf(x,0,1)相類似地,
y=pdf('beta',x,A,B)
y=betapdf(x,A,B)
y=pdf('bino,x,N,p)
y=binopdf(x,N,p)……
……第29頁(yè)Matlab相關(guān)命令介紹
normfit正態(tài)分布中參數(shù)預(yù)計(jì)[muhat,sigmahat,muci,sigmaci]=normfit(x,alpha)對(duì)樣本數(shù)據(jù)x
進(jìn)行參數(shù)預(yù)計(jì),并計(jì)算置信度為1-alpha
置信區(qū)間
alpha
能夠省略,缺省值為0.05,即置信度為95%
load從matlab數(shù)據(jù)文件中載入數(shù)據(jù)S=load('數(shù)據(jù)文件名')
hist繪制給定數(shù)據(jù)直方圖hist(x,m)第30頁(yè)Matlab相關(guān)命令介紹table=tabulate(x)繪制頻數(shù)表,返回值table
中,第一列為x值,第二列為該值出現(xiàn)次數(shù),最終一列包含每個(gè)值百分比。ttest(x,m,alpha)假設(shè)檢驗(yàn)函數(shù)。此函數(shù)對(duì)樣本數(shù)據(jù)x
進(jìn)行顯著性水平為alpha
t
假設(shè)檢驗(yàn),以檢驗(yàn)正態(tài)分布樣本x(標(biāo)準(zhǔn)差未知)均值是否為m。第31頁(yè)Matlab相關(guān)命令介紹normplot(x)統(tǒng)計(jì)繪圖函數(shù),進(jìn)行正態(tài)分布檢驗(yàn)。研究表明:假如數(shù)據(jù)是來(lái)自一個(gè)正態(tài)分布,則該線為一直線形態(tài);假如它是來(lái)自其它分布,則為曲線形態(tài)。wblplot(x)統(tǒng)計(jì)繪圖函數(shù),進(jìn)行Weibull
分布檢驗(yàn)。第32頁(yè)Matlab相關(guān)命令介紹
其它函數(shù)
cdf
系列函數(shù):累積分布函數(shù)
inv
系列函數(shù):逆累積分布函數(shù)
rnd
系列函數(shù):隨機(jī)數(shù)發(fā)生函數(shù)
stat
系列函數(shù):均值與方差函數(shù)例:p=normcdf(-2:2,0,1)x=norminv([0.0250.975],0,1)n=normrnd(0,1,[15])n=1:5;
[m,v]=normstat(n'*n,n'*n)第33頁(yè)常見(jiàn)概率分布二項(xiàng)式分布Binomialbino卡方分布Chisquarechi2指數(shù)分布ExponentialexpF分布Ff幾何分布Geometricgeo正態(tài)分布Normalnorm泊松分布PoissonpoissT分布Tt均勻分布Uniformunif離散均勻分布DiscreteUniformunid第34頁(yè)連續(xù)分布:正態(tài)分布
正態(tài)分布(連續(xù)分布)假如隨機(jī)變量X
密度函數(shù)為:則稱X
服從正態(tài)分布。記做:標(biāo)準(zhǔn)正態(tài)分布:N(0,1)正態(tài)分布也稱高斯分布,是概率論中最主要一個(gè)分布。假如一個(gè)變量是大量微小、獨(dú)立隨機(jī)原因疊加,那么它一定滿足正態(tài)分布。如測(cè)量誤差、產(chǎn)品質(zhì)量、月降雨量等第35頁(yè)正態(tài)分布舉例x=-8:0.1:8;y=normpdf(x,0,1);y1=normpdf(x,1,2);plot(x,y,x,y1,':')例:標(biāo)準(zhǔn)正態(tài)分布和非標(biāo)準(zhǔn)正態(tài)分布密度函數(shù)圖形第36頁(yè)連續(xù)分布:均勻分布
均勻分布(連續(xù)分布)假如隨機(jī)變量X
密度函數(shù)為:則稱X
服從均勻分布。記做:
均勻分布在實(shí)際中經(jīng)常使用,譬如一個(gè)半徑為r
汽車輪胎,因?yàn)檩喬ド先我稽c(diǎn)接觸地面可能性是相同,所以輪胎圓周接觸地面位置X
是服從[0,2
r]
上均勻分布。第37頁(yè)均勻分布舉例x=-10:0.01:10;r=1;y=unifpdf(x,0,2*pi*r);plot(x,y);第38頁(yè)連續(xù)分布:指數(shù)分布
指數(shù)分布(連續(xù)分布)假如隨機(jī)變量X
密度函數(shù)為:則稱X
服從參數(shù)為
指數(shù)分布。記做:
在實(shí)際應(yīng)用問(wèn)題中,等候某特定事物發(fā)生所需要時(shí)間往往服從指數(shù)分布。如一些元件壽命;隨機(jī)服務(wù)系統(tǒng)中服務(wù)時(shí)間;動(dòng)物壽命等都常常假定服從指數(shù)分布。指數(shù)分布含有沒(méi)有記憶性:第39頁(yè)指數(shù)分布舉例x=0:0.1:30;y=exppdf(x,4);plot(x,y)例:
=4時(shí)指數(shù)分布密度函數(shù)圖第40頁(yè)離散分布:幾何分布
幾何分布是一個(gè)常見(jiàn)離散分布
在貝努里試驗(yàn)中,每次試驗(yàn)成功概率為
p,設(shè)試驗(yàn)進(jìn)行到第
次才出現(xiàn)成功,則
分充滿足:其右端項(xiàng)是幾何級(jí)數(shù)
普通項(xiàng),于是人們稱它為幾何分布。第41頁(yè)x=0:30;y=geopdf(x,0.5);plot(x,y)例:p=0.5時(shí)幾何分布密度函數(shù)圖第42頁(yè)離散分布:二項(xiàng)式分布
二項(xiàng)式分布屬于離散分布假如隨機(jī)變量X
分布列為:則稱這種分布為二項(xiàng)式分布。記做:第43頁(yè)x=0:50;y=binopdf(x,500,0.05);plot(x,y)例:n=500,p=0.05時(shí)二項(xiàng)式分布密度函數(shù)圖第44頁(yè)離散分布:Poisson分布
泊松分布也屬于離散分布,是1837年由法國(guó)數(shù)學(xué)家Poisson首次提出,其概率分布列為:記做:
泊松分布是一個(gè)慣用離散分布,它與單位時(shí)間(或單位面積、單位產(chǎn)品等)上計(jì)數(shù)過(guò)程相聯(lián)絡(luò)。如:?jiǎn)挝粫r(shí)間內(nèi),電話總機(jī)接到用戶呼喚次數(shù);1
平方米內(nèi),玻璃上氣泡數(shù)等。第45頁(yè)P(yáng)oisson分布舉例x=0:50;y=poisspdf(x,25);plot(x,y)例:
=25時(shí)泊松分布密度函數(shù)圖第46頁(yè)離散分布:均勻分布假如隨機(jī)變量X
分布列為:則稱這種分布為離散均勻分布。記做:第47頁(yè)n=20;x=1:n;y=unidpdf(x,n);plot(x,y,'o-')例:n=20時(shí)離散均勻分布密度函數(shù)圖第48頁(yè)抽樣分布:
2分布設(shè)隨機(jī)變量X1,X2,…,Xn
相互獨(dú)立,且同服從正態(tài)分布N(0,1),則稱隨機(jī)變量
n2=
X12+X22+…+Xn2服從自由度為n
2分布,記作,亦稱隨機(jī)變量
n2為
2變量。第49頁(yè)x=0:0.1:20;y=chi2pdf(x,4);plot(x,y)例:n=4和n=10時(shí)
2分布密度函數(shù)圖x=0:0.1:20;y=chi2pdf(x,10);plot(x,y)第50頁(yè)抽樣分布:
F分布設(shè)隨機(jī)變量
,且X
與Y
相互獨(dú)立,則稱隨機(jī)變量為服從自由度(m,n)
F
分布。記做:第51頁(yè)x=0.01:0.1:8.01;y=fpdf(x,4,10);plot(x,y)例:F(4,10)分布密度函數(shù)圖第52頁(yè)抽樣分布:
t分布設(shè)隨機(jī)變量
,且X
與Y
相互獨(dú)立,則稱隨機(jī)變量為服從自由度n
t
分布。記做:第53頁(yè)x=-6:0.01:6;y=tpdf(x,4);plot(x,y)例:t
(4)分布密度函數(shù)圖第54頁(yè)頻數(shù)直方圖或頻數(shù)表對(duì)于給定數(shù)據(jù)集,假設(shè)它們滿足以上十種分布之一,怎樣確定屬于哪種分布?繪制頻數(shù)直方圖,或列出頻數(shù)表第55頁(yè)
從圖形上看,筆試成績(jī)較為靠近正態(tài)分布x=load('data1.txt');x=x(:);hist(x)例1:某次筆試分?jǐn)?shù)見(jiàn)data1.txt,試畫出頻數(shù)直方圖第56頁(yè)頻數(shù)直方圖或頻數(shù)表x=load('data2.txt');x=x(:);hist(x)例2:某次上機(jī)考試分?jǐn)?shù)見(jiàn)data2.txt,試畫出頻數(shù)直方圖
從圖形上看,上機(jī)考試成績(jī)較為靠近離散均勻分布第57頁(yè)x=load('data3.txt');x=x(:);hist(x)例3:上海1998年來(lái)月降雨量數(shù)據(jù)見(jiàn)data3.txt,
試畫出頻數(shù)直方圖
從圖形上看,月降雨量較為靠近
2分布第58頁(yè)頻數(shù)直方圖或頻數(shù)表在重復(fù)數(shù)據(jù)較多情況下,我們也能夠利用Matlab自帶tabulate
函數(shù)生成頻數(shù)表,并以頻數(shù)表形式來(lái)發(fā)掘數(shù)據(jù)分布規(guī)律。x=load('data4.txt');
x=x(:);tabulate(x)hist(x)例4:給出數(shù)據(jù)data4.txt,試畫出其直方圖,并生成頻數(shù)表第59頁(yè)ValueCountPercent1613.04%2613.04%31226.09%41021.74%5510.87%6715.22%第60頁(yè)頻數(shù)直方圖或頻數(shù)表x=load('data5.txt');x=x(:);hist(x)fiugrehistfit(x)%
加入較靠近正態(tài)分布密度曲線例5:現(xiàn)累積有100次刀具故障統(tǒng)計(jì),當(dāng)故障出現(xiàn)時(shí)該批刀具完成零件數(shù)見(jiàn)data5.txt,試畫出其直方圖。第61頁(yè)
從圖形上看,較為靠近正態(tài)分布第62頁(yè)參數(shù)預(yù)計(jì)當(dāng)我們能夠基本確定數(shù)據(jù)集X
符合某種分布后,我們還需要確定這個(gè)分布參數(shù)。因?yàn)檎龖B(tài)分布情況發(fā)生比較多,故我們主要考慮正態(tài)分布情形。對(duì)于未知參數(shù)預(yù)計(jì),可分兩種情況:點(diǎn)預(yù)計(jì)區(qū)間預(yù)計(jì)第63頁(yè)參數(shù)預(yù)計(jì):點(diǎn)預(yù)計(jì)結(jié)構(gòu)樣本X
與某個(gè)統(tǒng)計(jì)量相關(guān)一個(gè)函數(shù),作為該統(tǒng)計(jì)量一個(gè)預(yù)計(jì),稱為點(diǎn)預(yù)計(jì)。Matlab統(tǒng)計(jì)工具箱中,普通采取最大似然預(yù)計(jì)法給出參數(shù)點(diǎn)預(yù)計(jì)。泊松分布P
(
)
最大似然預(yù)計(jì)是指數(shù)分布Exp
(
)
最大似然預(yù)計(jì)是第64頁(yè)點(diǎn)預(yù)計(jì)舉例正態(tài)分布N
(
,
2)
中,
最大似然預(yù)計(jì)是,
2最大似然預(yù)計(jì)是x=load('data1.txt');x=x(:);[mu,sigma]=normfit(x)例6:已知例1中數(shù)據(jù)服從正態(tài)分布
N
(
,
2)
,試求其參數(shù)
和
值。使用
normfit
函數(shù)第65頁(yè)參數(shù)預(yù)計(jì):區(qū)間預(yù)計(jì)結(jié)構(gòu)樣本X
與某個(gè)統(tǒng)計(jì)量相關(guān)兩個(gè)函數(shù),作為該統(tǒng)計(jì)量下限預(yù)計(jì)與上限預(yù)計(jì),下限與上限組成一個(gè)區(qū)間,這個(gè)區(qū)間作為該統(tǒng)計(jì)量預(yù)計(jì),稱為區(qū)間預(yù)計(jì)。Matlab統(tǒng)計(jì)工具箱中,普通也采取最大似然預(yù)計(jì)法給出參數(shù)區(qū)間預(yù)計(jì)。第66頁(yè)區(qū)間預(yù)計(jì)舉例x=load('data1.txt');x=x(:);[mu,sigma,muci,sigmaci]=normfit(x)例7:已知例1中數(shù)據(jù)服從正態(tài)分布
N
(
,
2)
,試求出
和
2
置信度為95%區(qū)間預(yù)計(jì)。x=load('data6.txt');x=x(:);[mu,sigma,muci,sigmaci]=normfit(x,0.01)例8:從自動(dòng)機(jī)床加工同類零件中抽取16件,測(cè)得長(zhǎng)度值見(jiàn)data6.txt,已知零件長(zhǎng)度服從正態(tài)分布
N
(
,
2)
,試求零件長(zhǎng)度均值
和標(biāo)準(zhǔn)差
置信度為99%置信區(qū)間。第67頁(yè)假設(shè)檢驗(yàn)對(duì)總體分布律或分布參數(shù)作某種假設(shè),依據(jù)抽取樣本觀察值,利用數(shù)理統(tǒng)計(jì)分析方法,檢驗(yàn)這種假設(shè)是否正確,從而決定接收假設(shè)或拒絕假設(shè),這就是假設(shè)檢驗(yàn)問(wèn)題。以正態(tài)假設(shè)檢驗(yàn)為例,來(lái)說(shuō)明假設(shè)檢驗(yàn)基本過(guò)程。第68頁(yè)正態(tài)假設(shè)檢驗(yàn)正態(tài)假設(shè)檢驗(yàn)普通過(guò)程:假設(shè)檢驗(yàn):利用Matlab統(tǒng)計(jì)工具箱給出慣用假設(shè)檢驗(yàn)方法函數(shù)ttest,進(jìn)行顯著性水平為alpha
t
假設(shè)檢驗(yàn),以檢驗(yàn)正態(tài)分布樣本x(標(biāo)準(zhǔn)差未知)均值是否為m。運(yùn)行結(jié)果中,當(dāng)h=1
時(shí),表示拒絕零假設(shè);當(dāng)h=0
時(shí),表示不能拒絕零假設(shè)。對(duì)比正態(tài)分布概率密度函數(shù)分布圖,判斷某統(tǒng)計(jì)量分布可能服從正態(tài)分布利用統(tǒng)計(jì)繪圖函數(shù)normplot
或wblplot
進(jìn)行正態(tài)分布檢驗(yàn)第69頁(yè)正態(tài)假設(shè)檢驗(yàn)舉例例9:試說(shuō)明例5中刀具使用壽命服從正態(tài)分布,而且說(shuō)明在方差未知情況下其均值m取為597是否合理。(1)對(duì)比刀具使用壽命分布圖與正態(tài)分布概率密度分布函數(shù)圖,得初步結(jié)論:該批刀具使用壽命可能服從正態(tài)分布。解:第70頁(yè)第71頁(yè)x=load('data5.txt');x=x(:);normplot(x)(2)利用統(tǒng)計(jì)繪圖函數(shù)normplot
進(jìn)行分布正態(tài)性檢驗(yàn)結(jié)果顯示:這100個(gè)離散點(diǎn)非??拷鼉A斜直線段,即圖形為線性,所以可得結(jié)論:該批刀具使用壽命近似服從正態(tài)分布。第72頁(yè)正態(tài)假設(shè)檢驗(yàn)舉例x=load('data5.txt');x=x(:);h=ttest(x,597,0.05)(3)利用函數(shù)ttest
進(jìn)行顯著性水平為alpha
t
假設(shè)檢驗(yàn)檢驗(yàn)結(jié)果:h=0。表示不拒絕零假設(shè),說(shuō)明所提出假設(shè)“壽命均值為597”是合理第73頁(yè)
前面討論了當(dāng)總體分布為正態(tài)時(shí),關(guān)于其中未知參數(shù)假設(shè)檢驗(yàn)問(wèn)題.
然而可能碰到這么情形,總體服從何種理論分布并不知道,要求我們直接對(duì)總體分布提出一個(gè)假設(shè).第74頁(yè)比如,從1500年到1931年432年間,每年暴發(fā)戰(zhàn)爭(zhēng)次數(shù)能夠看作一個(gè)隨機(jī)變量,據(jù)統(tǒng)計(jì),這432年間共暴發(fā)了299次戰(zhàn)爭(zhēng),詳細(xì)數(shù)據(jù)以下:戰(zhàn)爭(zhēng)次數(shù)X01234
22314248154
發(fā)生X次戰(zhàn)爭(zhēng)年數(shù)第75頁(yè)
在概率論中,大家對(duì)泊松分布產(chǎn)生普通條件已經(jīng)有所了解,輕易想到,每年暴發(fā)戰(zhàn)爭(zhēng)次數(shù),能夠用一個(gè)泊松隨機(jī)變量來(lái)近似描述.也就是說(shuō),我們能夠假設(shè)每年暴發(fā)戰(zhàn)爭(zhēng)次數(shù)分布X近似泊松分布.上面數(shù)據(jù)能否證實(shí)X
含有泊松分布假設(shè)是正確?現(xiàn)在問(wèn)題是:第76頁(yè)再如,某工廠制造一批骰子,聲稱它是均勻.為檢驗(yàn)骰子是否均勻,要把骰子實(shí)地投擲若干次,統(tǒng)計(jì)各點(diǎn)出現(xiàn)頻率與1/6差距.也就是說(shuō),在投擲中,出現(xiàn)1點(diǎn),2點(diǎn),…,6點(diǎn)概率都應(yīng)是1/6.得到數(shù)據(jù)能否說(shuō)明“骰子均勻”假設(shè)是可信?問(wèn)題是:第77頁(yè)K.皮爾遜這是一項(xiàng)很主要工作,不少人把它視為近代統(tǒng)計(jì)學(xué)開(kāi)端.
處理這類問(wèn)題工具是英國(guó)統(tǒng)計(jì)學(xué)家K.皮爾遜在19發(fā)表一篇文章中引進(jìn)所謂
檢驗(yàn)法.第78頁(yè)
檢驗(yàn)法是在總體X分布未知時(shí),依據(jù)來(lái)自總體樣本,檢驗(yàn)關(guān)于總體分布假設(shè)一個(gè)檢驗(yàn)方法.第79頁(yè)
H0:總體X分布函數(shù)為F0(x)然后依據(jù)樣本經(jīng)驗(yàn)分布和所假設(shè)理論分布之間吻合程度來(lái)決定是否接收原假設(shè).使用
對(duì)總體分布進(jìn)行檢驗(yàn)時(shí),我們先提出原假設(shè):檢驗(yàn)法這種檢驗(yàn)通常稱作擬合優(yōu)度檢驗(yàn),它是一個(gè)非參數(shù)檢驗(yàn).第80頁(yè)總體分布擬合優(yōu)度檢驗(yàn)
GoodnessofFitTest
forDistributionofPopulation第81頁(yè)卡方擬合優(yōu)度檢驗(yàn)原理與步驟1.原理判斷樣本觀察頻數(shù)(Observedfrequency)與理論(期望)頻數(shù)(Expectedfrequency
)之差是否由抽樣誤差所引發(fā)。第82頁(yè)3.依據(jù)所假設(shè)理論分布,能夠算出總體X值落入每個(gè)Ak概率pk,于是npk就是落入Ak樣本值理論頻數(shù).1.將總體X取值范圍分成r個(gè)互不重迭小區(qū)間[ai-1,ai],i=1,…r,記作A1,A2,…,Ar
.2.把落入第k個(gè)小區(qū)間Ak樣本值個(gè)數(shù)記作nk
,稱為實(shí)際頻數(shù).2.步驟第83頁(yè)標(biāo)志著經(jīng)驗(yàn)分布與理論分布之間差異大小.皮爾遜引進(jìn)以下統(tǒng)計(jì)量表示經(jīng)驗(yàn)分布與理論分布之間差異:統(tǒng)計(jì)量分布是什么?在理論分布已知條件下,npk是常量實(shí)際頻數(shù)理論頻數(shù)第84頁(yè)皮爾遜證實(shí)了以下定理:
若原假設(shè)中理論分布F0(x)已經(jīng)完全給定,那么當(dāng)時(shí),統(tǒng)計(jì)量分布漸近(r-1)個(gè)自由度分布.
假如理論分布F0(x)中有m個(gè)未知參數(shù)需用對(duì)應(yīng)預(yù)計(jì)量來(lái)代替,那么當(dāng)時(shí),統(tǒng)計(jì)量分布漸近(r-m-1)個(gè)自由度分布.第85頁(yè)
假如依據(jù)所給樣本值X1,X2,…,Xn算得統(tǒng)計(jì)量實(shí)測(cè)值落入拒絕域,則拒絕原假設(shè),不然就認(rèn)為差異不顯著而接收原假設(shè).得拒絕域:(不需預(yù)計(jì)參數(shù))(預(yù)計(jì)r個(gè)參數(shù))查分布表可得臨界值,使得
依據(jù)這個(gè)定理,對(duì)給定顯著性水平,第86頁(yè)卡方分布下檢驗(yàn)水準(zhǔn)及其臨界值第87頁(yè)
皮爾遜定理是在n無(wú)限增大時(shí)推導(dǎo)出來(lái),因而在使用時(shí)要注意n要足夠大,以及npi不太小這兩個(gè)條件.
依據(jù)計(jì)算實(shí)踐,要求n大于50,以及npi
都大于5.不然應(yīng)適當(dāng)合并區(qū)間,使npi滿足這個(gè)要求.注意:理論頻數(shù)不宜過(guò)?。ㄈ绱笥?),不然需要合并組段!第88頁(yè)讓我們回到開(kāi)始一個(gè)例子,檢驗(yàn)每年暴發(fā)戰(zhàn)爭(zhēng)次數(shù)分布是否服從泊松分布.提出假設(shè)H0:X服從參數(shù)為泊松分布按參數(shù)為0.69泊松分布,計(jì)算事件X=i概率pi
,=0.69將相關(guān)計(jì)算結(jié)果列表以下:pi預(yù)計(jì)是,i=0,1,2,3,4依據(jù)觀察結(jié)果,得參數(shù)極大似然預(yù)計(jì)為第89頁(yè)
因H0所假設(shè)理論分布中有一個(gè)未知參數(shù),故自由度為4-1-1=2.x01234fi
22314248154
0.580.310.180.010.02n
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 財(cái)險(xiǎn)反洗錢知識(shí)培訓(xùn)課件
- 著眼幼小銜接助力兒童成長(zhǎng)幼小銜接培訓(xùn)
- 掌握結(jié)構(gòu)化表達(dá)提升溝通效率
- 食材加工知識(shí)培訓(xùn)課件
- 二零二五年度大數(shù)據(jù)分析與應(yīng)用簡(jiǎn)易技術(shù)服務(wù)合同范本2篇
- 2025年度酒店甲醛濃度達(dá)標(biāo)治理合同范本3篇
- 二零二五年度建筑工程施工現(xiàn)場(chǎng)用電補(bǔ)充協(xié)議范本3篇
- 中學(xué)生寒假計(jì)劃安排
- 四川省眉山市仁壽縣2024-2025學(xué)年高二上學(xué)期期末考試歷史試題(含答案)
- 人教版九年級(jí)歷史與社會(huì)上冊(cè)說(shuō)課稿:第一單元 第一課 世界的格局與第一次世界大戰(zhàn)
- 合作投資酒店意向合同范例
- 安全教育教案大班40篇
- 叉車工安全培訓(xùn)資料
- 九年級(jí)英語(yǔ)教學(xué)反思
- 外研新標(biāo)準(zhǔn)初中英語(yǔ)七年級(jí)上冊(cè)冊(cè)寒假提升補(bǔ)全對(duì)話短文練習(xí)三附答案解析
- 《旅游消費(fèi)者行為學(xué)》-課程教學(xué)大綱
- YY/T 1117-2024石膏繃帶
- 蘇教版小學(xué)三年級(jí)科學(xué)上冊(cè)單元測(cè)試題附答案(全冊(cè))
- 2024年人教版初一語(yǔ)文(上冊(cè))期末試卷及答案(各版本)
- 生豬屠宰獸醫(yī)衛(wèi)生檢驗(yàn)人員理論考試題及答案
- 物流園保安服務(wù)投標(biāo)方案(技術(shù)方案)
評(píng)論
0/150
提交評(píng)論