MATLAB-第10講數(shù)據(jù)統(tǒng)計分析課件_第1頁
MATLAB-第10講數(shù)據(jù)統(tǒng)計分析課件_第2頁
MATLAB-第10講數(shù)據(jù)統(tǒng)計分析課件_第3頁
MATLAB-第10講數(shù)據(jù)統(tǒng)計分析課件_第4頁
MATLAB-第10講數(shù)據(jù)統(tǒng)計分析課件_第5頁
已閱讀5頁,還剩91頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

數(shù)學建模與數(shù)學實驗經(jīng)濟數(shù)學系數(shù)學建模研究室數(shù)據(jù)的統(tǒng)計描述和分析11/21/20221數(shù)學建模與數(shù)學實驗經(jīng)濟數(shù)學系數(shù)學建模研究室數(shù)據(jù)的統(tǒng)計描述和分實驗目的實驗內(nèi)容2、掌握用數(shù)學軟件包求解統(tǒng)計問題。1、直觀了解統(tǒng)計基本內(nèi)容。1、統(tǒng)計的基本理論。3、實驗作業(yè)。2、用數(shù)學軟件包求解統(tǒng)計問題。11/21/20222實驗目的實驗內(nèi)容2、掌握用數(shù)學軟件包求解統(tǒng)計問題。1、直觀了統(tǒng)計的基本概念參數(shù)估計假設檢驗數(shù)據(jù)的統(tǒng)計描述和分析11/21/20223統(tǒng)計的基本概念參數(shù)估計假設檢驗數(shù)據(jù)的統(tǒng)計描述和分析11/21一、統(tǒng)計量11/21/20224一、統(tǒng)計量11/21/2022411/21/2022511/21/20225二、分布函數(shù)的近似求法11/21/20226二、分布函數(shù)的近似求法11/21/20226三、幾個在統(tǒng)計中常用的概率分布-4-2024600.050.10.150.20.250.30.350.41.正態(tài)分布),(2smN密度函數(shù):222)(21)(smsp--=xexp分布函數(shù):dyexFyx222)(21)(smsp--¥-ò=其中m為均值,2s為方差,+¥<<¥-x.標準正態(tài)分布:N(0,1)密度函數(shù)2221)(xex-=pjdyexyx2221)(-¥-ò=Fp,

分布函數(shù)11/21/20227三、幾個在統(tǒng)計中常用的概率分布-4-2024600.050.11/21/2022811/21/2022811/21/2022911/21/20229返回F分布F(10,50)的密度函數(shù)曲線11/21/202210返回F分布F(10,50)的密度函數(shù)曲線11/21/2022參數(shù)估計11/21/202211參數(shù)估計11/21/202211一、點估計的求法(一)矩估計法11/21/202212一、點估計的求法(一)矩估計法11/21/202212(二)極大似然估計法11/21/202213(二)極大似然估計法11/21/202213二、區(qū)間估計的求法11/21/202214二、區(qū)間估計的求法11/21/2022141、已知DX,求EX的置信區(qū)間2.未知方差DX,求EX的置信區(qū)間(一)數(shù)學期望的置信區(qū)間(二)方差的區(qū)間估計返回11/21/2022151、已知DX,求EX的置信區(qū)間2.未知方差DX,求EX的置1.參數(shù)檢驗:如果觀測的分布函數(shù)類型已知,這時構造出的統(tǒng)計量依賴于總體的分布函數(shù),這種檢驗稱為參數(shù)檢驗.參數(shù)檢驗的目的往往是對總體的參數(shù)及其有關性質(zhì)作出明確的判斷.

對總體X的分布律或分布參數(shù)作某種假設,根據(jù)抽取的樣本觀察值,運用數(shù)理統(tǒng)計的分析方法,檢驗這種假設是否正確,從而決定接受假設或拒絕假設.假設檢驗2.非參數(shù)檢驗:如果所檢驗的假設并非是對某個參數(shù)作出明確的判斷,因而必須要求構造出的檢驗統(tǒng)計量的分布函數(shù)不依賴于觀測值的分布函數(shù)類型,這種檢驗叫非參數(shù)檢驗.如要求判斷總體分布類型的檢驗就是非參數(shù)檢驗.11/21/2022161.參數(shù)檢驗:如果觀測的分布函數(shù)類型已知,這時構造出的假設檢驗的一般步驟是:11/21/202217假設檢驗的一般步驟是:11/21/202217(一)單個正態(tài)總體均值檢驗一、參數(shù)檢驗11/21/202218(一)單個正態(tài)總體均值檢驗一、參數(shù)檢驗11/21/2022111/21/20221911/21/202219(二)單個正態(tài)總體方差檢驗11/21/202220(二)單個正態(tài)總體方差檢驗11/21/202220(三)兩個正態(tài)總體均值檢驗11/21/202221(三)兩個正態(tài)總體均值檢驗11/21/202221(四)兩個正態(tài)總體方差檢驗11/21/202222(四)兩個正態(tài)總體方差檢驗11/21/202222二、非參數(shù)檢驗(二)概率紙檢驗法概率紙是一種判斷總體分布的簡便工具.使用它們,可以很快地判斷總體分布的類型.概率紙的種類很多.返回11/21/202223二、非參數(shù)檢驗(二)概率紙檢驗法概率紙是一種統(tǒng)計工具箱中的基本統(tǒng)計命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本統(tǒng)計量3.常見概率分布的函數(shù)4.頻數(shù)直方圖的描繪5.參數(shù)估計6.假設檢驗7.綜合實例返回11/21/202224統(tǒng)計工具箱中的基本統(tǒng)計命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本一、數(shù)據(jù)的錄入、保存和調(diào)用例1上海市區(qū)社會商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下統(tǒng)計工具箱中的基本統(tǒng)計命令11/21/202225一、數(shù)據(jù)的錄入、保存和調(diào)用例1上海市區(qū)社會1、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。命令格式:x=a:h:bt=78:872、分別以x和y代表變量職工工資總額和商品零售總額。

x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4]y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]3、將變量t、x、y的數(shù)據(jù)保存在文件data中。savedatatxy4、進行統(tǒng)計分析時,調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù)。loaddataToMATLAB(txy)方法111/21/2022261、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。2、分別以x和1、輸入矩陣:data=[78,79,80,81,82,83,84,85,86,87,88;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]2、將矩陣data的數(shù)據(jù)保存在文件data1中:savedata1data3、進行統(tǒng)計分析時,先用命令:loaddata1

調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y:t=data(1,:)x=data(2,:)y=data(3,:)若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令:data(:,j)方法2ToMATLAB(data)返回11/21/2022271、輸入矩陣:2、將矩陣data的數(shù)據(jù)保存在文件data1中二、基本統(tǒng)計量對隨機變量x,計算其基本統(tǒng)計量的命令如下:均值:mean(x)中位數(shù):median(x)標準差:std(x)

方差:var(x)偏度:skewness(x)

峰度:kurtosis(x)例對例1中的職工工資總額x,可計算上述基本統(tǒng)計量。ToMATLAB(tjl)返回11/21/202228二、基本統(tǒng)計量對隨機變量x,計算其基本統(tǒng)計量的命令如下:例三、常見概率分布的函數(shù)Matlab工具箱對每一種分布都提供五類函數(shù),其命令字符為:概率密度:pdf概率分布:cdf逆概率分布:inv均值與方差:stat隨機數(shù)生成:rnd(當需要一種分布的某一類函數(shù)時,將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標量、數(shù)組或矩陣)和參數(shù)即可.)11/21/202229三、常見概率分布的函數(shù)Matlab工具箱對每一種分布都提供五在Matlab中輸入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)1、密度函數(shù):p=normpdf(x,mu,sigma)(當mu=0,sigma=1時可缺省)ToMATLAB(liti2)如對均值為mu、標準差為sigma的正態(tài)分布,舉例如下:11/21/202230在Matlab中輸入以下命令:1、密度函數(shù):p=normpdToMATLAB(liti3)3、逆概率分布:x=norminv(P,mu,sigma).即求出x,使得P{X<x}=P.此命令可用來求分位數(shù).2、概率分布:P=normcdf(x,mu,sigma)ToMATLAB(liti4)11/21/202231ToMATLAB(liti3)3、逆概率分布:x=normToMATLAB(liti5)4、均值與方差:[m,v]=normstat(mu,sigma)例5求正態(tài)分布N(3,52)的均值與方差.命令為:[m,v]=normstat(3,5)結果為:m=3,v=255、隨機數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生mn階的正態(tài)分布隨機數(shù)矩陣.例6命令:M=normrnd([123;456],0.1,2,3)結果為:M=0.95672.01252.88543.83345.02886.1191ToMATLAB(liti6)此命令產(chǎn)生了23的正態(tài)分布隨機數(shù)矩陣,各數(shù)分別服從N(1,0.12),N(2,22),N(3,32),N(4,0.12),N(5,22),N(6,32)返回11/21/202232ToMATLAB(liti5)4、均值與方差:[m,v]=1、給出數(shù)組data的頻數(shù)表的命令為:

[N,X]=hist(data,k)此命令將區(qū)間[min(data),max(data)]分為k個小區(qū)間(缺省為10),返回數(shù)組data落在每一個小區(qū)間的頻數(shù)N和每一個小區(qū)間的中點X.2、描繪數(shù)組data的頻數(shù)直方圖的命令為:

hist(data,k)四、頻數(shù)直方圖的描繪返回11/21/2022331、給出數(shù)組data的頻數(shù)表的命令為:2、描繪數(shù)組da五、參數(shù)估計1、正態(tài)總體的參數(shù)估計設總體服從正態(tài)分布,則其點估計和區(qū)間估計可同時由以下命令獲得:

[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在顯著性水平alpha下估計數(shù)據(jù)X的參數(shù)(alpha缺省時設定為0.05),返回值muhat是X的均值的點估計值,sigmahat是標準差的點估計值,muci是均值的區(qū)間估計,sigmaci是標準差的區(qū)間估計.11/21/202234五、參數(shù)估計1、正態(tài)總體的參數(shù)估計設總體服從正2、其它分布的參數(shù)估計有兩種處理辦法:一.取容量充分大的樣本(n>50),按中心極限定理,它近似地服從正態(tài)分布;二.使用Matlab工具箱中具有特定分布總體的估計命令.(1)[muhat,muci]=expfit(X,alpha)-----在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點估計及其區(qū)間估計.(2)[lambdahat,lambdaci]=poissfit(X,alpha)-----在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X的參數(shù)的點估計及其區(qū)間估計.(3)[phat,pci]=weibfit(X,alpha)-----在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X的參數(shù)的點估計及其區(qū)間估計.返回11/21/2022352、其它分布的參數(shù)估計有兩種處理辦法:(1)[muha六、假設檢驗在總體服從正態(tài)分布的情況下,可用以下命令進行假設檢驗.1、總體方差sigma2已知時,總體均值的檢驗使用z-檢驗

[h,sig,ci]=ztest(x,m,sigma,alpha,tail)檢驗數(shù)據(jù)x的關于均值的某一假設是否成立,其中sigma為已知方差,alpha為顯著性水平,究竟檢驗什么假設取決于tail的取值:tail=0,檢驗假設“x的均值等于m”tail=1,檢驗假設“x的均值大于m”tail=-1,檢驗假設“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設,h=0表示不可以拒絕假設,sig為假設成立的概率,ci為均值的1-alpha置信區(qū)間.11/21/202236六、假設檢驗在總體服從正態(tài)分布的情況下,可用以

例7Matlab統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年一月份和二月份的汽油平均價格(price1,price2分別是一,二月份的油價,單位為美分),它是容量為20的雙樣本.假設一月份油價的標準偏差是一加侖四分幣(=4),試檢驗一月份油價的均值是否等于115.解作假設:m=115.首先取出數(shù)據(jù),用以下命令:loadgas然后用以下命令檢驗[h,sig,ci]=ztest(price1,115,4)返回:h=0,sig=0.8668,ci=[113.3970116.9030].檢驗結果:1.布爾變量h=0,表示不拒絕零假設.說明提出的假設均值115是合理的.2.sig-值為0.8668,遠超過0.5,不能拒絕零假設3.95%的置信區(qū)間為[113.4,116.9],它完全包括115,且精度很高..

ToMATLAB(liti7)11/21/202237例7Matlab統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.2、總體方差sigma2未知時,總體均值的檢驗使用t-檢驗[h,sig,ci]=ttest(x,m,alpha,tail)檢驗數(shù)據(jù)x的關于均值的某一假設是否成立,其中alpha為顯著性水平,究竟檢驗什么假設取決于tail的取值:tail=0,檢驗假設“x的均值等于m”tail=1,檢驗假設“x的均值大于m”tail=-1,檢驗假設“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設,h=0表示不可以拒絕假設,sig為假設成立的概率,ci為均值的1-alpha置信區(qū)間.11/21/2022382、總體方差sigma2未知時,總體均值的檢驗使用t-檢驗返回:h=1,sig=4.9517e-004,ci=[116.8120.2].檢驗結果:1.布爾變量h=1,表示拒絕零假設.說明提出的假設油價均值115是不合理的.2.95%的置信區(qū)間為[116.8120.2],它不包括115,故不能接受假設.3.sig-值為4.9517e-004,遠小于0.5,不能接受零假設.

ToMATLAB(liti8)例8試檢驗例8中二月份油價Price2的均值是否等于115.解作假設:m=115,price2為二月份的油價,不知其方差,故用以下命令檢驗[h,sig,ci]=ttest(price2,115)11/21/202239返回:h=1,sig=4.9517e-004,ci3、兩總體均值的假設檢驗使用t-檢驗

[h,sig,ci]=ttest2(x,y,alpha,tail)檢驗數(shù)據(jù)x,y的關于均值的某一假設是否成立,其中alpha為顯著性水平,究竟檢驗什么假設取決于tail的取值:tail=0,檢驗假設“x的均值等于y的均值”tail=1,檢驗假設“x的均值大于y的均值”tail=-1,檢驗假設“x的均值小于y的均值”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設,h=0表示不可以拒絕假設,sig為假設成立的概率,ci為與x與y均值差的的1-alpha置信區(qū)間.11/21/2022403、兩總體均值的假設檢驗使用t-檢驗[h,sig,ci返回:h=1,sig=0.0083,ci=[-5.8,-0.9].檢驗結果:1.布爾變量h=1,表示拒絕零假設.說明提出的假設“油價均值相同”是不合理的.2.95%的置信區(qū)間為[-5.8,-0.9],說明一月份油價比二月份油價約低1至6分.3.sig-值為0.0083,遠小于0.5,不能接受“油價均相同”假設.ToMATLAB(liti9)例9試檢驗例8中一月份油價Price1與二月份的油價Price2均值是否相同.解用以下命令檢驗[h,sig,ci]=ttest2(price1,price2)11/21/202241返回:h=1,sig=0.0083,ci=[-5.4、非參數(shù)檢驗:總體分布的檢驗Matlab工具箱提供了兩個對總體分布進行檢驗的命令:(1)h=normplot(x)(2)h=weibplot(x)此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).返回11/21/2022424、非參數(shù)檢驗:總體分布的檢驗Matlab工具箱提供了兩個對例10一道工序用自動化車床連續(xù)加工某種零件,由于刀具損壞等會出現(xiàn)故障.故障是完全隨機的,并假定生產(chǎn)任一零件時出現(xiàn)故障機會均相同.工作人員是通過檢查零件來確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀錄,故障出現(xiàn)時該刀具完成的零件數(shù)如下:459362624542509584433748815505612452434982640742565706593680926653164487734608428115359384452755251378147438882453886265977585975549697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851試觀察該刀具出現(xiàn)故障時完成的零件數(shù)屬于哪種分布.11/21/20224311/21/202243解1、數(shù)據(jù)輸入ToMATLAB(liti101)2、作頻數(shù)直方圖hist(x,10)3、分布的正態(tài)性檢驗normplot(x)4、參數(shù)估計:[muhat,sigmahat,muci,sigmaci]=normfit(x)(看起來刀具壽命服從正態(tài)分布)(刀具壽命近似服從正態(tài)分布)估計出該刀具的均值為594,方差204,均值的0.95置信區(qū)間為[553.4962,634.5038],方差的0.95置信區(qū)間為[179.2276,237.1329].ToMATLAB(liti104)ToMATLAB(liti102)ToMATLAB(liti103)11/21/202244解1、數(shù)據(jù)輸入ToMATLAB(liti101)3、5、假設檢驗ToMATLAB(liti105)已知刀具的壽命服從正態(tài)分布,現(xiàn)在方差未知的情況下,檢驗其均值m是否等于594.結果:h=0,sig=1,ci=[553.4962,634.5038].檢驗結果:1.布爾變量h=0,表示不拒絕零假設.說明提出的假設壽命均值594是合理的.2.95%的置信區(qū)間為[553.5,634.5],它完全包括594,且精度很高.3.sig-值為1,遠超過0.5,不能拒絕零假設.

返回11/21/2022455、假設檢驗ToMATLAB(liti105)已知刀1、某校60名學生的一次考試成績?nèi)缦?9375839391858482777677959489918886839681799778756769688483817566857094848382807874737670867690897166867380947978776353551)計算均值、標準差、極差、偏度、峰度,畫出直方圖;2)檢驗分布的正態(tài)性;3)若檢驗符合正態(tài)分布,估計正態(tài)分布的參數(shù)并檢驗參數(shù).作業(yè)11/21/2022461、某校60名學生的一次考試成績?nèi)缦?1)計算均值、標準差、2、據(jù)說某地汽油的價格是每加侖115美分,為了驗證這種說法,一位學者開車隨機選擇了一些加油站,得到某年一月和二月的數(shù)據(jù)如下:一月:119117115116112121115122116118109112119112117113114109109118二月:1181191151221181211201221281161201231211191171191281261181251)分別用兩個月的數(shù)據(jù)驗證這種說法的可靠性;2)分別給出1月和2月汽油價格的置信區(qū)間;3)給出1月和2月汽油價格差的置信區(qū)間.11/21/2022472、據(jù)說某地汽油的價格是每加侖115美分,為了驗證這種說法,謝謝大家11/21/202248謝謝大家11/21/202248數(shù)學建模與數(shù)學實驗經(jīng)濟數(shù)學系數(shù)學建模研究室數(shù)據(jù)的統(tǒng)計描述和分析11/21/202249數(shù)學建模與數(shù)學實驗經(jīng)濟數(shù)學系數(shù)學建模研究室數(shù)據(jù)的統(tǒng)計描述和分實驗目的實驗內(nèi)容2、掌握用數(shù)學軟件包求解統(tǒng)計問題。1、直觀了解統(tǒng)計基本內(nèi)容。1、統(tǒng)計的基本理論。3、實驗作業(yè)。2、用數(shù)學軟件包求解統(tǒng)計問題。11/21/202250實驗目的實驗內(nèi)容2、掌握用數(shù)學軟件包求解統(tǒng)計問題。1、直觀了統(tǒng)計的基本概念參數(shù)估計假設檢驗數(shù)據(jù)的統(tǒng)計描述和分析11/21/202251統(tǒng)計的基本概念參數(shù)估計假設檢驗數(shù)據(jù)的統(tǒng)計描述和分析11/21一、統(tǒng)計量11/21/202252一、統(tǒng)計量11/21/2022411/21/20225311/21/20225二、分布函數(shù)的近似求法11/21/202254二、分布函數(shù)的近似求法11/21/20226三、幾個在統(tǒng)計中常用的概率分布-4-2024600.050.10.150.20.250.30.350.41.正態(tài)分布),(2smN密度函數(shù):222)(21)(smsp--=xexp分布函數(shù):dyexFyx222)(21)(smsp--¥-ò=其中m為均值,2s為方差,+¥<<¥-x.標準正態(tài)分布:N(0,1)密度函數(shù)2221)(xex-=pjdyexyx2221)(-¥-ò=Fp,

分布函數(shù)11/21/202255三、幾個在統(tǒng)計中常用的概率分布-4-2024600.050.11/21/20225611/21/2022811/21/20225711/21/20229返回F分布F(10,50)的密度函數(shù)曲線11/21/202258返回F分布F(10,50)的密度函數(shù)曲線11/21/2022參數(shù)估計11/21/202259參數(shù)估計11/21/202211一、點估計的求法(一)矩估計法11/21/202260一、點估計的求法(一)矩估計法11/21/202212(二)極大似然估計法11/21/202261(二)極大似然估計法11/21/202213二、區(qū)間估計的求法11/21/202262二、區(qū)間估計的求法11/21/2022141、已知DX,求EX的置信區(qū)間2.未知方差DX,求EX的置信區(qū)間(一)數(shù)學期望的置信區(qū)間(二)方差的區(qū)間估計返回11/21/2022631、已知DX,求EX的置信區(qū)間2.未知方差DX,求EX的置1.參數(shù)檢驗:如果觀測的分布函數(shù)類型已知,這時構造出的統(tǒng)計量依賴于總體的分布函數(shù),這種檢驗稱為參數(shù)檢驗.參數(shù)檢驗的目的往往是對總體的參數(shù)及其有關性質(zhì)作出明確的判斷.

對總體X的分布律或分布參數(shù)作某種假設,根據(jù)抽取的樣本觀察值,運用數(shù)理統(tǒng)計的分析方法,檢驗這種假設是否正確,從而決定接受假設或拒絕假設.假設檢驗2.非參數(shù)檢驗:如果所檢驗的假設并非是對某個參數(shù)作出明確的判斷,因而必須要求構造出的檢驗統(tǒng)計量的分布函數(shù)不依賴于觀測值的分布函數(shù)類型,這種檢驗叫非參數(shù)檢驗.如要求判斷總體分布類型的檢驗就是非參數(shù)檢驗.11/21/2022641.參數(shù)檢驗:如果觀測的分布函數(shù)類型已知,這時構造出的假設檢驗的一般步驟是:11/21/202265假設檢驗的一般步驟是:11/21/202217(一)單個正態(tài)總體均值檢驗一、參數(shù)檢驗11/21/202266(一)單個正態(tài)總體均值檢驗一、參數(shù)檢驗11/21/2022111/21/20226711/21/202219(二)單個正態(tài)總體方差檢驗11/21/202268(二)單個正態(tài)總體方差檢驗11/21/202220(三)兩個正態(tài)總體均值檢驗11/21/202269(三)兩個正態(tài)總體均值檢驗11/21/202221(四)兩個正態(tài)總體方差檢驗11/21/202270(四)兩個正態(tài)總體方差檢驗11/21/202222二、非參數(shù)檢驗(二)概率紙檢驗法概率紙是一種判斷總體分布的簡便工具.使用它們,可以很快地判斷總體分布的類型.概率紙的種類很多.返回11/21/202271二、非參數(shù)檢驗(二)概率紙檢驗法概率紙是一種統(tǒng)計工具箱中的基本統(tǒng)計命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本統(tǒng)計量3.常見概率分布的函數(shù)4.頻數(shù)直方圖的描繪5.參數(shù)估計6.假設檢驗7.綜合實例返回11/21/202272統(tǒng)計工具箱中的基本統(tǒng)計命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本一、數(shù)據(jù)的錄入、保存和調(diào)用例1上海市區(qū)社會商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下統(tǒng)計工具箱中的基本統(tǒng)計命令11/21/202273一、數(shù)據(jù)的錄入、保存和調(diào)用例1上海市區(qū)社會1、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。命令格式:x=a:h:bt=78:872、分別以x和y代表變量職工工資總額和商品零售總額。

x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4]y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]3、將變量t、x、y的數(shù)據(jù)保存在文件data中。savedatatxy4、進行統(tǒng)計分析時,調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù)。loaddataToMATLAB(txy)方法111/21/2022741、年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。2、分別以x和1、輸入矩陣:data=[78,79,80,81,82,83,84,85,86,87,88;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]2、將矩陣data的數(shù)據(jù)保存在文件data1中:savedata1data3、進行統(tǒng)計分析時,先用命令:loaddata1

調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y:t=data(1,:)x=data(2,:)y=data(3,:)若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令:data(:,j)方法2ToMATLAB(data)返回11/21/2022751、輸入矩陣:2、將矩陣data的數(shù)據(jù)保存在文件data1中二、基本統(tǒng)計量對隨機變量x,計算其基本統(tǒng)計量的命令如下:均值:mean(x)中位數(shù):median(x)標準差:std(x)

方差:var(x)偏度:skewness(x)

峰度:kurtosis(x)例對例1中的職工工資總額x,可計算上述基本統(tǒng)計量。ToMATLAB(tjl)返回11/21/202276二、基本統(tǒng)計量對隨機變量x,計算其基本統(tǒng)計量的命令如下:例三、常見概率分布的函數(shù)Matlab工具箱對每一種分布都提供五類函數(shù),其命令字符為:概率密度:pdf概率分布:cdf逆概率分布:inv均值與方差:stat隨機數(shù)生成:rnd(當需要一種分布的某一類函數(shù)時,將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標量、數(shù)組或矩陣)和參數(shù)即可.)11/21/202277三、常見概率分布的函數(shù)Matlab工具箱對每一種分布都提供五在Matlab中輸入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)1、密度函數(shù):p=normpdf(x,mu,sigma)(當mu=0,sigma=1時可缺省)ToMATLAB(liti2)如對均值為mu、標準差為sigma的正態(tài)分布,舉例如下:11/21/202278在Matlab中輸入以下命令:1、密度函數(shù):p=normpdToMATLAB(liti3)3、逆概率分布:x=norminv(P,mu,sigma).即求出x,使得P{X<x}=P.此命令可用來求分位數(shù).2、概率分布:P=normcdf(x,mu,sigma)ToMATLAB(liti4)11/21/202279ToMATLAB(liti3)3、逆概率分布:x=normToMATLAB(liti5)4、均值與方差:[m,v]=normstat(mu,sigma)例5求正態(tài)分布N(3,52)的均值與方差.命令為:[m,v]=normstat(3,5)結果為:m=3,v=255、隨機數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生mn階的正態(tài)分布隨機數(shù)矩陣.例6命令:M=normrnd([123;456],0.1,2,3)結果為:M=0.95672.01252.88543.83345.02886.1191ToMATLAB(liti6)此命令產(chǎn)生了23的正態(tài)分布隨機數(shù)矩陣,各數(shù)分別服從N(1,0.12),N(2,22),N(3,32),N(4,0.12),N(5,22),N(6,32)返回11/21/202280ToMATLAB(liti5)4、均值與方差:[m,v]=1、給出數(shù)組data的頻數(shù)表的命令為:

[N,X]=hist(data,k)此命令將區(qū)間[min(data),max(data)]分為k個小區(qū)間(缺省為10),返回數(shù)組data落在每一個小區(qū)間的頻數(shù)N和每一個小區(qū)間的中點X.2、描繪數(shù)組data的頻數(shù)直方圖的命令為:

hist(data,k)四、頻數(shù)直方圖的描繪返回11/21/2022811、給出數(shù)組data的頻數(shù)表的命令為:2、描繪數(shù)組da五、參數(shù)估計1、正態(tài)總體的參數(shù)估計設總體服從正態(tài)分布,則其點估計和區(qū)間估計可同時由以下命令獲得:

[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在顯著性水平alpha下估計數(shù)據(jù)X的參數(shù)(alpha缺省時設定為0.05),返回值muhat是X的均值的點估計值,sigmahat是標準差的點估計值,muci是均值的區(qū)間估計,sigmaci是標準差的區(qū)間估計.11/21/202282五、參數(shù)估計1、正態(tài)總體的參數(shù)估計設總體服從正2、其它分布的參數(shù)估計有兩種處理辦法:一.取容量充分大的樣本(n>50),按中心極限定理,它近似地服從正態(tài)分布;二.使用Matlab工具箱中具有特定分布總體的估計命令.(1)[muhat,muci]=expfit(X,alpha)-----在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點估計及其區(qū)間估計.(2)[lambdahat,lambdaci]=poissfit(X,alpha)-----在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X的參數(shù)的點估計及其區(qū)間估計.(3)[phat,pci]=weibfit(X,alpha)-----在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X的參數(shù)的點估計及其區(qū)間估計.返回11/21/2022832、其它分布的參數(shù)估計有兩種處理辦法:(1)[muha六、假設檢驗在總體服從正態(tài)分布的情況下,可用以下命令進行假設檢驗.1、總體方差sigma2已知時,總體均值的檢驗使用z-檢驗

[h,sig,ci]=ztest(x,m,sigma,alpha,tail)檢驗數(shù)據(jù)x的關于均值的某一假設是否成立,其中sigma為已知方差,alpha為顯著性水平,究竟檢驗什么假設取決于tail的取值:tail=0,檢驗假設“x的均值等于m”tail=1,檢驗假設“x的均值大于m”tail=-1,檢驗假設“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設,h=0表示不可以拒絕假設,sig為假設成立的概率,ci為均值的1-alpha置信區(qū)間.11/21/202284六、假設檢驗在總體服從正態(tài)分布的情況下,可用以

例7Matlab統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年一月份和二月份的汽油平均價格(price1,price2分別是一,二月份的油價,單位為美分),它是容量為20的雙樣本.假設一月份油價的標準偏差是一加侖四分幣(=4),試檢驗一月份油價的均值是否等于115.解作假設:m=115.首先取出數(shù)據(jù),用以下命令:loadgas然后用以下命令檢驗[h,sig,ci]=ztest(price1,115,4)返回:h=0,sig=0.8668,ci=[113.3970116.9030].檢驗結果:1.布爾變量h=0,表示不拒絕零假設.說明提出的假設均值115是合理的.2.sig-值為0.8668,遠超過0.5,不能拒絕零假設3.95%的置信區(qū)間為[113.4,116.9],它完全包括115,且精度很高..

ToMATLAB(liti7)11/21/202285例7Matlab統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.2、總體方差sigma2未知時,總體均值的檢驗使用t-檢驗[h,sig,ci]=ttest(x,m,alpha,tail)檢驗數(shù)據(jù)x的關于均值的某一假設是否成立,其中alpha為顯著性水平,究竟檢驗什么假設取決于tail的取值:tail=0,檢驗假設“x的均值等于m”tail=1,檢驗假設“x的均值大于m”tail=-1,檢驗假設“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設,h=0表示不可以拒絕假設,sig為假設成立的概率,ci為均值的1-alpha置信區(qū)間.11/21/2022862、總體方差sigma2未知時,總體均值的檢驗使用t-檢驗返回:h=1,sig=4.9517e-004,ci=[116.8120.2].檢驗結果:1.布爾變量h=1,表示拒絕零假設.說明提出的假設油價均值115是不合理的.2.95%的置信區(qū)間為[116.8120.2],它不包括115,故不能接受假設.3.sig-值為4.9517e-004,遠小于0.5,不能接受零假設.

ToMATLAB(liti8)例8試檢驗例8中二月份油價Price2的均值是否等于115.解作假設:m=115,price2為二月份的油價,不知其方差,故用以下命令檢驗[h,sig,ci]=ttest(price2,115)11/21/202287返回:h=1,sig=4.9517e-004,ci3、兩總體均值的假設檢驗使用t-檢驗

[h,sig,ci]=ttest2(x,y,alpha,tail)檢驗數(shù)據(jù)x,y的關于均值的某一假設是否成立,其中alpha為顯著性水平,究竟檢驗什么假設取決于tail的取值:tail=0,檢驗假設“x的均值等于y的均值”tail=1,檢驗假設“x的均值大于y的均值”tail=-1,檢驗假設“x的均值小于y的均值”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設,h=0表示不可以拒絕假設,sig為假設成立的概率,ci為與x與y均值差的的1-alpha置信區(qū)間.11/21/2022883、兩總體均值的假設檢驗使用t-檢驗[h,sig,ci返回:h=1,sig=0.0083,ci=[-5.8,-0.9].檢驗結果:1.布爾變量h=1,表示拒絕零假設.說明提出的假設“油價均值相同”是不合理的.2.95%的置信區(qū)間為[-5.8,-0.9],說明一月份油價比二月份油價約低1至6分.3.sig-值為0.0083,遠小于0.5,不能接受“油價均相同”假設.ToMATLAB(liti9)例9試檢驗例8中一月份油價Price1與二月份的油價Price2均值是否相同.解用以下命令檢驗[h,sig,ci]=ttest2(price1,price2)11/21/202289返回:h=1,sig=0.0083,ci=[-5.4、非參數(shù)檢驗:總體分布的檢驗Matlab工具箱提供了兩個對總體分布進行檢驗的命令:(1)h=normplot(x)(2)h=weibplot(x)此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).返回11/21/2022904、非參數(shù)檢驗:總體分布的檢驗Matlab工具箱提供了兩個對例10一道工序用自動化車床連續(xù)加工某種零件,由于刀具損壞等會出現(xiàn)故障.故障是完全隨機的,并假定生產(chǎn)任一零件時出現(xiàn)故障機會均相同.工作人

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論