第五講數(shù)據(jù)統(tǒng)計分析以及概率模型_第1頁
第五講數(shù)據(jù)統(tǒng)計分析以及概率模型_第2頁
第五講數(shù)據(jù)統(tǒng)計分析以及概率模型_第3頁
第五講數(shù)據(jù)統(tǒng)計分析以及概率模型_第4頁
第五講數(shù)據(jù)統(tǒng)計分析以及概率模型_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五講

數(shù)據(jù)統(tǒng)計分析以及概率模型1MATLAB中統(tǒng)計工具箱中的基本統(tǒng)計命令2概率模型2/3/20231一MATLAB中統(tǒng)計工具箱中的基本統(tǒng)計命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本統(tǒng)計量3.常見的概率分布函數(shù)4.頻數(shù)直方圖的描繪5.參數(shù)估計6.假設(shè)檢驗7.綜合實例返回2/3/20232一、數(shù)據(jù)的錄入、保存和調(diào)用例1

上海市區(qū)社會商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下:統(tǒng)計工具箱中的基本統(tǒng)計命令2/3/202331.年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入.

命令格式:x=a:h:b

t=78:87

2.分別以x和y代表變量職工工資總額和商品零售總額.

x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4]

y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]3.將變量t、x、y的數(shù)據(jù)保存在文件data中.savedatatxy

4.進行統(tǒng)計分析時,調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù).

loaddataToMATLAB(txy)方法12/3/202341.輸入矩陣:data=[78,79,80,81,82,83,84,85,86,87,88;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0]2.將矩陣data的數(shù)據(jù)保存在文件data1中:savedata1data3.進行統(tǒng)計分析時,先用命令:loaddata1

調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y:

t=data(1,:)x=data(2,:)y=data(3,:)若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令:

data(:,j)方法2ToMATLAB(data)返回2/3/20235基本統(tǒng)計量2/3/202362/3/20237二、基本統(tǒng)計量對隨機變量x,計算其基本統(tǒng)計量的命令如下:均值:mean(x)中位數(shù):median(x)標(biāo)準差:std(x)

方差:var(x)偏度:skewness(x)

峰度:kurtosis(x)例對例1中的職工工資總額x,可計算上述基本統(tǒng)計量.ToMATLAB(tjl)返回2/3/20238三、常見概率分布的函數(shù)MATLAB工具箱對每一種分布都提供5類函數(shù),其命令字符為:概率密度:pdf

概率分布:cdf逆概率分布:inv

均值與方差:stat隨機數(shù)生成:rnd(當(dāng)需要一種分布的某一類函數(shù)時,將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.)2/3/20239在MATLAB中輸入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)1.密度函數(shù):p=normpdf(x,mu,sigma)(當(dāng)mu=0,sigma=1時可缺省)ToMATLAB(liti2)如對均值為mu、標(biāo)準差為sigma的正態(tài)分布,舉例如下:2/3/202310ToMATLAB(liti3)2.概率分布:P=normcdf(x,mu,sigma)4.均值與方差:[m,v]=normstat(mu,sigma)例5求正態(tài)分布N(3,52)的均值與方差.

命令為:[m,v]=normstat(3,5)

結(jié)果為:m=3,v=25ToMATLAB(liti5)2/3/2023111.給出數(shù)組data的頻數(shù)表的命令為:

[N,X]=hist(data,k)

此命令將區(qū)間[min(data),max(data)]分為k個小區(qū)間(缺省為10),返回數(shù)組data落在每一個小區(qū)間的頻數(shù)N和每一個小區(qū)間的中點X.2.描繪數(shù)組data的頻數(shù)直方圖的命令為:

hist(data,k)四、數(shù)直方圖的描繪返回2/3/202312五、參數(shù)估計1.正態(tài)總體的參數(shù)估計設(shè)總體服從正態(tài)分布,則其點估計和區(qū)間估計可同時由以下命令獲得:

[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在顯著性水平alpha下估計數(shù)據(jù)X的參數(shù)(alpha缺省時設(shè)定為0.05),返回值muhat是X的均值的點估計值,sigmahat是標(biāo)準差的點估計值,muci是均值的區(qū)間估計,sigmaci是標(biāo)準差的區(qū)間估計.2/3/2023132.其它分布的參數(shù)估計有兩種處理辦法:一、取容量充分大的樣本(n>50),按中心極限定理,它近似地服從正態(tài)分布;二、使用MATLAB工具箱中具有特定分布總體的估計命令.(1)[muhat,muci]=expfit(X,alpha)──在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點估計及其區(qū)間估計.(2)[lambdahat,lambdaci]=poissfit(X,alpha)──在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X的參數(shù)的點估計及其區(qū)間估計.(3)[phat,pci]=weibfit(X,alpha)──在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X的參數(shù)的點估計及其區(qū)間估計.返回2/3/202314六、假設(shè)檢驗在總體服從正態(tài)分布的情況下,可用以下命令進行假設(shè)檢驗.1.總體方差已知時,總體均值的檢驗使用z檢驗

[h,sig,ci]=ztest(x,m,sigma,alpha,tail)檢驗數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立,其中sigma為已知方差,alpha為顯著性水平,究竟檢驗什么假設(shè)取決于tail的取值:tail=0,檢驗假設(shè)“x的均值等于m”tail=1,檢驗假設(shè)“x的均值大于m”tail=-1,檢驗假設(shè)“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci

為均值的1-alpha置信區(qū)間.2/3/202315

例7MATLAB統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年1月份和2月份的汽油平均價格(price1,price2分別是1、2月份的油價,單位為美分),它是容量為20的雙樣本.假設(shè)1月份油價的標(biāo)準偏差是每加侖4分幣(=4),試檢驗1月份油價的均值是否等于115.解作假設(shè):m=115.首先取出數(shù)據(jù),用以下命令:

loadgas然后用以下命令檢驗

[h,sig,ci]=ztest(price1,115,4)返回:h=0,sig=0.8668,ci=[113.3970116.9030].檢驗結(jié)果:1.布爾變量h=0,表示不拒絕零假設(shè).說明提出的假設(shè)均值115

是合理的.2.sig值為0.8668,遠超過0.5,不能拒絕零假設(shè)

3.95%的置信區(qū)間為[113.4,116.9],它完全包括115,且精度很高..

ToMATLAB(liti7)2/3/2023162.總體方差未知時,總體均值的檢驗使用t檢驗

[h,sig,ci]=ttest(x,m,alpha,tail)檢驗數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立,其中alpha為顯著性水平,究竟檢驗什么假設(shè)取決于tail的取值:tail=0,檢驗假設(shè)“x的均值等于m”tail=1,檢驗假設(shè)“x的均值大于m”tail=-1,檢驗假設(shè)“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci

為均值的1-alpha置信區(qū)間.2/3/202317返回:h=1,sig=4.9517e-004,ci=[116.8120.2].檢驗結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說明提出的假設(shè)油價均值115是不合理的.2.95%的置信區(qū)間為[116.8120.2],它不包括

115,故不能接受假設(shè).3.sig值為4.9517e-004,遠小于0.5,不能接受零假設(shè).

ToMATLAB(liti8)例8試檢驗例8中2月份油價price2的均值是否等于115.解作假設(shè):m=115,price2為2月份的油價,不知其方差,故用以下命令檢驗[h,sig,ci]=ttest(price2,115)2/3/2023183.兩總體均值的假設(shè)檢驗使用t

檢驗

[h,sig,ci]=ttest2(x,y,alpha,tail)檢驗數(shù)據(jù)x,y的關(guān)于均值的某一假設(shè)是否成立,其中alpha為顯著性水平,究竟檢驗什么假設(shè)取決于tail的取值:tail=0,檢驗假設(shè)“x的均值等于y的均值”tail=1,檢驗假設(shè)“x的均值大于y的均值”tail=-1,檢驗假設(shè)“x的均值小于y的均值”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci

為與x與y均值差的的1-alpha置信區(qū)間.2/3/202319返回:h=1,sig=0.0083,ci=[-5.8,-0.9].檢驗結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說明提出的假設(shè)“油價均值相同”是不合理的.2.95%的置信區(qū)間為[-5.8,-0.9],說明一月份油價比二月份油價約低1至6分.3.sig-值為0.0083,遠小于0.5,不能接受“油價均相同”假設(shè).ToMATLAB(liti9)例9試檢驗例8中1月份油價price1與2月份的油價price2均值是否相同.解用以下命令檢驗[h,sig,ci]=ttest2(price1,price2)2/3/2023204.非參數(shù)檢驗:總體分布的檢驗MATLAB工具箱提供了兩個對總體分布進行檢驗的命令:(1)h=normplot(x)(2)h=weibplot(x)此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).返回2/3/202321分布函數(shù)的近似求法2/3/2023222/3/2023232/3/202324返回F(10,50)分布的密度函數(shù)曲線2/3/202325例10

一道工序用自動化車床連續(xù)加工某種零件,由于刀具損壞等會出現(xiàn)故障.故障是完全隨機的,并假定生產(chǎn)任一零件時出現(xiàn)故障機會均相同.工作人員是通過檢查零件來確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀錄,故障出現(xiàn)時該刀具完成的零件數(shù)如下:

459362624542509584433748815505612452434982640742565706593680926653164487734608428115359384452755251378147438882453886265977585975549697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851試觀察該刀具出現(xiàn)故障時完成的零件數(shù)屬于哪種分布.2/3/202326解1.?dāng)?shù)據(jù)輸入ToMATLAB(liti101)2.作頻數(shù)直方圖

hist(x,10)

3.分布的正態(tài)性檢驗

normplot(x)4.參數(shù)估計:

[muhat,sigmahat,muci,sigmaci]=normfit(x)(看起來刀具壽命服從正態(tài)分布)(刀具壽命近似服從正態(tài)分布)估計出該刀具的均值為594,方差204,均值的0.95置信區(qū)間為[553.4962,634.5038],方差的0.95置信區(qū)間為[179.2276,237.1329].ToMATLAB(liti104)ToMATLAB(liti102)ToMATLAB(liti103)2/3/2023275.假設(shè)檢驗ToMATLAB(liti105)已知刀具的壽命服從正態(tài)分布,現(xiàn)在方差未知的情況下,檢驗其均值m是否等于594.結(jié)果:h=0,sig=1,ci=[553.4962,634.5038].檢驗結(jié)果:1.布爾變量h=0,表示不拒絕零假設(shè).說明提出的假設(shè)壽命均值594是合理的.2.95%的置信區(qū)間為[553.5,634.5],它完全包括594,且精度很高.3.sig值為1,遠超過0.5,不能拒絕零假設(shè).

返回2/3/202328第五講

概率模型1軋鋼中的浪費2隨機存儲策略2/3/202329確定性因素和隨機性因素隨機因素可以忽略隨機因素影響可以簡單地以平均值的作用出現(xiàn)隨機因素影響必須考慮概率模型統(tǒng)計回歸模型馬氏鏈模型隨機模型確定性模型隨機性模型2/3/2023301軋鋼中的浪費軋制鋼材兩道工序

粗軋(熱軋)~形成鋼材的雛形

精軋(冷軋)~得到鋼材規(guī)定的長度粗軋鋼材長度正態(tài)分布均值可以調(diào)整方差由設(shè)備精度確定粗軋鋼材長度大于規(guī)定切掉多余部分粗軋鋼材長度小于規(guī)定整根報廢隨機因素影響精軋問題:如何調(diào)整粗軋的均值,使精軋的浪費最小背景2/3/202331分析設(shè)已知精軋后鋼材的規(guī)定長度為l,粗軋后鋼材長度的均方差為記粗軋時可以調(diào)整的均值為m,則粗軋得到的鋼材長度為正態(tài)隨機變量,記作x~N(m,2)切掉多余部分的概率整根報廢的概率存在最佳的m使總的浪費最小lP0p(概率密度)mxP′mPP′2/3/202332建模選擇合適的目標(biāo)函數(shù)切掉多余部分的浪費整根報廢的浪費總浪費=+粗軋一根鋼材平均浪費長度粗軋N根成品材

PN根成品材長度lPN總長度mN共浪費長度mN-lPN2/3/202333選擇合適的目標(biāo)函數(shù)粗軋一根鋼材平均浪費長度得到一根成品材平均浪費長度更合適的目標(biāo)函數(shù)優(yōu)化模型:求m使J(m)最?。ㄒ阎猯,

)建模粗軋N根得成品材

PN根2/3/202334求解求z使J(z)最小(已知

)2/3/202335求解2/3/202336例設(shè)l=2(米),=20(厘米),求m使浪費最小。=l/=10z*=-1.78*=-z*=11.78m*=*=2.36(米)求解1.2530.8760.6560.5160.4200.3550227.0-3.00.556.79-2.51.018.10-2.01.57.206-1.52.02.53.4771.680-1.0-0.5zzF(z)F(z)1.02.00-1.0-2.0105F(z)z2/3/2023372隨機存貯策略問題以周為時間單位;一周的商品銷售量為隨機;周末根據(jù)庫存決定是否訂貨,供下周銷售。(s,S)存貯策略制訂下界s,上界S,當(dāng)周末庫存小于s時訂貨,使下周初的庫存達到S;否則,不訂貨??紤]訂貨費、存貯費、缺貨費、購進費,制訂(s,S)存貯策略,使(平均意義下)總費用最小2/3/202338模型假設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論