04.第四講輸入數(shù)據(jù)建模_第1頁
04.第四講輸入數(shù)據(jù)建模_第2頁
04.第四講輸入數(shù)據(jù)建模_第3頁
04.第四講輸入數(shù)據(jù)建模_第4頁
04.第四講輸入數(shù)據(jù)建模_第5頁
已閱讀5頁,還剩86頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、現(xiàn)代物流與仿真郭武斌 :歡送溝通!上次內(nèi)容回憶隨機分布的種類隨機數(shù)的生成方法隨機變量的生成方法物流仿真中存在大量的隨機分布貨物訂單到來:愛爾朗分布人員效勞時間:正態(tài)分布機械故障時間:威布爾分布班輪到達(dá)時間:愛爾朗分布5.2.3常用隨機變量的分布 1貝努里分布概率分布函數(shù):累計分布函數(shù):平 均 值:數(shù)學(xué)方差:概率分布函數(shù):累計分布函數(shù):平 均 值:數(shù)學(xué)方差:2泊松分布 Poisson( a )3均勻分布 Ua,b概率密度函數(shù)pdf: 概率分布函數(shù)cdf: 平 均 值: 數(shù)學(xué)方差:(4) 指數(shù)分布 EXPONa概率密度函數(shù)pdf: 概率分布函數(shù)cdf: 平 均 值: 數(shù)學(xué)方差:Mean= a5正態(tài)

2、分布 Nu, 概率密度函數(shù)pdf: 概率分布函數(shù)cdf: 平 均 值: 數(shù)學(xué)方差:6愛爾朗分布 Erlang(a, k) 概率密度函數(shù)pdf: 平 均 值: 數(shù)學(xué)方差:當(dāng)k=1時,Erlang分布為指數(shù)分布Expona:7威布爾分布 Weibull(a,b)概率密度函數(shù)pdf: 概率分布函數(shù)cdf: 平 均 值: 數(shù)學(xué)方差:7威布爾分布 Weibull(a,b)概率密度函數(shù)pdf: 8伽馬分布 Gamma(a,b)概率密度函數(shù)pdf: 概率分布函數(shù)cdf: 平 均 值: 數(shù)學(xué)方差:8伽馬分布 Gamma(a,b)概率密度函數(shù)pdf: 9三角分布 TRIA(a,m,b)概率密度函數(shù)pdf: 平

3、均 值: 數(shù)學(xué)方差:知識關(guān)聯(lián)圖產(chǎn)生均勻分布的偽隨機數(shù) 確定符合數(shù)據(jù)的概率分布 產(chǎn)生特定分布的隨機變量 逆變換法函數(shù)變換法卷積法組合法取舍法近似法平方取中法線性同余法貝努里分布泊松分布均勻分布指數(shù)分布愛爾朗分布正態(tài)分布韋伯爾分布等隨機變量的產(chǎn)生算法樹5.3 隨機數(shù)的產(chǎn)生5.3.1隨機數(shù)的性質(zhì)隨機數(shù)(random number):隨機數(shù)就是隨機變量的樣本取樣值。均勻分布的隨機數(shù):隨機變量x在其可能值范圍中的任一區(qū)間出現(xiàn)的概率正比于此區(qū)間的大小與可能值范圍的比值。(0,1)均勻分布隨機數(shù):在各種分布的隨機數(shù)中,最常用和最重要的是在(0,1)區(qū)間上的均勻分布隨機數(shù)。其他許多分布的隨機數(shù)都可以由(0,1

4、)均勻分布隨機數(shù)經(jīng)過變換和計算來產(chǎn)生。隨機數(shù)的產(chǎn)生0-1均勻分布產(chǎn)生偽隨機數(shù) 獨立性檢驗 可信否?否是可以使用 均勻性檢驗 可信否?否是 5.3.2偽隨機數(shù)的產(chǎn)生方法 1偽隨機數(shù)(pseudo random number)的產(chǎn)生2計算機產(chǎn)生隨機數(shù)的要求 偽隨機數(shù)具有一定的周期性。對隨機數(shù)值序列的要求有:分布的均勻性、抽樣的隨機性、試驗的獨立性以及前后的一致性。足夠長的周期,以滿足的實際需要。產(chǎn)生的速度要快,占用的內(nèi)存空間要小。3計算機產(chǎn)生隨機數(shù)的算法計算機產(chǎn)生隨機數(shù)的通常方法是利用一個遞推公式:給定了第k個初始值,就可以利用這個遞推公式推算出第k+1個數(shù)Xk+1;遞推公式有多種形式,其中最常見

5、的有兩種:平方取中法,同余法。4平方取中法首先給出一個初始數(shù),或稱種子。把這個數(shù)平方,然后取中間位的數(shù),再放上小數(shù)點就得到一個隨機數(shù)。這個中間位的數(shù)再平方取中得到第二個隨機數(shù)。其遞推公式為:初值為x0其中,x0為2k位的非負(fù)整數(shù),x表示取x的整數(shù)局部,NmodM為對N進(jìn)行模為M的求余運算,即:平方取中法例題任取一4位正整數(shù):5497。即,k=2,x0=5497。x0=5497,平方x1=x0 x0=30217009,取中x1=2170,R1=2170/104=0.2170 x1=2170,平方x2=x1x1=04708900,取中x2=7089,R2=7089/104=0. 7089x2=70

6、89,平方x3=x2x2=50253921,取中x3=2539,R3=2539/104=0. 2539該方法的問題:產(chǎn)生的隨機數(shù)可能產(chǎn)生退化,的到的Ri值趨于0或者重復(fù)相同的Ri值平方取中法有許多改進(jìn)型,如:乘積取中法;常數(shù)乘子法;Fibonacci法等。5同余法同余法是將一組數(shù)據(jù)通過一系列特定的數(shù)字運算,最后利用一個數(shù)字的整除求余,所得的數(shù)值就是一個偽隨機數(shù)。因為這個計算過程,那么稱該求隨機數(shù)的方法為同余法。同余法的有三種:加同余法Linear Congruence Generator、乘同余法和混合同余法。其中以混合同余法產(chǎn)生的隨機數(shù)統(tǒng)計性質(zhì)較好,因而應(yīng)用最為廣泛。混合同余法的遞推公式:其

7、中:m為模數(shù)為隨機數(shù)的周期,a為乘子乘數(shù)或乘法因子,c為增量加數(shù)或加法因子,且x0,m,a均為非負(fù)整數(shù),c0。同余法產(chǎn)生0,1均勻分布的隨機數(shù)的根本條件:c和m互質(zhì),即沒有大于1的公因子。m的每個質(zhì)數(shù)因子也是a-1的因子。假設(shè)4是m的因子,那么4也是a-1的因子。為延長隨機數(shù)的周期,通常取m=2b。5同余法續(xù)混合同余法例題 取m=8,a=3,c=1,x0=1,迭代結(jié)果如下表。n123456789103xn+1413161413161413xn4501450145un0.50.62500.1250.50.62500.1250.50.625可見平方x1=x5=4,從n=5開始xn及un循環(huán)取x1到

8、x4的值。周期m。如=m,那么稱為滿周期。同余法具有計算簡便的優(yōu)點。5.3.3隨機數(shù)的檢驗用任何一種方法產(chǎn)生的隨機數(shù)序列在把它用到實際問題中去之前都必須進(jìn)行一些統(tǒng)計檢驗,看它是否能夠令人滿意地作為隨機變量的獨立取樣值(顯著性檢驗),是否有較好的獨立性和均勻性。從理論上說,統(tǒng)計檢驗并不能得出完全肯定的結(jié)論,但是卻可以使我們有較大的把握獲得具有較好統(tǒng)計性質(zhì)的隨機數(shù)序列。五種隨機數(shù)檢驗方法:a)頻率檢驗用于檢驗均勻性b)趨勢檢驗用于檢驗獨立性c)自相關(guān)檢驗用于檢驗獨立性d)間隙檢驗用于檢驗獨立性e)撲克檢驗用于檢驗獨立性5.3.3隨機數(shù)的檢驗續(xù)檢驗假設(shè)均勻性檢驗中,有如下假設(shè): H0: Ri U0,

9、1 H1: Ri U0,1獨立性檢驗中,有如下假設(shè): H0: Ri 獨立 H1: Ri 獨立對每一個檢驗,必須說明顯著性水平的 值, 值 E(X)和與的平均值 E(X2)之差異是否顯著,從而決定能否把 x1,x2,xN看作是(0,1)均勻分布隨機變量 X的 N個獨立取樣值。=P(拒絕H0|H0屬真)對任一檢驗,必須設(shè)定 值。 值常取0.01或0.05。5.3.4分布均勻性檢驗1頻率檢驗 分布均勻性檢驗又稱頻率檢驗,是對經(jīng)驗頻率和理論頻率之間的差異進(jìn)行檢驗。均勻性檢驗有兩種方法:卡方檢驗 Chi-Square Test 柯爾莫哥洛夫-斯米爾洛夫檢驗(Kolmogorov-Smirnov Test

10、)卡方檢驗2 檢驗,卡方檢驗利用樣本統(tǒng)計量式中,Qi是第i組觀察到的次數(shù),Ei是出現(xiàn)在第i組的期望次數(shù),n是組數(shù)。對均勻分布來說,當(dāng)各組尺寸相同時,每一組中數(shù)的期望次數(shù) Ei由下式給出: 式中,N是總觀察次數(shù)??ǚ綐颖窘y(tǒng)計量分布漸近地服從自由度為 n-1 的卡方分布。3卡方檢驗步驟如下卡方檢驗步驟如下:第一步:將0,1)區(qū)間分成 n-1個不相容的小區(qū)間 i=1,2,n;第二步:由均勻性假設(shè),xi落入第i個小區(qū)間 概率為1/n,計算, (i=1,2,m),稱之為理論頻數(shù);第三步:計算xi 序列落在區(qū)間 中的個數(shù)ni (i=1,2,m),稱之為經(jīng)驗頻數(shù);第四步:由于樣本統(tǒng)計量漸近地服從自由度為n-

11、1的卡方分布,對給定水平,查卡方分布表得臨界值:第五步:計算出卡方的值,如果,可以得出結(jié)論:經(jīng)驗頻數(shù)與理論頻數(shù)之間沒有檢測出明顯的差異。如果,拒絕假設(shè)。某隨機數(shù)發(fā)生器發(fā)生100個數(shù)如下:0.34,0.90,0.25,0.89,0.87,0.44,0.12,0.21,0.46,0.67,0.83,0.76,0.79,0.64,0.70,0.81,0.94,0.74,0.22,0.74,0.96,0.99,0.77,0.67,0.56,0.41,0.52,0.73,0.99,0.02,0.47,0.30,0.17,0.82,0.56,0.05,0.45,0.37,0.18,0.05,0.79,0.

12、71,0.23,0.19,0.82,0.93,0.65,0.37,0.39,0.42,0.99,0.17,0.99,0.46,0.05,0.66,0.10,0.42,0.18,0.49,0.37,0.51,0.54,0.01,0.81,0.28,0.69,0.34,0.75,0.49,0.72,0.43,0.56,0.97,0.30,0.94,0.96,0.58,0.73,0.05,0.06,0.39,0.84,0.24,0.40,0.64,0.40,0.19,0.79,0.62,0.18,0.26,0.97,0.88,0.64,0.47,0.60,0.11,0.29,0.78給定顯著性水平=

13、0.05,試檢驗其均勻性??ǚ綑z驗例題xi序列落在10區(qū)間的個數(shù)(經(jīng)驗頻數(shù)) 以0.1位單位統(tǒng)計xi序列落在各區(qū)間(a,b的個數(shù),即經(jīng)驗頻數(shù)。區(qū)間頻數(shù)區(qū)間頻數(shù)0.0-0.170.5-0.670.1-0.290.6-0.7100.2-0.380.7-0.8150.3-0.490.8-0.990.4-0.5140.9-1.02直方圖的制作201816141210864200 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0解:第一步:將 0,1) 區(qū)間分成10個小區(qū)間,即 n =10;第二步:計算理論頻數(shù), ;第三步:計算xi序列落在10區(qū)間的個數(shù),即經(jīng)驗頻數(shù),分別為

14、7,9,8,9,14,7,10,15,9,12。第四步:樣本統(tǒng)計量對給定水平 =0.05,查卡方分布表得臨界值: ;第五步: =716.92,可以得出結(jié)論:經(jīng)驗頻數(shù)與理論頻數(shù)之間沒有檢測出明顯的差異。即該隨機數(shù)均勻地分布在0,1區(qū)間上??ǚ綑z驗的缺點可能隨分組方法不同得出不同結(jié)論樣本較少時,不能采用卡方檢驗柯爾莫哥洛夫-斯米爾洛夫檢驗該檢驗把均勻分布的連續(xù) cdf,F(xiàn)(x),與 N次觀察的樣本的經(jīng)驗 cdf,S(x)進(jìn)行比較。有定義: F(x) = x,0 x1如果隨機數(shù)發(fā)生器產(chǎn)生的樣本是x1,x2,xN,那么經(jīng)驗經(jīng)驗 cdf,SN(x)由下式定義:只要零假設(shè)屬真,那么 N 值越大,SN(x)

15、 應(yīng)更好地逼近 F(x)??聽柲缏宸?斯米爾洛夫檢驗是基于在隨機變量范圍內(nèi) F(x)與 SN(x)之間偏差的最大值來檢驗的。即基于下式: D=max|F(x) - SN(x)|柯爾莫哥洛夫-斯米爾洛夫檢驗步驟:第一步:將數(shù)據(jù)從小到大排列,x1x2xN第二步:計算 ,第三步:計算第四步:在指定的顯著性水平和給定的樣本量N之下確定臨界值D 。第五步:如果 ,拒絕數(shù)據(jù)來自均勻樣本的零假設(shè)。 如果 ,可以得出結(jié)論:在x1,x2,xN的真實分布與均勻樣本之間沒有檢測出明顯的差異??聽柲缏宸?斯米爾洛夫檢驗例題當(dāng) = 0.05和 N= 5 時,查表得D =0.565,于是 D D 。因此,不拒絕真實分

16、布與均勻樣本之間無差異假設(shè)。有5個數(shù)為0.44,0.81,0.14,0.05,0.93,取顯著性水平=0.05,檢驗其均勻性。步驟公式123451從小到大排列xi 0.050.140.440.810.932i/N 0.200.400.600.801.003D+ = i/N-xi 0.150.260.16-0.010.07D- = xi (i-1)/N 0.05-0.060.040.210.134D = max(D+,D-)0.260.215D 0.26 5.3.5分布獨立性檢驗1自相關(guān)檢驗自相關(guān)檢驗利用相關(guān)系數(shù)進(jìn)行隨機數(shù)的獨立性檢驗。相關(guān)系數(shù)反映了隨機變量之間的線性相關(guān)程度。一個序列可以是均勻

17、分布,但卻不一定是獨立。如果它們相互獨立,那么它們的相關(guān)系數(shù)應(yīng)為0反之不一定。所以可以用相關(guān)系數(shù)來檢驗隨機數(shù)的獨立性。設(shè)給定N個隨機數(shù) x1,x2,xN,假設(shè) j 階自相關(guān)系數(shù)為j=0j =1,2,m??紤]樣本的 j 階自相關(guān)系數(shù) j=1,2,m當(dāng) n-j 充分大,且j=0 成立時, j=1,2,m漸近地服從N(0,1) 分布。在實際檢驗中,常取 n = 10-20。利用統(tǒng)計量vj進(jìn)行檢驗,給定水平 ,如果 ,可以接受相關(guān)系數(shù)j=0的假設(shè);否那么,拒絕假設(shè)。 2趨勢檢驗連貫性檢驗趨勢檢驗通過一個隨機數(shù)序列中的數(shù)值的排列來檢驗獨立性假設(shè)。包括:趨勢向上或趨勢向下,在均值之上和均值值下的趨勢,趨勢

18、長度的檢驗。在對隨機數(shù)序列進(jìn)行趨勢檢驗時,要關(guān)心兩件事:趨勢的個數(shù),趨勢的長度。1趨勢向上或趨勢向下檢驗設(shè)給定N個隨機數(shù) x1,x2,xN,令 vi= xi-xi-1,I=1,2,N,把 vi按正負(fù)分為兩類,表示隨機數(shù)的增減及長度的變化規(guī)律,組成升降兩類連。如以下序列:0.41,0.68,0.89,0.74,0.55,0.36,0.54,0.72,0.75,0.08+ + - - - + + + - 該序列共有4個升降連順序為升連,降連,升連,降連,其長度分別為2,3,3,1用T表示一個隨機數(shù)序列的連的總數(shù),當(dāng) x1,x2,xN 獨立服從 U(0,1)分布時,有 , ;統(tǒng)計量 漸近地服從N(0

19、,1)。于是,可以利用統(tǒng)計量T 對隨機數(shù)序列進(jìn)行檢驗。升降連法檢驗例題:例題 對前例中的前40個隨機數(shù),給定水平 =0.05,試檢驗其獨立性。解該序列的升降連如下:+ - + - - - + + + + - + - + + + - - + + + - - - - + + + - + - - + - - + - - + -該序列共有22個升降連,即T=22,n=40;統(tǒng)計量而 Z0.025=1.96。|Z| Z0.025 ,所以不能拒絕獨立性假設(shè)。于是, , 3間隙檢驗間隙檢驗用來確定同一個隨機數(shù)重復(fù)出現(xiàn)之間間隔的顯著程度。長度為 的間隙指同一個隨機數(shù)重復(fù)出現(xiàn)之間的數(shù)的個數(shù)。下面的例子說明數(shù)字3

20、的間隔長度。4,1,3,5,1,7,2,8,2,0,7,9,1,3,5,2,7,9,4,1,6,3,3,9,6,3,4,8,2,3,1,9,4,4,4,6,8,4,1,3,8,9,5. 間隔長度10 7 2 3 9 第一個間隙的概率為:P(間隔長度10)=P(不出現(xiàn)3)* P(不出現(xiàn)3)*P(出現(xiàn)3)=(0.9)10(0.1) 共10個=間隔長度用間隙檢驗來分析一組數(shù)的獨立性,每一個數(shù)字0,1,2,9都應(yīng)當(dāng)予以分析。記下所有數(shù)字的觀察頻數(shù),并利用離散數(shù)據(jù)的柯爾莫哥洛夫-斯米爾洛夫檢驗,把它和理論頻數(shù)進(jìn)行比較。對隨機排列的數(shù)序來講,其理論頻數(shù)分布由下式?jīng)Q定: 3間隙檢驗步驟第一步:依選定的區(qū)間寬

21、度,計算出理論頻數(shù)分布的 F(x)和 cdf;第二步:用相同的分組,將觀察到的間隙樣本整理成累計分布的形式;第三步:計算柯爾莫哥洛夫-斯米爾洛夫檢驗中的 F(x)和 SN(x)之間的極大偏差D;第四步:在指定 值和樣本容量N之下,確定臨界值D第五步:如果D0,分布函數(shù)為 ,x0,其反函數(shù)F-1(.)公式由于U與1-U均為服從U(0,1) 的隨機變量,抽樣公式為采用逆變換法生成負(fù)指數(shù)分布E()的隨機數(shù)的步驟:第一步:產(chǎn)生獨立的U(0,1)隨機數(shù) xi;第二步:令 ,i=1,2,n,則ui 就是負(fù)指數(shù)分布E()的隨機數(shù)。 3威布爾分布威布爾分布W(,)的概率密度函數(shù)為分布函數(shù)為 ,其反函數(shù)F-1(

22、.)公式由于U與1-U均為服從U(0,1) 的隨機變量,抽樣公式為采用逆變換法生成威布爾分布W(,)的隨機數(shù)的步驟:第一步:產(chǎn)生獨立的U(0,1)隨機數(shù) xi;第二步:令 ,i=1,2,n,那么ui 就是威布爾分布W(,)的隨機數(shù)。5.5 小結(jié)1系統(tǒng)仿真中常見的隨機變量分布有貝努里分布、泊松分布、均勻分布、指數(shù)分布、愛爾朗分布、正態(tài)分布、韋伯爾分布等。2隨機數(shù)就是隨機變量的樣本取樣值。最常用和最重要的隨機數(shù)是(0,1)區(qū)間上的均勻分布隨機數(shù)。其他分布的隨機數(shù)都可以由(0,1)均勻分布隨機數(shù)經(jīng)過變換和計算來產(chǎn)生。3產(chǎn)生隨機數(shù)是為了發(fā)生0,1之間的一組數(shù)的序列。由于是利用計算機程序產(chǎn)生出來的,會有

23、一定的周期性,因而被稱為偽隨機數(shù)。4計算機上產(chǎn)生的隨機數(shù)的一般要求有:獨立性、均勻性。 5計算機產(chǎn)生隨機數(shù)的通常方法是利用遞推公式進(jìn)行。遞推公式有多種形式,其中最常見的有兩種:平方取中法,同余法。平方取中法有乘積取中法,常數(shù)乘子法,F(xiàn)ibonacci法等。同余法同余法的有三種:加同余法、乘同余法和混合同余法。其中以混合同余法較好。5.5 小結(jié)續(xù)6隨機數(shù)序列在使用之前都必須進(jìn)行統(tǒng)計檢驗。五種隨機數(shù)檢驗方法:頻率檢驗,趨勢檢驗,自相關(guān)檢驗,間隙檢驗,撲克檢驗。均勻性檢驗有兩種方法:柯爾莫哥洛夫-斯米爾洛夫檢驗,卡方檢驗。 7所有分布的隨機變量的產(chǎn)生都是從符合均勻分布的隨機數(shù)x,或xi開始。其他分布

24、的隨機變量由隨機變量產(chǎn)生算法的樹結(jié)構(gòu)圖表示。8隨機變量的產(chǎn)生方法包括:逆變換法或反函數(shù)法,函數(shù)變換法,卷積法,組合法,取舍法,近似法。5.6研究問題1復(fù)習(xí)隨機變量,隨機變量的數(shù)字特征,在系統(tǒng)仿真中常見的隨機變量分布有貝努里分布、泊松分布、均勻分布、指數(shù)分布、愛爾朗分布、正態(tài)分布、韋伯爾分布等。2說明計算機上產(chǎn)生隨機數(shù)的特點和要求。3隨機數(shù)發(fā)生方法有哪些。試采用某種方法發(fā)生隨機數(shù)序列并進(jìn)行檢驗見實驗一。4.隨機數(shù)的檢驗及檢驗方法有哪些?5.說明隨機變量的產(chǎn)生方法。6試采用某種方法生成正態(tài)分布的隨機變量并進(jìn)行檢驗見實驗二。第四講 輸入數(shù)據(jù)建模本章內(nèi)容 概述數(shù)據(jù)的收集分布的識別 參數(shù)估計 擬合度檢驗

25、 相關(guān)性分析 本章學(xué)習(xí)目標(biāo)1.理解數(shù)據(jù)收集的作用和步驟2.掌握數(shù)據(jù)的收集的方法3.掌握理解分布識別的方法4.了解參數(shù)估計的方法5.理解擬合度檢驗的方法6.理解相關(guān)性分析的方法7.1 概述輸入數(shù)據(jù)是仿真試驗的動力。系統(tǒng)名稱典型的輸入數(shù)據(jù)排隊系統(tǒng) 顧客到達(dá)的間隔時間 顧客被服務(wù)時間的分布庫存系統(tǒng) 需求顧客的分布 顧客需求量的分布 物料訂貨的提前期分布生產(chǎn)系統(tǒng) 作業(yè)到達(dá)的間隔時間 作業(yè)類型的概率 每種作業(yè)每道工序服務(wù)時間的分布可靠性系統(tǒng) 生產(chǎn)無故障作業(yè)時間系統(tǒng)仿真運行依賴于輸入數(shù)據(jù)。7.1 概述收集原始數(shù)據(jù) 根本統(tǒng)計分布的辨識 參 數(shù) 估 計 擬合度檢驗 可信否?否是是輸入數(shù)據(jù)分析的根底,需要分析的

26、經(jīng)驗,對收集的方法、數(shù)據(jù)需要做預(yù)先的設(shè)計和估算。因此這是一個關(guān)鍵的、細(xì)致的工作。通過統(tǒng)計的數(shù)學(xué)手段計數(shù)統(tǒng)計、頻率分析、直方圖制作等,得出統(tǒng)計分布的假設(shè)函數(shù)如:正態(tài)分布、負(fù)指數(shù)分布、Erlang分布等根據(jù)統(tǒng)計特征,計算確定系統(tǒng)的假設(shè)分布參數(shù)。運用統(tǒng)計分布的檢驗方法,對假設(shè)的分布函數(shù)進(jìn)行可信度檢驗。通常采用的是2檢驗。確定輸入數(shù)據(jù)的 根本方法正確輸入數(shù)據(jù) 7.2 數(shù)據(jù)的收集(Data Collection) 什么是數(shù)據(jù)收集?數(shù)據(jù)收集是針對實際問題,經(jīng)過系統(tǒng)分析或經(jīng)驗的總結(jié),以系統(tǒng)的特征為目標(biāo),收集與此有關(guān)的資料、數(shù)據(jù)、信息等反映特征的相關(guān)數(shù)據(jù)。數(shù)據(jù)收集的意義? 數(shù)據(jù)的收集是一項工作量很大的工作,也

27、是在仿真中最重要、最困難的問題。即使一個模型結(jié)構(gòu)是正確的,但假設(shè)收集的輸入數(shù)據(jù)數(shù)據(jù)不正確,或數(shù)據(jù)分析不對,或這些數(shù)據(jù)不能代表實際情況,那么利用這樣的數(shù)據(jù)作為決策的依據(jù)必將導(dǎo)致錯誤,造成損失和浪費。數(shù)據(jù)收集的根本態(tài)度?數(shù)據(jù)收集工作應(yīng)該具有科學(xué)的態(tài)度、忠于現(xiàn)實的工作作風(fēng)。應(yīng)該將數(shù)據(jù)收集工作、仿真工作的意義讓參與者明確,得到參與者的支持和理解。數(shù)據(jù)收集過程中的本卷須知 做好仿真方案,詳細(xì)規(guī)劃仿真所需要收集的數(shù)據(jù)在收集數(shù)據(jù)過程中要注意分析數(shù)據(jù)數(shù)據(jù)的均勻組合收集的數(shù)據(jù)要滿足獨立性的要求先作獨立性判別數(shù)據(jù)自相關(guān)性的檢驗 根據(jù)問題的特征,進(jìn)行仿真的前期研究。分析影響系統(tǒng)的關(guān)鍵因素。從相關(guān)事物的觀察入手,盡量

28、收集相關(guān)的數(shù)據(jù)。為此可以事先設(shè)計好調(diào)研表格,并注意不斷完善和修改調(diào)研方式,使收集的數(shù)據(jù)更符合仿真對象的數(shù)據(jù)需要。數(shù)據(jù)的收集與仿真的試運行是密切相關(guān)的,應(yīng)當(dāng)是邊收集數(shù)據(jù)、邊進(jìn)行仿真的試運行。然而系統(tǒng)仿真是一項專業(yè)性很強的工作,要正確認(rèn)識“仿真的含義,抓住仿真研究的關(guān)鍵,防止求全、求精。確信所收集的數(shù)據(jù)足以確定仿真中的輸入分量,而對仿真無用或影響不顯著的數(shù)據(jù)就沒有必要去多加收集。針對仿真所收集的各個數(shù)據(jù)需要進(jìn)行相關(guān)性檢驗。為了確定在兩個變量之間是否存在相關(guān)。要建立兩個變量的散布圖。通過統(tǒng)計方法確定相關(guān)的顯著性。盡量把均勻數(shù)據(jù)組合在一組里。校核在相繼的時間周期里以及在相繼日子內(nèi)的一時間周期里的數(shù)據(jù)的

29、均勻性。當(dāng)校核均勻性時,初步的檢驗是看一下分布的均值是相同??疾煲粋€似乎是獨立的觀察序列數(shù)據(jù)存在自相關(guān)的可能性。自相關(guān)可能存在于相繼的時間周期或相繼的顧客中。例如,第i個顧客的效勞時間與(i+n)個顧客的效勞時間相關(guān)。 7.3 分布的識別(Identifying distribution)7.3.1 直方圖(Histograms)對于離散系統(tǒng)的統(tǒng)計分析中,一般用頻率統(tǒng)計的分析方法來計算分布函數(shù)。其圖形描述用的就是直方圖。直方圖構(gòu)筑方法取值區(qū)間劃分水平 區(qū)坐 間標(biāo) 標(biāo)軸 注的計 區(qū)算 間確 內(nèi)定 的每 發(fā)一 生 數(shù)垂直 標(biāo)坐 注標(biāo) 頻軸 數(shù)上繪 上制 的各 發(fā)個 生區(qū) 頻間 數(shù)繪制直方圖區(qū)間中的

30、次數(shù)。落在inNnPiii=;直方圖分組區(qū)間數(shù)量的選取分組區(qū)間的組數(shù)依賴于觀察次數(shù)以及數(shù)據(jù)的分散或散布的程度。一般分組區(qū)間組數(shù)近似等于樣本量的平方根。即: 如果區(qū)間太寬m太小,那么直方圖太粗或呈短粗狀,這樣,它的形狀不能良好地顯示出來。如果區(qū)間太窄,那么直方圖顯得凹凸不平不好平滑 適宜的區(qū)間選擇m值是直方圖制作,分布函數(shù)分析的根底。 直方圖分組區(qū)間數(shù)量的選取適宜的區(qū)間選擇m值是直方圖制作,分布函數(shù)分析的根底。 對直方圖進(jìn)行曲線擬合,所得到的曲線應(yīng)該就是該隨機變量的概率密度函數(shù)。 通常,我們通過標(biāo)準(zhǔn)函數(shù)的假設(shè),將概率分布假設(shè)成標(biāo)準(zhǔn)分布函數(shù)形式。如:負(fù)指數(shù)分布、泊松分布、正態(tài)分布等。What?設(shè)現(xiàn)

31、在的數(shù)據(jù)符合某一標(biāo)準(zhǔn)分布。Why?假設(shè)現(xiàn)在的數(shù)據(jù)是某個標(biāo)準(zhǔn)分布的采樣。例7-1 直方圖的制作下表是一個交通路口的上午7點到7點零5分的5分鐘周期內(nèi)所到達(dá)的車輛數(shù)的統(tǒng)計,試以此制作直方圖。每周期內(nèi)到達(dá)的車輛數(shù)頻數(shù)每周期內(nèi)到達(dá)的車輛數(shù)頻數(shù)0126711075219853179341010358111例7-1 直方圖的制作201816141210864200 1 2 3 4 5 6 7 8 9 10 117.3 參數(shù)估計的作用 上一節(jié)通過對隨機過程的樣本值的直方圖分析,我們已經(jīng)得到了隨機過程的分布假設(shè),即假設(shè)隨機過程的概率分布符合某一種標(biāo)準(zhǔn)隨機分布。這是一種定性分析的結(jié)果。 在給定了一種隨機分布函數(shù)

32、后,需要進(jìn)一步獲取這一分布函數(shù)的特征參數(shù),這一標(biāo)準(zhǔn)分布函數(shù)的參數(shù)需通過參數(shù)估計(Parameter Estimation)來求得。 因此,參數(shù)估計求得隨機分布函數(shù)的參數(shù)的工具。樣本統(tǒng)計量:樣本均值和樣本方差 設(shè)某一個隨機過程X,其n個抽樣樣本為x1,x2,xn,該樣本的均值為該樣本的方差為如果離散數(shù)據(jù)已按頻數(shù)分組,那么k是X中不相同數(shù)值的個數(shù)即分組數(shù),f是X中數(shù)值Xj的觀察頻數(shù) 例7-2 對例7-1的數(shù)據(jù)進(jìn)行分析由表可知,n=100, k=12i123456789101112fi12101917108755331Xi01234567891011Xi20149162536496481100121

33、fiXi01038514040423540273011fiXi201076153160200252245320243300121建議使用的參數(shù)估計量仿真中常用的一些分布參數(shù)建議值(Suggested Estimators)分 布參 數(shù)建議使用的估計量泊 松指 數(shù)(0,b)上的均勻分布正 態(tài)例7-3 對例7-1進(jìn)行分布參數(shù)分析對泊松分布,但這里,樣本均值3.64不等于樣本方差(7.63)。由直方圖,可假設(shè)它是具有未知參數(shù) 的泊松分布。由前表,對泊松分布, 的估計量是X的樣本均值。這意味著什么?7.4 擬合優(yōu)度檢驗 將前面講過的隨機數(shù)的假設(shè)檢驗應(yīng)用于輸入數(shù)據(jù)分布形式的假設(shè)的檢驗。 擬合優(yōu)度檢驗(G

34、oodness-of-Fit Tests)用來檢驗總體是否符合一個事先給定的分布。卡方檢驗(Chi-Square Test)柯爾莫哥洛夫-斯米爾諾夫檢驗(Kolmogorov-Smirnov Test) 卡方2擬合度檢驗為了測試隨機樣本量為n的隨機變量X服從某一特定分布形式的假設(shè),常用2擬合度檢驗。這種檢驗方法首先是把n個觀察值分成k個分組區(qū)間或單元。k=6檢驗的統(tǒng)計量為(k為分布的階數(shù))Ei 是在該分組區(qū)間的期望頻數(shù)。每一分組區(qū)間的期望頻數(shù)是 Ei = n pi, 這里的pi是理論值,是對應(yīng)第i個分組區(qū)間的假設(shè)概率。式中,Oi是在第i個分組區(qū)間的觀察頻數(shù)。 Oi = ni /n 擬合度檢驗假

35、設(shè)可以證明:02近似服從具有自由度 f = k-s-1的2分布。這里 s 表示由采樣統(tǒng)計量所估計的假設(shè)分布的參數(shù)個數(shù)。我們可以根據(jù)擬合度檢驗的要求,設(shè)定一個擬合度的顯著性指數(shù),根據(jù)設(shè)定的顯著性指數(shù)以及2分布的自由度數(shù)f = k-s-1,可以查2表得到,f2 。假設(shè)檢驗:H0:觀察值Xi是一組屬于分組分布函數(shù)F的獨立同分布的隨機變量。如果 那么檢驗未通過,H0不成立。如果 那么檢驗通過, H0成立。2分布介紹Gamma分布族有兩個重要子族:如令a = 1,即得指數(shù)分布,如令 a = n/2, B = 1/2,即得自由度為 n 的 2 分布。其中, 函數(shù)為: 2分布為 (Gamma)分布族的子族,

36、 分布的概率密度函數(shù)(pdf): 2分布介紹2自由度為 n 的 2 分布2(n)= 概率密度函數(shù)pdf: 擬合度檢驗的步驟1、首先將數(shù)軸劃分k個區(qū)間a0,a1), a1,a2), , ak-1,ak);2、計算各組的理論頻數(shù)nPi i=1,.,k;3、計算樣本觀察值x1,x2,xn落在區(qū)間ai-1,ai)中的數(shù)目fi,即觀察頻數(shù);4、計算 02 ;5、根據(jù)設(shè)定的顯著性指數(shù),查2表得到,f , f = k-s-16、比較,如果 02 ,f ,那么拒絕假設(shè),否那么,接受假設(shè)。使用時數(shù)據(jù)分組區(qū)間要求樣本量 n分組區(qū)間數(shù) k20不用卡方檢驗505-1010010-20100 到 n/5同時,要求每一個

37、fi值都不小于 5。 例7-4用2 檢驗對例7-1進(jìn)行擬合優(yōu)度檢驗由例7-3,算出泊松分布的參數(shù)估計:有如下假設(shè)H0:隨機變量是泊松分布。H1:隨機變量不是泊松分布。對泊松分布,概率密度函數(shù)xP(x)xP(x)00.02660.08510.09670.04420.17480.02030.21190.00840.192100.00350.140110.001例7-4(續(xù)1)由上結(jié)果,可構(gòu)造下表。xi觀察頻數(shù)期望頻數(shù)QiEi01234567891011121019171087553312.69.617.421.119.214.08.54.42.00.80.30.17.870.150.804.412.570.2611.62合計100100.027.68E1 = n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論