




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
深圳大學(xué)管理學(xué)院商務(wù)管理專(zhuān)業(yè)2003級(jí)顧云飛第一章數(shù)據(jù)的整理和描述數(shù)據(jù)的分類(lèi):?按照描述的事物分類(lèi):分類(lèi)型數(shù)據(jù):描述事物的品質(zhì)特征,本質(zhì)表現(xiàn)是文字形式(一般不能相加);數(shù)量型數(shù)據(jù):描述事物的數(shù)量特征,用數(shù)值形式表示(通常可以相加);日期和時(shí)間。?按照被描述的對(duì)象與時(shí)間的關(guān)系分類(lèi):截面數(shù)據(jù):描述事物在某一時(shí)刻的變化情況(也叫橫向數(shù)據(jù));時(shí)間序列數(shù)據(jù):描述事物在一定的時(shí)間范圍內(nèi)的變化情況(也叫縱向數(shù)據(jù));平行數(shù)據(jù):截面數(shù)據(jù)與時(shí)間序列數(shù)據(jù)的組合。數(shù)據(jù)的整理和圖表顯示:?數(shù)據(jù)的整理1.單值分組法:數(shù)據(jù)中不同數(shù)據(jù)的個(gè)數(shù)不多時(shí)用.2.組距分組法:找出最大值max和最小值min;適當(dāng)取a<min,b>max;1)定數(shù)據(jù)范圍:2)分組定組距:分成m組,組距c=(b-a)/m;3)定各組界限:確定每組的上、下限;4)唱票記頻數(shù);5)算出組頻率,組中值;6)制作頻數(shù)(率)表。?數(shù)據(jù)的圖表顯示餅形圖:用來(lái)描述和表現(xiàn)各成分或某一成分占全部的百分比。注意,成分份額總和必須是100%;比例必須與扇形區(qū)域的面積比例一致。條形圖:用來(lái)對(duì)各項(xiàng)信息進(jìn)行比較。(當(dāng)各項(xiàng)信息的標(biāo)識(shí)(名稱(chēng))較長(zhǎng)時(shí),宜用條形圖)。柱形圖:橫軸表示時(shí)間,縱軸表示數(shù)據(jù)大?。ǔS糜跁r(shí)間序列數(shù)據(jù))。它可以直觀(guān)地看出事物隨時(shí)間變化的情況。折線(xiàn)圖:明顯表示趨勢(shì)的圖示方法。簡(jiǎn)單、容易理解。曲線(xiàn)圖:用光滑曲線(xiàn)連接各點(diǎn),形成一條整體光滑的曲線(xiàn)。散點(diǎn)圖:用來(lái)表現(xiàn)兩個(gè)變量之間的相互關(guān)系,以及數(shù)據(jù)變化的趨勢(shì)。莖葉圖:把數(shù)據(jù)分成莖與葉兩個(gè)部分,按一定規(guī)律排列。它既保留了所有原始數(shù)據(jù),又直觀(guān)地顯示出數(shù)據(jù)的分布。數(shù)據(jù)集中趨勢(shì)的度量:?平均數(shù):n個(gè)數(shù)據(jù)的算術(shù)平均數(shù)n個(gè)數(shù)據(jù)的算術(shù)平均數(shù)=全體數(shù)據(jù)的和
數(shù)據(jù)的個(gè)數(shù)(組中值x(組中值x頻數(shù))的和分組數(shù)據(jù)的加權(quán)平均數(shù)-—頻數(shù)的和y牝1i其中m為組數(shù),y.為第i組組中值,v.為第i組頻數(shù)。平均數(shù)容易理解,計(jì)算;它不偏不倚地對(duì)待每一個(gè)數(shù)據(jù);是數(shù)據(jù)集的“重心”;缺點(diǎn)是它對(duì)極端值十分敏感。?中位數(shù):將數(shù)據(jù)按從小到大順序排列,處在中間位置上的一個(gè)數(shù)或最中間兩個(gè)數(shù)的平均數(shù)。中位數(shù)對(duì)極端值不像平均數(shù)那么敏感,因此,如果數(shù)據(jù)含有極端值,用中位數(shù)來(lái)描述集中趨勢(shì)比用平均數(shù)更為恰當(dāng)。?眾數(shù):數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)。它反映了數(shù)據(jù)中最常見(jiàn)的數(shù)值,不僅對(duì)數(shù)量型數(shù)據(jù)(數(shù)值)有意義,對(duì)分類(lèi)型數(shù)據(jù)也有意義;它能夠告訴我們最普遍、最流行的款式、尺寸、色彩等產(chǎn)品特征。缺點(diǎn)是一組數(shù)據(jù)可能沒(méi)有眾數(shù),也可能眾數(shù)不唯一。四.數(shù)據(jù)離散趨勢(shì)的度量:?極差R=max-min。?四分位極差=Q3-Q1。第2四分位點(diǎn)q2=全體數(shù)據(jù)的中位數(shù);第1四分位點(diǎn)Q1=數(shù)據(jù)中所有WQ2的那些數(shù)據(jù)的中位數(shù);第3四分位點(diǎn)Q3=數(shù)據(jù)中所有NQ2的那些數(shù)據(jù)的中位數(shù)。四分位極差不像極差R那樣容易受極端值的影響,但是仍然存在著沒(méi)有充分地利用數(shù)據(jù)所有信息的缺點(diǎn)。?方差:反映數(shù)據(jù)離開(kāi)平均數(shù)遠(yuǎn)近的偏離程度。EV'',一、,〉一C、.n(X-x)2=+(乙X2一nx2)分組數(shù)據(jù)的方差。2=+Zm(y,—y)2七=+(Zmy;七—ny2)其中m,y「vi同上,n=2nvi是數(shù)據(jù)的個(gè)數(shù),y是分組數(shù)據(jù)的加權(quán)平均數(shù)。?標(biāo)準(zhǔn)差:。=兵(方差的算術(shù)平方根,與原來(lái)數(shù)據(jù)的單位相同)?變異系數(shù):v=奪(%)(反映數(shù)據(jù)相對(duì)于其平均數(shù)的分散程度)X兩組數(shù)據(jù)的平均數(shù)不同或兩組數(shù)據(jù)的單位不同時(shí)用。第二章隨機(jī)事件及其概率隨機(jī)試驗(yàn)與隨機(jī)事件:?隨機(jī)試驗(yàn):可以在相同的條件下重復(fù)進(jìn)行;試驗(yàn)的結(jié)果不止一個(gè),但所有可能的結(jié)果在試驗(yàn)之前都知道;每次試驗(yàn)之前,不知道這次試驗(yàn)出現(xiàn)哪個(gè)結(jié)果。?樣本空間Q:隨機(jī)試驗(yàn)中每個(gè)可能的結(jié)果,稱(chēng)為一個(gè)基本事件(或樣本點(diǎn));基本事件的全體所組成的集合稱(chēng)為樣本空間(是必然事件);若干個(gè)樣本點(diǎn)組成的集合(即樣本空間的子集),稱(chēng)為隨機(jī)事件(簡(jiǎn)稱(chēng)事件);事件A發(fā)生。A中一個(gè)樣本點(diǎn)出現(xiàn);只含一個(gè)樣本點(diǎn)的事件是基本事件,不含任何樣本點(diǎn)的事件是不可能事件0。?樣本空間的表示方法:列舉法,描述法。事件的關(guān)系和運(yùn)算?事件的關(guān)系:包含關(guān)系:若A發(fā)生,則B一定發(fā)生(或事件A的樣本點(diǎn)都包含在B中),則稱(chēng)事件A含于B(或B包含A),記作AuB(或BdA)。相等關(guān)系:若事件A,B所含樣本點(diǎn)相同,則稱(chēng)事件A與B相等,記作A=B。?事件的運(yùn)算
并AUB:A發(fā)生或B發(fā)生(或A,B至少有一個(gè)發(fā)生)的事件,常記作A+B。交AHB:A,B同時(shí)發(fā)生的事件,常記作AB。差A(yù)-B:A發(fā)生,但B不發(fā)生的事件?;コ馐录菏录嗀,B中若有一個(gè)發(fā)生,另一個(gè)一定不發(fā)生(即AB=0),則稱(chēng)事件A,B互斥,否則稱(chēng)A,B相容。對(duì)立事件:若事件A,B互斥,且AUB是樣本空間(即AB=0,A+B=Q),則稱(chēng)事件A,B對(duì)立(或互逆)。A的對(duì)立事件記作A(即AA=0,A+A=Q)。?一個(gè)常用的等式:A-B=A-AB=AB?運(yùn)算律:交換律:A+B=B+A,AB=BA;結(jié)合律:(A+B)+C=A+(B+C),(AB)C=A(BC);分配律:(A+B)C=AC+BC,(AB)+C=(A+C)(B+C);對(duì)偶律:A+B=AB,~AB=A+B。概率的定義:(統(tǒng)計(jì))事件A發(fā)生的頻率的穩(wěn)定值稱(chēng)為A的概率,記作P(A)(0WP(A)W1)。(古典)若隨機(jī)試驗(yàn)的樣本空間只含有限個(gè)樣本點(diǎn),且每個(gè)樣本點(diǎn)發(fā)生的可能性相同,mA所含樣本點(diǎn)個(gè)數(shù)則P(A)=樣本點(diǎn)總數(shù)一。(幾何)設(shè)質(zhì)點(diǎn)落在Q內(nèi)任何一點(diǎn)的可能性相同,AuQ,則質(zhì)點(diǎn)落在A內(nèi)(記作事件A)的概率A的面積P(A)=A的面積P(A)=Q的面積(=1)=A的面積。?兩個(gè)基本原理加法原理:做一件事,有兩類(lèi)辦法,第一類(lèi)有m種方法,第二類(lèi)有n種方法,則做完這件事,共有m+n種方法(可以推廣到有多類(lèi)辦法的情況);乘法原理:做一件事,分兩步來(lái)做,第一步有m種方法,第二步有n種方法,則做完這件事,共有mXn種方法(可以推廣到多個(gè)步驟的情況)。排列:從n個(gè)不同元素中任取r個(gè),按照一定的順序排成一列,稱(chēng)為從n個(gè)不同元素中任取r個(gè)的一個(gè)排列。所有排列的個(gè)數(shù),稱(chēng)為從n個(gè)不同元素中任取r個(gè)的排列數(shù),記作Pn。組合:從n個(gè)不同元素中任取r個(gè),不管怎樣的順序合成一組,稱(chēng)為從n個(gè)不同元素中任取r個(gè)的一個(gè)組合。所有組合的個(gè)數(shù),稱(chēng)為從n個(gè)不同元素中任取r個(gè)的組合數(shù),記作Cr。顯然Pi=Ci=n,Cn=1。"概率的性質(zhì):0MPn(A)W1「P(0)=O,P(Q)=1。條件概率:在事件B(假定P(B)>0)發(fā)生的條件下,事件A發(fā)生的概率稱(chēng)為A對(duì)B的條件概率,記作P(AIB)。計(jì)算公式P(AIB)=3);P(B)概率公式:
互逆概率:對(duì)任意事件A,P(A)+P(A)=1;加法公式:P(A+B)=P(A)+P(B)-P(AB)可以推廣到有限個(gè)事件的并的情形,如:P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)減法公式:P(A-B)=P(A)-P(AB)特別地,當(dāng)AoB時(shí),P(A-B)=P(A)-P(B);乘法公式:P(AB)=P(A)P(BIA),P(A)/0;全概公式:設(shè)事件A1,%,???,An兩兩互斥,A1+-+An=fi,且P(A1)>0,…,P(An)>0,則對(duì)任意事件B,有P(B)=P(A1)P(BIA1)+P(A2)P(BIA2)+?+P(An)P(BIAn);貝葉斯公式:條件同上,則對(duì)任意事件B(P(B)>0),有P(A.IB)=PAB=p(氣)p(BI氣),i=1,2,…,n,(分母中的P(B)用全概公式求)。iP(B)P(B)第三章隨機(jī)變量及其分布取值帶有隨機(jī)性,但取值具有概率規(guī)律的變量稱(chēng)為隨機(jī)變量。離散型隨機(jī)變量:取值可以逐個(gè)列出。?數(shù)學(xué)期望:定義:性質(zhì):EX=£xipiEc?數(shù)學(xué)期望:定義:性質(zhì):EX=£xipiEc=cE(aX)=aEXE(aX+b)=aEX+bXx1x2…pp1p2…(以概率為權(quán)數(shù)的加權(quán)平均數(shù));(常數(shù)期望是本身)(常數(shù)因子提出來(lái))(一項(xiàng)一項(xiàng)分開(kāi)算)?方差:定義:性質(zhì):DX=E(X?方差:定義:性質(zhì):DX=E(X-EX)2=£(xi-EX)2pi;Dc=0D(aX)=a2DXD(aX+b)=a2DX(常數(shù)方差等于0)(常數(shù)因子平方提)(一項(xiàng)一項(xiàng)分開(kāi)算)DX=E(X2)-(EX)2(方差=平方的期望-期望的平方);3.公式:?常用離散型隨機(jī)變量:(0-1)分布:隨機(jī)變量(0-1)分布:隨機(jī)變量X只能取0,1這兩個(gè)值;X?B(1,p);EX=p,DX=p(1-p)二項(xiàng)分布:分布律:P(X=k)=Ckpk(1-p)n-k,k=0,1,2,…,n;nX?B(n,p);EX=np,DX=np(1-p)4)適用:隨機(jī)試驗(yàn)有兩個(gè)可能的結(jié)果(A或A),且P(A)=p,將該試驗(yàn)獨(dú)立重復(fù)n次。泊松分布:分布律:P(X=k)=血項(xiàng),k=0,1,2,…,入>0;k!X?P(入);EX=入,DX=入;適用:在指定時(shí)間段(或指定范圍)內(nèi)某事件發(fā)生的次數(shù)。三.連續(xù)型隨機(jī)變量:取某個(gè)范圍內(nèi)的一切實(shí)數(shù)。?X的密度函數(shù)f(x):對(duì)任意實(shí)數(shù)x,f(x)N0;對(duì)任意實(shí)數(shù)a<b,P(a<XWb)是密度曲線(xiàn)y=f(x)下方,[a,b]區(qū)間上方圖形的面積。?設(shè)X是連續(xù)型隨機(jī)變量:期望EX=大量重復(fù)試驗(yàn)結(jié)果的算術(shù)平均數(shù)的穩(wěn)定值(常記作u);方差DX=E(X-EX)2=E(X2)-(EX)2(方差=平方的期望一期望的平方);標(biāo)差方差的算術(shù)平方根。?常用連續(xù)型隨機(jī)變量:名稱(chēng)密度函數(shù)記法EXDX均勻分布f⑴=〕a<x<bX?U[a,b]a+b(b一a)2、0,其他212指數(shù)分布f⑴=■人e-兀,0x>0,入>0x<0X?E(入)1力1人2正態(tài)分布p(x)=:-e-4x-u422ct2,b>0X?N(u,。2)u。2,■2兀Q標(biāo)準(zhǔn)正態(tài)x2一分布'(x)=士e一2L2KX?N(0,1)01?正態(tài)分布的密度曲線(xiàn)y=p(x)是一條關(guān)于直線(xiàn)x=u的對(duì)稱(chēng)的鐘形曲線(xiàn),在x=u處最高,兩側(cè)迅速下降,無(wú)限接近x軸;。越小(大),曲線(xiàn)越尖(扁)。?標(biāo)準(zhǔn)正態(tài)分布的密度曲線(xiàn)y=e(x)是關(guān)于y軸對(duì)稱(chēng)的鐘形曲線(xiàn)。?隨機(jī)變量的標(biāo)準(zhǔn)化XTX-EX(減去期望除標(biāo)差)?!鯠X?標(biāo)準(zhǔn)化定理:設(shè)X?N(u,。2),則Z=\丁?N(0,1)。二維隨機(jī)變量:?用兩個(gè)隨機(jī)變量合在一起(X,Y)描述一個(gè)隨機(jī)試驗(yàn),(X,Y)的取值帶有隨機(jī)性,但取值具有概率規(guī)律,則稱(chēng)(X,Y)為二維隨機(jī)變量。?X,Y的協(xié)方差:cov(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-EXXEY協(xié)方差cov(X,Y)的正負(fù)反映X,Y之間相關(guān)關(guān)系的方向。cov(X,Y)>0表示X與Y之間存在一定程度的正相關(guān)關(guān)系;cov(X,Y)<0表示X與Y之間存在一定程度的負(fù)相關(guān)關(guān)系;cov(X,Y)=0稱(chēng)作X與Y不相關(guān)。?X,Y的相關(guān)系數(shù):rXY=心A(-1WrXYW1)XYDX.、DY又丫相關(guān)系數(shù)rXY反映X,Y之間的線(xiàn)性相關(guān)的程度。rXY越接近1,表明X,Y之間的正線(xiàn)性相關(guān)程度越強(qiáng);rXY越接近-1,表明X,Y之間的負(fù)線(xiàn)性相關(guān)程度越強(qiáng);rXY=0,X與Y不相關(guān)。?隨機(jī)變量的線(xiàn)性組合:E(aX+bY)=aEX+bEYD(aX+bY)=a2DX+2abcov(X,Y)+b2DY決策準(zhǔn)則與決策樹(shù):?對(duì)不確定的因素進(jìn)行估計(jì),從幾個(gè)方案中選擇一個(gè),這個(gè)過(guò)程稱(chēng)為決策;?決策三準(zhǔn)則:極大極小原則:將各種方案的最壞結(jié)果(極小收益)進(jìn)行比較,選擇極小收益最大的方案;最小期望損失原則:選擇期望損失最小的方案;最大期望收益原則:選擇期望收益最大的方案。?決策樹(shù):把不確定因素下的決策過(guò)程用圖解的形式表示出來(lái),簡(jiǎn)單、直觀(guān)。第四章抽樣方法與抽樣分布一、抽樣基本概念:總體:研究對(duì)象的全體;個(gè)體:組成總體的每一個(gè)個(gè)體;抽樣:從總體中抽取一部分個(gè)體的過(guò)程;有放回抽樣(各次抽取相互獨(dú)立),不放回抽樣(各次抽取不相互獨(dú)立)。樣本:從總體中抽出的一部分個(gè)體構(gòu)成的集合;樣本值:在一次試驗(yàn)或觀(guān)察以后得到一組確定的值;隨機(jī)樣本:①個(gè)體被抽到的可能性相同;②相互獨(dú)立;③同分布。二、抽樣方法:?簡(jiǎn)單隨機(jī)抽樣:總體中有n個(gè)個(gè)體,從中抽取r個(gè)個(gè)體作為樣本,使得所有可能的樣本都有同樣的機(jī)會(huì)被抽中(r稱(chēng)為樣本容量)。有放回抽樣的樣本個(gè)數(shù)為nr;無(wú)放回抽樣的樣本個(gè)數(shù)為史。?系統(tǒng)抽樣(等距抽樣):將總體中的個(gè)體按照某種順序排列,按照規(guī)則確定一個(gè)起點(diǎn),然后每隔一定的間距抽取個(gè)體作為樣本。?分層抽樣:在抽樣之前將總體劃分為互不交叉重疊的若干層,然后從各個(gè)層中獨(dú)立地抽取一定數(shù)量的個(gè)體作為樣本。?整群抽樣:在總體中由若干個(gè)個(gè)體自然或人為地組成的群體稱(chēng)為群,抽樣時(shí)以群為抽樣單位,對(duì)抽中的各群的所有個(gè)體進(jìn)行觀(guān)察。三、抽樣中經(jīng)常遇到的三個(gè)問(wèn)題:抽樣框選取不當(dāng);無(wú)回答:處理無(wú)回答常用的方法:注意調(diào)查問(wèn)卷的設(shè)計(jì)和加強(qiáng)調(diào)查員的培訓(xùn);進(jìn)行多次訪(fǎng)問(wèn);替換無(wú)回答的樣本單元;對(duì)存在無(wú)回答的結(jié)果進(jìn)行調(diào)整。抽樣本身的誤差。1)抽樣誤差(樣本指標(biāo)與被估計(jì)的總體相應(yīng)指標(biāo)的差)與抽樣標(biāo)準(zhǔn)誤差(抽樣誤差的標(biāo)準(zhǔn)差);2)非抽樣誤差與偏差。四、抽樣分布與中心極限定理:?不含任何未知參數(shù)的樣本的函數(shù)稱(chēng)作統(tǒng)計(jì)量。?常用的統(tǒng)計(jì)量樣本均值:X=+z^x;樣本方差:S2=六£;(X"X)2;(注意是除以n-1,其中n是樣本容量)樣本標(biāo)差:S=.、§。?統(tǒng)計(jì)量的分布叫做抽樣分布。?樣本均值的期望與方差:設(shè)隨機(jī)變量X],…,Xn獨(dú)立同分布,且EX尸u,DX=。2,i=1,2,…,n,X=+^^^X^,則EX=E(士£"X)=+£-EX=+-職=u;DX=D(七£nX)=+D(£nX)=+£nDX=+-n。2=gn1in21in211n2n即,樣本均值的期望=總體均值,樣本均值的方差=總體方差/樣本容量。?中心極限定理:設(shè)隨機(jī)變量X],…,Xn獨(dú)立同分布,且EX廣…=EXn=u,DX廣…=DXn=。2,X=+£nX貝gX近似N。即,大樣本(樣本容量nN30),*論原來(lái)總體服從什么分布,樣本均值都近似服從正態(tài)分布。五、常用的抽樣分布樣本均值的分布:總體分布樣本容量樣本均值的分衫N(u,°2)任意X?N(p,吁)非正態(tài)分布大樣本X?似N(R,&2)n樣本均值的期望與方差總體抽樣方式EXDX有放回抽樣有限總體■^2n不放回抽樣uN-n無(wú)限總體任意n當(dāng)有限總體不放回抽樣n<5%時(shí),修正系數(shù)N-nR1,樣本均值的方差可以簡(jiǎn)化為艮。N2.樣本比例的分布:P'?N(p,NW)n樣本比例的期望與方差N-1n總體抽樣方式EPDP有放回抽樣有限總體p(1-p)n不放回抽樣PP(l-P)--N-n-無(wú)限總體任意P(1-P)n
。未矢小樣本s代。當(dāng)有限總體不放回抽樣n<5%時(shí),修正系數(shù)。未矢小樣本s代。六、名稱(chēng)統(tǒng)計(jì)量記法上a分位點(diǎn)X2分布X],…,Xn?N(0,]),獨(dú)立x2=X:+???+X2x2?x2(n)P[x2>xa2(n)]=at分布X?N(0,]),Y?x2(n),獨(dú)立.t=X/<ynt?t(n)P[t>t(n)]=aF分布U?x2(m),V?x2(n),獨(dú)立.F=5V/nF?F(m,n)P[F>F(m,n)]=a七、幾種重要統(tǒng)計(jì)量的分布:設(shè)X?N?,02),X],…,Xn是X的樣本,樣本均值X,樣本方差S2:].t分布:X?N(R,砰)標(biāo)TL?N(0,1)n朽ny?.?X2分布:乙阡疽)=(nj)^?*2(n一]);設(shè)X],…,Xm;%…,Yn分別是N?],。^),N(u2,o22)的樣本,且相互獨(dú)立,則:X-V?N(旦—旦,嚀+哼)標(biāo)驊X-Y-W廣叩?N(0,1)
mn■.4+略mnX-V-(七-七
S"I+:)?tX-V-(七-七
S"I+:)?t(m+n—2)口S2=+£m(X—X)2S2=+£n(V-Y)2,S2=(m-1)S2+(n-1)S2n-12n-1]iS2=+£m(X—X)2n-1一、參數(shù)的點(diǎn)估計(jì)?設(shè)總體分布中含有未知參數(shù)。,從總體中抽取一個(gè)樣本X],…,Xn,用來(lái)估計(jì)未知參數(shù)。的統(tǒng)計(jì)量°(X],…,Xn)稱(chēng)為。的一個(gè)估計(jì)量。若X],…,xn是樣本的一組觀(guān)察值,則稱(chēng)°(X],…,xn)為參數(shù)。的一個(gè)點(diǎn)估計(jì)值。?估計(jì)量的評(píng)價(jià)標(biāo)準(zhǔn):無(wú)偏性:設(shè)°是總體未知參數(shù)。的估計(jì)量,若E°=°則稱(chēng)°是。的無(wú)偏估計(jì)量。樣本均值X是總體均值U的無(wú)偏估計(jì)量:EX=U;樣本方差S2是總體方差。2的無(wú)偏估計(jì)量:ES2=02;樣本比例P是總體比例p的無(wú)偏估計(jì)量:EP=p。有效性:。的方差最小的無(wú)偏估計(jì)量稱(chēng)為。的有效估計(jì)量。正態(tài)總體的樣本均值X是總體均值u的有效估計(jì)量。
一致性:若樣本容量增大時(shí),估計(jì)量0的值越來(lái)越接近未知參數(shù)。的真值,則稱(chēng)0是。的一致估計(jì)量。樣本均值是總體均值的一致估計(jì)量;樣本方差是總體方差的一致估計(jì)量;樣本比例是總體比例的一致估計(jì)量。二、參數(shù)的區(qū)間估計(jì):?設(shè)。是總體分布中的未知參數(shù),X1,…,Xn是總體的一個(gè)樣本,若對(duì)給定的a(0<a<1),存在兩個(gè)估計(jì)量0(X,…,X)和0(X|,…,X),使P(0<°<°)=1—a,則稱(chēng)隨機(jī)區(qū)間]'1n21n12(01,02)為參數(shù)。的置信度為1—a的置信區(qū)間,°a稱(chēng)為顯著水平。?意義:隨機(jī)區(qū)間(01,02)包含°真值的概率是l—a。三、總體均值的置信區(qū)間標(biāo)準(zhǔn)化T置信度1-a待估參數(shù):總體均值h樣本勻”,A估計(jì)量X?N(h,b2)—bX+Z—a/2x'nnb已知Z=IZh?N(0,1)置信區(qū)間或大樣本f'nSX土t(n—1)—a/25。未知,小樣本,X—^置信區(qū)間—t=標(biāo)準(zhǔn)化T置信度1-a—bX+Z—a/2x'nSX土t(n—1)—a/25總體分布樣本量。已知。未知S代。大樣本正態(tài)分布非正態(tài)分布小樣本nZa/2寫(xiě)X土ta〃(n—1)?十S代。大樣本.nP—P2土P—P2土Z樣本量抽樣方式置信區(qū)間大樣本有放回抽樣P+Zv:P1—P)a/2*n不放回抽樣p土za/2jpup)-N—n五、兩個(gè)總體均值之差的置信區(qū)間(置信度1-a)總體分布樣本量。已知。未知大樣本S1代。1,S2代。2正態(tài)分布小樣本X—Y+Z寸嚀+哼X—Y土ta/2(m+n—2)-S合?寸+++非正態(tài)分布大樣本S1代。1,,2代。2六、兩個(gè)總體比例之差p1—p2的置信區(qū)間(置信度1—a):'】~~\;P^+P^—P^a/2'mn七、樣本容量的確定抽樣方式置信區(qū)間(置信度1—a)絕對(duì)誤差樣本容量有放回抽樣(或抽樣比<5%)總體均值X+有放回抽樣(或抽樣比<5%)總體均值X+Za/2-總體比例P土七/2?線(xiàn)冒△=z?a/2■■n△=z(P^P)
a/2n(zb)2n=a/2I△J不放回抽樣總體均值iX+Z/2千Nn△=Za/2,-&■-?'N-nn'"I先算出有放回抽樣的樣本容量n,然后:總體比例c,rI△=Z\*;P(1-P)-N-n0n=—P±Z寸P(1-P)-N~na/2'bnN-11+的Nn=z&2P(1")第六章假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的基本概念:?小概率原理:小概率事件在一次試驗(yàn)中很難發(fā)生(但并不意味著絕對(duì)不會(huì)發(fā)生)。?對(duì)總體參數(shù)的取值所作的假設(shè),稱(chēng)為原假設(shè)(或零假設(shè)),記作H0;原假設(shè)的對(duì)立假設(shè)稱(chēng)為備選假設(shè)(備擇假設(shè)),記作H1O?犯“H0成立,但拒絕H0”這種錯(cuò)誤稱(chēng)為第一類(lèi)錯(cuò)誤(棄真錯(cuò)誤),犯第一類(lèi)錯(cuò)誤的概率a稱(chēng)為顯著水平;犯“H0不成立,但接受H0”這種錯(cuò)誤稱(chēng)為第二類(lèi)錯(cuò)誤(取偽錯(cuò)誤),犯第二類(lèi)錯(cuò)誤的概率記作B。?用來(lái)判斷是否接受原假設(shè)的統(tǒng)計(jì)量稱(chēng)為檢驗(yàn)統(tǒng)計(jì)量。?當(dāng)檢驗(yàn)統(tǒng)計(jì)量取某個(gè)范圍D內(nèi)的值時(shí),我們拒絕原假設(shè)H0,這時(shí)D稱(chēng)為拒絕域。?拒絕域的邊界點(diǎn)稱(chēng)為臨界點(diǎn)。?假設(shè)檢驗(yàn)的基本思想:先假定H0成立,在這個(gè)前提下用樣本數(shù)據(jù)進(jìn)行推導(dǎo)、計(jì)算,如果導(dǎo)致小概率事件發(fā)生,則拒絕H0,否則就接受H0。?當(dāng)檢驗(yàn)統(tǒng)計(jì)量H0:u=u0H1:u#u0(雙側(cè)檢驗(yàn))拒絕域:IZI^z/2a/2H0:u=u0H1:u>u0(右側(cè)檢驗(yàn))拒絕域:Z3zH0:u=u——0—u<u0——(左側(cè)檢驗(yàn))拒絕域:ZW-za?假設(shè)檢驗(yàn)的五個(gè)步驟:提出原假設(shè)與備選假設(shè)。原則:1)把含有等號(hào)的式子作為原假設(shè);2)把從樣本作出猜測(cè)而希望證實(shí)的問(wèn)題作為備選假設(shè)。選取統(tǒng)計(jì)量。(通過(guò)選取適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量來(lái)構(gòu)造小概率事件)按P(拒絕H0IH0成立)=a確定拒絕域;計(jì)算統(tǒng)計(jì)量的值;作出判斷:若樣本值落在拒絕域內(nèi),小概率事件發(fā)生,拒絕H0;若樣本值不落在拒絕域內(nèi),小概率事件沒(méi)有發(fā)生,接受H0。、總體均值的假設(shè)檢驗(yàn):已知條件H0H1檢驗(yàn)統(tǒng)計(jì)量及其分布拒絕域X?N(u,02)。已知u=u0或大樣本uNuIZlNz0X^丑0為真a/2u>uZ==°虬N(0,1)Z3z0b/5au<uZW-z0a
X?N(u,02)。未知,小樣本u=u0u#u0u>u0u<ut=又-%燮t(n-1)S/m|t2ta/2(n-1)t3t(n-1)tW-t(n-1):、總體比例的假設(shè)檢驗(yàn):已知條件__Ho___H1檢驗(yàn)統(tǒng)計(jì)量及其分布拒絕域p#p0p>p0Z=-P—PH0為真0一七N(0,1)1―_X|Z2z/2a/2Z3z大樣本p=p00p(1—p)Q―00—P<P07nZW-zQ四、兩個(gè)總體均值之差的假設(shè)檢驗(yàn):比例-已知條件_10__—H1__檢驗(yàn)統(tǒng)計(jì)量及其分布拒絕域X?N(ui,o12)Y?N(u2,。22)。],。2已知u1=u2ujNu?u1>u2u<uZ=X—YH抄N(0,1)、嚴(yán)+哼mn|Z2z「a/2Z3zaZW-z或大樣本12QX?N(ui,oi2)Y?N(u2,。22)。]=。2未知,小樣本u1=u2ujNu?u1>u2u1<u2x—Yh為真/?t=~t(m+n—2)S、:+++合vmn|t2ta/2(m+n-2)t3t(m+n-2)tW-t(m+n-2)p1#p2rP—PH為真、i\Z=、L2IN(0,1)\P(1—P)住+4)■mn|Z2z「/2Z3zaZW-z大樣本p1=p2p1>p2pm第七章相關(guān)與回歸分析一、相關(guān)分析:?線(xiàn)性相關(guān):變量的關(guān)系近似線(xiàn)性函數(shù);1正線(xiàn)性相關(guān):變量同向變化;2負(fù)線(xiàn)性相關(guān):變量反向變化;?非線(xiàn)性相關(guān):變量的關(guān)系近似非線(xiàn)性函數(shù);?完全相關(guān):變量的關(guān)系是函數(shù)關(guān)系;1完全線(xiàn)性相關(guān):變量的關(guān)系是線(xiàn)性函數(shù);2完全非線(xiàn)性相關(guān):變量的關(guān)系是非線(xiàn)性函數(shù);?不相關(guān):變量之間沒(méi)有任何規(guī)律。?協(xié)方差:cov(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-EXXEY?總體相關(guān)系數(shù):r=cov£x皿XY■-DX??DY一"L一、記,?簡(jiǎn)單相關(guān)系數(shù):r=亍乙(巴1)(導(dǎo)一y)_=―^,(x1,y1),^,(xn,yn)是總體(X,Y)的n對(duì)觀(guān)察值?.乙(Xi-X)2.?.乙(yt-y)2■-lxxr反映兩個(gè)變量之間線(xiàn)性相關(guān)的密切程度。l=£x.y.-nx?y,l=£x.2-nx^,l=£y.2-nyxyWixyiyyi
、一元線(xiàn)性回歸:如果可以近似地用函數(shù)來(lái)描述變量之間的相關(guān)關(guān)系,則稱(chēng)該函數(shù)為回歸函數(shù);若回歸函數(shù)是線(xiàn)性(一次)函數(shù),則稱(chēng)為線(xiàn)性回歸函數(shù);若兩個(gè)變量之間的回歸函數(shù)是線(xiàn)性函數(shù),則稱(chēng)為一元線(xiàn)性回歸函數(shù)(其圖形稱(chēng)為回歸直線(xiàn));4.回歸直線(xiàn)》=a+bx,其中b=lxy/lxx稱(chēng)為斜率(或回歸系數(shù)),a=y-bx稱(chēng)為截距。5.平方和分解公式Z(y—y)2=S(y—y)2iiiSST=SSE總變差平方和=剩余平方和+SSR(SST=lyy,SSR=b2lxx)+回歸平方和總變差平方和:反映y1,…,yn的分散程度;回歸平方和:反映由于x1,??:xn的分散性引起的y],???,yn的分散程度;剩余平方和:反映其他因素引起的y1,SST=SSE總變差平方和=剩余平方和6判定系數(shù):r2=st(回歸平方和占總變差平方和的比例)=(相關(guān)系數(shù)r)27.判定系數(shù)的意義0WhW1SSE意義r2=0SSE=SSTx的變化與y無(wú)關(guān),x,y沒(méi)有線(xiàn)性相關(guān)關(guān)系、八一一-r2-1SSE—0,y,Tyj觀(guān)察點(diǎn)接近回歸直線(xiàn),x,y高度線(xiàn)性相關(guān)r2=1r2=1sse=o,y,=y,觀(guān)察點(diǎn)落在回歸直線(xiàn)上,x,y完全線(xiàn)性相關(guān).....一......最小二乘法:使因變量的觀(guān)察值y與估計(jì)值y,之差的平方和SSE(剩余平方和)達(dá)到最小來(lái)求得a和b的方法,即SSE=£(y.-y)2=S(y.-a-bx.)2=min。估計(jì)標(biāo)準(zhǔn)誤差:s=W=產(chǎn)"Z、廣2皿y?n—2In—2y0的點(diǎn)估計(jì)與區(qū)間估計(jì)::給定x=x0y0的點(diǎn)估計(jì):y0=a+bx0個(gè)別值y「的預(yù)測(cè)區(qū)間:y土t(n—2)-S?.「1+++(xo—x)2
』°0ayYnlTOC\o"1-5"\h\z2xx平均值Ey的置信區(qū)間:y土t(n—2)?S?:1+?!?ayvnix三、多元線(xiàn)性回歸和非線(xiàn)性回歸:2_.a?多元線(xiàn)性回歸:y=b°+b1x1+_+bkxk?表示在其它變量不變的條件下,%增加1個(gè)單位時(shí),y平均變動(dòng)Q個(gè)單位.平方和分解公式:SST=SSE+SSR多重判定系數(shù)R2=SSR/SST=(多重相關(guān)系數(shù)R)2意義:因變量的總變差中,有R2(%)可以由回歸方程來(lái)解釋。估計(jì)標(biāo)準(zhǔn)誤差:$=I’TAy,n—k—1意義:用x],...,xk來(lái)預(yù)測(cè)因變量y,平均預(yù)測(cè)誤差為sy個(gè)單位。
?可線(xiàn)性化的非線(xiàn)性回歸:名稱(chēng)方程變量代換線(xiàn)性回歸雙曲函數(shù)y=a+b?+Xx’=十Xy=a+bx’對(duì)數(shù)函數(shù)y=a+blogxx’=logxy=a+bx’冪函數(shù)y=Axby’=logy,x’=logx,a=logAy’=a+bx多項(xiàng)式函數(shù)y=b0+b1x1+...+bkxkx]=x,x2=x2,…,xk=xky=b0+b1x1+...+bkxk第八章時(shí)間數(shù)列分析一、時(shí)間數(shù)列的分類(lèi)?絕對(duì)數(shù)時(shí)間數(shù)列時(shí)期數(shù)列一觀(guān)察值反映現(xiàn)象在一段時(shí)期內(nèi)的總量(可以直接相加)。時(shí)點(diǎn)數(shù)列一觀(guān)察值反映現(xiàn)象在某一時(shí)刻上的總量(通常不能相加)。?相對(duì)數(shù)時(shí)間數(shù)列:兩個(gè)同類(lèi)的絕對(duì)數(shù)的比形成的時(shí)間數(shù)列(無(wú)單位,通常用百分?jǐn)?shù)表示)。?平均數(shù)時(shí)間數(shù)列:兩個(gè)不同類(lèi)絕對(duì)數(shù)的比形成的時(shí)間數(shù)列(有單位)。二、時(shí)間數(shù)列的序時(shí)平均數(shù)現(xiàn)象在各個(gè)時(shí)間上的觀(guān)察值稱(chēng)為發(fā)展水平(反映現(xiàn)象的規(guī)模和發(fā)展的程度)。各個(gè)時(shí)期發(fā)展水平的平均數(shù)稱(chēng)為平均發(fā)展水平(序時(shí)平均數(shù))。序時(shí)平均數(shù)的計(jì)算方法:1)絕對(duì)數(shù)時(shí)期數(shù)列:算術(shù)平均法Y=頃++Yn絕對(duì)數(shù)時(shí)點(diǎn)數(shù)列:連續(xù)時(shí)點(diǎn):同上間斷時(shí)點(diǎn):加權(quán)平均法首末折半法Y=號(hào).匕+號(hào)T2+...+蛆九.J1間斷時(shí)點(diǎn):加權(quán)平均法首末折半法—T1+T2+...+T1(其中T1,T2,…,Tn-1是時(shí)間間隔長(zhǎng)度)時(shí)2=...%「^=專(zhuān)+%+...+七1+飛
n-12)相對(duì)數(shù),平均數(shù)時(shí)間數(shù)列:分開(kāi)平均再相比Y=皆b三、時(shí)間數(shù)列的水平(絕對(duì)數(shù))分析增長(zhǎng)量=報(bào)告期水平一基期水平;逐期增長(zhǎng)量=報(bào)告期水平一前期水平;累計(jì)增長(zhǎng)量=報(bào)告期水平一固定基期水平四、時(shí)間數(shù)列的速度(相對(duì)數(shù))分析、、報(bào)告期水平發(fā)展速度=基期水平增長(zhǎng)速度=發(fā)展速度-1報(bào)告期水平環(huán)比發(fā)展速度=前期水平;環(huán)比增長(zhǎng)速度=環(huán)比發(fā)展速度-1
定基發(fā)展速度=、、報(bào)告期水平發(fā)展速度=基期水平增長(zhǎng)速度=發(fā)展速度-1報(bào)告期水平環(huán)比發(fā)展速度=前期水平;環(huán)比增長(zhǎng)速度=環(huán)比發(fā)展速度-1定基發(fā)展速度=報(bào)告期水平
固定基期水平定基增長(zhǎng)速度=定基發(fā)展速度-1累積增長(zhǎng)量
觀(guān)察值個(gè)數(shù)-1平均發(fā)展速度=各環(huán)比發(fā)展速度的幾何平均數(shù);I水平法:Y=請(qǐng)Y0累計(jì)法:Y+Y2+...+Yn=Y0+Y1;+匕(查表)Y0水平法、一」I1=平均增長(zhǎng)速度=平均發(fā)展速度一1累計(jì)法’六、長(zhǎng)期趨勢(shì)分析及預(yù)測(cè):時(shí)間數(shù)列的構(gòu)成要素:T一長(zhǎng)期趨勢(shì);S一季節(jié)變動(dòng);C一循環(huán)變動(dòng);I一不規(guī)則變動(dòng)。時(shí)間數(shù)列的模型:乘法模型一Y=TXSXCXI;加法模型一Y=T+S+C+I;混合模型等。移動(dòng)平均法:適當(dāng)擴(kuò)大時(shí)間間隔,逐期移動(dòng),算出移動(dòng)平均趨勢(shì),消除短期波動(dòng)(偶數(shù)項(xiàng)要作兩次移動(dòng)平均);數(shù)學(xué)模型法線(xiàn)性模型(直線(xiàn)趨勢(shì))以時(shí)間t作自變量,發(fā)展水平Y(jié)t作因變量線(xiàn)性模型(直線(xiàn)趨勢(shì))以時(shí)間t作自變量,發(fā)展水平Y(jié)t作因變量,用最小二乘法得趨勢(shì)直線(xiàn)方程。a=Y—bttY=a+bt,
t非線(xiàn)性模型(曲線(xiàn)趨勢(shì))指數(shù)曲線(xiàn)Y=a?bt,
tb=l/1tY,tt(其中t用時(shí)間編碼)Gompertz曲線(xiàn)二次曲線(xiàn)Y=a+bt+ct2,
t=修正指數(shù)曲線(xiàn)Y=K+a?bt,tY=Kabt,
tLogistic曲線(xiàn)人Y=^—tK+a-bt七、季節(jié)變動(dòng)分析:?季節(jié)變動(dòng)的測(cè)定:1.按季(月)平均法;同季(月)平均數(shù)(消除隨機(jī)影響)一總季(月)平均數(shù)J全體數(shù)據(jù)的和)數(shù)據(jù)個(gè)數(shù)一季節(jié)指數(shù)C同季(月)平均數(shù)(%))總季(月)平均數(shù)’四季季節(jié)指數(shù)之和=400%七、季節(jié)變動(dòng)分析:?季節(jié)變動(dòng)的測(cè)定:1.按季(月)平均法;趨勢(shì)剔除法:先消除趨勢(shì)變動(dòng),再計(jì)算季節(jié)指數(shù)。四季(或全年)的移動(dòng)平均趨勢(shì)T一y=觀(guān)察值(%),消除趨勢(shì)變動(dòng);一將Y/T按季(月)重新排列,計(jì)算同季(月)平均數(shù)。?季節(jié)變動(dòng)的調(diào)整:算出Y/S(消除季節(jié)變動(dòng))
一根據(jù)Y的數(shù)據(jù),配合趨勢(shì)直線(xiàn)Y=a+bt,a=-bt,b=l_/lxx(其中t為時(shí)間編碼)一由趨勢(shì)直線(xiàn)方程,算出調(diào)整后的趨勢(shì)值。季節(jié)變動(dòng)和不規(guī)則變動(dòng)。八、循環(huán)變動(dòng)的測(cè)定:剩余法一從時(shí)間數(shù)列中消除趨勢(shì)變動(dòng)、消除季節(jié)變動(dòng),計(jì)算二一根據(jù)Y的數(shù)據(jù),配合趨勢(shì)直線(xiàn)Yf=a+bt,算出
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 文具企業(yè)競(jìng)爭(zhēng)力分析與提升策略考核試卷
- 搬家行業(yè)節(jié)能減排與綠色物流考核試卷
- 期貨市場(chǎng)交易風(fēng)險(xiǎn)監(jiān)測(cè)與預(yù)警考核試卷
- 小學(xué)生抗旱主題班會(huì)課件
- 客廳家具批發(fā)考核試卷
- 工業(yè)氣體批發(fā)考核試卷
- 2023視頻監(jiān)控及火災(zāi)報(bào)警系統(tǒng)施工作業(yè)指導(dǎo)書(shū)
- 上海建房合同范本
- 空調(diào)技術(shù)入股合同范本
- 汽修門(mén)頭合作合同范本
- 2025年山東青島自貿(mào)發(fā)展有限公司招聘筆試參考題庫(kù)含答案解析
- 液化氣罐的使用和安全防范
- 2025年中考物理總復(fù)習(xí)《內(nèi)能》專(zhuān)項(xiàng)測(cè)試卷含有答案
- 會(huì)計(jì)法律法規(guī)答題答案
- 2024年無(wú)錫工藝職業(yè)技術(shù)學(xué)院高職單招語(yǔ)文歷年參考題庫(kù)含答案解析
- 劇本殺范本完整版
- 北師大版一年級(jí)語(yǔ)文下冊(cè)第一單元元宵節(jié)《1元宵節(jié)》
- 2024年全球協(xié)作機(jī)器人產(chǎn)業(yè)發(fā)展白皮書(shū)
- 消防設(shè)施維保過(guò)程風(fēng)險(xiǎn)及保障措施
- 智能交通系統(tǒng)概論 課件全套 朱文興 第1-10章 緒論 - 城市交通子區(qū)控制系統(tǒng)
- 一鍵自動(dòng)生成spccpkmsappk數(shù)據(jù)工具
評(píng)論
0/150
提交評(píng)論