基本統(tǒng)計概念的回顧.ppt_第1頁
基本統(tǒng)計概念的回顧.ppt_第2頁
基本統(tǒng)計概念的回顧.ppt_第3頁
基本統(tǒng)計概念的回顧.ppt_第4頁
基本統(tǒng)計概念的回顧.ppt_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Econometrics計 量 經 濟 學,祝樹金 教 授 經濟與貿易學院 二零零七年十月,第二章 基本統(tǒng)計概念的回顧,主要內容,2.1 隨機試驗 2.2 隨機變量 2.3 總體的的數(shù)字特征 2.4 樣本分布的數(shù)字特征,2.1 隨機試驗,隨機試驗:指至少有兩個可能結果,但不確定哪一個結果會出現(xiàn)的過程 總體:隨機試驗所有可能的集合稱為總體(population)或樣本空間 例子:在一種雙回合游戲中,O1表示兩個回合全部獲勝;O2表示第一個回合獲勝,第二個回合失敗; O3表示第一個回合失敗,第二個回合獲勝; O4表示兩個回合全部失敗。樣本空間有4種結果組成:O1,O2 , O3 , O4 樣本點:

2、樣本空間(或總體)的每一元素,即每一種結果成為樣本點,2.1 隨機試驗,隨機試驗的可能結果組成的集合稱為事件,它是樣本空間的一個子集 如果兩個事件不能同時發(fā)生,則兩個事件稱為是互斥的 如果一個事件的發(fā)生與另一個事件的發(fā)生的可能性相同,則兩個事件稱為等可能性的。例如拋一枚硬幣,正面朝上和正面朝下是等可能出現(xiàn)的,2.2 隨機變量,一、概率分布 引入一個隨機變量來描述總體,隨機變量是取值具有隨機性的變量,按取值情況可以分為離散型和連續(xù)型兩種類型。 樣本就是n個相互獨立的與總體具有相同分布的隨機變量x1,xn,即n元隨機變量。隨機試驗的可能結果組成的集合稱為事件,它是樣本空間的一個子集 總體與樣本間的

3、聯(lián)系在于具有相同的分布,2.2 隨機變量,一、概率分布 引入一個隨機變量來描述總體,隨機變量是取值具有隨機性的變量,按取值情況可以分為離散型和連續(xù)型兩種類型。 樣本就是n個相互獨立的與總體具有相同分布的隨機變量x1,xn,即n元隨機變量。隨機試驗的可能結果組成的集合稱為事件,它是樣本空間的一個子集 總體與樣本間的聯(lián)系在于具有相同的分布,2.2 隨機變量,2、概率分布的含義和性質 隨機變量X取各個值的概率稱為X的概率分布。對一個離散型隨機變量X可以給出如下的概率分布: P(X=xi)=pi 對于隨機變量X(無論連續(xù)還是離散)可以確定實值函數(shù)F(x),稱為累積分布函數(shù)(cumulative dis

4、tribution function, CDF), 定義如下 F(x) P(Xx),概率分布性質 (1)取值范圍 (2)若A, B, C, 為互斥事件,則有 P(A+B+C+)P(A)P(B)P(C) 對于任意事件A, B則有P(A+B)P(A)P(B)P(AB) (3)若A, B, C, 為互斥事件,且為一完備事件組,則 P(A+B+C+)P(A)P(B)P(C)=1 (4)事件A, B, C, 稱為相互獨立的事件,如果有 P(ABC)P(A)P(B)P(C) (5)條件概率P(A|B)=P(AB)/P(B),2.2 隨機變量,舉例: 國際貿易專業(yè)有200名學生,其中男生120人,女生80人

5、,在這些學生中,40名男生和24名女生計劃選學計量經濟學,若隨機抽取一人,發(fā)現(xiàn)這個學生計劃選學計量經濟學。那么這個學生是男生的概率是多少?,3、連續(xù)型隨機變量的分布函數(shù)及概率密度函數(shù) 對于連續(xù)型隨機變量,取任何特定數(shù)值的概率為0。 設F(x)是隨機變量X的分布函數(shù),如果對任意實數(shù)x,存在非負函數(shù)f(x)0, 使 就稱f(x)0為X的概率密度函數(shù)(PDF),且f(x)具有性質,2.2 隨機變量,4、多元隨機變量的概率密度函數(shù) 聯(lián)合概率密度函數(shù)f(X, Y) =P(X=x, Y=y)。 邊緣概率密度函數(shù)f(X) , f(Y)。 條件概率密度函數(shù) f(X|Y) =P(X=x|Y=y) 條件概率密度函

6、數(shù)f(X|Y) f(X, Y) / f(Y) 獨立隨機變量 如果f(X, Y) f(X) f(Y),則稱變量X和Y是統(tǒng)計獨立的,2.2 隨機變量,5、隨機變量函數(shù) 設f(x)是定義在隨機變量X的一切可能取值集合上的函數(shù)。如果對于X的每一個可能值x,都有另一個隨機變量Y的取值y=f(x)與之相對應,則稱Y為X的函數(shù),記作Y=f(X)。 常常遇到一些隨機變量,它們的分布往往難于直接得到(例如滾珠體積的測量值等),但與它們有關系的另一個隨機變量的分布卻是容易知道的(如滾珠直徑的測量值)。因此,就要研究兩個隨機變量之間的關系,然后通過它們之間的關系,由已知隨機變量的分布求出與之有關的其它隨機變量的分布

7、。其間的關系通常用函數(shù)關系表示。,2.2 隨機變量,2.3 對總體的描述:隨機變量的數(shù)字特征,數(shù)學期望 方差 數(shù)學期望與方差的圖示 相關系數(shù)與協(xié)方差 偏度和峰度,一、數(shù)學期望(集中趨勢的度量),1、離散型隨機變量數(shù)學期望的定義 假定有一個離散型隨機變量X有n個不同的可能取值x1,x2,xn,而p1,p2,pn是X取這些值相應的概率,則這個隨機變量X的數(shù)學期望定義如下: 數(shù)學期望描述的是隨機變量(總體)的一般水平,2、連續(xù)型隨機變量數(shù)學期望的定義 若連續(xù)型隨機變量X有分布密度函數(shù)f(x) ,而積分 絕對收斂,則稱 為X的數(shù)學期望。 數(shù)學期望是最容易發(fā)生的,因而是可以期待的。它反映數(shù)據(jù)集中的趨勢。

8、,一、數(shù)學期望(集中趨勢的度量),求離散型隨機變量數(shù)學期望舉例 例1 甲、乙兩射手在一次射擊中的得分(分別用X、Y表示)的分布率如下: 試比較兩射手的射擊技術水平,并計算如果二人各發(fā)一彈,他們得分和的估計值。 解 EX=1 0.4+2 0.1+3 0.5=2.1 EY=1 0.1+2 0.6+3 0.3=2.2 E(X+Y)=2.1+2.2=4.3 因為EXEY,所以乙射手射擊水平比較高;二人各發(fā)一彈,得分總和最可能在4.3分左右(即4分或5分),例2:,3、數(shù)學期望的性質,(1)如果a、b為常數(shù),則 E(aX+b)=aE(X)+b (2)如果X、Y為兩個隨機變量,則 E(X+Y)=E(X)+

9、E(Y) (3)如果g(x)和f(x)分別為X的兩個函數(shù),則 Eg(X)+f(X)=Eg(X)+Ef(X) (4)如果X、Y是兩個獨立的隨機變量,則 E(X.Y)=E(X).E(Y),4、條件期望,條件期望值的定義: 對于連續(xù)型隨機變量的條件期望只要把加總符號換成積分號即可。,幾個重要性質 (1) 一般地 (2) (3)重期望律: 例:已知 , 則,二、方差:離散程度的度量,1、隨機變量方差的定義 若X為連續(xù)型隨機變量,則X的方差以下式給出 隨機變量的方差記作Var(x) 。方差的算術平方根叫標準差。,2、方差的性質,(1)Var(c )=0 (2)Var(c+x)=Var(x ) (3)Va

10、r(cx)=c2Var(x) (4)x, y為相互獨立的隨機變量,則 Var(x+y)=Var(x )+Var(y )=Var(x-y) (5)Var(a+bx)=b2Var(x) (6)a,b為常數(shù),x, y為兩個相互獨立的隨機變量,則Var(ax+by)=a2Var(x)+b2Var(y) (7)Var(x)=E(x2)-(E(x)2,例3 計算本節(jié)例1中甲射手的方差,例1 甲、乙兩射手在一次射擊中的得分(分別用X、Y表示)的分布率如下: E(X)=2.1 Var(X)=(- 1.1) 2 0.4+(-0.1)2 0.1+0.92 0.5 = 0.89,三、數(shù)學期望與方差的圖示,數(shù)學期望描

11、述隨機變量的集中程度,方差描述隨機變量的離散程度。 1 方差同、期望變大 2 期望同、方差變小,5,四、相關系數(shù)與協(xié)方差,協(xié)方差和相關系數(shù)都是描述兩個隨機變量相互關聯(lián)程度的參數(shù)或統(tǒng)計量。 方差是度量一個隨機變量變異程度的指標,而協(xié)方差則是度量兩個隨機變量協(xié)同變動的指標。要度量兩個隨機變量之間的關系,自然要考察兩個變量同時變化協(xié)同變化的情況,于是需要定義協(xié)方差。為了彌補協(xié)方差的不足受計量單位和數(shù)量尺度的影響,進而定義了度量兩個隨機變量呈線性相關程度的指標相關系數(shù)。,1、協(xié)方差,(1)定義:令隨機變量X和Y的期望分別為E(x),E(y),其協(xié)方差為: cov(X,Y)=E(X- E(x)(Y- E

12、(y) =E(XY)-E(X)E(Y) 一般而言,兩隨機變量的協(xié)方差可正可負。若兩變量同方向變動,則協(xié)方差為正,反之則為負。,(2) 協(xié)方差的性質 (1)若隨機變量X,Y相互獨立,則其協(xié)方差為0。 (2)cov(a+bX,c+dY)=bdcov(X,Y) (3)cov(X,X)=var(X) (3)相關變量的方差 若隨機變量不是獨立的,對于X+Y或X-Y的方差為: Var(X+Y)=var(X)+var(Y)+2cov(X,Y) Var(X-Y)=var(X)+var(Y)-2cov(X,Y) (4)若E(y|x)=E(y), 則Cov(x, y)=0 證明:利用重期望律,2、相關系數(shù),相關系

13、數(shù)用 表示,其計算公式為: 從公式可看出兩變量的相關系數(shù)等于它們的協(xié)方差與其各自的標準差之比。 相關系數(shù)介于-1到1之間。 相關系數(shù)的典型圖形見P31,五、偏度(skewness)與峰度(kurtosis),用于描述概率密度函數(shù)形狀的數(shù)字特征。偏度(S)是對稱性的度量;峰度(K)是概率密度函數(shù)高低或胖瘦的度量 1、偏度(S)的計算 對于正態(tài)分布,S0;若偏度S的值為正,則其概率密度為正偏或右偏,分布函數(shù)有長的右尾;若S的值為負,則其概率密度為負偏或左偏,分布函數(shù)有長的左尾。,2、峰度(K)的計算 概率密度函數(shù)的峰度K小于3時,成為低峰態(tài)的(胖的或短尾的),峰度K大于3時,稱為尖峰態(tài)的(瘦的或長

14、尾的)。對于正態(tài)分布的峰度為3,稱為常峰態(tài)的。,五、偏度(skewness)與峰度(kurtosis),2.4 樣本分布的數(shù)字特征,一、樣本平均數(shù) 總體的數(shù)字特征是一個固定不變的數(shù),稱為參數(shù);樣本的數(shù)字特征是隨抽樣而變化的數(shù),是一個隨機變量,稱為統(tǒng)計量。 樣本平均數(shù)的定義:對于樣本x1, x2, ,xn , 則樣本平均數(shù)為 樣本平均數(shù)用來描述樣本的平均水平(一般水平)。,二、樣本方差和標準差,1、定義:對于樣本x1, x2, ,xn , 則稱 分別為樣本方差和標準差。 2、樣本序列的正態(tài)性檢驗 偏度: 峰度:,檢驗樣本序列的正態(tài)性可采用Jarque-Bera檢驗。該檢驗的零假設是樣本服從正態(tài)分

15、布,檢驗統(tǒng)計量為 其中m是產生樣本序列時用到的估計系數(shù)的個數(shù)。在零假設下JB統(tǒng)計量服從2(2) 分布。若為原始數(shù)據(jù)則m=0; 若序列是通過模型估計得到的,m為估計的參數(shù)個數(shù)。,2、樣本序列的正態(tài)性檢驗,檢驗的顯著性水平 虛擬假設:H0;對立假設:H1。在假設檢驗中存在兩類錯誤:拒絕一個其實是真的虛擬假設,即第類錯誤;第 類錯誤是指H0實際上是錯誤的,但沒有拒絕它。 檢驗的顯著性水平(significance level)則定義為第類錯誤的概率,用符號表示為: P(拒絕H0 | H0) 即當H0為真時拒絕H0的概率。 檢驗的p值 檢驗的p值(p-value)是指給定t統(tǒng)計量的觀測值,能拒絕虛擬假設的最小顯著性水平。小的p值是拒絕虛擬假設的證據(jù)。,檢驗的顯著性水平和p值,例如:樣本序列取2002年我國30個地區(qū)以1978年為基衡量的實際人均GDP,采用Eviews軟件計算有 S2.32 K=8.53 JB=65.29 p-value=0.00 則2002年各地區(qū)人均GDP呈現(xiàn)右偏、尖峰的分布形態(tài),并且在99%的置信水平下拒絕零假設,即序列不服從正態(tài)分布。,三、樣本協(xié)方差,1、協(xié)方差的定義式 若樣本容量足夠大,可用pij=1/n, 那么,2協(xié)方差的缺陷,(1)協(xié)方差是一個有單位的指標。例如,Y為身高(厘米),X為體重(千克),那么它們的協(xié)方差COV(Y,X)的單位為厘米.千克

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論