計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)知識(shí)梳理超全_第1頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)知識(shí)梳理超全_第2頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)知識(shí)梳理超全_第3頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)知識(shí)梳理超全_第4頁(yè)
計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)知識(shí)梳理超全_第5頁(yè)
已閱讀5頁(yè),還剩167頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)量經(jīng)濟(jì)學(xué)基礎(chǔ)知識(shí)梳理超全第1頁(yè),共172頁(yè),2023年,2月20日,星期二如果表示n個(gè)數(shù)的一個(gè)序列,那么我們就把這n個(gè)數(shù)的總和寫(xiě)為:第一節(jié)高數(shù)知識(shí)一、求和第2頁(yè),共172頁(yè),2023年,2月20日,星期二二、算術(shù)平均算術(shù)平均(arithmeticmean)就是我們?nèi)粘I钪惺褂玫钠胀ǖ钠骄鶖?shù),其定義如下式:第3頁(yè),共172頁(yè),2023年,2月20日,星期二三、加權(quán)算術(shù)平均加權(quán)平均是將各數(shù)據(jù)先乘以反映其重要性的權(quán)數(shù)(w),再求平均的方法。其定義如下式:第4頁(yè),共172頁(yè),2023年,2月20日,星期二四、變化率變化率的定義如下式:第5頁(yè),共172頁(yè),2023年,2月20日,星期二五、幾何平均幾何平均是n個(gè)數(shù)據(jù)連乘積的n次方根,其定義如下式:

第6頁(yè),共172頁(yè),2023年,2月20日,星期二六、線性函數(shù)

如果兩個(gè)變量x和y的關(guān)系是:我們便說(shuō)y是x的線性函數(shù):而和是描述這一關(guān)系的兩個(gè)參數(shù),為截距(Intercept),為斜率。一個(gè)線性函數(shù)的定義特征在于,y的改變量總是x的改變量的倍:其中,表示“改變量”。換句話說(shuō),x對(duì)y的邊際效應(yīng)是一個(gè)等于的常數(shù)。第7頁(yè),共172頁(yè),2023年,2月20日,星期二例:線性住房支出函數(shù)假定每月住房支出和每月收入的關(guān)系式是Housing=164+0.27income那么,每增加1元收入,就有0.27元用于住房支出,如果家庭收入增加200元,那么住房支出就增加0.27×200=54元。

機(jī)械解釋上述方程,即時(shí)一個(gè)沒(méi)有收入的家庭也有164元的住房支出,這當(dāng)然是不真實(shí)的。對(duì)低收入水平家庭,這個(gè)線性函數(shù)不能很好的描述housing和income之間的關(guān)系,這就是為什么我們最終還得用其他函數(shù)形式來(lái)描述這種關(guān)系。第8頁(yè),共172頁(yè),2023年,2月20日,星期二多于兩個(gè)變量的線性函數(shù):假定y與兩個(gè)變量和有一般形式的關(guān)系:由于這個(gè)函數(shù)的圖形是三維的,所以相當(dāng)難以想象,不過(guò)仍然是截距(即=0和=0時(shí)y的取值),且和都是特定斜率的度量。由方程(A.12)可知,給定和的改變量,y的改變量是若不改變,即,則有因此是關(guān)系式在坐標(biāo)上的斜率:第9頁(yè),共172頁(yè),2023年,2月20日,星期二因?yàn)樗攘苛吮3止潭〞r(shí),y如何隨而變,所以常把叫做對(duì)y的偏效應(yīng)。由于偏效應(yīng)涉及保持其他因素不變,所以它與其他條件不變(CeterisParibus)的概念有密切聯(lián)系,參數(shù)可作類似解釋:即若,則因此,是對(duì)y的偏效應(yīng)。線性函數(shù)的性質(zhì)第10頁(yè),共172頁(yè),2023年,2月20日,星期二假定大學(xué)生每月對(duì)CD的需求量與CD的價(jià)格和每個(gè)月的零花錢(qián)有如下關(guān)系:式中,price為每張碟的價(jià)格,income以元計(jì)算。需求曲線表示在保持收入(和其他因素)不變的情況下,quantity和price的關(guān)系。例:

對(duì)CD的需求第11頁(yè),共172頁(yè),2023年,2月20日,星期二線性函數(shù)的基本性質(zhì):不管x的初始值是什么,x每變化一個(gè)單位都導(dǎo)致y同樣的變化。x對(duì)y的邊際效應(yīng)是常數(shù),這對(duì)許多經(jīng)濟(jì)關(guān)系來(lái)說(shuō)多少有點(diǎn)不真實(shí)。例如,邊際報(bào)酬遞減這個(gè)重要的經(jīng)濟(jì)概念就不符合線性關(guān)系。

為了建立各種經(jīng)濟(jì)現(xiàn)象的模型,我們需要研究一些非線性函數(shù)。

非線性函數(shù)的特點(diǎn)是,給定x的變化,y的變化依賴于x的初始值。七、若干特殊函數(shù)第12頁(yè),共172頁(yè),2023年,2月20日,星期二1.二次函數(shù)

刻畫(huà)報(bào)酬遞減規(guī)律的一個(gè)簡(jiǎn)單方法,就是在線性關(guān)系中添加一個(gè)二次項(xiàng)。考慮方程式式中,,和為參數(shù)。當(dāng)時(shí),y和x之間的關(guān)系呈拋物線狀,并且可以證明,函數(shù)的最大值出現(xiàn)在第13頁(yè),共172頁(yè),2023年,2月20日,星期二1.二次函數(shù)例如,若y=6+8x-2x2。(從而=8且=-2),則y的最大值出現(xiàn)在x*=8/4=2處,并且這個(gè)最大值是6+8×2-2×(2)2=14。第14頁(yè),共172頁(yè),2023年,2月20日,星期二

對(duì)方程式意味著x對(duì)y的邊際效應(yīng)遞減,這從圖中清晰可見(jiàn),應(yīng)用微積分知識(shí),也可以通過(guò)求這個(gè)二次函數(shù)的一階導(dǎo)數(shù)得出。斜率=方程右端是此二次函數(shù)對(duì)x的導(dǎo)數(shù)。同樣,則意味著x對(duì)y的邊際效應(yīng)遞增,二次函數(shù)的圖形就呈U行,函數(shù)的最小值出現(xiàn)在點(diǎn)處。1.二次函數(shù)第15頁(yè),共172頁(yè),2023年,2月20日,星期二

在計(jì)量經(jīng)濟(jì)分析中起著最重要作用的非線性函數(shù)是自然對(duì)數(shù),或簡(jiǎn)稱為對(duì)數(shù)函數(shù),記為還有幾種不同符號(hào)可以表示自然對(duì)數(shù),最常用的是或。當(dāng)對(duì)數(shù)使用幾個(gè)不同的底數(shù)時(shí),這些不同的符號(hào)是有作用的。目前,只有自然對(duì)數(shù)最重要,因此我們都用表示自然對(duì)數(shù)。2.自然對(duì)數(shù)第16頁(yè),共172頁(yè),2023年,2月20日,星期二2.自然對(duì)數(shù)圖2.1.4y=log(x)的圖形第17頁(yè),共172頁(yè),2023年,2月20日,星期二2.自然對(duì)數(shù)

有如下性質(zhì):

1.log(x)可正可負(fù):log(x)<0,0<x<1;log(1)=0;log(x)>0,x>12.一些有用的性質(zhì)(牢記):

log(x1·x2)=log(x1)+log(x2),x1,x2>0log(x1/x2)=log(x1)-log(x2),x1,x2>0

log(xc)=c·log(x),x>0,c為任意實(shí)數(shù)第18頁(yè),共172頁(yè),2023年,2月20日,星期二2.自然對(duì)數(shù)

對(duì)數(shù)可用于計(jì)量經(jīng)濟(jì)學(xué)應(yīng)用中的各種近似計(jì)算。1.對(duì)于x≈0,有l(wèi)og(1+x)≈x。這個(gè)近似計(jì)算隨著x變大而越來(lái)越不精確。2.兩對(duì)數(shù)之差可用作比例變化的近似值。令x0和x1為兩個(gè)正數(shù),可以證明(利用微積分),對(duì)x的微小變化,有如果我們用100乘以上述方程,并記那么,對(duì)x的微小變化,便有“微小”的含義取決于具體情況。第19頁(yè),共172頁(yè),2023年,2月20日,星期二2.自然對(duì)數(shù)近似計(jì)算的作用:定義y對(duì)x的彈性(elasticity)為換言之,y對(duì)x的彈性就是當(dāng)x增加1%時(shí)y的百分?jǐn)?shù)變化。若y是x的線性函數(shù):,則這個(gè)彈性是它明顯取決于x的取值(彈性并非沿著需求曲線保持不變)。第20頁(yè),共172頁(yè),2023年,2月20日,星期二2.自然對(duì)數(shù)不僅在需求理論中,在許多應(yīng)用經(jīng)濟(jì)學(xué)領(lǐng)域,彈性都是非常重要的。在許多情況下,使用一個(gè)常彈性模型都很方便,而對(duì)數(shù)函數(shù)能幫助我們?cè)O(shè)定這樣的模型。如果我們對(duì)x和y都使用對(duì)數(shù)近似計(jì)算,彈性就近似等于因此,一個(gè)常彈性模型可近似描述為方程式中,為y對(duì)x的彈性(假定x,y>0)。這類模型在經(jīng)驗(yàn)經(jīng)濟(jì)學(xué)中扮演著重要角色。目前,式中的只是接近于彈性這一事實(shí)并不重要,可以忽略。第21頁(yè),共172頁(yè),2023年,2月20日,星期二例:常彈性需求函數(shù)若q代表需求量而p代表價(jià)格,并且二者關(guān)系為則需求的價(jià)格彈性是-1.25.初略地說(shuō),價(jià)格每增加1%,將導(dǎo)致需求量下降1.25%。第22頁(yè),共172頁(yè),2023年,2月20日,星期二2.自然對(duì)數(shù)在經(jīng)驗(yàn)研究工作中還經(jīng)常出現(xiàn)使用對(duì)數(shù)函數(shù)的其他可能性。假定y>0,且則,從而。由此可知,當(dāng)y和x有上述方程所示關(guān)系時(shí),第23頁(yè),共172頁(yè),2023年,2月20日,星期二例:對(duì)數(shù)工資方程假設(shè)小時(shí)工資與受教育年數(shù)有如下關(guān)系:根據(jù)前面所述方程,有由此可知,多受一年教育將使小時(shí)工資增加約9.4%。通常把%△y/△x稱為y對(duì)x的半彈性,半彈性表示當(dāng)x增加一個(gè)單位時(shí)y的百分?jǐn)?shù)變化。在上述模型中,半彈性是個(gè)常數(shù)并且等于,在上述例子中,我們可以方便的把工資和教育的關(guān)系概括為:多受一年教育——無(wú)論所受教育的起點(diǎn)如何——都將使工資提高約9.4%。這說(shuō)明了這類模型在經(jīng)濟(jì)學(xué)中的重要作用。第24頁(yè),共172頁(yè),2023年,2月20日,星期二2.自然對(duì)數(shù)另一種關(guān)系式在應(yīng)用經(jīng)濟(jì)學(xué)中也是有意義的:其中,x>0。若取y的變化,則有,這又可以寫(xiě)為。利用近似計(jì)算,可得當(dāng)x增加1%時(shí),y變化個(gè)單位。第25頁(yè),共172頁(yè),2023年,2月20日,星期二例:勞動(dòng)供給函數(shù)假定一個(gè)工人的勞動(dòng)供給可描述為式中,wage為小時(shí)工資而hours為每周工作小時(shí)數(shù),于是,由方程可得:換言之,工資每增加1%,將使每周工作小時(shí)增加約0.45或略小于半個(gè)小時(shí)。若工資增加10%,則或約四個(gè)半小時(shí)。注意:不宜對(duì)更大的工資百分?jǐn)?shù)變化應(yīng)用這個(gè)近似計(jì)算。第26頁(yè),共172頁(yè),2023年,2月20日,星期二考慮方程此處log(y)是x的線性函數(shù),但是怎樣寫(xiě)出y本身作為x的一個(gè)函數(shù)呢?指數(shù)函數(shù)給出了答案。我們把指數(shù)函數(shù)寫(xiě)為y=exp(x),有時(shí)也寫(xiě)為,但在我們課程中這個(gè)符號(hào)不常用。指數(shù)函數(shù)的兩個(gè)重要的數(shù)值是exp(0)=1和exp(1)=2.7183(取4位小數(shù))。

3.指數(shù)函數(shù)第27頁(yè),共172頁(yè),2023年,2月20日,星期二3.指數(shù)函數(shù)圖2.1.4y=exp(x)的圖形第28頁(yè),共172頁(yè),2023年,2月20日,星期二從上圖可以看出,exp(x)對(duì)任何x值都有定義,而且總大于零。指數(shù)函數(shù)在如下意義上是對(duì)數(shù)函數(shù)的反函數(shù):對(duì)所有x,都有l(wèi)og﹝exp(x)﹞=x,而對(duì)x>0,有exp﹝log(x)﹞=x。換言之,對(duì)數(shù)“解除了”指數(shù),反之亦然。對(duì)數(shù)函數(shù)和指數(shù)函數(shù)互為反函數(shù)。指數(shù)函數(shù)的兩個(gè)有用性質(zhì)是

exp(x1+x2)=exp(x1)exp(x2)和exp﹝c·log(x)﹞=xc3.指數(shù)函數(shù)第29頁(yè),共172頁(yè),2023年,2月20日,星期二記憶:經(jīng)濟(jì)學(xué)中常用的一些函數(shù)及其導(dǎo)數(shù)有

4.微分學(xué)第30頁(yè),共172頁(yè),2023年,2月20日,星期二當(dāng)y是多元函數(shù)時(shí),偏導(dǎo)數(shù)的概念便很重要。假定y=f(x1,x2),此時(shí)便有兩個(gè)偏導(dǎo)數(shù),一個(gè)關(guān)于x1,另一個(gè)關(guān)于x2。y對(duì)x1的偏導(dǎo)數(shù)記為,就是把x2看做常數(shù)時(shí)方程對(duì)x1的普通導(dǎo)數(shù)。類似的,就是固定x1時(shí)方程對(duì)x2的導(dǎo)數(shù)。若則這些偏導(dǎo)數(shù)可被視為經(jīng)濟(jì)學(xué)所定義的偏效應(yīng)。4.微分學(xué)第31頁(yè),共172頁(yè),2023年,2月20日,星期二把工資與受教育年數(shù)和工作經(jīng)驗(yàn)(以年計(jì))相聯(lián)系的一個(gè)函數(shù)是exper對(duì)wage的偏效應(yīng)就是上式對(duì)exper的偏導(dǎo)數(shù):這是增加一年工作經(jīng)驗(yàn)所導(dǎo)致工資的近似變化。注意這個(gè)偏效應(yīng)與exper和educ的初始水平都有關(guān)系。例如,一個(gè)從educ=12和exper=5開(kāi)始的工人,再增加一年工作經(jīng)驗(yàn),將使工資增加約0.19-0.08×5+0.007×12=0.234元。準(zhǔn)確的變化通過(guò)計(jì)算,結(jié)果是0.23,和近似計(jì)算結(jié)果非常接近。例:含交互項(xiàng)的工資方程第32頁(yè),共172頁(yè),2023年,2月20日,星期二一、隨機(jī)變量及其概率分布假設(shè)我們擲一枚錢(qián)幣10次,并計(jì)算出現(xiàn)正面的次數(shù),這就是一個(gè)實(shí)驗(yàn)的例子。一般地說(shuō),一個(gè)實(shí)驗(yàn)是指至少在理論上能夠無(wú)限重復(fù)下去的任何一種程序,并且它有一個(gè)定義完好的結(jié)果集。

一個(gè)隨機(jī)變量是指一個(gè)具有數(shù)值特征并由一個(gè)實(shí)驗(yàn)來(lái)決定其結(jié)果的變量。

第二節(jié)概率論基礎(chǔ)第33頁(yè),共172頁(yè),2023年,2月20日,星期二按照概率和統(tǒng)計(jì)學(xué)的慣例,我們一律用大寫(xiě)字母如常見(jiàn)的W,X,Y和Z表示隨機(jī)變量,而用相應(yīng)的小寫(xiě)字母w,x,y和z表示隨機(jī)變量的特定結(jié)果。例如,在擲幣實(shí)驗(yàn)中,令X為一枚錢(qián)幣投擲10次出現(xiàn)正面的次數(shù)。所以X并不是任何具體數(shù)值,但我們知道X將在集合中取一個(gè)值。比方說(shuō),一個(gè)特殊的結(jié)果是x=6。我們用下標(biāo)表示一系列隨機(jī)變量。例如,我們記錄隨機(jī)選擇的20個(gè)家庭去年的收入。可以用X1,X2,··,X20表示這些隨機(jī)變量,并用x1,x2,···,x20表示其特殊結(jié)果。一、隨機(jī)變量及其概率分布第34頁(yè),共172頁(yè),2023年,2月20日,星期二如定義所言,即使隨機(jī)變量描述的是一些定性事件,我們也總定義它的結(jié)果是數(shù)值。例如,考慮只擲一枚錢(qián)幣,其兩個(gè)結(jié)果是正面和反面。我們可以定義一個(gè)隨機(jī)變量如下:如果出現(xiàn)正面則X=1;如果出現(xiàn)反面則X=0。一個(gè)只能取0和1兩個(gè)值的隨機(jī)變量叫做貝努利隨機(jī)變量。X~Bernoulli(θ)(讀作“X服從一個(gè)成功概率為θ的貝努利分布):P(X=1)=θ,P(X=0)=1-θ一、隨機(jī)變量及其概率分布第35頁(yè),共172頁(yè),2023年,2月20日,星期二1.離散隨機(jī)變量

離散隨機(jī)變量是指一個(gè)只取有限個(gè)或可數(shù)的無(wú)限個(gè)數(shù)值的隨機(jī)變量?!翱蓴?shù)的無(wú)限個(gè)”:雖然隨機(jī)變量可取無(wú)限個(gè)值,但這些值可以和正整數(shù)一一對(duì)應(yīng)。貝努力隨機(jī)變量是離散隨機(jī)變量的最簡(jiǎn)單的例子。

一、隨機(jī)變量及其概率分布第36頁(yè),共172頁(yè),2023年,2月20日,星期二一個(gè)離散隨機(jī)變量要由它的全部可能值和取每個(gè)值的相應(yīng)概率來(lái)完整描述。如果X取k個(gè)可能值其概率p1,p2,···,pk被定義為

pj=P(X=xj),j=1,2,···

,k(讀作:“X取值xj的概率等于pj”。)其中,每個(gè)pj都在0-1之間,并且

p1+p2+···+pk=11.離散隨機(jī)變量第37頁(yè),共172頁(yè),2023年,2月20日,星期二X的概率密度函數(shù)(probabilitydensityfunction,pdf)概括了X的可能結(jié)果及其相應(yīng)概率的信息:

而且對(duì)某個(gè)j,凡是不等于xj的x都有f(x)=0。換言之,對(duì)任何實(shí)數(shù)x,f(x)都是隨機(jī)變量X取該特定值x的概率。當(dāng)我們?cè)O(shè)計(jì)多于一個(gè)隨機(jī)變量時(shí),有時(shí)需要給所考慮的pdf加一個(gè)下標(biāo):例如fx是X的pdf,fY是Y的pdf等等。1.離散隨機(jī)變量第38頁(yè),共172頁(yè),2023年,2月20日,星期二給定任一離散隨機(jī)變量的pdf,就不難計(jì)算關(guān)于該隨機(jī)變量的任何事件的概率。例如,設(shè)X為一名籃球運(yùn)動(dòng)員在兩次罰球中的命中次數(shù)。因此X的三個(gè)可能值是{0,1,2}。假定X的pdf是f(0)=0.20,f(1)=0.44和f(2)=0.36這三個(gè)概率之和必然為1.利用這個(gè)pdf,我們能算出該運(yùn)動(dòng)員至少投中一球的概率:P(X≥1)=P(X=1)+P(X=2)=0.44+0.36=0.80。X的pdf如下圖示:1.離散隨機(jī)變量第39頁(yè),共172頁(yè),2023年,2月20日,星期二2.連續(xù)隨機(jī)變量

連續(xù)隨機(jī)變量是指一個(gè)取任何實(shí)數(shù)的概率都為零的變量。這個(gè)定義有點(diǎn)違背直覺(jué),因?yàn)樵谌魏螒?yīng)用中,我們最終都會(huì)觀測(cè)到一個(gè)隨機(jī)變量取得的某種結(jié)果。這里的思想是,一個(gè)連續(xù)隨機(jī)變量X的可能取值如此之多,以致我們無(wú)法用正整數(shù)去計(jì)算,因而,邏輯上的一致性就要求X必須以零概率取每一個(gè)值。

一、隨機(jī)變量及其概率分布第40頁(yè),共172頁(yè),2023年,2月20日,星期二在計(jì)算連續(xù)隨機(jī)變量的概率時(shí),討論一個(gè)連續(xù)隨機(jī)變量取某特定值的概率是沒(méi)有意義的,最方便的是使用累積分布函數(shù)(cumulativedistributionfunction,cdf)。設(shè)X為任意隨機(jī)變量,它對(duì)任何實(shí)數(shù)x的cdf被定義為F(x)≡P(X≤x)對(duì)于一個(gè)連續(xù)隨機(jī)變量,F(xiàn)(x)就是概率密度函數(shù)f之下、點(diǎn)x以左的面積。因?yàn)镕(x)就是一個(gè)概率,所以它總是介于0-1之間。此外,若x1<x2,則P(X≤x1)≤P(X≤x2),即F(x1)≤F(x2)。這意味著cdf是x的一個(gè)增(至少非減)函數(shù)。2.連續(xù)隨機(jī)變量第41頁(yè),共172頁(yè),2023年,2月20日,星期二cdf有如下兩個(gè)對(duì)計(jì)算概率頗為有用的重要性質(zhì):

1.對(duì)任何數(shù)c,P(X>c)=1-F(c)

2.對(duì)任何兩個(gè)數(shù)a<b,P(a<X≤b)=F(b)-F(a)

在我們學(xué)習(xí)計(jì)量經(jīng)濟(jì)學(xué)時(shí),用cdf僅計(jì)算連續(xù)隨機(jī)變量的概率,所以在概率命題中的不等式是否嚴(yán)格不等便無(wú)所謂。也就是說(shuō),對(duì)于一個(gè)連續(xù)隨機(jī)變量X,有P(X≥c)=P(X>c)和P(a<X<b)=P(a≤X≤b)=P(a≤X<b)=P(a<X≤b)

對(duì)于概率和統(tǒng)計(jì)學(xué)中所有重要的連續(xù)分布,其累積分布函數(shù)已被制成表格,其中最為人們熟知的是正態(tài)分布。2.連續(xù)隨機(jī)變量第42頁(yè),共172頁(yè),2023年,2月20日,星期二1.聯(lián)合分布與獨(dú)立性令X和Y為離散隨機(jī)變量。那么(X,Y)的聯(lián)合分布由它們的聯(lián)合概率密度函數(shù)充分描述:上式右端是X=x和Y=y的概率。若我們知道X和Y的pdf,就容易得到它們的聯(lián)合pdf。具體而言,我們說(shuō)X和Y相互獨(dú)立的充要條件是,對(duì)所有x和y,都有式中,fX為X的pdf而fY為Y的pdf。二、聯(lián)合分布、條件分布與獨(dú)立性第43頁(yè),共172頁(yè),2023年,2月20日,星期二在多個(gè)隨機(jī)變量的背景中,fX和fY這兩個(gè)pdf常被稱為邊緣概率密度函數(shù),以區(qū)別于聯(lián)合pdf,即fX,Y。上述獨(dú)立性定義適用于離散和連續(xù)隨機(jī)變量。如果X和Y都是離散的,那么上式就等同于P(X=x,Y=y)=P(X=x)·P(Y=y)因?yàn)閮H需要知道P(X=x)與P(Y=y),所以計(jì)算聯(lián)合概率相當(dāng)容易。

若兩隨機(jī)變量不獨(dú)立,則稱它們是相依的。1.聯(lián)合分布與獨(dú)立性第44頁(yè),共172頁(yè),2023年,2月20日,星期二考慮籃球運(yùn)動(dòng)員的兩次罰球。令X為貝努利隨機(jī)變量:如果第一次命中它等于1,否則等于0。再令Y為貝努利隨機(jī)變量:如果第二次命中它等于1,否則等于0。假設(shè)該運(yùn)動(dòng)員每次罰球的命中率都是80%,即P(X=1)=P(Y=1)=0.8,問(wèn)兩罰兩中的概率是多少?例:罰球命中率若X和Y獨(dú)立,則很容易回答這個(gè)問(wèn)題:P(X=1,Y=1)=P(X=1)·P(Y=1)=0.8×0.8=0.64。因此,有64%的機(jī)會(huì)兩罰兩中。若第二次命中的機(jī)會(huì)依賴于第一次是否命中,即X和Y不獨(dú)立,這種簡(jiǎn)單計(jì)算便不再正確。第45頁(yè),共172頁(yè),2023年,2月20日,星期二隨機(jī)變量的獨(dú)立性是一個(gè)十分重要的概念。若X和Y獨(dú)立,則知道X的結(jié)果并不改變Y出現(xiàn)的各種可能結(jié)果的概率,反之亦然。

關(guān)于獨(dú)立性的一個(gè)有用結(jié)論是,若X和Y獨(dú)立,而我們對(duì)任意函數(shù)g和h定義兩個(gè)新的隨機(jī)變量g(X)和h(Y),則這些新的隨機(jī)變量也是獨(dú)立的。1.聯(lián)合分布與獨(dú)立性第46頁(yè),共172頁(yè),2023年,2月20日,星期二在計(jì)量經(jīng)濟(jì)學(xué)中,我們通常也對(duì)一個(gè)隨機(jī)變量(稱之為Y)與另外一個(gè)或多個(gè)隨機(jī)變量的聯(lián)系感興趣。暫且假設(shè)我們只對(duì)一個(gè)變量的影響感興趣,并稱之為X。關(guān)于X如何影響Y,我們所能知道的,都包含在給定X時(shí)Y的條件分布中,由條件概率密度函數(shù)概括的這一信息被定義為:對(duì)所有滿足的x值,都有2.條件分布第47頁(yè),共172頁(yè),2023年,2月20日,星期二當(dāng)X和Y都是離散變量時(shí),上式可解釋為其中,上式右端讀作“給定X=x時(shí)Y=y的概率”。當(dāng)Y是連續(xù)變量時(shí),由于前述理由,不能直接解釋為概率,但可以通過(guò)計(jì)算條件概率密度函數(shù)之下的面積來(lái)求出條件概率。條件分布的一個(gè)重要性質(zhì)是,若X和Y是獨(dú)立隨機(jī)變量,知道X取什么值無(wú)助于確定Y取各值的概率(反之亦然)。這就是說(shuō),且。2.條件分布第48頁(yè),共172頁(yè),2023年,2月20日,星期二再次考慮籃球員兩次投籃的例子。假定條件密度是這意味著球員第二次罰球命中的概率依賴于第一次罰球是否命中:如果第一次命中,則第二次命中的概率是0.85;如果第一次失誤,則第二次命中的概率是0.70。這就是說(shuō),X和Y不是獨(dú)立的,而是相關(guān)的。我們?nèi)糁繮(X=1),便可以計(jì)算P(X=1,Y=1)。假定第一次命中的概率是0.8,即P(X=1)=0.8,那么我們得到兩罰兩中的概率為P(X=1,Y=1)=P(Y=1|X=1)·P(X=1)=0.85×0.8=0.68例:罰球命中率第49頁(yè),共172頁(yè),2023年,2月20日,星期二多數(shù)情況下我們只對(duì)隨機(jī)變量分布的少數(shù)幾個(gè)性質(zhì)感興趣。這些特征可分成三類:集中趨勢(shì)的度量、變異或分散程度的度量以及兩個(gè)隨機(jī)變量之間關(guān)聯(lián)性的度量。1.集中趨勢(shì)的一種度量:期望值期望值是我們?cè)谟?jì)量經(jīng)濟(jì)學(xué)學(xué)習(xí)中遇到的最重要的概率性概念之一。設(shè)X為一隨機(jī)變量。它的期望值,記做E(X),就是對(duì)X的所有可能值的一個(gè)加權(quán)平均。權(quán)數(shù)由概率密度函數(shù)決定。有時(shí)期望值又被稱為總體均值,特別是在我們強(qiáng)調(diào)X代表了總體中的某個(gè)變量時(shí)。三、概率分布的特征第50頁(yè),共172頁(yè),2023年,2月20日,星期二當(dāng)X是取有限個(gè)值[比方說(shuō)]的離散隨機(jī)變量時(shí),期望值的準(zhǔn)確定義最為簡(jiǎn)單。令f(x)表示X的概率密度函數(shù),則X的期望值為加權(quán)平均:給定pdf在X的每個(gè)可能結(jié)果處的取值,這很容易計(jì)算。1.集中趨勢(shì)的一種度量:期望值第51頁(yè),共172頁(yè),2023年,2月20日,星期二假定X分別以概率1/8、1/2和3/8取值-1、0和2,則

E(X)=(-1)×1/8+0×(1/2)+2×(3/8)=5/8例:計(jì)算一個(gè)期望值第52頁(yè),共172頁(yè),2023年,2月20日,星期二例:假定X分別以概率1/8、1/2和3/8取值-1、0和2,則:

E(X)=(-1)×1/8+0×(1/2)+2×(3/8)=5/8

對(duì)于例2.2.3中的隨機(jī)變量,令g(X)=X2,便有E(X2)=(-1)2×1/8+(0)2×(1/2)+(2)2×(3/8)=13/8例:X2期望值第53頁(yè),共172頁(yè),2023年,2月20日,星期二性質(zhì)1.對(duì)任意常數(shù)c,E(c)=c。性質(zhì)2.對(duì)任意常數(shù)a和b,E(aX+b)=aE(X)+b。性質(zhì)3.如果是常數(shù)而是隨機(jī)變量,則或者,利用求和符號(hào),作為一個(gè)特例,取每個(gè)aj=1,我們有因此,和的期望值就是期望值之和。在數(shù)理統(tǒng)計(jì)的推導(dǎo)中常常用到這個(gè)性質(zhì)。2.期望值的性質(zhì)第54頁(yè),共172頁(yè),2023年,2月20日,星期二令X1,X2和X3分別為比薩店在某日出售的小、中、大比薩個(gè)數(shù)。這些隨機(jī)變量的期望值是E(X1)=25,E(X2)=57和E(X3)=40。小、中、大比薩的價(jià)格分別是5.50、7.60和9.15美元。因此,該日出售比薩的期望收入是E(5.5X1+7.60X2+9.15X3)=5.50E(X1)+7.60E(X2)+9.15E(X3)=5.5×25+7.60×57+9.15×40=936.70即936.70美元。這不過(guò)是期望收入,具體某一天的實(shí)際收入一般都會(huì)有所差異。例:求期望收入第55頁(yè),共172頁(yè),2023年,2月20日,星期二度量集中趨勢(shì)的另一種方法是用中位數(shù)。若X是連續(xù)的,則X的中位數(shù)(比方說(shuō)m)就是這樣一個(gè)數(shù):pdf之下的一半面積在m之左,另一半面積在m之右。當(dāng)X是離散的且取有奇數(shù)個(gè)值時(shí),中位數(shù)就是按大小排序后居中的一個(gè)數(shù)。若X可能取偶數(shù)個(gè)值,則實(shí)際上有兩個(gè)中位數(shù);有時(shí)取這兩個(gè)數(shù)的平均,便得到唯一的一個(gè)中位數(shù)。一般而言,中位數(shù),有時(shí)記為Med(X),和期望值E(X)是不相同的。作為集中趨勢(shì)的度量,不能說(shuō)哪一個(gè)比另一個(gè)更好,兩者都是度量X分布中心的有效方法。2.集中趨勢(shì)的另一種度量:中位數(shù)第56頁(yè),共172頁(yè),2023年,2月20日,星期二對(duì)一個(gè)隨機(jī)變量X,令μ=E(X)。為了度量X離其期望值多遠(yuǎn),有許多種方法,而最簡(jiǎn)單的一種代數(shù)方法就是用差異的平方(X-μ)2。(平方是為了消除距離度量的符號(hào),由此得到的正值符合我們對(duì)距離的直觀認(rèn)識(shí)。)因這一距離隨X的每一結(jié)果而變,故本身就是一個(gè)隨機(jī)變量。正如我們需要用一個(gè)數(shù)來(lái)總結(jié)X的集中趨勢(shì)那樣,我們也需要用一個(gè)數(shù)來(lái)告訴我們X平均而言離μ有多遠(yuǎn)。一個(gè)這樣的數(shù)就是方差(variance),它告訴我們X對(duì)其均值的期望距離:方差有時(shí)記為,由方程知方差必定非負(fù)。3.方差第57頁(yè),共172頁(yè),2023年,2月20日,星期二方差S2的定義如下式(樣本):

第58頁(yè),共172頁(yè),2023年,2月20日,星期二(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y為相互獨(dú)立的隨機(jī)變量,則Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(x)=E(x2)-(E(x))2方差的重要性質(zhì)第59頁(yè),共172頁(yè),2023年,2月20日,星期二一個(gè)隨機(jī)變量的標(biāo)準(zhǔn)差,記為sd(X),就是它的方差的正的平方根:sd(X)≡+。標(biāo)準(zhǔn)差有時(shí)又記做。標(biāo)準(zhǔn)差有兩個(gè)重要性質(zhì)可從方差的兩個(gè)性質(zhì)中直接推出。

性質(zhì)1.對(duì)任意常數(shù)c,sd(c)=0性質(zhì)2.對(duì)任意常數(shù)a和b,sd(aX+b)=|a|sd(X)特別是,若a>0,則sd(aX)=a·sd(X)。4.標(biāo)準(zhǔn)差第60頁(yè),共172頁(yè),2023年,2月20日,星期二標(biāo)準(zhǔn)差S的的定義分別如下式:第61頁(yè),共172頁(yè),2023年,2月20日,星期二作為方差和標(biāo)準(zhǔn)差性質(zhì)的一個(gè)應(yīng)用——而且本身也是有實(shí)際意義的一個(gè)問(wèn)題——假如給定隨機(jī)變量X,我們將它減去其均值μ并除以其標(biāo)準(zhǔn)差б,便定義了一個(gè)新的隨機(jī)變量

Z≡這又可寫(xiě)為Z=aX+b,其中a=(1/б)而b=-(μ/б)??傻茫篍(Z)=aE(X)+b=(μ/б)-(μ/б)=0Var(Z)=a2Var(X)=б2/б2=1因此,隨機(jī)變量Z的均值為零,方差(或者標(biāo)準(zhǔn)差)為1。這一過(guò)程有時(shí)被稱為將隨機(jī)變量X標(biāo)準(zhǔn)化,而Z則叫做標(biāo)準(zhǔn)化隨機(jī)變量。5.標(biāo)準(zhǔn)化一個(gè)隨機(jī)變量第62頁(yè),共172頁(yè),2023年,2月20日,星期二1.關(guān)聯(lián)度:協(xié)方差與相關(guān)雖然兩個(gè)隨機(jī)變量的聯(lián)合pdf完整地描述了它們之間的關(guān)系,但對(duì)于它們大致如何互相變動(dòng),仍需要一個(gè)扼要的度量手段。正如期望值和方差一樣,這類似于用一個(gè)數(shù)字來(lái)概括整個(gè)分布的某一方面,現(xiàn)在要概括的便是兩個(gè)隨機(jī)變量的聯(lián)合pdf。四、聯(lián)合與條件分布的特征第63頁(yè),共172頁(yè),2023年,2月20日,星期二兩個(gè)隨機(jī)變量X和Y之間的協(xié)方差(有時(shí)也叫做總體協(xié)方差,以強(qiáng)調(diào)它考慮的是描述一個(gè)總體的兩個(gè)隨機(jī)變量之間的關(guān)系),被定義為乘積(X-μX)(Y-μY)的期望值:有時(shí)又記為。若,則平均而言,當(dāng)X超過(guò)其均值時(shí),Y也超過(guò)其均值;若,則平均而言,當(dāng)X超過(guò)其均值時(shí),Y低于其均值。2.協(xié)方差第64頁(yè),共172頁(yè),2023年,2月20日,星期二計(jì)算的幾個(gè)有用表達(dá)式如下:協(xié)方差度量?jī)蓚€(gè)隨機(jī)變量之間的線性相依性。一個(gè)正的協(xié)方差表示兩隨機(jī)變量同向移動(dòng),而一個(gè)負(fù)的協(xié)方差則表示兩隨機(jī)變量反向移動(dòng)。2.協(xié)方差第65頁(yè),共172頁(yè),2023年,2月20日,星期二

性質(zhì)Cov.1:若X和Y相互獨(dú)立,則注意:此性質(zhì)的反命題并不成立:X和Y之間的協(xié)方差為零并不意味著X和Y相互獨(dú)立。

性質(zhì)Cov.2:對(duì)任意常數(shù)a1,b1,a2和b2,都有此性質(zhì)的重要含義在于,兩個(gè)隨機(jī)變量之間的協(xié)方差會(huì)因?yàn)閷烧呋蛘邇烧咧怀艘砸粋€(gè)常數(shù)倍而改變。這在經(jīng)濟(jì)學(xué)中之所以重要,是因?yàn)橹T如貨幣變量和通貨膨脹率等,都可使用不同的度量單位進(jìn)行定義而不改變其實(shí)質(zhì)。協(xié)方差的性質(zhì)第66頁(yè),共172頁(yè),2023年,2月20日,星期二取決于度量單位是協(xié)方差的一個(gè)缺陷。為克服這一缺陷,現(xiàn)引進(jìn)X和Y的相關(guān)系數(shù)(correlationcoefficient):X和Y的相關(guān)系數(shù)有時(shí)記做(而且有時(shí)稱總體相關(guān))。所謂相關(guān)系數(shù)是用來(lái)測(cè)量諸如收入與消費(fèi)、氣溫和啤酒的消費(fèi)量、匯率與牛肉的進(jìn)口價(jià)格等兩個(gè)變量X、Y之間的相互關(guān)系的大小和方向(正或負(fù))的系數(shù)。通過(guò)計(jì)算相關(guān)系數(shù),可以知道X與Y之間具有多大程度的線性(linear)關(guān)系。相關(guān)系數(shù)R的定義如下式:3.相關(guān)系數(shù)第67頁(yè),共172頁(yè),2023年,2月20日,星期二第68頁(yè),共172頁(yè),2023年,2月20日,星期二性質(zhì)Corr.1

-1≤Corr(X,Y)≤1若Corr(X,Y)=0,或等價(jià)地Cov(X,Y)=0,則X和Y之間就不存在線性關(guān)系,并稱X和Y為不相關(guān)隨機(jī)變量;否則X和Y就是相關(guān)的。Corr(X,Y)=1意味著一個(gè)完全的正線性關(guān)系,意思是說(shuō),我們對(duì)某常數(shù)a和某常數(shù)b>0可以寫(xiě)Y=a+bX。Corr(X,Y)=-1則意味著一個(gè)完全的負(fù)線性關(guān)系,使得對(duì)某個(gè)b<0有Y=a+bX。+1和-1兩個(gè)極端情形很少出現(xiàn)。接近1或-1的值便意味著較強(qiáng)的線性關(guān)系。3.相關(guān)系數(shù)第69頁(yè),共172頁(yè),2023年,2月20日,星期二性質(zhì)Corr.2

對(duì)于常數(shù)a1,b1,a2和b2,若a1a2>0,則Corr(a1X+b1,a2Y+b2)=Corr(X,Y)若a1a2<0,則Corr(a1X+b1,a2Y+b2)=-Corr(X,Y)作為一個(gè)例子,假定薪水和教育的總體相關(guān)系數(shù)是0.15.這一度量將與用美元、千美元或任何其他單位計(jì)算薪水都無(wú)關(guān);與用年、季、月或其他單位來(lái)衡量受教育時(shí)間也無(wú)關(guān)。3.相關(guān)系數(shù)第70頁(yè),共172頁(yè),2023年,2月20日,星期二一旦定義了協(xié)方差和相關(guān)系數(shù),就可以把方差的主要性質(zhì)完整地列出來(lái)。

性質(zhì)VAR.3對(duì)于常數(shù)a和b,有由此可知,若X和Y不相關(guān)(從而Cov(X,Y)=0)則和在后一情形中,要注意為什么差的方差是(兩個(gè))方差之和,而不是方差之差。4.隨機(jī)變量之和的方差第71頁(yè),共172頁(yè),2023年,2月20日,星期二例:令X為星期五夜晚某酒店賺到的利潤(rùn),而Y為接下來(lái)星期六夜晚賺到的利潤(rùn)。因此,Z=X+Y就是這兩個(gè)夜晚賺的利潤(rùn)。假定X和Y都有一個(gè)300美元的期望值和一個(gè)15美元的標(biāo)準(zhǔn)差(因而方差為225)。兩夜晚的期望利潤(rùn)將是E(Z)=E(X)+E(Y)=2×300=600美元。若X和Y獨(dú)立,從而它們也不相關(guān),則總利潤(rùn)的方差便是兩個(gè)方差之和:Var(Z)=Var(X)+Var(Y)=2×225=450。于是總利潤(rùn)的標(biāo)準(zhǔn)差是,約為21.21美元。4.隨機(jī)變量之和的方差第72頁(yè),共172頁(yè),2023年,2月20日,星期二從兩個(gè)變量推廣到多于兩個(gè)變量的情形。若隨機(jī)變量中的每一個(gè)變量與集合中其他任何一個(gè)變量都不相關(guān),我們便稱其為兩兩不相關(guān)的隨機(jī)變量。也就是說(shuō),對(duì)所有的,都有4.隨機(jī)變量之和的方差第73頁(yè),共172頁(yè),2023年,2月20日,星期二

性質(zhì)VAR.4若是兩兩不相關(guān)的隨機(jī)變量且是常數(shù),則用求和符號(hào)便可寫(xiě)為此性質(zhì)的一個(gè)特殊情形就是,對(duì)所有i都取ai=1.這時(shí),對(duì)兩兩不相關(guān)的隨機(jī)變量來(lái)說(shuō),和的方差就是方差之和:4.隨機(jī)變量之和的方差第74頁(yè),共172頁(yè),2023年,2月20日,星期二協(xié)方差和相關(guān)系數(shù)都是對(duì)兩個(gè)隨機(jī)變量之間線性關(guān)系的度量,并且對(duì)稱地處理兩者。在社會(huì)科學(xué)中更多的情況是,我們想用一個(gè)變量X去解釋另一個(gè)變量Y。而且,若Y和X有非線性形式的關(guān)系,則我們還希望知道這個(gè)形式。把Y叫做被解釋變量,而X叫做解釋變量。例如Y代表小時(shí)工資,而X代表受過(guò)正式教育的年數(shù)??梢酝ㄟ^(guò)給定X下Y的條件期望(有時(shí)又稱條件均值)來(lái)概括Y和X之間的關(guān)系。即,一旦我們知道X取了某個(gè)特定值x,就能根據(jù)X的這個(gè)結(jié)果算出Y的期望值。記作E(Y|X=x)或簡(jiǎn)記E(Y|x)。一般情形是,隨著x的改變,E(Y|x)也會(huì)改變。5.條件期望第75頁(yè),共172頁(yè),2023年,2月20日,星期二當(dāng)Y是取值為的離散隨機(jī)變量時(shí),則有當(dāng)Y連續(xù)時(shí),E(Y|x)便由對(duì)的y的所有可能值求積分來(lái)定義。好比無(wú)條件期望那樣,條件期望也是對(duì)Y所有可能值的一個(gè)加權(quán)平均,只不過(guò)這時(shí)的權(quán)數(shù)反映了X已取了某個(gè)特殊值的情形。因此,E(Y|x)是x的某個(gè)函數(shù),這個(gè)函數(shù)告訴我們Y的期望值如何隨x而變化。5.條件期望第76頁(yè),共172頁(yè),2023年,2月20日,星期二例令(X,Y)代表一個(gè)工人總體,其中X為受教育年數(shù),Y為小時(shí)工資。那么,E(Y|x=12)便是總體中所有受了12年教育(相當(dāng)于讀完高中)的工人的平均小時(shí)工資。E(Y|x=16)則是所有受過(guò)16年教育的工人的平均小時(shí)工資。跟蹤各種教育水平的期望值,便為工資和教育之間的關(guān)系提供了重要信息。5.條件期望第77頁(yè),共172頁(yè),2023年,2月20日,星期二原則上,可以在每個(gè)教育水平上求出小時(shí)工資的期望值,然后將這些期望值列表。由于教育的變化范圍很大——且可度量為一年的某個(gè)分?jǐn)?shù)——所以用這種方法顯示平均工資和受教育程度之間的關(guān)系很煩瑣。計(jì)量經(jīng)濟(jì)學(xué)中的典型方法是,設(shè)定一些足以刻畫(huà)這種關(guān)系的簡(jiǎn)單函數(shù)。作為一個(gè)例子,假設(shè)WAGE在給定EDUC時(shí)的期望值是如下線性函數(shù):E(WAGE|EDUC)=1.05+0.45EDUC假定這一關(guān)系對(duì)工人總體成立,則受8年和16年教育者的平均工資分別是多少?EDUC的系數(shù)如何解釋?5.條件期望第78頁(yè),共172頁(yè),2023年,2月20日,星期二條件期望的一些基本性質(zhì)對(duì)計(jì)量經(jīng)濟(jì)分析中的推導(dǎo)頗為有用。

性質(zhì)CE.1對(duì)任意函數(shù)c(X),都有E[c(X)|X]=c(X)。這意味著,當(dāng)我們計(jì)算以X為條件的期望值時(shí),X的函數(shù)可視為常數(shù)。例如E(X2|X)=X2。直觀上,這無(wú)非就是說(shuō),若知道了X,也就知道了X2。

6.條件期望的性質(zhì)第79頁(yè),共172頁(yè),2023年,2月20日,星期二性質(zhì)CE.2對(duì)任意函數(shù)a(X)和b(X),有

例如,我們能很容易地計(jì)算像XY+2X2這種函數(shù)的條件期望:6.條件期望的性質(zhì)第80頁(yè),共172頁(yè),2023年,2月20日,星期二性質(zhì)CE.3若X和Y相互獨(dú)立,則E(Y|X)=E(Y)。這個(gè)性質(zhì)意味著,若X和Y相互獨(dú)立,則Y在給定X時(shí)的期望值與X無(wú)關(guān),這是E(Y|X)必定等于Y的(無(wú)條件)期望。在工資與教育一例中,假設(shè)工資獨(dú)立于教育,則高中畢業(yè)生和大學(xué)畢業(yè)生的平均工資便相同。這幾乎無(wú)疑是錯(cuò)誤的,所以我們不能假定工資與教育是獨(dú)立的。6.條件期望的性質(zhì)第81頁(yè),共172頁(yè),2023年,2月20日,星期二性質(zhì)CE.4E[E(Y|X)]=E(Y)。這個(gè)性質(zhì)意味著,如果我們先把E(Y|X)看做X的函數(shù),再求這個(gè)函數(shù)的期望值,那么結(jié)果就是E(Y)。

例:令Y=WAGE和X=EDUC,其中WAGE為小時(shí)工資,而EDUC為受教育年數(shù)。假定給定EDUC下WAGE的期望值是E(WAGE|EDUC)=4+0.6EDUC,且E(EDUC)=11.5。則有E(WAGE)=E(4+0.6EDUC)=4+0.6E(EDUC)=10.90美元/小時(shí)。6.條件期望的性質(zhì)第82頁(yè),共172頁(yè),2023年,2月20日,星期二性質(zhì)CE.5若E(Y|X)=E(Y),則Cov(X,Y)=0(因而Corr(X,Y)=0。事實(shí)上X的每個(gè)函數(shù)都與Y不相關(guān)。該性質(zhì)的含義是,若對(duì)X的了解不能改變Y的期望值,則X和Y必然不相關(guān)。注意:此性質(zhì)的逆命題不成立。若X和Y不相關(guān),E(Y|X)仍然可能取決于X。6.條件期望的性質(zhì)第83頁(yè),共172頁(yè),2023年,2月20日,星期二1.正態(tài)分布正態(tài)分布和由它衍生出來(lái)的分布是統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)中最廣泛使用的分布。假定在總體上定義的隨機(jī)變量是正態(tài)分布,將使概率計(jì)算得以簡(jiǎn)化。五、正態(tài)及其有關(guān)分布圖正態(tài)概率密度函數(shù)的一般形狀第84頁(yè),共172頁(yè),2023年,2月20日,星期二當(dāng)連續(xù)的隨機(jī)變量的概率密度函數(shù)形式為時(shí),稱X的分布為正態(tài)分布,記為X~,密度函數(shù)中和是X的數(shù)學(xué)期望和方差。當(dāng)和時(shí),稱X服從標(biāo)準(zhǔn)正態(tài)分布,記為X~。第85頁(yè),共172頁(yè),2023年,2月20日,星期二表正態(tài)分布與標(biāo)準(zhǔn)正態(tài)分布第86頁(yè),共172頁(yè),2023年,2月20日,星期二x0x-x圖

標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)第87頁(yè),共172頁(yè),2023年,2月20日,星期二卡方分布(分布)是一種連續(xù)型隨機(jī)變量的概率分布。這個(gè)分布是由別奈梅(Benayme)、赫爾默特(Helmert)、皮爾遜分別于1858年、1876年、1900年所發(fā)現(xiàn),它是由正態(tài)分布派生出來(lái)的,主要用于列聯(lián)表檢驗(yàn)。1.卡方分布的數(shù)學(xué)形式設(shè)隨機(jī)變量X1,X2,…Xk,相互獨(dú)立,且都服從同一的正態(tài)分布N(μ,σ2)。那么,我們可以先把它們變?yōu)闃?biāo)準(zhǔn)正態(tài)變量Z1,Z2,…Zk,k個(gè)獨(dú)立標(biāo)準(zhǔn)正態(tài)變量的平方和被定義為卡方分布(分布)的隨機(jī)變量(讀作卡方)六、卡方分布第88頁(yè),共172頁(yè),2023年,2月20日,星期二X即所謂具有n個(gè)自由度(degreesoffreedom,df)的分布。自由度概念在我們計(jì)量經(jīng)濟(jì)學(xué)中扮演著重要角色。1.卡方分布的數(shù)學(xué)形式第89頁(yè),共172頁(yè),2023年,2月20日,星期二

t分布在經(jīng)典統(tǒng)計(jì)學(xué)和多元回歸分析中廣為應(yīng)用:它可以從一個(gè)標(biāo)準(zhǔn)正態(tài)和一個(gè)分布得到。設(shè)Z服從標(biāo)準(zhǔn)正態(tài)分布,而X服從自由度為n的分布。于是,隨機(jī)變量便服從自由度為n的t分布,記為T(mén)~tn。t分布的自由度得子分母中的隨機(jī)變量。t分布的特點(diǎn)是:左右對(duì)稱;當(dāng)n很大時(shí),非常接近正態(tài)分布。七、t分布第90頁(yè),共172頁(yè),2023年,2月20日,星期二如果隨機(jī)變量X服從標(biāo)準(zhǔn)正態(tài)分布N(0,1);隨機(jī)變量服從自由度為n、方差為2n的分布。并且X和相互獨(dú)立,則統(tǒng)計(jì)量:服從t分布(注:可以將分子理解為符合正態(tài)分布的參數(shù),分母看作其標(biāo)準(zhǔn)差。第91頁(yè),共172頁(yè),2023年,2月20日,星期二對(duì)于從標(biāo)準(zhǔn)正態(tài)分布中的總體中抽的容量為n的簡(jiǎn)單隨機(jī)樣本,其樣本均值與樣本標(biāo)準(zhǔn)差S構(gòu)成如下統(tǒng)計(jì)量。服從自由度為n-1的t分布,記為t~t(n-1)。注意:這里的分母是子樣標(biāo)準(zhǔn)差除以自由度,實(shí)際上是子樣均值的標(biāo)準(zhǔn)差!只有這樣才與分子保持一致性。分子被平均了,分母當(dāng)然也要平均!t分布在小樣本(n<30)統(tǒng)計(jì)推斷中占有重要的地位。第92頁(yè),共172頁(yè),2023年,2月20日,星期二T分布圖形:正態(tài)分布相當(dāng)于標(biāo)準(zhǔn)差為1的t分布。而t分布的標(biāo)準(zhǔn)差多小于1。因而出現(xiàn)這種尾部肥大的現(xiàn)象。正態(tài)分布T分布第93頁(yè),共172頁(yè),2023年,2月20日,星期二統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)中的另一重要分布是F分布。特別是在多元回歸分析中,要用F分布去檢驗(yàn)假設(shè)。為了定義F隨機(jī)變量,令

和,并假定X1和X2獨(dú)立,則隨機(jī)變量服從一個(gè)自由度為(k1,k2)的F分布。記為。F分布即是兩個(gè)消去自由度的分布變量的比值八、F分布第94頁(yè),共172頁(yè),2023年,2月20日,星期二如果隨機(jī)變量Xi(i=1,2,3,…n),Yi(i=1,2,3,…n)是相互獨(dú)立的,而且服從相同的正態(tài)分布。令第95頁(yè),共172頁(yè),2023年,2月20日,星期二則統(tǒng)計(jì)量服從第一自由度、第二自由度的F分布。記為F~F(,)注:F分布在方差分析中有著重要的作用。例如判斷兩個(gè)正態(tài)分布總體的方差是否有顯著差異,需要利用F分布。其分子與分母其實(shí)是兩個(gè)方差,在進(jìn)行回歸檢驗(yàn)時(shí)正是利用F函數(shù)這個(gè)特點(diǎn)。第96頁(yè),共172頁(yè),2023年,2月20日,星期二九、分位點(diǎn)0

z(1)標(biāo)準(zhǔn)正態(tài)分布雙側(cè)分位點(diǎn)第97頁(yè),共172頁(yè),2023年,2月20日,星期二

α

1-α

z0(1)標(biāo)準(zhǔn)正態(tài)分布單側(cè)分位點(diǎn)第98頁(yè),共172頁(yè),2023年,2月20日,星期二(2)雙側(cè)分位點(diǎn)xf(x)α/2α/21-α1-α/20第99頁(yè),共172頁(yè),2023年,2月20日,星期二xf(x)0(2)單側(cè)分位點(diǎn)第100頁(yè),共172頁(yè),2023年,2月20日,星期二(3)T分布的雙側(cè)分位點(diǎn)圖2-9T分布的雙側(cè)分位點(diǎn)xf(x)α/2α/21-α0第101頁(yè),共172頁(yè),2023年,2月20日,星期二(3)T分布的單側(cè)分位點(diǎn)xf(x)α0第102頁(yè),共172頁(yè),2023年,2月20日,星期二(4)F分布的雙側(cè)分位點(diǎn)xf(x)α/2α/201-α第103頁(yè),共172頁(yè),2023年,2月20日,星期二(4)F分布的單側(cè)分位點(diǎn)xf(x)0第104頁(yè),共172頁(yè),2023年,2月20日,星期二表

隨機(jī)變量分布的比較第105頁(yè),共172頁(yè),2023年,2月20日,星期二一、總體、參數(shù)與隨機(jī)抽樣統(tǒng)計(jì)推斷指利用來(lái)自總體的一個(gè)樣本而獲知該總體的某些情況。所謂總體,指任何定義完好的一組對(duì)象,這些對(duì)象可以是個(gè)人、企業(yè)、城市或其他諸多可能性。所謂“獲知”,可以有很多含義,但大致歸類為估計(jì)和假設(shè)檢驗(yàn)兩個(gè)范疇。

第三節(jié)數(shù)理統(tǒng)計(jì)基礎(chǔ)1、點(diǎn)估計(jì)——用某一數(shù)值作為參數(shù)的近似值2、區(qū)間估計(jì)——在要求的精度范圍內(nèi)指出參數(shù)可能的取值范圍第106頁(yè),共172頁(yè),2023年,2月20日,星期二例1:勞動(dòng)經(jīng)濟(jì)學(xué)家想了解中國(guó)全體就業(yè)成人的教育回報(bào),問(wèn)再多受一年教育,工作平均增加的百分?jǐn)?shù)是多少?要獲得中國(guó)全體就業(yè)人口的工資和教育信息既不現(xiàn)實(shí)又不經(jīng)濟(jì),但我們可以獲得總體中的一個(gè)子集的數(shù)據(jù)。利用收集到的這些數(shù)據(jù),一位勞動(dòng)經(jīng)濟(jì)學(xué)家也許能報(bào)告他對(duì)再受一年教育的回報(bào)的最好估計(jì)為7.5%。這就是點(diǎn)估計(jì)的一個(gè)例子。或者,他想報(bào)告一個(gè)范圍,比方說(shuō)“教育的回報(bào)在5.6%~9.4%之間”。這是區(qū)間估計(jì)的一個(gè)例子。一、總體、參數(shù)與隨機(jī)抽樣第107頁(yè),共172頁(yè),2023年,2月20日,星期二例2:城市經(jīng)濟(jì)學(xué)家想知道鄰里犯罪計(jì)劃是否與低犯罪率有關(guān)。經(jīng)過(guò)在取自總體的一個(gè)樣本中比較了安排和不安排監(jiān)控計(jì)劃的鄰里犯罪率,他可以得到兩結(jié)論之一:鄰里犯罪監(jiān)控計(jì)劃對(duì)犯罪率確實(shí)有影響,或者沒(méi)有影響。這個(gè)例子就屬于假設(shè)檢驗(yàn)的范疇。一、總體、參數(shù)與隨機(jī)抽樣第108頁(yè),共172頁(yè),2023年,2月20日,星期二統(tǒng)計(jì)推斷的第一步就是要明確所關(guān)注的總體,而且一定要使之非常具體。一旦明確了總體是什么,就可對(duì)所關(guān)注的總體關(guān)系建立或設(shè)定一個(gè)模型。這個(gè)模型將涉及一些概率分布或概率分布的特征,而這又取決于一些未知參數(shù)。所謂參數(shù),就是決定變量關(guān)系之方向和強(qiáng)度的一些常數(shù)。如勞動(dòng)經(jīng)濟(jì)學(xué)的例子中,所關(guān)注的參數(shù)是總體中的教育回報(bào)(率)。一、總體、參數(shù)與隨機(jī)抽樣第109頁(yè),共172頁(yè),2023年,2月20日,星期二令Y為一個(gè)隨機(jī)變量,代表著概率密度函數(shù)為f(y;θ)的一個(gè)總體,其中f(y;θ)依賴于單個(gè)參數(shù)θ

。假定除了θ值未知外,Y的概率密度函數(shù)pdf是已知的。不同的θ值將意味著不同的概率分布,因此我們對(duì)θ值感興趣。如果我們能得到該總體的某種樣本,就能了解θ的某些情況。最容易處理的抽樣方案是隨機(jī)抽樣。抽樣第110頁(yè),共172頁(yè),2023年,2月20日,星期二若Y1,Y2,···Yn是具有同一概率密度函數(shù)f(y;θ)的獨(dú)立隨機(jī)變量,我們稱為來(lái)自f(y;θ)的隨機(jī)樣本[或者說(shuō)來(lái)自由所代表的總體的一個(gè)隨機(jī)樣本]。

當(dāng)是來(lái)自密度f(wàn)(y;θ)的一個(gè)隨機(jī)樣本時(shí),我們又稱Yi是取自f(y;θ)的獨(dú)立同分布樣本。抽樣第111頁(yè),共172頁(yè),2023年,2月20日,星期二“有限樣本”一詞來(lái)自如下事實(shí):無(wú)論樣本容量如何,所討論的性質(zhì)對(duì)任何樣本容量都成立。有時(shí)把這些性質(zhì)叫做小樣本性質(zhì)。1.估計(jì)量與估計(jì)值給定一個(gè)隨機(jī)樣本,它來(lái)自一個(gè)取決于某未知參數(shù)θ的總體分布,θ的一個(gè)估計(jì)量就是賦予樣本每個(gè)可能結(jié)果一個(gè)θ值的法則。這個(gè)法則在進(jìn)行抽樣之前就已經(jīng)確立,具體而言,無(wú)論實(shí)際得到什么樣的數(shù)據(jù),這個(gè)法則都不會(huì)改變。二、估計(jì)量的有限樣本性質(zhì)第112頁(yè),共172頁(yè),2023年,2月20日,星期二作為估計(jì)量的一個(gè)例子,令為取自均值為μ的總體的一個(gè)隨機(jī)樣本。μ的一個(gè)估計(jì)量,就是這個(gè)隨機(jī)樣本的均值我們把叫做樣本均值,但是它不同于我們?cè)诖鷶?shù)知識(shí)中作為一個(gè)描述統(tǒng)計(jì)量而定義的一個(gè)數(shù)集的樣本均值。這里是一個(gè)估計(jì)量。給定隨機(jī)變量Y1,Y2,···Yn的任何一種結(jié)果,我們都用同樣的法則去估計(jì)μ:取其平均。對(duì)于實(shí)際結(jié)果,估計(jì)值就是該樣本的均值:1.估計(jì)量與估計(jì)值第113頁(yè),共172頁(yè),2023年,2月20日,星期二假設(shè)我們得到美國(guó)10個(gè)城市的如下失業(yè)率樣本:例:城市失業(yè)率城市失業(yè)率123456789105.16.49.24.17.58.32.63.55.87.5我們對(duì)美國(guó)平均城市失業(yè)率的估計(jì)值是。一般地說(shuō),每個(gè)樣本都有一個(gè)不同的估計(jì)值,但是求估計(jì)值的法則是一樣的,不管在樣本中出現(xiàn)的是哪些城市,也不管樣本中有多少個(gè)城市。第114頁(yè),共172頁(yè),2023年,2月20日,星期二一個(gè)估計(jì)量的第一個(gè)重要性質(zhì)就是關(guān)于它的期望值。

無(wú)偏估計(jì)量:若θ的估計(jì)量W對(duì)一切可能的θ值,都有E(W)=θ則W是一個(gè)無(wú)偏估計(jì)量(unbiasedestimator)2.無(wú)偏性第115頁(yè),共172頁(yè),2023年,2月20日,星期二一個(gè)估計(jì)量若是無(wú)偏的,則其概率分布的期望值就等于它所估計(jì)的參數(shù)。無(wú)偏性并不是說(shuō)我們用任何一個(gè)特定樣本得到的估計(jì)值等于θ,或者很接近θ。而是說(shuō),如果我們能夠從總體中抽取關(guān)于Y的無(wú)限多個(gè)樣本,并且每次都計(jì)算一個(gè)估計(jì)值,那么將所有隨機(jī)樣本的這些估計(jì)值平均起來(lái),我們便得到θ。由于在大多數(shù)應(yīng)用中,我們僅使用一個(gè)隨機(jī)樣本,所以這個(gè)思維實(shí)驗(yàn)有點(diǎn)抽象。2.無(wú)偏性第116頁(yè),共172頁(yè),2023年,2月20日,星期二一個(gè)估計(jì)量的無(wú)偏性和可能偏誤的大小取決于Y的分布和函數(shù)h。通常,Y的分布不是我們所能控制的(雖然我們常常為這個(gè)分布選擇一個(gè)模型):它由自然規(guī)律或社會(huì)力量來(lái)決定。但法則h的選擇則操縱在我們手中,我們?nèi)粝胍粋€(gè)無(wú)偏估計(jì)量,就必須對(duì)h作相應(yīng)的選擇??梢宰C明,有些估計(jì)量在一般情形下是無(wú)偏的。2.無(wú)偏性第117頁(yè),共172頁(yè),2023年,2月20日,星期二現(xiàn)在我們來(lái)證明,樣本均值是總體均值μ的一個(gè)無(wú)偏估計(jì)量,不管其背后的總體如何分布。2.無(wú)偏性第118頁(yè),共172頁(yè),2023年,2月20日,星期二令Wn為θ基于容量為n的一個(gè)樣本Y1,Y2,···Yn的一個(gè)估計(jì)量。那么,若隨著,對(duì)任一ξ>0,都有Wn便是θ的一個(gè)一致估計(jì)量。若Wn不是θ的一致估計(jì)量,則說(shuō)它是非一致性的。當(dāng)Wn是一致的,我們也說(shuō)θ是Wn的概率極限,記作plim(Wn)=θ。3.一致性第119頁(yè),共172頁(yè),2023年,2月20日,星期二和無(wú)偏性不一樣——無(wú)偏性是估計(jì)量在給定樣本容量下的一個(gè)特征——一致性描述了估計(jì)量的抽樣分布在樣本容量變大時(shí)的形態(tài)。為了強(qiáng)調(diào)這一點(diǎn),我們?cè)陉愂錾鲜龆x時(shí),就已對(duì)估計(jì)量加上了樣本容量n這個(gè)下標(biāo),并將在本節(jié)中始終保持這個(gè)慣常做法。前述方程意味著,Wn的分布越來(lái)越集中于θ,粗略地講,對(duì)于越來(lái)越大的樣本容量,Wn離開(kāi)θ很遠(yuǎn)的可能性越來(lái)越小。3.一致性第120頁(yè),共172頁(yè),2023年,2月20日,星期二無(wú)偏估計(jì)量不一定是一致的,但那些隨著樣本容量增大而方差縮減至零的無(wú)偏估計(jì)量是一致的。這個(gè)結(jié)果可規(guī)范陳述如下:若Wn是θ的無(wú)偏估計(jì)量,且隨著有Var(Wn)→0,則plim(Wn)=θ。利用全部數(shù)據(jù)樣本的無(wú)偏估計(jì)量,通常其方差都隨著樣本容量的擴(kuò)大而縮減至零,因而是一致的。一致估計(jì)量的一個(gè)很好的例子,是取自均值為μ和方差為的總體的一個(gè)隨機(jī)樣本的均值。該樣本均值對(duì)μ是無(wú)偏的。對(duì)于任何一個(gè)樣本容量n,我們都推導(dǎo)出。因此,隨著n→∞,有,所以,除了無(wú)偏外,還是μ的一致估計(jì)量。3.一致性第121頁(yè),共172頁(yè),2023年,2月20日,星期二

是μ的一致估計(jì)量,即使不存在Var(),這一結(jié)論也是成立的。這個(gè)經(jīng)典的結(jié)論被稱為大數(shù)定律。

大數(shù)定律令Y1,Y2,···Yn是均值為μ的獨(dú)立同分布隨機(jī)變量,于是plim()=μ大數(shù)定律意味著,如果我們對(duì)估計(jì)總體均值μ感興趣,通過(guò)選取一個(gè)足夠大的樣本,便能得到一個(gè)任意接近μ的數(shù)。這個(gè)基

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論