![離散因變量和受限因變量模型演示文稿_第1頁](http://file4.renrendoc.com/view/855fa57ce6307a874f7e3ec1d7f70e95/855fa57ce6307a874f7e3ec1d7f70e951.gif)
![離散因變量和受限因變量模型演示文稿_第2頁](http://file4.renrendoc.com/view/855fa57ce6307a874f7e3ec1d7f70e95/855fa57ce6307a874f7e3ec1d7f70e952.gif)
![離散因變量和受限因變量模型演示文稿_第3頁](http://file4.renrendoc.com/view/855fa57ce6307a874f7e3ec1d7f70e95/855fa57ce6307a874f7e3ec1d7f70e953.gif)
![離散因變量和受限因變量模型演示文稿_第4頁](http://file4.renrendoc.com/view/855fa57ce6307a874f7e3ec1d7f70e95/855fa57ce6307a874f7e3ec1d7f70e954.gif)
![離散因變量和受限因變量模型演示文稿_第5頁](http://file4.renrendoc.com/view/855fa57ce6307a874f7e3ec1d7f70e95/855fa57ce6307a874f7e3ec1d7f70e955.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
離散因變量和受限因變量模型演示文稿1第一頁,共四十三頁。2(優(yōu)選)離散因變量和受限因變量模型第二頁,共四十三頁。§7.1二元選擇模型
在離散選擇模型中,最簡單的情形是在兩個可供選擇的方案中選擇其一,此時被解釋變量只取兩個值,稱為二元選擇模型(binarychoicemodel)。在實際生活中,我們經(jīng)常遇到二元選擇問題。例如,在買車與不買車的選擇中,買車記為1,不買記為0。是否買車與兩類因素有關(guān)系:一類是車本身所具有的屬性,如價格、型號等;另一類是決策者所具有的屬性如收入水平、對車的偏好程度等。如果我們要研究是否買車與收入之間的關(guān)系,即研究具有某一收入水平的個體買車的可能性。因此,二元選擇模型的目的是研究具有給定特征的個體作某種而不作另一種選擇的概率。
第三頁,共四十三頁。
為了深刻地理解二元選擇模型,首先從最簡單的線性概率模型開始討論。線性概率模型的回歸形式為:
()其中:N是樣本容量;k是解釋變量個數(shù);xj為第j個個體特征的取值。例如,x1表示收入;x2表示汽車的價格;x3表示消費者的偏好等。設(shè)yi表示取值為0和1的離散型隨機變量:
式()中ui為相互獨立且均值為0的隨機擾動項。
線性概率模型及二元選擇模型的形式
第四頁,共四十三頁。令pi=P(yi=1),那么
1-pi=P(yi=0),于是()又因為E(ui)
=0,所以E(yi)
=xi,xi=(x1i,
x2i,…,xki),
=(1
,
2,…,k),從而有下面的等式:()
第五頁,共四十三頁。式(7.1.3)只有當(dāng)xi的取值在(0,1)之間時才成立,否則就會產(chǎn)生矛盾,而在實際應(yīng)用時很可能超出這個范圍。因此,線性概率模型常常寫成下面的形式:
(7.1.4)此時就可以把因變量看成是一個概率。那么擾動項的方差為:
(7.1.5)或
(7.1.6)
第六頁,共四十三頁。
由此可以看出,誤差項具有異方差性。異方差性使得參數(shù)估計不再是有效的,修正異方差的一個方法就是使用加權(quán)最小二乘估計。但是加權(quán)最小二乘法無法保證預(yù)測值?在(0,1)之內(nèi),這是線性概率模型一個嚴(yán)重的弱點。由于上述問題,我們考慮對線性概率模型進(jìn)行一些變換,由此得到下面要討論的模型。假設(shè)有一個未被觀察到的潛在變量yi*,它與xi之間具有線性關(guān)系,即
(7.1.7)其中:ui*是擾動項。yi和yi*的關(guān)系如下:
(7.1.8)第七頁,共四十三頁。
yi*大于臨界值0時,yi=1;小于等于0時,yi=0。這里把臨界值選為0,但事實上只要xi包含有常數(shù)項,臨界值的選擇就是無關(guān)的,所以不妨設(shè)為0。這樣
(7.1.9)其中:F是ui*的分布函數(shù),要求它是一個連續(xù)函數(shù),并且是單調(diào)遞增的。因此,原始的回歸模型可以看成如下的一個回歸模型:
(7.1.10)即yi關(guān)于它的條件均值的一個回歸。第八頁,共四十三頁。
分布函數(shù)的類型決定了二元選擇模型的類型,根據(jù)分布函數(shù)F的不同,二元選擇模型可以有不同的類型,常用的二元選擇模型如表7.1所示:
表7.1常用的二元選擇模型
ui*對應(yīng)的分布分布函數(shù)F相應(yīng)的二元選擇模型標(biāo)準(zhǔn)正態(tài)分布Probit模型邏輯分布Logit模型極值分布Extreme模型第九頁,共四十三頁。二元選擇模型一般采用極大似然估計。似然函數(shù)為
(7.1.11)即
(7.1.12)
對數(shù)似然函數(shù)為
(7.1.13)7.1.2二元選擇模型的估計問題第十頁,共四十三頁。對數(shù)似然函數(shù)的一階條件為
(7.1.14)其中:fi表示概率密度函數(shù)。那么如果已知分布函數(shù)和密度函數(shù)的表達(dá)式及樣本值,求解該方程組,就可以得到參數(shù)的極大似然估計量。例如,將上述3種分布函數(shù)和密度函數(shù)代入式(7.1.14)就可以得到3種模型的參數(shù)極大似然估計。但是式(7.1.14)通常是非線性的,需用迭代法進(jìn)行求解。二元選擇模型中估計的系數(shù)不能被解釋成對因變量的邊際影響,只能從符號上判斷。如果為正,表明解釋變量越大,因變量取1的概率越大;反之,如果系數(shù)為負(fù),表明相應(yīng)的概率將越小。
第十一頁,共四十三頁。
例7.1二元選擇模型實例
考慮Greene給出的斯佩克特和馬澤歐(1980)的例子,在例子中分析了某種教學(xué)方法對成績的有效性。因變量(GRADE)代表在接受新教學(xué)方法后成績是否改善,如果改善為1,未改善為0。解釋變量(PSI)代表是否接受新教學(xué)方法,如果接受為1,不接受為0。還有對新教學(xué)方法量度的其他解釋變量:平均分?jǐn)?shù)(GPA)和測驗得分(TUCE),來分析新的教學(xué)方法的效果。第十二頁,共四十三頁。
(1)模型的估計
估計二元選擇模型,從EquationSpecification對話框中,選擇Binary估計方法。在二元模型的設(shè)定中分為兩部分。首先,在EquationSpecification區(qū)域中,鍵入二元因變量的名字,隨后鍵入一列回歸項。由于二元變量估計只支持列表形式的設(shè)定,所以不能輸入公式。然后,在Binaryestimationmethod中選擇Probit,Logit,Extremevalue選擇三種估計方法的一種。以例7.1為例,對話框如圖7.2所示。第十三頁,共四十三頁。圖7.2二元選擇模型估計對話框第十四頁,共四十三頁。
例7.1的估計輸出結(jié)果如下:第十五頁,共四十三頁。
參數(shù)估計結(jié)果的上半部分包含與一般的回歸結(jié)果類似的基本信息,標(biāo)題包含關(guān)于估計方法(ML表示極大似然估計)和估計中所使用的樣本的基本信息,也包括達(dá)到收斂要求的迭代次數(shù)。和計算系數(shù)協(xié)方差矩陣所使用方法的信息。在其下面顯示的是系數(shù)的估計、漸近的標(biāo)準(zhǔn)誤差、z-統(tǒng)計量和相應(yīng)的概率值及各種有關(guān)統(tǒng)計量。第十六頁,共四十三頁。在回歸結(jié)果中還提供幾種似然函數(shù):①loglikelihood是對數(shù)似然函數(shù)的最大值L(b),b是未知參數(shù)的估計值。②Avg.loglikelihood是用觀察值的個數(shù)N去除以對數(shù)似然函數(shù)L(b),即對數(shù)似然函數(shù)的平均值。③Restr.Loglikelihood是除了常數(shù)以外所有系數(shù)被限制為0時的極大似然函數(shù)L(b)。④LR統(tǒng)計量檢驗除了常數(shù)以外所有系數(shù)都是0的假設(shè),這類似于線性回歸模型中的統(tǒng)計量,測試模型整體的顯著性。圓括號中的數(shù)字表示自由度,它是該測試下約束變量的個數(shù)。第十七頁,共四十三頁。⑤Probability(LRstat)是LR檢驗統(tǒng)計量的P值。在零假設(shè)下,LR檢驗統(tǒng)計量近似服從于自由度等于檢驗下約束變量的個數(shù)的2分布。⑥McFaddenR-squared是計算似然比率指標(biāo),正像它的名字所表示的,它同線性回歸模型中的R2是類似的。它具有總是介于0和1之間的性質(zhì)。第十八頁,共四十三頁。
利用式(7.1.10),分布函數(shù)采用標(biāo)準(zhǔn)正態(tài)分布,即Probit模型,例7.1計算結(jié)果為(7.1.15)z=(-2.93)(2.34)(0.62)(2.39)
利用式(7.1.15)的Probit模型的系數(shù),本例按如下公式給出新教學(xué)法對學(xué)習(xí)成績影響的概率,當(dāng)PSI=0時:
(7.1.19)
當(dāng)PSI=1時:
(7.1.20)
式中測驗得分TUCE取均值(21.938),平均分?jǐn)?shù)GPA是按從小到大重新排序后的序列。
第十九頁,共四十三頁。圖7.1新教學(xué)法對學(xué)習(xí)成績影響的概率第二十頁,共四十三頁。
(2)估計選項
因為我們是用迭代法求極大似然函數(shù)的最大值,所以O(shè)ption選項可以從估計選項中設(shè)定估計算法與迭代限制。單擊Options按鈕,打開對話框如圖7.3所示。圖7.3Options對話框第二十一頁,共四十三頁。
(4)產(chǎn)生殘差序列
通過Procs/MakeReidualSeries選項產(chǎn)生下面三種殘差類型中的一種類型。表7.6殘差類型普通殘差(Ordinary)標(biāo)準(zhǔn)化殘差(Standardized)廣義殘差(Generalized)第二十二頁,共四十三頁。
§7.2排序選擇模型當(dāng)因變量不止是兩種選擇時,就要用到多元選擇模型(multiplechoicemodel)。多元離散選擇問題普遍存在于經(jīng)濟生活中。例如:
(1)一個人面臨多種職業(yè)選擇,將可供選擇的職業(yè)排隊,用0,1,2,3表示。影響選擇的因素有不同職業(yè)的收入、發(fā)展前景和個人偏好等;
(2)同一種商品,不同的消費者對其偏好不同。例如,十分喜歡、一般喜歡、無所謂、一般厭惡和十分厭惡,分別用0,1,2,3,4表示。而影響消費者偏好的因素有商品的價格、性能、收入及對商品的需求程度等;
(3)一個人選擇上班時所采用的方式——自己開車,乘出租車,乘公共汽車,還是騎自行車。第二十三頁,共四十三頁。上述3個例子代表了多元選擇問題的不同類型。前兩個例子屬于排序選擇問題,所謂“排序”是指在各個選擇項之間有一定的順序或級別種類。而第3個例子只是同一個決策者面臨多種選擇,多種選擇之間沒有排序,不屬于排序選擇問題。與一般的多元選擇模型不同,排序選擇問題需要建立排序選擇模型(orderedchoicemodel)。下面我們主要介紹排序選擇模型。
第二十四頁,共四十三頁。與二元選擇模型類似,設(shè)有一個潛在變量yi*,是不可觀測的,可觀測的是yi
,設(shè)yi有0,1,2,…,M等M+1個取值。()其中:ui*是獨立同分布的隨機變量,yi可以通過yi*按下式得到
()
第二十五頁,共四十三頁。設(shè)ui*的分布函數(shù)為F(x),可以得到如下的概率
()和二元選擇模型一樣,根據(jù)分布函數(shù)F(x)的不同可以有3種常見的模型:Probit模型、Logit模型和Extremevalue模型。仍然采用極大似然方法估計參數(shù),需要指出的是,M個臨界值c1,c2,…,cM事先也是不確定的,所以也作為參數(shù)和回歸系數(shù)一起估計。第二十六頁,共四十三頁?!?.3受限因變量模型
現(xiàn)實的經(jīng)濟生活中,有時會遇到這樣的問題,因變量是連續(xù)的,但是受到某種限制,也就是說所得到的因變量的觀測值來源于總體的一個受限制的子集,并不能完全反映總體的實際特征,那么通過這樣的樣本觀測值來推斷總體的特征就需要建立受限因變量模型(limiteddependentvariablemodels)。本節(jié)研究兩類受限因變量模型,即審查回歸模型(censoredregressionmodels)和截斷回歸模型(truncatedregressionmodels)。
第二十七頁,共四十三頁。
7.3.1審查回歸模型
1.模型的形式考慮下面的潛在因變量回歸模型
(7.3.1)其中:是比例系數(shù);y*是潛在變量。被觀察的數(shù)據(jù)y與潛在變量y*的關(guān)系如下:
(7.3.2)第二十八頁,共四十三頁。換句話說,yi*的所有負(fù)值被定義為0值。我們稱這些數(shù)據(jù)在0處進(jìn)行了左截?。▽彶椋╨eftcensored)。而不是把觀測不到的yi*的所有負(fù)值簡單地從樣本中除掉。此模型稱為規(guī)范的審查回歸模型,也稱為Tobit模型。更一般地,可以在任意有限點的左邊和右邊截取(審查),即
(7.3.3)其中:,代表截?。▽彶椋c,是常數(shù)值。如果沒有左截取(審查)點,可以設(shè)為。如果沒有右截取(審查)點,可以設(shè)為。規(guī)范的Tobit模型是具有和的一個特例。
第二十九頁,共四十三頁。
2.審查回歸模型的極大似然估計
與前邊介紹的幾個模型類似,可以采用極大似然法估計審查回歸模型的參數(shù),對數(shù)似然函數(shù)為
(7.3.4)求式(7.3.4)的最大值即可得參數(shù)
,
的估計。這里f,F分別是u的密度函數(shù)和分布函數(shù)。第三十頁,共四十三頁。特別地,對于Tobit模型,設(shè)u~N(0,1),這時對數(shù)似然函數(shù)為
(7.3.5)式(7.3.5)是由兩部分組成的。第一部分對應(yīng)沒有限制的觀測值,與經(jīng)典回歸的表達(dá)式是相同的;第二部分對應(yīng)于受限制的觀測值。因此,此似然函數(shù)是離散分布與連續(xù)分布的混合。將似然函數(shù)最大化就可以得到參數(shù)的極大似然估計。第三十一頁,共四十三頁。
例7.3審查模型的實例
本例研究已婚婦女工作時間問題,共有50個調(diào)查數(shù)據(jù),來自于美國國勢調(diào)查局[U.S.BureauoftheCensus(CurrentPopulationSurvey,1993)],其中y表示已婚婦女工作時間,x1~x4分別表示已婚婦女的未成年子女個數(shù)、年齡、受教育的年限和丈夫的收入。只要已婚婦女沒有提供工作時間,就將工作時間作零對待,符合審查回歸模型的特點。
第三十二頁,共四十三頁。
7.3.2截斷回歸模型
截斷問題,形象地說就是掐頭或者去尾。即在很多實際問題中,不能從全部個體中抽取因變量的樣本觀測值,而只能從大于或小于某個數(shù)的范圍內(nèi)抽取樣本的觀測值,此時需要建立截斷因變量模型。例如,在研究與收入有關(guān)的問題時,收入作為被解釋變量。從理論上講,收入應(yīng)該是從零到正無窮,但實際中由于各種客觀條件的限制,只能獲得處在某個范圍內(nèi)的樣本觀測值。這就是一個截斷問題。截斷回歸模型的形式如下:()其中:yi只有在時才能取得樣本觀測值,,為兩個常數(shù)。對于截斷回歸模型,仍然可以采用極大似然法估計模型的參數(shù),只不過此時極大似然估計的密度函數(shù)是條件密度。
第三十三頁,共四十三頁。
7.5.3估計審查回歸模型
1.模型的估計
為估計審查模型,打開Equation對話框,從EquationSpecification對話框所列估計方法中選擇CENSORED估計方法。在EquationSpecification區(qū)域,輸入被審查的因變量的名字及一系列回歸項。審查回歸模型的估計只支持列表形式的設(shè)定(圖7.5)。
第三十四頁,共四十三頁。
圖7.5審查模型的估計對話框第三十五頁,共四十三頁。
在三種分布中選擇一種作為誤差項的分布,EViews提供三種可供選擇的分布(表7.8)。
表7.8誤差項的分布
StandardnormalLogisticExtremevalue
(歐拉常數(shù)
)
還需要在DependentVariableCensoringPoints一欄提供關(guān)于被檢查因變量的臨界點的信息。臨界點可以是數(shù)值、表達(dá)式、序列,還可以是空的。有兩種情況需要考慮:①臨界點對于所有個體都是已知的;②臨界點只對具有審查觀察值的個體是已知的。
第三十六頁,共四十三頁。
(1)臨界點對所有個體都已知
按照要求在編輯欄的左編輯區(qū)(Left)和右編輯區(qū)(Right)輸入臨界點表達(dá)式。注意如果在編輯區(qū)域留下空白,EViews將假定該種類型的觀測值沒有被審查。例如,在規(guī)范的Tobit模型中,數(shù)據(jù)在0值左邊審查,在0值右邊不被審查。這種情況可以被指定為:左編輯區(qū):0
右編輯區(qū):[blank]
而一般的左邊和右邊審查由下式給出:
左編輯區(qū):右編輯區(qū):
EViews也允許更一般的設(shè)定,這時審查點已知,但在觀察值之間有所不同。簡單地在適當(dāng)?shù)木庉媴^(qū)域輸入包含審查點的序列名字。第三十七頁,共四十三頁。
(2)臨界點通過潛在變量產(chǎn)生并且只對被審查的觀測值個體已知
在一些情況下,假設(shè)臨界點對于一些個體(和不是對所有的觀察值都是可觀察到的)是未知的,此時可以通過設(shè)置0-1虛擬變量(審查指示變量)來審查數(shù)據(jù)。EViews提供了另外一種數(shù)據(jù)審查的方法來適應(yīng)這種形式。簡單地,在估計對話框中選擇Fieldiszero/oneindicatorofcensoring選項,然后在合適的編輯區(qū)域輸入審查指示變量的序列名。對應(yīng)于審查指示變量值為1的觀察值要進(jìn)行審查處理,而值為0的觀察值不進(jìn)行審查。第三十八頁,共四十三頁。例如,假定我們有個人失業(yè)時間的觀察值,但其中的一些觀察值反映的是在取得樣本時仍然繼續(xù)失業(yè)的情況,這些觀察值可以看作在報告值的右邊審查。如果變量rcens是一個代表審查的指示變量,可以選擇Fieldiszero/oneindicatorofcensoring設(shè)置,并在編輯區(qū)域輸入:左編輯區(qū):[blank]
右編輯區(qū):rcens
如果數(shù)據(jù)在左邊和右邊都需要審查的話,對于每種形式的審查使用單獨的審查指示變量:左編輯區(qū):lcens
右編輯區(qū):rcens這里,lcens也是審查指示變量。完成模型的指定后,單擊OK。EViews將會使用合適的迭代步驟估計模型的參數(shù)。第三十九頁,共四十三頁。例7.3的估計結(jié)果如下:
第四十頁,共四十三頁。
2.模型的預(yù)測與產(chǎn)生殘差
EViews提供了預(yù)測因變量期望E(y|x,,)的選項,或預(yù)測潛在變量期望E(y*|x,,)的選項。從工具欄選擇Forecast打開預(yù)測對話框。為了預(yù)測因變量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 車輛定點洗車服務(wù)合同范本
- 兼職聘用勞動合同
- 北師大版高中數(shù)學(xué)(必修3)《算法的基本結(jié)構(gòu)及設(shè)計》教案3篇
- 宇航用步進(jìn)電機驅(qū)動線路發(fā)展及展望
- 區(qū)塊鏈技術(shù)在公共資源交易檔案管理中的應(yīng)用
- 大學(xué)物理課后習(xí)題及答案
- 基于Mahony和EKF融合算法的MEMS關(guān)節(jié)姿態(tài)測量系統(tǒng)
- 2025年外研版選修歷史上冊月考試卷含答案
- 健身器材創(chuàng)新技術(shù)與專利分析考核試卷
- 2025年新世紀(jì)版高三語文上冊月考試卷
- 船員健康知識課件
- 《揚州東關(guān)街掠影》課件
- 環(huán)保行業(yè)研究報告
- 物流服務(wù)項目的投標(biāo)書
- 廣西太陽能資源分析
- 地鐵車站低壓配電及照明系統(tǒng)
- 行業(yè)會計比較(第三版)PPT完整全套教學(xué)課件
- 值機業(yè)務(wù)與行李運輸實務(wù)(第3版)高職PPT完整全套教學(xué)課件
- 高考英語語法填空專項訓(xùn)練(含解析)
- 42式太極劍劍譜及動作說明(吳阿敏)
- 部編版語文小學(xué)五年級下冊第一單元集體備課(教材解讀)
評論
0/150
提交評論