版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、二、限值因素變量模型、限值因素變量是什么情況(LDV )、因素變量是定性變量或不連續(xù)變量或受約束的變量的情況下,統(tǒng)稱為限值因素變量回歸模型。 不同的受限變量模型使用不同的估計方法,具體取決于變量的情況。 例如,非線性最小二乘法,大多使用最大似然估計法。 根據(jù)變量,受限值可以是任何狀態(tài)(LDV )、線性概率模型、對數(shù)單位模型、概率單位模型、拍子模型、孔洞剪切回歸模型(ceel斷尾回歸模型)、二元選擇模型、一、線性概率模型二、Logit model三、probit model二元選擇模型中的殘奧參數(shù)2.1線性概率模型,原因變量是取值為0、1的二值結(jié)果的分類變量考慮模型: y表示已婚婦女是否參與勞動
2、力市場,x是收入的其他來源、經(jīng)驗、經(jīng)驗的平方、年齡、未滿6歲兒童的數(shù)量、家庭的6-18歲兒童的數(shù)量等一系列參數(shù)。 (Example From Wooldridge )、在線性概率模型中,殘奧儀表度量是在保持其他因素不變的情況下,由自變量的變化引起的成功概率的變化。 用OLS報價。 什么是“成功”的定義? Y=1,example,Wooldridge(Mroz,1987 ),線性概率模型的缺陷,1,干擾項的非正規(guī)性,2,干擾的分散性,3,4,可疑的適合度R2對于給予的x,y是0或1,橫軸的線,Y=1的線對于異方差問題,即使通過廣義的最小二乘法獲得異方差條件下的有效估計量,也存在如下問題,1、概率
3、擬合值可被降到(0,1 )之外。 2 .由于隨機擾動項的分布是兩點分布而不是正態(tài)分布,所以該估計是漸近有效估計而不是有效估計。 線性概率模型的改進:估計的概率在0,1之間。 對于所有的xi,希望當(dāng)xi增加時,yi也單調(diào)增加或者單調(diào)減小。 顯然,累積概率分布函數(shù)可以滿足這樣的要求,常用的是logistic分布、正態(tài)分布、weibull分布、極值分布,而probit和logit分布最常用。 Weibull分布不假定對稱性,而是p(y=1|x)=exp (-exp (XB ) ) (CDF ) log-log分布: p (y=1| x )=。 兩條曲線的pi=0.5都有關(guān)拐點點,但是logit曲線在
4、兩條曲線的末尾都比Probit曲線厚。 兩分布的概率值分別如表1所示。 在、2.2 Logit模型和線性概率模型LPM中,假定響應(yīng)概率對于一系列殘奧儀表是線性的。 Logit模型也稱為對數(shù)單位模型,表現(xiàn)為、link function、對數(shù)單位模型的特征,該模型是McFadden于1973年首次提出的,采用了logistic概率分布函數(shù)。 從logit模型可以看出,logit模型的重要優(yōu)點之一是將在0,1區(qū)間預(yù)測概率的問題轉(zhuǎn)換為在實軸預(yù)測事件發(fā)生的機會比(也稱為發(fā)生比率odds )問題。 logit累積概率分布函數(shù)的斜率在pi=0.5時最大,累積分布在兩末端的斜率逐漸減少。 解釋變量xi相對于p
5、i=0.5附近的變化對概率的變化有很大影響,但相對于pi接近0和1的xi值的變化對概率的變化很小。 對數(shù)單位模型的特征保證1,p在0-1之間。 2.l對x是線性的,而p對x不是線性的。 3 .傾斜系數(shù)解釋了由于x的變化而不是由于概率的變化引起的l的變化。 4 .但是,我們關(guān)心的是x的變化引起的概率的變化,如何導(dǎo)出? 估計系數(shù)之后,利用推導(dǎo)。 5 .如何估計,2.3 LOGIT模型的估計采用極大似然估計法。為什么采用極大似然估計法? Stata指令: logit depvar indepvars if in weight、options、極大似然估計的起點是在樣本觀測值發(fā)生的可能性最高的條件下的
6、估計值。 從樣本來看,第一個選項發(fā)生了n次,第二個選項發(fā)生了N-n次。 取第一選擇的概率設(shè)為pi。 做出第二個選擇的概率是(1- pi )。 如果對樣本數(shù)據(jù)進行重新排列,使得前n個觀測值成為第一選擇項,后N-n個觀測值成為第二選擇項,則似然函數(shù)對發(fā)生比率(odds )概念的擴展、1、發(fā)生比率(odds ratio )例如男性對女性的失業(yè)發(fā)生比率:風(fēng)險是什么example分別設(shè)有2個25人規(guī)模的試驗組,試驗組服用某種藥物,對照組服用安慰劑。 試驗組中有2人感染了疾病,控制組中有3人感染了疾病。 試驗組患病風(fēng)險為2/25=0.08,控制組為3/25=0.12,試驗組對控制組的相對患病風(fēng)險為0.08
7、/0.12=0.67,試驗組的患病風(fēng)險為控制組如果事件發(fā)生的概率較小,則經(jīng)常使用發(fā)生比率來近似表示相對風(fēng)險。 另外,Probit模型除了邏輯斯蒂函數(shù)之外還可以使用正態(tài)分布函數(shù)來解釋二元因素變量。 這就是Probit模型,也稱為概率單位模型。 如果g采取如下形式,則得到Probit model。 Probit模型的推定:極大似然推定法STATA命令: Probitdepvarindepvarsifinweight,probit_options,2.4從潛在變量模型導(dǎo)出的logit和probit模型,logit公共交通工具和個人交通工具對于分別對于標準正態(tài)分布或邏輯分布,可將某一方面的選擇公共或個
8、人交通的效用寫為似然函數(shù),其中f表示概率密度函數(shù)。 另外,由于1、Probit和Logit所使用的分布函數(shù)不同,因此不能直接比較模型回歸系數(shù)的解釋的殘奧儀表估計值。 有必要修正和比較邊際效應(yīng)。 2 .然而,在非線性模型中,邊際效果隨著解釋變量而不是常數(shù)變化。 一般邊際效應(yīng)概念: (1)分別校正平均邊際效應(yīng)(average marginal effect ),即每個樣本在觀測值上的邊際效應(yīng),然后進行簡單算術(shù)平均。 (2)樣本平均中的極限效應(yīng),即X=平均中的極限效應(yīng)。 (3)給定代表值的極限效應(yīng),即在給定的x*和x=x*處的極限效應(yīng)。 3 .在非線性模型中,樣本平均中的個體行為不等于樣本中的個體平
9、均行為(averagebehaviorofindividualsdiffersfrombehavioroftheaverageindividual )。 4 .對于政策分析,平均邊緣效應(yīng)(Stata缺省方法)或某個代表性值上的邊緣效應(yīng)通常更加重要。模型回歸系數(shù)解釋將logit殘奧儀表估計值(適用于虛擬變量)解釋為產(chǎn)生比率比。 意思是:抑制收入的情況下,女性參加投票的概率幾乎是男性的2倍。 對于連續(xù)變量,回歸系數(shù)的指數(shù)表示該變量每上升一個單位時所帶來的發(fā)生比率的倍數(shù)變化,即在性別相同的情況下,收入每增加1000元,投票的發(fā)生比率就是原來的1.01倍(exp(0.012 ) )。 模型回歸系數(shù)的解
10、釋關(guān)注了自變量對logit和probit模型響應(yīng)概率的影響。 如果是連續(xù)的,那么一對小的變化一般可以在以下方程式中確定原始樣本平均值。 在Stata中,可以根據(jù)margins的命令求出極限效果。 模型評估和比較1的極限:由于變量本身不包含比例信息,因此是類變量。2 .適合度檢查3、對數(shù)似然比統(tǒng)一校正量4、嵌套模型比較、1、適合度檢查: R2=0,表示模型完全不適合樣品觀測值,R2=1,表示模型完全適合樣品觀測值。 (McFadden R-squared ),2,總體顯性檢驗:建立似然比統(tǒng)計量,其中零假設(shè)所有的殘奧參數(shù)都為0,準備假設(shè)都不為0。 模型滿足零假設(shè)時的似然函數(shù)值,是通過模型估計得到的
11、似然函數(shù)值。 LR較大時,有拒絕零假說而接受候補假說的傾向。 自由度是當(dāng)前模型中的殘奧儀表的個數(shù)和零模型中的殘奧儀表的個數(shù)的差。 嵌套模型之間的比較可以通過卡端差分來驗證,以便比較兩個模型中哪個更好,只要模型之間是嵌套關(guān)系即可。 卡方差分等于無約束模型的模型減去約束模型的模型,其自由度是殘差自由度的差。 比較模型1和模型2中的哪一個更好,表明兩個模型在數(shù)據(jù)擬合上沒有顯著差異。但是,模型2更節(jié)約、更好。統(tǒng)一校驗和估計、單殘奧儀表校驗: 1、Wald校驗:某個變量更顯著依賴最大似然估計方法的最大樣本性質(zhì)2 .似然比檢驗如果兩個模型只減去一個參數(shù),則可視為處于嵌套關(guān)系的模型,可以使用嵌套模型的檢驗。
12、 多殘奧儀表檢查: 1,Wald檢查:在多個制約的情況下也能廣泛應(yīng)用。 檢查的零假設(shè)為:2,2,似然比檢驗嵌套模型似然比檢驗可以用于檢驗多個約束,但是這也是一種聯(lián)合檢驗常用的殘奧參數(shù)估計的方法。 假設(shè)m-1是具有許多約束的模型,對應(yīng)的似然函數(shù)值是l-1,m-2是具有較少約束的模型,對應(yīng)的似然函數(shù)值是l-2,則似然比卡方綜合校正量是自由度大的模型m-2中的殘奧儀表個數(shù)和小模型中的殘奧儀表個數(shù)的差。 注: M1為M2.Wald統(tǒng)一修正量和似然比統(tǒng)一量均利用了較大的樣本性質(zhì)。 因此,對相同的數(shù)據(jù)、相同的模型進行相同的假說驗證,這些結(jié)果不一定完全相同。 然而,隨著樣本數(shù)目的增加,其傾向于逐漸變得相等。 借助EXAMPLE、wooldridge的數(shù)據(jù),看到L
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國紫菜蛋花湯行業(yè)投資前景及策略咨詢研究報告
- 2025至2031年中國普通彈簧鉤行業(yè)投資前景及策略咨詢研究報告
- 2025至2030年中國麥飯石床墊數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國銅包鋼鍍錫編織線數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國遠照燈數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國大米粉碎調(diào)漿機數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國卡子發(fā)數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國六缸式氣壓工作臺數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國上下波長型波分復(fù)用器數(shù)據(jù)監(jiān)測研究報告
- 2025年中國方形衛(wèi)生桶市場調(diào)查研究報告
- 2024-2025學(xué)年北京石景山區(qū)九年級初三(上)期末語文試卷(含答案)
- 第一章 整式的乘除 單元測試(含答案) 2024-2025學(xué)年北師大版數(shù)學(xué)七年級下冊
- 春節(jié)聯(lián)歡晚會節(jié)目單課件模板
- 中國高血壓防治指南(2024年修訂版)
- 糖尿病眼病患者血糖管理
- 抖音音樂推廣代運營合同樣本
- 《春酒》琦君完整版
- 教育促進會會長總結(jié)發(fā)言稿
- 北師大版(2024新版)七年級上冊數(shù)學(xué)第四章《基本平面圖形》測試卷(含答案解析)
- 心理調(diào)適教案調(diào)整心態(tài)積極應(yīng)對挑戰(zhàn)
- 小學(xué)數(shù)學(xué)6年級應(yīng)用題100道附答案(完整版)
評論
0/150
提交評論