第一章_傳統(tǒng)觀點(diǎn)下的多元線性回歸模型回顧_第1頁(yè)
第一章_傳統(tǒng)觀點(diǎn)下的多元線性回歸模型回顧_第2頁(yè)
第一章_傳統(tǒng)觀點(diǎn)下的多元線性回歸模型回顧_第3頁(yè)
第一章_傳統(tǒng)觀點(diǎn)下的多元線性回歸模型回顧_第4頁(yè)
第一章_傳統(tǒng)觀點(diǎn)下的多元線性回歸模型回顧_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Ch1.傳統(tǒng)觀點(diǎn)下的多元線性回歸模型回顧1. 問(wèn)題的提出我們認(rèn)為,要關(guān)注的結(jié)果與個(gè)因素有關(guān),。(其中是截距項(xiàng),一個(gè)量綱標(biāo)準(zhǔn)化的單位指標(biāo)。)例如:已婚工作婦女的工資(log wage)與工作經(jīng)驗(yàn)(exper)、工作經(jīng)驗(yàn)的外在性作用()、受教育程度(educ)、該婦女的年紀(jì)(age)、家庭少于6個(gè)孩子(kidslt6)以及家庭中孩子至少6歲以上的個(gè)數(shù)(kidage6)有關(guān),并建立如下的模型:對(duì)上述模型,我們做如下說(shuō)明:a. 關(guān)于命題:1. 要關(guān)注的結(jié)果:已婚工作婦女的工資。2. 影響結(jié)果的因素:自身的經(jīng)驗(yàn)、教育、年齡;和孩子的年齡與多少。注:1.結(jié)果與哪些因素有關(guān)不是絕對(duì)的,例如在中國(guó)影響工資的一

2、個(gè)重要因素是所在行業(yè),另外社會(huì)關(guān)系也是不可忽視的,等等。命題與你的目的和知識(shí)相關(guān),并且命題要求表述得越清楚越好。b. 關(guān)于模型:模型是命題的數(shù)學(xué)表達(dá),是命題的深化、細(xì)化和抽象化。從命題到模型是一個(gè)不斷提煉的過(guò)程。建立一個(gè)“好”的模型,取決于我們對(duì)命題認(rèn)識(shí)的深入程度和相關(guān)知識(shí)的儲(chǔ)備。一般而言,多元線性回歸模型的基本框架是:假設(shè)與有因果關(guān)系。如果觀測(cè)的數(shù)據(jù)來(lái)源是:,且存在單調(diào)連續(xù)函數(shù),使得:,。那么,定義多元線性回歸模型:。即:,稱是關(guān)于未知參數(shù)的多元線性回歸模型。這里是隨機(jī)誤差項(xiàng),稱為解釋變量,是確定性變量。稱為因變量或被解釋變量。線性模型的類型主要有:1) 多項(xiàng)式模型: 或 例如,庫(kù)茲涅茨倒U

3、形曲線和拉弗曲線等。2) 對(duì)數(shù)線性模型:(增長(zhǎng)率之間存在因果關(guān)系,例如生產(chǎn)函數(shù)。)3) 倒數(shù)線性模型: 或 (因果呈反向關(guān)系,如菲利普斯曲線)4) 指數(shù)線性模型:(原因是影響增長(zhǎng)率的因素,例如上例)5) Logit線性模型:(因果呈慢,快,慢的變化趨勢(shì),并有飽和)如圖:6) 虛擬變量(Dummy Variable)模型:解釋變量中有些變量變化是“不均勻”的,觀測(cè)數(shù)據(jù)在不同時(shí)段或不同地區(qū)不同行業(yè)或不同政策等之下有明顯不同的特點(diǎn)。在散點(diǎn)圖上,表現(xiàn)為某個(gè)解釋變量或整體上與因變量有跳躍或轉(zhuǎn)折現(xiàn)象。如圖:解決辦法是引入虛擬變量。設(shè)D是虛擬變量,則D描寫的是一種狀態(tài),只取1或0為值。1表示受到某種因素影響

4、,0表示沒(méi)有受到影響。例如:中,截距受到影響,D對(duì)Y有整體影響。又,中,的斜率受到了影響,即D對(duì)的影響導(dǎo)致對(duì)Y的影響,影響斜率。例如,在上例中對(duì)已婚婦女的工資可引入行業(yè)的虛擬變量。1國(guó)有企業(yè),0 非國(guó)有企業(yè)。注:1。如果的影響是時(shí)間特征,則不宜采用虛擬變量。且虛擬變量不宜大量采用。 2經(jīng)過(guò)變換后的數(shù)據(jù),參數(shù)的含義是不一樣的。例如,就是增長(zhǎng)率變化的邊際效果,又如果,則就是彈性系數(shù)。3模型設(shè)定是一個(gè)非?!八囆g(shù)”化的東西,準(zhǔn)確的設(shè)定模型,合理的選擇變量,能使模型反映的經(jīng)濟(jì)意義更細(xì)致、更明顯、解釋力更直接。這是一門需要在實(shí)踐中不斷摸索和積累的“藝術(shù)”。以后,我們總假定從命題到模型可以標(biāo)準(zhǔn)化為如下形式,

5、簡(jiǎn)稱為基本模型:2. 傳統(tǒng)觀點(diǎn)下基本模型的假定基本模型是因果關(guān)系最簡(jiǎn)單的量化表述。形式上它由兩部分構(gòu)成,一部分是確定性關(guān)系,由表達(dá);另一部分是不確定性關(guān)系,由表達(dá)。其中是未知參數(shù),在不同的模型假定中有不同的內(nèi)在含義。一般,指的是因素對(duì)結(jié)果的邊際貢獻(xiàn),沒(méi)有特定的經(jīng)濟(jì)含義。關(guān)于解釋變量,傳統(tǒng)觀點(diǎn)假定是確定性的變量,而且對(duì)的觀測(cè)是準(zhǔn)確的,對(duì)沒(méi)有任何隨機(jī)性影響。因此,任何兩個(gè)或多個(gè)解釋變量之間沒(méi)有線性相關(guān)關(guān)系,且解釋變量和誤差項(xiàng)也沒(méi)有線性相關(guān)關(guān)系。這種傳統(tǒng)觀點(diǎn)蘊(yùn)含著對(duì)解釋變量是可控的,甚至樣本的觀測(cè)也可是預(yù)先已知的。因此,沒(méi)有必要考慮估計(jì)和檢驗(yàn)的漸近性質(zhì)。假設(shè)我們可以對(duì)觀測(cè)N次,把所有觀測(cè)排成一個(gè)矩陣

6、(加上常數(shù)截距項(xiàng))。稱為觀測(cè)矩陣。那么,傳統(tǒng)觀點(diǎn)假定,秩,即列滿秩。且。注:列滿秩不意味且不意味它們就沒(méi)有其它的非線性關(guān)系。又因?yàn)槭侨我庹麛?shù),以后任意與任意不加區(qū)分。關(guān)于誤差項(xiàng),隨機(jī)并不是全部無(wú)知,這里隨機(jī)項(xiàng)反映的是環(huán)境和各種不可預(yù)料的因素對(duì)產(chǎn)生的影響。因?yàn)榻忉屪兞渴强煽氐?,可以認(rèn)為隨機(jī)誤差不影響,且對(duì)的影響是一個(gè)小量。又模型一般設(shè)定有中心化常數(shù)項(xiàng),各種不可控的水平(平均)影響都可放到常數(shù)項(xiàng)上。故可設(shè),,一般情況下是未知的。傳統(tǒng)觀點(diǎn)進(jìn)一步假定,。所以抽樣后服從多元正態(tài)分布,。關(guān)于樣本統(tǒng)計(jì)量,對(duì)解釋變量進(jìn)行N次觀測(cè)得到的值就是樣本。的的抽取傳統(tǒng)觀點(diǎn)假定是獨(dú)立的,而事實(shí)上在許多情況下,獨(dú)立性往往

7、辦不到,樣本有時(shí)有群集效應(yīng)、層次效應(yīng)、串效應(yīng),有時(shí)為了某種特殊目的會(huì)有意識(shí)的選擇相關(guān)的樣本,等等。這些特殊樣本的問(wèn)題正是計(jì)量經(jīng)濟(jì)學(xué)要面對(duì)的問(wèn)題,數(shù)據(jù)是什么樣就是什么樣,是不能隨意假定的。我們將從第二章開始在現(xiàn)代觀點(diǎn)下介紹處理各種特殊樣本的方法。顯然,抽取的樣本越多,與的關(guān)系表現(xiàn)得就越明顯。但是若不對(duì)樣本進(jìn)行整理加工,大量數(shù)據(jù)的堆積并不能看出與之間的因果關(guān)系。我們需要對(duì)樣本做一些加工,提煉出某些有用的信息,這些信息稱為樣本統(tǒng)計(jì)量或樣本函數(shù)。下面是一些直接常用的樣本統(tǒng)計(jì)量。給樣本值,定義:(1)樣本均值(2)樣本方差(標(biāo)準(zhǔn)差的平方)(3)樣本協(xié)方差 樣本相關(guān)系數(shù)(4)樣本k階矩(5)樣本k階中心矩

8、(6)樣本順序統(tǒng)計(jì)量和極差統(tǒng)計(jì)量(7)偏度(8)峰度(9)中位數(shù) n為偶數(shù),或 n為奇數(shù)隨著問(wèn)題的不斷深化,特別在假設(shè)檢驗(yàn)中,我們將引入更多的樣本統(tǒng)計(jì)量。最后,簡(jiǎn)單提一下有關(guān)樣本大數(shù)定律和幾個(gè)重要分布。如果和分別是取自母體的獨(dú)立樣本,那么當(dāng),由大數(shù)律,等等。三個(gè)與正態(tài)樣本相關(guān)的統(tǒng)計(jì)分布是:1)分布獨(dú)立,則;2)分布且兩者獨(dú)立,則;3)分布且兩者獨(dú)立,則。3. 基本模型下的基本問(wèn)題多元線性回歸模型的任務(wù)是:通過(guò)樣本,1)給出未知參數(shù)和的估計(jì);2)給出有關(guān)及其相關(guān)線性組合和方差的統(tǒng)計(jì)檢驗(yàn)。1.估計(jì)問(wèn)題的提法任意取定觀測(cè)矩陣和因變量觀測(cè)值,設(shè)為樣本的函數(shù)。稱為的擬合值,為殘差值(殘差向量),為殘差平

9、方和。問(wèn)題的提法是什么樣的樣本函數(shù)能使得殘差平方和最?。考??(注:也用SSR表示殘差平方和)2.的求解這是一個(gè)多元函數(shù)求極值的問(wèn)題。欲使RSS極小,則一階條件是:。是一個(gè)對(duì)稱矩陣,且。 。,是正定矩陣。(為什么?)??赡?,。稱其為的普通最小二乘估計(jì),記成。注:用樣本函數(shù)擬合,使殘差平方和最小只是一種標(biāo)準(zhǔn),它的直觀意義是明顯的。但我們也可以選擇另外一種標(biāo)準(zhǔn),如使殘差絕對(duì)值的和最小,即:,求。從技術(shù)上講,我們還可以找一個(gè)多項(xiàng)式,把所有樣本光滑的連接起來(lái)。但是這個(gè)多項(xiàng)式的系數(shù)就沒(méi)有太多的經(jīng)濟(jì)意義。例如給樣本則存在次多項(xiàng)式使得。真正有意義的擬合和評(píng)價(jià)標(biāo)準(zhǔn)是建立在概率統(tǒng)計(jì)意義上的,有許多好的統(tǒng)計(jì)性質(zhì)。3

10、.的統(tǒng)計(jì)性質(zhì)(1),根據(jù)正態(tài)分布的線性變換定理:,則。由,故得:。是的無(wú)偏估計(jì),且是的線性函數(shù),服從正態(tài)分布。(2)記,則。對(duì),設(shè),則代表了的任一線性估計(jì)。改寫,那么,。如果考慮讓是的無(wú)偏線性估計(jì)量,則必須有,對(duì)于所有真值都成立。其充要條件是。因此滿足,就代表了的任一線性無(wú)偏估計(jì)量。, 故。注意到是一個(gè)半正定矩陣,所以主對(duì)角線上元素。當(dāng)且僅當(dāng)時(shí),方差最小。(其中是中對(duì)角線上第個(gè)元素)這就是說(shuō),在真值的所有線性無(wú)偏估計(jì)類中,具有最小方差屬性,即是有效的。綜上所述,是無(wú)偏線性估計(jì)類中的有效估計(jì)。(此稱為高斯馬爾科夫定理)注:1.對(duì)有偏的估計(jì)類,不一定是有效的。如存在多重共線性,又不能剔除解釋變量,

11、常采用嶺回歸,犧牲無(wú)偏性提高有效性。2.除了無(wú)偏性、有效性外,還有一致性、穩(wěn)健性等許多其他有統(tǒng)計(jì)意義的標(biāo)準(zhǔn)。在不同模型和要求下有特殊的意義。傳統(tǒng)觀點(diǎn)由于樣本固定,一般不考慮一致性。這是與現(xiàn)代觀點(diǎn)最大的區(qū)別。3的極大似然估計(jì)在基本模型假定下就是。(習(xí)題)4.的無(wú)偏估計(jì)及統(tǒng)計(jì)性質(zhì) 我們用命題的形式陳述有關(guān)未知參數(shù)的估計(jì)和性質(zhì),已備后用。命題1:是未知方差的一個(gè)無(wú)偏估計(jì)。又稱為標(biāo)準(zhǔn)差。證明:()容易驗(yàn)證,且。是一個(gè)對(duì)稱冪等矩陣。有性質(zhì),特征根為0或1。命題1得證。命題2:服從自由度為的分布。證明:由命題1知,。對(duì)稱冪等,。的特征根1的個(gè)數(shù)為。又為實(shí)對(duì)稱陣的,必可正交對(duì)角化,存在正交矩陣,使得成立。令

12、 則。獨(dú)立服從標(biāo)準(zhǔn)正態(tài)分布。這是個(gè)獨(dú)立標(biāo)準(zhǔn)正態(tài)分布之平方和。由分布的定義,。命題2得證。命題3:與的分布獨(dú)立。證明:,。與都是的線性函數(shù),故和都服從正態(tài)分布。由多元正態(tài)分布的性質(zhì)知,和相互獨(dú)立當(dāng)且僅當(dāng)。事實(shí)上,與獨(dú)立。又是的連續(xù)函數(shù),與獨(dú)立。命題3得證。 把前述內(nèi)容用框圖示意如下:4. 關(guān)于假設(shè)檢驗(yàn)?zāi)P椭杏写罅康募俣?,這些假定是否合理?這些假定包括,變量的選擇是否合理,隨機(jī)誤差的設(shè)定是否恰當(dāng),還有變量與誤差不相關(guān)是否成立?等等。我們可以把這些假定歸結(jié)為一些對(duì)未知參數(shù)的判斷,如果這些判斷基本正確或錯(cuò)誤,那么從數(shù)據(jù)中就能夠反映出來(lái)。假設(shè)檢驗(yàn)是估計(jì)完成后對(duì)模型的設(shè)定做進(jìn)一步的確認(rèn)。拒絕原假設(shè),意味著

13、命題真時(shí)犯錯(cuò)誤的可能性可控制在一定的范圍內(nèi)。請(qǐng)看例:例:假定,觀測(cè)樣本為。,。令,用估計(jì),并構(gòu)造樣本統(tǒng)計(jì)量。有。如果命題為真,則。查表得。當(dāng)拒絕,認(rèn)為不對(duì),否則不能拒絕。進(jìn)一步,未知。同樣用估計(jì),估計(jì)。如何構(gòu)造統(tǒng)計(jì)量?所以,若命題真,則統(tǒng)計(jì)量。查表得臨界值。當(dāng)時(shí),拒絕,否則不能拒絕。1假設(shè)檢驗(yàn)問(wèn)題的一般提法:從上例,我們得到一般的啟示是,對(duì)模型中的某一假設(shè)給出一個(gè)假設(shè)命題,在一定條件下命題可轉(zhuǎn)化為對(duì)模型中某些未知參數(shù)的推斷,對(duì)的回答是拒絕或不能拒絕。這都有可能判斷失誤。有二種情況:1)真,拒絕。犯第一類錯(cuò)誤“去真”;2)假,接受。犯第二類錯(cuò)誤“存?zhèn)巍?。奈克皮爾遜定理說(shuō)明,給定樣本容量,不可能同

14、時(shí)保證犯兩類錯(cuò)誤都充分小。即任何檢驗(yàn)方法,若要降低犯第一類錯(cuò)誤的概率就會(huì)增加犯第二類錯(cuò)誤的概率,除非增加樣本容量。顯著性檢驗(yàn)的提法:給定一個(gè),稱為顯著性水平,通常是一個(gè)小概率或等。檢驗(yàn)的目標(biāo)是把犯第一類錯(cuò)誤的概率控制在以下,而不考慮犯第二類錯(cuò)誤概率的大小。顯著性檢驗(yàn)的直觀含義是:我們只關(guān)注命題真時(shí),控制少犯拒絕的錯(cuò)誤,而命題假時(shí)接受了產(chǎn)生的后果并不嚴(yán)重。例如,基本模型中,假設(shè)檢驗(yàn),命題即使是假的,接受了后果并不嚴(yán)重,因?yàn)榇藭r(shí)一定很小,近似的看成零對(duì)模型沒(méi)有太大影響。但是,當(dāng)某些命題犯第二類錯(cuò)誤后果很嚴(yán)重時(shí),顯著性檢驗(yàn)就不適用了。例如,偽回歸,回歸效果非常好且顯著性檢驗(yàn)也沒(méi)有問(wèn)題,如數(shù)據(jù)存在測(cè)量

15、誤差,或誤差項(xiàng)是單位根過(guò)程,但其實(shí)這是一個(gè)錯(cuò)誤的回歸。所以當(dāng)回歸效果特別好時(shí),要進(jìn)一步考慮檢驗(yàn)的勢(shì)V,V是假時(shí)拒絕的概率,即V=犯第二類錯(cuò)誤的概率。如果V的值很小,說(shuō)明犯第二類錯(cuò)誤的可能性很大,設(shè)定的命題很可能是不真的。但是要確定V必須要對(duì)被擇命題給出確定的范圍,這很麻煩。一般的原則是,檢驗(yàn)效果非常好,但與實(shí)際情況明顯抵觸,干脆不用,除非特別需要。又,顯著性檢驗(yàn)的另一個(gè)補(bǔ)充是檢驗(yàn)的值。值度量的是犯第一類錯(cuò)誤的概率,即。因此,值越大,錯(cuò)誤的拒絕的可能性越大,故應(yīng)當(dāng)接受。值越小,拒絕時(shí)就越放心。一般值超過(guò)0.8,我們一般不能拒絕。 值與顯著性檢驗(yàn)的關(guān)系是不能拒絕,拒絕。例如,給定,但那么我們有充分

16、的信心拒絕。顯著性檢驗(yàn)的一般步驟:提出原假設(shè)和備擇假設(shè),給出顯著性水平,依據(jù)命題和模型中得到的未知參數(shù)的估計(jì)和構(gòu)造樣本統(tǒng)計(jì)量。且當(dāng)命題真時(shí),可得到的統(tǒng)計(jì)分布(或漸近分布)。通過(guò)分布查表或計(jì)算得到臨界值,最后根據(jù)取樣后計(jì)算的統(tǒng)計(jì)值與比較大小判斷拒絕還是不能拒絕,相應(yīng)的給出值作為判斷的補(bǔ)充。所以,假設(shè)檢驗(yàn)問(wèn)題的關(guān)鍵是:1) 根據(jù)問(wèn)題巧妙建立模型,恰當(dāng)提出假設(shè)命題;2) 尋求樣本統(tǒng)計(jì)量,給出命題真時(shí)的統(tǒng)計(jì)分布或漸近分布。其實(shí),假設(shè)檢驗(yàn)的思想很簡(jiǎn)單,困難在于找到合適的樣本統(tǒng)計(jì)量在命題真時(shí)的統(tǒng)計(jì)分布。一般情況下,假設(shè)檢驗(yàn)的命題常常歸結(jié)為某個(gè)參數(shù)為零或部分參數(shù)為零的檢驗(yàn)或未知參數(shù)線性組合的檢驗(yàn)。此時(shí),我們

17、就可以直接應(yīng)用數(shù)理統(tǒng)計(jì)中的結(jié)論。2.基本模型下的假設(shè)檢驗(yàn)1)的單參數(shù)檢驗(yàn)是否可以解釋的變化,或者說(shuō)它們是不是的原因?相應(yīng)的假設(shè)檢驗(yàn)命題是:。(為截距項(xiàng)的參數(shù)。), 其中是中對(duì)角線上第個(gè)元素。假設(shè)命題真,則。但是未知,這還不是一個(gè)樣本統(tǒng)計(jì)量。又知,且與獨(dú)立,。由t分布的定義服從自由度為的分布。記稱為的標(biāo)準(zhǔn)差,則。給顯著性水平,查表得臨界值。則就拒絕,否則不能拒絕。拒絕意味著在統(tǒng)計(jì)意義上可解釋的變化,稱統(tǒng)計(jì)顯著。注:1. 檢驗(yàn)是基本模型必須進(jìn)行的檢驗(yàn)。不能拒絕意味著作為解釋的原因?qū)嶋H意義不大;但拒絕并不意味著作為解釋的原因意義一定就大,尤其值較小時(shí),即但接近,需要作進(jìn)一步的分析。2.單參數(shù)假設(shè)檢驗(yàn)

18、與區(qū)間估計(jì)是聯(lián)系在一起的。不能拒絕的概率含義是:。即,的概率為。稱此為置信區(qū)間。所以,的標(biāo)準(zhǔn)差越大,越容易接受,但估計(jì)精度卻降低。同時(shí),注意到,如果未知方差是已知的,由分布的尖峰胖尾性質(zhì),故臨界值比方差已知時(shí)要更遠(yuǎn)離0點(diǎn)些, 更容易被接受。這說(shuō)明,信息越多(方差已知),滿足命題的要求越嚴(yán)。例如,已知和估計(jì)比較,估計(jì)命題更難被拒絕。2)的整體性檢驗(yàn)每個(gè)統(tǒng)計(jì)顯著,并不意味著整體上對(duì)的影響顯著。某些的作用有可能相互抵消。于是我們需要檢驗(yàn),至少有某一不為零?;颍辽儆心骋徊粸榱?。即整體參數(shù)為0和部分參數(shù)為0的檢驗(yàn)。還有,某些參數(shù)要滿足一定的制約關(guān)系。例如,生產(chǎn)函數(shù)一次齊次假定:。我們需要檢驗(yàn),等等。我

19、們可以把上述的檢驗(yàn)統(tǒng)一歸結(jié)為有關(guān)判斷未知參數(shù)的線性方程組的形式:。其中是一個(gè)矩陣,是向量。例如推斷,相應(yīng)的。又如推斷,則相應(yīng)的()等等。注:未知參數(shù)的非線性推斷和有關(guān)未知方差的推斷不在討論之列。如推斷等等。問(wèn)題:如何檢驗(yàn)?顯然,采用檢驗(yàn)的方法不行了,依假設(shè)檢驗(yàn)問(wèn)題的提法,我們需要找到當(dāng)命題真時(shí)的樣本統(tǒng)計(jì)量及其分布。從假設(shè)檢驗(yàn)的理論知,要對(duì)進(jìn)行檢驗(yàn),先要對(duì)有一個(gè)估計(jì)。自然,用估計(jì)。,由正態(tài)隨機(jī)變量線性變換定理,。命題4:的二次型服從自由度為的分布。我們一般的證明,則。,正定。且可逆。服從標(biāo)準(zhǔn)正態(tài)分布,且分量獨(dú)立。將代入立得的二次型服從自由度為的分布。的分布盡管已知,但含有未知參數(shù),故還不能成為樣

20、本統(tǒng)計(jì)量。注意到命題2,服從自由度為的分布。故與都服從分布。若它們彼此獨(dú)立,由分布的定義,我們就可以得到一個(gè)重要的統(tǒng)計(jì)量:。命題5:的二次型與相互獨(dú)立。證明:,其中。又知。只要證與相互獨(dú)立。又由于與服從正態(tài)分布,只要證。事實(shí)上,。命題5得證。3.的統(tǒng)計(jì)意義假設(shè)檢驗(yàn),如果命題真,那么模型的實(shí)質(zhì)就是: ,于是方法在命題真下的實(shí)質(zhì)是: 。我們知道,在無(wú)約束條件下的估計(jì)為,那么有約束條件下的估計(jì)是什么?采用拉格朗日乘子法:。,代入到中,得:,。為約束條件下的殘差向量,為約束條件下的殘差平方和。(注意:),又注意到統(tǒng)計(jì)量的表達(dá)式,。再由命題4,最后得:。所以,統(tǒng)計(jì)量的統(tǒng)計(jì)意義是:命題6:有線性約束條件下

21、的與無(wú)約束條件下的的殘差平方和所構(gòu)成的殘差形式的樣本函數(shù)服從分布:。特別,當(dāng)約束條件為。意即所選解釋變量整體與沒(méi)有因果關(guān)系。那么,原模型實(shí)質(zhì)變成:,。 ,。這就得到了傳統(tǒng)的擬合優(yōu)度(決定系數(shù))與統(tǒng)計(jì)量的關(guān)系??梢钥闯?,是的增函數(shù),是的減函數(shù),且。所以,大致反映了原因整體上能否解釋結(jié)果。一般來(lái)講,一個(gè)多元回歸模型可以標(biāo)準(zhǔn)化為:,(有含時(shí)數(shù)據(jù)時(shí)用于檢驗(yàn)序列相關(guān)性。)。注:假設(shè)檢驗(yàn)通過(guò),即每個(gè)都統(tǒng)計(jì)顯著,且并不能說(shuō)明這就是一個(gè)好的回歸模型。甚至有可能是偽回歸。(犯第二類錯(cuò)誤概率很大)但若某些統(tǒng)計(jì)不顯著,或統(tǒng)計(jì)量偏小,DW值不接近2,那么這個(gè)回歸模型肯定有問(wèn)題。(通俗地說(shuō),“發(fā)燒”肯定病了,“不發(fā)燒”

22、不一定就沒(méi)有毛病。)4.檢驗(yàn)的應(yīng)用檢驗(yàn)有廣泛的應(yīng)用。這里僅舉幾例:1)參數(shù)的穩(wěn)定性檢驗(yàn)設(shè)同一模型,有兩組獨(dú)立不同的觀測(cè):設(shè)有N次觀測(cè); 設(shè)有M次觀測(cè)。問(wèn):不同的獨(dú)立觀測(cè)對(duì)參數(shù)的估計(jì)是否有影響?即,原因?qū)Y(jié)果的定量關(guān)系是否穩(wěn)定。相應(yīng)的假設(shè)檢驗(yàn)問(wèn)題是:即(),至少有一個(gè)。如何檢驗(yàn)?構(gòu)造模型,令,得到,取,則,且。 得統(tǒng)計(jì)量:。這里是,。知:給水平,查表得,當(dāng)不能拒絕,表示原因?qū)Y(jié)果的定量關(guān)系是穩(wěn)定的。于是,可以將兩次獨(dú)立觀測(cè)聯(lián)合起來(lái),構(gòu)成更大的樣本觀測(cè)矩陣,從而得到更精確的估計(jì)。拒絕,說(shuō)明兩組觀測(cè)有差異。我們?cè)诤竺娴拿姘鍞?shù)據(jù)中討論。特別,如果設(shè)定模型為:有次觀測(cè); ;有次觀測(cè)。構(gòu)造。 得。至少有某

23、一。適當(dāng)選取和,做檢驗(yàn)。這就是單因素方差分析的內(nèi)容。不能拒絕意味著因素不同水平對(duì)結(jié)果沒(méi)有顯著影響,拒絕意味著至少有一個(gè)水平對(duì)結(jié)果有顯著性影響。2)異常點(diǎn)的檢驗(yàn)?zāi)P椭校绻麣埐钕蛄坑心承┓至康臍埐钆c其它的分量相比相差很大,我們就稱觀測(cè)為異常點(diǎn)(觀測(cè))。如何檢驗(yàn)數(shù)據(jù)是否異常?分析:如果認(rèn)為殘差很大,那么就有理由認(rèn)為模型設(shè)定不對(duì),也就是。故設(shè):表示中的第行,是常數(shù),意味著測(cè)量中其他因素造成的一種實(shí)質(zhì)性的偏離。將和按行進(jìn)行適當(dāng)?shù)呐帕校梢詷?gòu)造模型:。要判斷是不是數(shù)據(jù)異常點(diǎn),相應(yīng)的假設(shè)檢驗(yàn)就是:。這就歸結(jié)為模型中的系數(shù)部分為零的檢驗(yàn)問(wèn)題。故采用檢驗(yàn)。這里,的自由度?請(qǐng)學(xué)生自己考慮。但這里更方便的辦法是:

24、(1) 對(duì)做得和(2) 對(duì)做得和然后采用統(tǒng)計(jì)量的殘差平方和形式,做檢驗(yàn)。注:1.一般異常點(diǎn)的數(shù)據(jù)量不宜太大,新構(gòu)造模型的實(shí)質(zhì)是把被懷疑的觀測(cè)部分作為虛擬變量處理。2.拒絕,認(rèn)為是異常點(diǎn)還要具體問(wèn)題具體分析。此時(shí)要特別細(xì)心,善于從差異中找到問(wèn)題的原因所在。3)模型設(shè)定的偏誤檢驗(yàn)建立模型時(shí),如果加入了不必要的解釋變量,可以直接通過(guò)檢驗(yàn)和檢驗(yàn)將它們排除。但是,模型中一些該引入而沒(méi)有引入的解釋變量如何知道?辦法是,加入一個(gè)或一些“替代變量”到模型中去。如果這些替代變量可以通過(guò)檢驗(yàn)和檢驗(yàn),則可判斷該模型遺漏了某些解釋變量,稱為RESET檢驗(yàn)?!疤娲兞俊币话氵x擇的擬合值的非線性多項(xiàng)式或其它函數(shù)形式。這可以通過(guò)殘差與的散點(diǎn)圖來(lái)大致判定。例如:建立模型為如果參數(shù)和能通過(guò)檢驗(yàn)和檢驗(yàn)。則說(shuō)明模型遺漏了某些應(yīng)加入的解釋變量。這是因?yàn)?、等與肯定是線性無(wú)關(guān)的。注,RESET檢驗(yàn)僅是能判斷遺漏了某些解釋變量,并不知道遺漏了什么解釋變量。4)格蘭杰因果關(guān)系檢驗(yàn)如果和是時(shí)間序列數(shù)據(jù),那么兩個(gè)因素的因果關(guān)系邏輯上只有四種:(1)是的原因,且不是的原因。(2)是的原因,且不是的原因。(3),互為原因。(4),沒(méi)有因果關(guān)系。分析:因果關(guān)系在時(shí)間上有前后關(guān)系。所以,如果命題(1)真,那么的變化應(yīng)當(dāng)發(fā)生在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論