第五章比率估計(jì)與回歸估計(jì)_第1頁(yè)
第五章比率估計(jì)與回歸估計(jì)_第2頁(yè)
第五章比率估計(jì)與回歸估計(jì)_第3頁(yè)
第五章比率估計(jì)與回歸估計(jì)_第4頁(yè)
第五章比率估計(jì)與回歸估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩30頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1第五章第五章 比率估計(jì)與回歸估計(jì)比率估計(jì)與回歸估計(jì)2本章要點(diǎn)本章要點(diǎn) 本章討論了簡(jiǎn)單隨機(jī)抽樣和分層隨機(jī)抽樣下比率估計(jì)量本章討論了簡(jiǎn)單隨機(jī)抽樣和分層隨機(jī)抽樣下比率估計(jì)量和回歸估計(jì)量的構(gòu)造及性質(zhì)。要求:和回歸估計(jì)量的構(gòu)造及性質(zhì)。要求: 掌握總體比率、比率估計(jì)量及回歸估計(jì)量的概念。掌握總體比率、比率估計(jì)量及回歸估計(jì)量的概念。 了解比率估計(jì)量、回歸估計(jì)量的偏倚、方差及方差的了解比率估計(jì)量、回歸估計(jì)量的偏倚、方差及方差的估計(jì)量。估計(jì)量。 掌握應(yīng)用比率估計(jì)量及回歸估計(jì)量的條件。掌握應(yīng)用比率估計(jì)量及回歸估計(jì)量的條件。3第一節(jié)第一節(jié) 問(wèn)題的提出問(wèn)題的提出n 在許多實(shí)際問(wèn)題中常常涉及兩個(gè)調(diào)查變量(指標(biāo))在許多

2、實(shí)際問(wèn)題中常常涉及兩個(gè)調(diào)查變量(指標(biāo))Y 和和X 。對(duì)于包含個(gè)抽樣單元的總體除了對(duì)總體信息進(jìn)行估計(jì)外,常對(duì)于包含個(gè)抽樣單元的總體除了對(duì)總體信息進(jìn)行估計(jì)外,常常要估計(jì)總體比率常要估計(jì)總體比率R??傮w比率在形式上總是表現(xiàn)為兩個(gè)變??傮w比率在形式上總是表現(xiàn)為兩個(gè)變量總值或均值之比。量總值或均值之比。 在涉及兩個(gè)變量的抽樣調(diào)查中,有兩種情況需要應(yīng)用比率在涉及兩個(gè)變量的抽樣調(diào)查中,有兩種情況需要應(yīng)用比率估計(jì)量。一種情況是利用雙變量樣本對(duì)總體比率進(jìn)行估計(jì)需估計(jì)量。一種情況是利用雙變量樣本對(duì)總體比率進(jìn)行估計(jì)需應(yīng)用比率估計(jì)量,此時(shí)兩個(gè)變量均為調(diào)查變量。另一種情況應(yīng)用比率估計(jì)量,此時(shí)兩個(gè)變量均為調(diào)查變量。另一種

3、情況是一個(gè)變量為調(diào)查變量,另一個(gè)變量表現(xiàn)為與調(diào)查變量有密是一個(gè)變量為調(diào)查變量,另一個(gè)變量表現(xiàn)為與調(diào)查變量有密切關(guān)系的輔助變量,在對(duì)調(diào)查變量總體總值、總體均值等目切關(guān)系的輔助變量,在對(duì)調(diào)查變量總體總值、總體均值等目標(biāo)量進(jìn)行估計(jì)時(shí),利用已知的輔助變量信息構(gòu)造比率估計(jì)量標(biāo)量進(jìn)行估計(jì)時(shí),利用已知的輔助變量信息構(gòu)造比率估計(jì)量可以改進(jìn)估計(jì)的精度??梢愿倪M(jìn)估計(jì)的精度。n 基于這種考慮利用已知的輔助變量信息構(gòu)造比率估計(jì)量就基于這種考慮利用已知的輔助變量信息構(gòu)造比率估計(jì)量就可使估計(jì)精度加以改進(jìn)??墒构烙?jì)精度加以改進(jìn)。4 n 一、比率估計(jì)量一、比率估計(jì)量 設(shè)對(duì)有兩個(gè)調(diào)查變量設(shè)對(duì)有兩個(gè)調(diào)查變量Y 和和X 的總體進(jìn)行

4、簡(jiǎn)單隨機(jī)抽樣的總體進(jìn)行簡(jiǎn)單隨機(jī)抽樣 ,分別以,分別以y,x表示樣本總值表示樣本總值 ,以,以 表示樣本均值,以表示樣本均值,以 為樣為樣本比率本比率 ,用,用 作為總體比率作為總體比率R的估計(jì)稱為的比率估計(jì)的估計(jì)稱為的比率估計(jì) 。 比率估計(jì)量除了使用調(diào)查變量樣本信息外,還要使用輔助變量比率估計(jì)量除了使用調(diào)查變量樣本信息外,還要使用輔助變量總體信息與樣本信息,而且是非線性估計(jì)量。這類估計(jì)量稱為復(fù)雜總體信息與樣本信息,而且是非線性估計(jì)量。這類估計(jì)量稱為復(fù)雜估計(jì)量。由于比率估計(jì)量使用的信息比簡(jiǎn)單估計(jì)量多,因而有可能估計(jì)量。由于比率估計(jì)量使用的信息比簡(jiǎn)單估計(jì)量多,因而有可能比簡(jiǎn)單估計(jì)量有更高的精度。同

5、時(shí)由于比率估計(jì)量是非線性估計(jì)量,比簡(jiǎn)單估計(jì)量有更高的精度。同時(shí)由于比率估計(jì)量是非線性估計(jì)量,因而對(duì)其性質(zhì)的研究比對(duì)簡(jiǎn)單估計(jì)量要復(fù)雜得多。因而對(duì)其性質(zhì)的研究比對(duì)簡(jiǎn)單估計(jì)量要復(fù)雜得多。, y xyyRxxR5n二、二、比率估計(jì)量的偏倚與均方誤差比率估計(jì)量的偏倚與均方誤差 比率估計(jì)量是有偏估計(jì)量,但當(dāng)樣本量增大時(shí)其偏倚比率估計(jì)量是有偏估計(jì)量,但當(dāng)樣本量增大時(shí)其偏倚將趨于零將趨于零 。 理論上可以證明,理論上可以證明, 分別為分別為 的近似無(wú)的近似無(wú)偏估計(jì)量偏估計(jì)量,而且對(duì)于比率估計(jì)量,其方差主要取決于而且對(duì)于比率估計(jì)量,其方差主要取決于 與與 之間的差異,當(dāng)之間的差異,當(dāng) 時(shí),估計(jì)量方差將很小。時(shí),

6、估計(jì)量方差將很小。換言之,比率估計(jì)量將有很高的精度。這告訴我們,只換言之,比率估計(jì)量將有很高的精度。這告訴我們,只有當(dāng)兩個(gè)變量大致成正比例關(guān)系時(shí),應(yīng)用比率有當(dāng)兩個(gè)變量大致成正比例關(guān)系時(shí),應(yīng)用比率 估計(jì)量才能使估計(jì)精度有較大改進(jìn)。估計(jì)量才能使估計(jì)精度有較大改進(jìn)。,RRR yY, ,R Y YiYiRXiiYRX6n三、三、 比率估計(jì)量方差的估計(jì)與置信區(qū)間比率估計(jì)量方差的估計(jì)與置信區(qū)間 對(duì)于一般的對(duì)于一般的n,比率估計(jì)量呈右偏分布,只有,比率估計(jì)量呈右偏分布,只有當(dāng)當(dāng)n30, 0.1, 0.1這些條件同時(shí)滿足時(shí)才這些條件同時(shí)滿足時(shí)才能直接用正態(tài)分布構(gòu)造置信區(qū)間。能直接用正態(tài)分布構(gòu)造置信區(qū)間。R的置

7、信區(qū)間為的置信區(qū)間為 其中其中 是標(biāo)準(zhǔn)正態(tài)分布的上是標(biāo)準(zhǔn)正態(tài)分布的上/2/2分位點(diǎn),分位點(diǎn),01。類似可得。類似可得 、Y的置信區(qū)間。的置信區(qū)間。xCyC22( ),( )Ru se R Ru se RY2u7案例一案例一8解解 答過(guò)程答過(guò)程9案例二案例二n 10解答過(guò)程解答過(guò)程11n四、四、 比率估計(jì)量?jī)?yōu)于簡(jiǎn)單估計(jì)量的條件比率估計(jì)量?jī)?yōu)于簡(jiǎn)單估計(jì)量的條件 定量分析計(jì)算表明,并非任何情況下比率估計(jì)量都優(yōu)于簡(jiǎn)單估計(jì)量,定量分析計(jì)算表明,并非任何情況下比率估計(jì)量都優(yōu)于簡(jiǎn)單估計(jì)量,只有當(dāng)調(diào)查變量與輔助變量有較高的正相關(guān)性時(shí)比率估計(jì)量才能使估計(jì)只有當(dāng)調(diào)查變量與輔助變量有較高的正相關(guān)性時(shí)比率估計(jì)量才能使估

8、計(jì)精度有較大提高。若精度有較大提高。若 ,則只需當(dāng),則只需當(dāng) 0.5 時(shí)比率估計(jì)量就比時(shí)比率估計(jì)量就比簡(jiǎn)單估計(jì)量精度高。簡(jiǎn)單估計(jì)量精度高。YCXC12n五、多元比率估計(jì)五、多元比率估計(jì) 對(duì)于調(diào)查變量對(duì)于調(diào)查變量Y ,若有,若有p個(gè)具有正相關(guān)性的輔助變量個(gè)具有正相關(guān)性的輔助變量 則則可構(gòu)造多元比率估計(jì)??蓸?gòu)造多元比率估計(jì)。 設(shè)設(shè) 是是 的基于第的基于第k個(gè)輔助變量的比率估計(jì),則個(gè)輔助變量的比率估計(jì),則 的多元比率的多元比率估計(jì)量為:估計(jì)量為: 其中其中 是相應(yīng)變量的樣本總值,是相應(yīng)變量的樣本總值, 是輔助是輔助變量總體均值,變量總體均值, 是適當(dāng)選取的權(quán),滿足是適當(dāng)選取的權(quán),滿足 。 利用拉格朗

9、日乘數(shù)法可計(jì)算得利用拉格朗日乘數(shù)法可計(jì)算得 此時(shí)最小方差為此時(shí)最小方差為 RkyY11ppkkkMRRkkkkyyw ywXxY12,py x xx12,pXXXkw11pkkw221211122122VVwVVV111221122122VVwVVV2112212min1122122MRV VVVyVVV12,.,pXXX13案例三案例三14解答過(guò)程解答過(guò)程15n六、乘積估計(jì)六、乘積估計(jì) 當(dāng)輔助變量當(dāng)輔助變量X 與調(diào)查變量與調(diào)查變量Y 呈負(fù)相關(guān)關(guān)系時(shí),不能應(yīng)用比率估計(jì)呈負(fù)相關(guān)關(guān)系時(shí),不能應(yīng)用比率估計(jì)而應(yīng)改用乘積估計(jì)而應(yīng)改用乘積估計(jì) 乘積估計(jì)優(yōu)于簡(jiǎn)單估計(jì)的條件是乘積估計(jì)優(yōu)于簡(jiǎn)單估計(jì)的條件是 此時(shí)

10、此時(shí) 在實(shí)際問(wèn)題中與調(diào)查變量呈負(fù)相關(guān)的變量很少見(jiàn),因此乘積估計(jì)在實(shí)際問(wèn)題中與調(diào)查變量呈負(fù)相關(guān)的變量很少見(jiàn),因此乘積估計(jì)應(yīng)用極為有限。應(yīng)用極為有限。pxyyXpxyYNX2XYCC()pV y( )V y16 第三節(jié)第三節(jié) 回歸估計(jì)回歸估計(jì)n 一、定義一、定義 在簡(jiǎn)單隨機(jī)抽樣下,總體均值在簡(jiǎn)單隨機(jī)抽樣下,總體均值 和總體和總體總值總值Y的回歸估計(jì)量定義為:的回歸估計(jì)量定義為: 其中其中 , 分別為調(diào)查變量、輔助變量的分別為調(diào)查變量、輔助變量的樣本均值,樣本均值, 是輔助變量的總體均值,是輔助變量的總體均值, 稱為回歸系數(shù)。稱為回歸系數(shù)。 Y)()lryyXxyxX(lrlrYN yyxX17n二

11、、二、為設(shè)定常數(shù)情形為設(shè)定常數(shù)情形 設(shè)設(shè) 是設(shè)定常數(shù),取是設(shè)定常數(shù),取 ,則回歸估計(jì)量,則回歸估計(jì)量是是 的無(wú)偏估計(jì)量。的無(wú)偏估計(jì)量。 其方差為其方差為當(dāng)當(dāng) 時(shí)時(shí) 達(dá)最小值達(dá)最小值20111()()1NiilrifV yYXXYnN00()()lryyXxyxX0000Y2012220011()()11(2)NiiiYXYXfYYXXnNfSSSn02YXXSBS()lrV y2222min211()()(1)YXYYlrXSffVySSnSn18n 三、三、 取樣本回歸系數(shù)情形取樣本回歸系數(shù)情形 若若需根據(jù)樣本確定,一個(gè)合理的選擇是取需根據(jù)樣本確定,一個(gè)合理的選擇是取為樣本為樣本回歸系數(shù)回歸

12、系數(shù)此時(shí)此時(shí) 的回歸估計(jì)量的回歸估計(jì)量為一復(fù)雜估計(jì)量,不再具有無(wú)偏性。為一復(fù)雜估計(jì)量,不再具有無(wú)偏性。 1221()()()niiyxinxiiyy xxsbsxxY()lryyb xX19n四、回歸估計(jì)與比率估計(jì)及簡(jiǎn)單估計(jì)的大樣本比較四、回歸估計(jì)與比率估計(jì)及簡(jiǎn)單估計(jì)的大樣本比較 對(duì)于大的樣本量,總有對(duì)于大的樣本量,總有 這就是說(shuō)在大樣本下回歸估計(jì)總是優(yōu)于簡(jiǎn)單估計(jì),僅在這就是說(shuō)在大樣本下回歸估計(jì)總是優(yōu)于簡(jiǎn)單估計(jì),僅在0時(shí)兩時(shí)兩者效果相同。者效果相同。 的充分必要條件為的充分必要條件為 這等價(jià)于這等價(jià)于 因此除非因此除非Y 關(guān)于關(guān)于X 的總體回歸系數(shù)的總體回歸系數(shù)BR,否則回歸估計(jì)總是優(yōu)于比,否

13、則回歸估計(jì)總是優(yōu)于比率估計(jì),僅在率估計(jì),僅在BR時(shí)兩者效果相同。時(shí)兩者效果相同。()( )lrV yV y()()lrRV yV y22222(1)2YYXYXSSR SR S S2222()()()YXYXXSSBRRRSS20案例四案例四 21解答過(guò)程(解答過(guò)程(1)22解答過(guò)程(解答過(guò)程(2)23解答過(guò)程(解答過(guò)程(3)24第四節(jié)第四節(jié) 分層比率估計(jì)與分層回歸估計(jì)分層比率估計(jì)與分層回歸估計(jì)n一、分別比率估計(jì)與聯(lián)合比率估計(jì)一、分別比率估計(jì)與聯(lián)合比率估計(jì)n(一一)分別比率估計(jì)分別比率估計(jì)25n (二二)聯(lián)合比率估計(jì)聯(lián)合比率估計(jì) 26n二二 分別回歸估計(jì)與聯(lián)合回歸估計(jì)分別回歸估計(jì)與聯(lián)合回歸估計(jì)

14、 (一)分別回歸估計(jì)(一)分別回歸估計(jì)27n(二)聯(lián)合回歸估計(jì)(二)聯(lián)合回歸估計(jì)28三、各種估計(jì)量的比較三、各種估計(jì)量的比較n 對(duì)分層隨機(jī)抽樣在有輔助變量可利用時(shí),為提高估計(jì)精度可以采用分別比對(duì)分層隨機(jī)抽樣在有輔助變量可利用時(shí),為提高估計(jì)精度可以采用分別比率估計(jì)、聯(lián)合比率估計(jì)、分別回歸估計(jì)、聯(lián)合回歸估計(jì)等多種形式的估計(jì)量,率估計(jì)、聯(lián)合比率估計(jì)、分別回歸估計(jì)、聯(lián)合回歸估計(jì)等多種形式的估計(jì)量,因此自然存在一個(gè)問(wèn)題,即如何對(duì)這些估計(jì)量進(jìn)行比較。因此自然存在一個(gè)問(wèn)題,即如何對(duì)這些估計(jì)量進(jìn)行比較。n 由以上各種估計(jì)量的構(gòu)造可以知道,分別比率估計(jì)和分別回歸估計(jì)必須由以上各種估計(jì)量的構(gòu)造可以知道,分別比率估

15、計(jì)和分別回歸估計(jì)必須使用總體各層的輔助變量均值使用總體各層的輔助變量均值 或總值或總值 的信息,而聯(lián)合比率估計(jì)和聯(lián)合的信息,而聯(lián)合比率估計(jì)和聯(lián)合回歸估計(jì)不要求使用總體各層的輔助變量信息,只要求使用總體的輔助變量回歸估計(jì)不要求使用總體各層的輔助變量信息,只要求使用總體的輔助變量均值均值 或總值或總值X的信息,分別估計(jì)量比聯(lián)合估計(jì)量對(duì)總體信息的使用更詳細(xì)的信息,分別估計(jì)量比聯(lián)合估計(jì)量對(duì)總體信息的使用更詳細(xì)一些,因此,當(dāng)各層樣本量一些,因此,當(dāng)各層樣本量 都比較大時(shí),分別比率估計(jì)精度比聯(lián)合比率估都比較大時(shí),分別比率估計(jì)精度比聯(lián)合比率估計(jì)高,分別回歸估計(jì)精度比聯(lián)合回歸估計(jì)高。計(jì)高,分別回歸估計(jì)精度比聯(lián)

16、合回歸估計(jì)高。n 但是各層樣本量但是各層樣本量 較小時(shí),分別比率估計(jì)、分別回歸估計(jì)將有較大偏較小時(shí),分別比率估計(jì)、分別回歸估計(jì)將有較大偏倚,從而均方誤差比較大。此時(shí)如果總樣本量比較大,則采用聯(lián)合比率估計(jì)、倚,從而均方誤差比較大。此時(shí)如果總樣本量比較大,則采用聯(lián)合比率估計(jì)、聯(lián)合回歸估計(jì)更好一些。聯(lián)合回歸估計(jì)更好一些。 XhXhXhnhnX29案例五案例五30解答過(guò)程(解答過(guò)程(1)n 相鄰兩年產(chǎn)量之間存在較高的正相關(guān)性,因此對(duì)今年平均畝產(chǎn)進(jìn)行估計(jì)時(shí)相鄰兩年產(chǎn)量之間存在較高的正相關(guān)性,因此對(duì)今年平均畝產(chǎn)進(jìn)行估計(jì)時(shí)以去年產(chǎn)量為輔助變量構(gòu)造分層比率估計(jì)和分層回歸估計(jì)是適宜的,此處以去年產(chǎn)量為輔助變量構(gòu)

17、造分層比率估計(jì)和分層回歸估計(jì)是適宜的,此處 n (1) 分別比率估計(jì)分別比率估計(jì)1230.1ffff31解答過(guò)程(解答過(guò)程(2)n(2) 聯(lián)合比率估計(jì)聯(lián)合比率估計(jì) 32解答過(guò)程(解答過(guò)程(3)n(3) 分別回歸估計(jì)分別回歸估計(jì)33解答過(guò)程(解答過(guò)程(4)n(4) 聯(lián)合回歸估計(jì)聯(lián)合回歸估計(jì) 以上結(jié)果表明不論是比率估計(jì)還是回歸估計(jì),總有分別估計(jì)量?jī)?yōu)于聯(lián)合以上結(jié)果表明不論是比率估計(jì)還是回歸估計(jì),總有分別估計(jì)量?jī)?yōu)于聯(lián)合估計(jì)量;不論是分別估計(jì)量還是聯(lián)合估計(jì)量,總有回歸估計(jì)優(yōu)于比率估計(jì)。估計(jì)量;不論是分別估計(jì)量還是聯(lián)合估計(jì)量,總有回歸估計(jì)優(yōu)于比率估計(jì)。 34編號(hào)為奇數(shù)的習(xí)題答案編號(hào)為奇數(shù)的習(xí)題答案5.15

18、.1 2000, 2000, 36, 136, 1 0.95, t0.95, t1.96, 1.96, 0.0180.018, 0.0000153590.000015359, 0.00392 置信區(qū)間為 。5.35.3當(dāng)當(dāng) 時(shí)用第一種方法,時(shí)用第一種方法,當(dāng)當(dāng) 時(shí)用第二種時(shí)用第二種方法,當(dāng)方法,當(dāng) 時(shí)兩種方法都可使用。這是因?yàn)椋簳r(shí)兩種方法都可使用。這是因?yàn)椋?, , 若若 則則 0 0NnNnf )(Rv)(Rse%47.42%,93.40YXCC2YXCC2YXCC222211)(YYCYnfSnfyV)2(1)()(222XYXYCCCCRnfRVxyV)(XyV2222211YYCRnfCYXnf YXCC2)2(1)()(2XYXCCCRnfxyVXyVYXCC20)2(1)()(2XYXCCCRnfxyVXyVYXCC2)2(1)()(2XYXCCCRnfxyVXyV 0355.55.5 證明:由(證明:由(5.65.6)得:)得: 5.75.7解:解: 2121)(1)(dNiiiRSNnnNNRXYnfyV,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論