教師薪金問題_第1頁
教師薪金問題_第2頁
教師薪金問題_第3頁
教師薪金問題_第4頁
教師薪金問題_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

教師薪金問題教師薪金問題/NUMPAGES22教師薪金問題教師薪金問題教師薪金問題楊婕孫佳彬郭蕓摘要:本文是一個關(guān)于建立教師薪金影響因素的回歸模型。對于問題(1)我們很難確定到底與哪些因素有關(guān),所以在模型中我們考慮到了題目給出的所有因素,通過題目給出的數(shù)據(jù),發(fā)現(xiàn)這七個變量之間與因變量均呈線性關(guān)系,因此我們初步的建立了一般的線性回歸模型,然后我們用MATLAB軟件求解。通過對解出的數(shù)據(jù)進行分析,我們發(fā)現(xiàn)模型存在缺陷,有些變量對因變量的影響不顯著,這也就說明性別和婚姻狀況上的差異對所調(diào)查的教師的薪金影響較小。為了使模型得到進一步的改進,我們剔除了其中對因變量影響不顯著的變量,然后再用對因變量影響顯著的X1和X4建立了簡單的統(tǒng)計回歸模型,求解之后發(fā)現(xiàn),模型依然沒有達到理想的效果,然后再利用殘差分析法,在前一模型中增加了他們的交互項和平方項,最終得到進一步改進的模型。然后再利用MATLAB軟件對其進行求解。關(guān)鍵詞:統(tǒng)計回歸模型;MATLAB軟件;殘差分析法;逐步回歸一.問題重述某地人事部門為研究中學教師的薪金與他們的資歷,性別,教育程度及培訓情況等因素之間的關(guān)系,要建立一個數(shù)學模型,分析人士策略的合理,特別是考慮女教師是否受到不公平的待遇,以及他們的婚姻狀況是否會影響收入。為此,從當?shù)亟處熤须S機選了3414位進行觀察,然后從中保留了90個觀察對象,得到了下表給出的相關(guān)數(shù)據(jù)。盡管這些數(shù)據(jù)具有一定的代表性,但是仍有統(tǒng)計分析的必要?,F(xiàn)將表中數(shù)據(jù)的符號介紹如下:Z~月薪(元);X1~工作時間(月);X2=1~男性,X2=0~女性;X3=1~男性或單身女性,X3=0~已婚女性;X4~學歷(取值0~6,值越大表示學歷越高);X5=1~受雇于重點中學,X5=0~其它;;X6=1~受過培訓的畢業(yè)生,X6=0~未受過培訓的畢業(yè)生或受過培訓的肄業(yè)生;X7=1~以兩年以上未從事教學工作,X7=0~其它。注意組合(X2,X3)=(1,1),(0,1),(0,0)的含義。進行變量選擇,建立變量X1~X7與Z的回歸模型(不一定包括每個自變量),說明教師的薪金與哪些變量關(guān)系密切,是否存在性別和婚姻狀況上的差異。為了數(shù)據(jù)處理上的方便,建立對薪金取對數(shù)后作為因變量。除了變量X1~X7本身之外,嘗試將他們的平方項或交互項加入到模型中,建立更好的模型量。給出變量X1~X7的相關(guān)系數(shù),偏向關(guān)系,并對z,X1~X7分析因子關(guān)系。ZX1X2X3X4X5X6X7ZX1X2X3X4X5X6X719987000000462201158114011210151411000047299215911511131028181101004816951620100004125019110000491792167110100510281901010050169017300000161028190000005118271740000017101827000001522604175112110810723000000053172019901000091290301100005417202090000001012043001000055215920901410011135231012010561852210010000121204310001005721042131101001311043800000058185222000000114111841110000591852222000000151127420000006022102221100001612594211010061226622301000017112742110000622027231100001811274200010063185222700010019109547000001641852232000001201113520000016519952350000012114625201201066261624511311022118254110000672324253110100231404540001006818522570100012411825400000069205426000000025159455112110702617284113110261459660001007119482871100002712376711010072172029001000128123767010100732604308112110291496750100007418523091101013014247811010075194231900010031142479010000762027325110000321347911101007719423261101003313439200000178172032911010034131094000100792048337000000351814103002110802334346112111361534103000000811720355000001371430103110000821942357110000381439111110100832117380110001391946114113110842742387112111402216114114110852740403112111411834114114111861942406110100421414117000001872266437010000432052139110100882436453010000442087140002111892067458010000452264154002111902000464112110圖1二.問題分析與模型假設1.問題分析本題要求我們分析教師薪金與他們的資歷,性別,教育程度及培訓情況等因素之間的關(guān)系。按我們?nèi)粘I钪械某WR,教師薪金應該與他們的資歷,受教育程度有密切關(guān)系,資歷高,受教育程度高其薪金也應該相應的要高,與其性別,婚姻狀況應該沒有必然的聯(lián)系。為了說明教師薪金于各個因素之間的關(guān)系以及女教師是否收到不公平的待遇,她們的婚姻狀況是否影響其收入。我們建立統(tǒng)計回歸模型,通過各組數(shù)據(jù)來說明他們之間的關(guān)系,并進一步分析論證來確定影響教師薪金的因素。2.模型假設1.工作時間、性別、教育程度及培訓情況之間相互獨立,沒有交互作用;2.假設教師薪金除題中所列因素之外不再考慮其他因素對教師薪金的影響;3.女性是否結(jié)婚與其工作能力無關(guān);4.該地區(qū)的人事部門對中學教師的薪金調(diào)查是可信的;三.模型建立與求解按一般生活常識,薪金隨工作時間的增加而增加,學歷越高薪金也越高。假定工作時間,學歷對薪金的作用是線性的。受雇于重點中學的薪金應高于沒有受雇于重點中學的,受過培訓的畢業(yè)生的薪金應高于未受過培訓的畢業(yè)生的薪金,從事過教學工作的薪金應高于其他的。為了便于研究,,假定:培訓情況,性別,單身與否,受雇于重點中學與否,以前從事過教師職業(yè)與否等之間沒有交互作用,建立薪金Z與工作時間(X1),性別(X2),婚姻狀況(X3),學歷(X4),受雇學校(X5),培訓情況(X6)及從事教育年限(X7)之間的多元線性回歸模型(為了數(shù)據(jù)方便起見我們令y=log10(Z))為:y=a0+a1X1+a2X2+a3X3+a4X4+a5X5+a6X6+a7X7+ε(1)其中a0,a1,a2,a3,a4,a5,a6,a7是待估計的回歸系數(shù),ε是隨機誤差。它是由眾多的未加考慮的因素(包括隨機因素)所產(chǎn)生的影響。利用Matlab統(tǒng)計工具可以得到回歸系數(shù)及其置信區(qū)間(置信水平α=0.05),檢驗統(tǒng)計的量R2,F,P的結(jié)果見下表:從而得到回歸模型結(jié)果分析:從表中R2=0.7874,即因變量(薪金)的78.74%可由模型決定,F(xiàn)值遠大于F檢驗的臨界值,P遠小于置信水平,所以模型一從整體上看是可用的。進一步的討論:模型一的結(jié)果中我們發(fā)現(xiàn)對于a2,a3,a5,a6,a7其置信區(qū)間中包含0點;所以該模型是不可靠的,為了尋求改進方向,我們常用殘差分析法表明其回歸系數(shù)(對因變量y的影響)不是太顯著。從而我們將性別,婚姻狀況,受雇學校,培訓情況及從事教育年限從模型中剔除不予考慮,建立一個只關(guān)于工作時間和學歷程度的模型。得到模型如下:y=b0+b1X1+b4X4+ε(2)其中b0,b1,b4是待估計的回歸系數(shù),ε是隨機誤差。它是由眾多的未加考慮的因素(包括隨機因素)所產(chǎn)生的影響。利用Matlab統(tǒng)計工具可以得到回歸系數(shù)及其置信區(qū)間(置信水平α=0.05),檢驗統(tǒng)計的量R2,F,P的結(jié)果見下表,從而得到回歸模型:y^=50.4557-7.2050x1+0.046022x4分析,我們通過用Matlab統(tǒng)計工具箱逐步回歸方法,我們可看出薪金可能與其它量如資力、性別、教育程度及培訓情況等因素存在聯(lián)系,為討論出薪金具體與哪些量存在關(guān)系,用stepwise命令作了薪金關(guān)于工作時間、學歷、培訓情況、性別、結(jié)婚狀況的StepwisePlot圖,和StepwiseTable表,對剩余標準差(RMSE)和統(tǒng)計量F的值的分析,可以大概估計薪金主要與工作時間、學歷、培訓情況有關(guān)(按相關(guān)性是由大到小排列),而與性別和婚姻狀況關(guān)系甚小。在這里就可以大致說明:分析人事策略的合理性,女教師是沒有受到不公平的待遇的,同時她們的結(jié)婚與否并不會影響其收入。2.通過上述的分析,為了得到更好的模型,我們對上面的模型引入一些自變量之間交互關(guān)系以及引出對模型影響不顯著的自變量,同時,這個模型也屬于一個統(tǒng)計模型,為此可我們運用統(tǒng)計軟件從眾多的自變量中選出與因變量相關(guān)性較大的那些,我們設置信區(qū)間alpha為0.05,容許誤差beta為0.10,并同時采用逐步回歸。根據(jù)所給的觀測數(shù)據(jù)以及自變量間的相互關(guān)系,運用統(tǒng)計軟件,可很快得到影響薪金因素的最佳模型:X1+0.08899358484063X4同時通過MATLAB軟件可得出:R2=0.777F=151.194P=0對該模型我們做如下結(jié)果分析:我們可以通過查看對回歸后的曲線圖象,可以很好地反映出薪金與工作時間、性別、教育程度及培訓情況的關(guān)系。對于用MATLAB軟件求出的結(jié)果我們做如下分析:R2=0.777,表示變量(薪金)的77.7%是由該模型決定的,F(xiàn)的值遠遠的大于了F檢驗的臨界值,而且此模型的F值大于了模型一的F值,所以此模型從整體上來考慮可知此模型更優(yōu)。3.雖然薪金的關(guān)于工作時間、性別、教育程度及培訓情況的一個線性回歸模型已經(jīng)求出,并看到了它與觀測數(shù)據(jù)比較吻合,但是,我們也應該清楚地看到:該模型仍然有相關(guān)系數(shù)不很理想(即不太接近于1),F(xiàn)也好像沒有達到理想的大小,為了求的更好的、更合理的、更有合適的模型,我們在上面的基礎模型中加入一些兩自變量的交叉項或平方項,也許可以還有一些組合項很是非常之重要,與因變量有很強的相關(guān)性呢?于是我們可以在這七個自變量中任意組其中兩個,當然也是把這七個變量的組合都加到模型中。一時出現(xiàn)了大量的自變量,這時我們就可以再次使用統(tǒng)計軟件MATLAB通過它的幫忙下,我們就可以很簡單也在大量的自變量中使用逐步回歸的方法,選擇出只與因變量相關(guān)性很大的、且滿足一定要求的那些,并且它算出了該模型的相關(guān)系數(shù)、F檢驗值、概率P等等一些評價模型穩(wěn)定性、合理性的相關(guān)指標。相應的模型為:6.907947097856+0.004509446782595X1X2+(-6.766785398321e-006)X3+(-0.0259629801793X4X5+0.09580956153614X6

設月薪Z與x1、x2、x3、x4、x5、x6、x7的相關(guān)系數(shù)為r1、r2、r3、r4、r5、r6、r7,相關(guān)系數(shù)的計算公式為:nozx1x2x3x4x5x6x7x8019987000000006102819000000008107230000000013110438000000015112742000000024118254000000036153410300000005417202090000000591852222000000079204833700000006920542600000000圖2:Z與X1的關(guān)系圖圖2是從圖1中抽取Z只與X1相關(guān)的部分,即X2,X3,X4,X5,X6,X7都為零,并且Z的平均值為z=1429,X1的平均值為x1=120.091.所以由(1)得r1的分子為:476925,分母為:487577.427,r1=476925/487577.427=0.9782因此,在不考慮其他因素影響的條件下Z與X1正相關(guān)。Z、X1、X2、X3、X4、X5、X6、X7的平均值為下圖:nozx1x2x3x4x5x6x71728.04172.20.460.640.60.440.210.26圖3.平均值Z、X1、X2、X3、X4、X5、X6、X7的值與對應平均值的差值如下圖:zx1x2x3x4x5x6x7zx1x2x3x4x5x6x7-730-165-0.5-0.6-0.6-0.4-0.21-0.3473-140.540.363.4-0.40.790.74-713-1580.540.36-0.6-0.4-0.21-0.31264-130.540.364.40.560.790.74-700-1540.540.36-0.60.56-0.21-0.3-33-10-0.50.36-0.6-0.4-0.21-0.26-478-1530.540.36-0.6-0.4-0.21-0.364-5.20.540.36-0.60.56-0.21-0.26-700-153-0.50.36-0.60.56-0.21-0.3-380.8-0.5-0.6-0.6-0.4-0.210.74-700-153-0.5-0.6-0.6-0.4-0.21-0.3991.8-0.5-0.6-0.6-0.4-0.210.74-710-145-0.5-0.6-0.6-0.4-0.210.748762.80.540.361.40.560.79-0.26-656-142-0.5-0.6-0.6-0.4-0.21-0.3-826.8-0.50.36-0.6-0.4-0.21-0.26-438-1420.540.36-0.6-0.4-0.21-0.3-836.8-0.5-0.6-0.6-0.4-0.21-0.26-524-142-0.50.36-0.6-0.4-0.21-0.343136.8-0.50.363.40.56-0.21-0.26-376-141-0.50.361.4-0.40.79-0.312437.8-0.50.36-0.6-0.4-0.21-0.26-524-141-0.5-0.6-0.60.56-0.21-0.337640.80.540.36-0.60.56-0.21-0.26-624-134-0.5-0.6-0.6-0.4-0.21-0.312447.8-0.5-0.6-0.6-0.4-0.210.74-610-1310.540.36-0.6-0.4-0.21-0.312449.8-0.5-0.6-0.6-0.4-0.21-0.26-601-130-0.5-0.6-0.6-0.4-0.21-0.348249.80.540.36-0.6-0.4-0.21-0.26-469-1300.540.36-0.60.56-0.21-0.353850.8-0.50.36-0.6-0.4-0.21-0.26-601-1300.540.36-0.6-0.4-0.21-0.329950.80.540.36-0.6-0.4-0.21-0.26-601-130-0.5-0.6-0.60.56-0.21-0.312454.8-0.5-0.6-0.60.56-0.21-0.26-633-125-0.5-0.6-0.6-0.4-0.210.7412459.8-0.5-0.6-0.6-0.4-0.210.74-615-120-0.5-0.6-0.6-0.4-0.210.7426762.8-0.5-0.6-0.6-0.4-0.210.74-266-120-0.50.361.4-0.40.79-0.388872.80.540.362.40.560.79-0.26-546-1180.540.36-0.6-0.4-0.21-0.359680.80.540.36-0.60.56-0.21-0.26-324-118-0.5-0.6-0.60.56-0.21-0.312484.8-0.50.36-0.6-0.4-0.210.74-546-118-0.5-0.6-0.6-0.4-0.21-0.332687.8-0.5-0.6-0.6-0.4-0.21-0.26-134-1170.540.361.40.560.79-0.38891120.540.362.40.560.79-0.26-269-106-0.5-0.6-0.60.56-0.21-0.32201150.540.36-0.6-0.4-0.21-0.26-491-1050.540.36-0.60.56-0.21-0.3-8118-0.50.36-0.6-0.4-0.210.74-491-105-0.50.36-0.60.56-0.21-0.38761360.540.361.40.560.79-0.26-232-97.2-0.50.36-0.6-0.4-0.21-0.31241370.540.36-0.60.56-0.210.74-304-94.20.540.36-0.60.56-0.21-0.3214147-0.5-0.6-0.60.56-0.21-0.26-304-93.2-0.50.36-0.6-0.4-0.21-0.32991530.540.36-0.6-0.4-0.21-0.26-381-81.20.540.36-0.60.56-0.21-0.32141540.540.36-0.60.56-0.21-0.26-385-80.2-0.5-0.6-0.6-0.4-0.210.74-81570.540.36-0.60.56-0.21-0.26-418-78.2-0.5-0.6-0.60.56-0.21-0.3320165-0.5-0.6-0.6-0.4-0.21-0.2686-69.2-0.5-0.61.40.560.79-0.36061740.540.361.40.560.790.74-194-69.2-0.5-0.6-0.6-0.4-0.21-0.3-8183-0.5-0.6-0.6-0.4-0.210.74-298-69.20.540.36-0.6-0.4-0.21-0.32141850.540.36-0.6-0.4-0.21-0.26-289-61.20.540.36-0.60.56-0.21-0.33892080.540.36-0.6-0.4-0.210.74218-58.20.540.362.40.560.79-0.310142150.540.361.40.560.790.74488-58.20.540.363.40.560.79-0.310122310.540.361.40.560.790.74106-58.20.540.363.40.560.790.74214234

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論