《數(shù)學模型》課程設計報告_第1頁
《數(shù)學模型》課程設計報告_第2頁
《數(shù)學模型》課程設計報告_第3頁
《數(shù)學模型》課程設計報告_第4頁
《數(shù)學模型》課程設計報告_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 數(shù)學模型課程設計(論文)設計(論文)題目統(tǒng)計模型案例分析學院名稱專業(yè)名稱學生姓名學生學號指導教師管理科學學院應用統(tǒng)計學劉春莉201707100218薛源設計(論文)成績E2C309教務處制2019年06月19日填寫說明1、專業(yè)名稱填寫為專業(yè)全稱,有專業(yè)方向的用小括號標明;2、格式要求:格式要求:用A4紙雙面打印(封面雙面打?。┗蛟贏4大小紙上用藍黑色水筆書寫。打印排版:正文用宋體小四號,1.5倍行距,頁邊距采取默認形式(上下2.54cm左右2.54cm,頁眉1.5cm,頁腳1.75cm)。字符間距為默認值(縮放100%,間距:標準);頁碼用小五號字底端居中。具體要求:題目(二號黑體居中);摘

2、要(“摘要”二字用小二號黑體居中,隔行書寫摘要的文字部分,小4號宋體)關鍵詞(隔行頂格書寫“關鍵詞”三字,提煉3-5個關鍵詞,用分號隔開,小4號黑體);正文部分采用三級標題;第1章XX(小二號黑體居中,段前0.5行)1.1XXXXX小三號黑體XXXXX(段前、段后0.5行)1.1.1小四號黑體(段前、段后0.5行)參考文獻(黑體小二號居中,段前0.5行),參考文獻用五號宋體,參照參考文獻著錄規(guī)則(GB/T77142005)。實驗一摘要:本文對某地教師薪金與其他影響因素做了合理科學的分析,建立教師薪金與其影響因素的回歸模型。問題(1)中我們很難確定到底與薪金哪些因素有關,在模型中我們考慮到了題目

3、給出的所有因素,通過題目給出的數(shù)據(jù),我們建立了初步的線性回歸模型,用MATLAB軟件求解。通過對解出的數(shù)據(jù)進行分析,我們發(fā)現(xiàn)模型存在缺陷,有些變量對因變量的影響不顯著,這也就說明這些因素對所調(diào)查的教師的薪金影響較小。我們剔除了其中對因變量影響不顯著的變量,使模型得到進一步的改進,然后再用對因變量影響顯著的XI和X4建立了簡單的統(tǒng)計回歸模型,求解之后發(fā)現(xiàn),模型依然沒有達到理想的效果,然后再利用殘差分析法,在前一模型中增加了他們的交互項和平方項,最終得到進一步改進的模型。然后再利用MATLAB軟件對其進行求解。關鍵詞:統(tǒng)計回歸模型;MATLAB一問題重述某地人事部門為研究中學教師的薪金與他們的資歷

4、,性別,教育程度及培訓情況等因素之間的關系,要建立一個數(shù)學模型,分析人士策略的合理,特別是考慮女教師是否受到不公平的待遇,以及他們的婚姻狀況是否會影響收入。為此,從當?shù)亟處熤须S機選了3414位進行觀察,然后從中保留了90個觀察對象,得到了下表給出的相關數(shù)據(jù)。盡管這些數(shù)據(jù)具有一定的代表性,但是仍有統(tǒng)計分析的必要。現(xiàn)將表中數(shù)據(jù)的符號介紹如下:Z月薪(元)XI工作時間(月)X2=l男性,X2=0女性;X3=1男性或單身女性,X3=0已婚女性;X4學歷(取值06,值越大表示學歷越高);X5=1受雇于重點中學,X5=0其它;X6=1受過培訓的畢業(yè)生,X6=0未受過培訓的畢業(yè)生或受過培訓的肄業(yè)生;X7=1

5、以兩年以上未從事教學工作,X7=0其它。注意組合(X2,X3)=(1,1),(0,1),(0,0)的含義。進行變量選擇,建立變量X1X7與Z的回歸模型(不一定包括每個自變量),說明教師的薪金與哪些變量關系密切,是否存在性別和婚姻狀況上的差異。為了數(shù)據(jù)處理上的方便,建立對薪金取對數(shù)后作為因變量。(1)除了變量XIX7本身之外,嘗試將他們的平方項或交互項加入到模型中,建立更好的模型量。(2)給出變量XIX7的相關系數(shù),偏向關系,并對z,XIX7分析因子關系。ZX1X2X3X4X5X6X7ZX1X2X3X4X5X6X719987000000462201158114011210151411000047

6、299215911511131028181101004816951620100004125019110000491792167110100510281901010050169017300000161028190000005118271740000017101827000001522604175112110810723000000053172019901000091290301100005417202090000001012043001000055215920901410011135231012010561852210010000121204310001005721042131101001311

7、043800000058185222000000114111841110000591852222000000151127420000006022102221100001612594211010061226622301000017112742110000622027231100001811274200010063185222700010019109547000001641852232000001201113520000016519952350000012114625201201066261624511311022118254110000672324253110100231404540001006

8、818522570100012411825400000069205426000000025159455112110702617284113110261459660001007119482871100002712376711010072172029001000128123767010100732604308112110291496750100007418523091101013014247811010075194231900010031142479010000762027325110000321347911101007719423261101003313439200000178172032911

9、010034131094000100792048337000000351814103002110802334346112111361534103000000811720355000001371430103110000821942357110000381439111110100832117380110001391946114113110842742387112111402216114114110852740403112111411834114114111861942406110100421414117000001872266437010000432052139110100882436453010

10、000442087140002111892067458010000452264154002111902000464112110圖1二問題分析與模型假設1.問題分析本題要求我們分析教師薪金與他們的資歷,性別,教育程度及培訓情況等因素之間的關系。按我們?nèi)粘I钪械某WR,教師薪金應該與他們的資歷,受教育程度有密切關系,資歷高,受教育程度高其薪金也應該相應的要高,性別,婚姻狀況可能沒有必然的聯(lián)系。為了說明教師薪金于各個因素之間的關系以及女教師是否收到不公平的待遇,她們的婚姻狀況是否影響其收入。我們建立統(tǒng)計回歸模型,通過各組數(shù)據(jù)來說明他們之間的關系,并進一步分析論證來確定影響教師薪金的因素。2.模型假設

11、工作時間、性別、教育程度及培訓情況之間相互獨立,沒有交互作用;假設教師薪金除題中所列因素之外不再考慮其他因素對教師薪金的影響;該地區(qū)的人事部門對中學教師的薪金調(diào)查是可信的;三模型建立與求解模型一為了便于研究,假定:培訓情況,性別,單身與否,受雇于重點中學與否,以前從事過教師職業(yè)與否等之間沒有交互作用,建立薪金Z與工作時間(XI),性別(X2),婚姻狀況(X3),學歷(X4),受雇學校(X5),培訓情況(X6)及從事教育年限(X7)之間的多元線性回歸模型(為了數(shù)據(jù)處理上的方便,我們對薪金取對數(shù)后作為自變量。)為:y二a0+alXl+a2X2+a3X3+a4X4+a5X5+a6X6+a7X7+(1

12、)其中a0,al,a2,a3,a4,a5,a6,a7是待估計的回歸系數(shù),是隨機誤差。它是由眾多的未加考慮的因素(包括隨機因素)所產(chǎn)生的影響。利用Matlab統(tǒng)計工具可以得到回歸系數(shù)及其置信區(qū)間(置信水平a=0.05),檢驗統(tǒng)計的量R2,F,p的結果見圖2參數(shù)參數(shù)估計值參數(shù)置信區(qū)間a07.05716.9923,7.1218al0.00170.0014,0.0019a20.0094-0.0759,0.0946a3-0.00270.0916,0.0863a40.08840.038&0.1380a50.0208-0.0486,0.0902a60.0354-0.1103,0.1811a7-0.0046-

13、0.0805,0.0712R2=0.7900F=44.0765p0.0001s2=0.0188圖2結果分析:從表中R2=0.7900,即因變量(薪金)的79.00%可由模型決定,F(xiàn)值遠大于F檢驗的臨界值,P遠小于置信水平,所以模型一從整體上看是可用的。模型二進一步的討論:模型一的結果中我們發(fā)現(xiàn)對于a2,a3,a5,a6,a7其置信區(qū)間中包含0點;所以該模型是存在缺點,我們將性別,婚姻狀況,受雇學校,培訓情況及從事教育年限從模型中剔除不予考慮,建立一個只關于工作時間和學歷程度的模型。得到模型如下:y=b0+blXl+b4X4+(2)其中b0,bl,b4是待估計的回歸系數(shù),是隨機誤差。它是由眾多的

14、未加考慮的因素(包括隨機因素)所產(chǎn)生的影響。利用Matlab統(tǒng)計工具可以得到回歸系數(shù)及其置信區(qū)間(置信水平a=0.05),檢驗統(tǒng)計的量R2,F,p的結果見圖3參數(shù)參數(shù)估計值參數(shù)置信區(qū)間b07.06527.0165,7.1138bl0.00170.0014,0.0019b40.10270.0794,0.1260r2=0.7874F=161.1350p0.0001s2=0.0180圖3在這里就可以大致說明:分析人事策略的合理性,女教師是沒有受到不公平的待遇的,同時她們的結婚與否并不會影響其收入。模型三通過上述的分析,為了得到更好的模型,我們先大致分析y與X1,X4的關系,首先利用圖1的數(shù)據(jù)分別作出

15、y對X1,X4的散點圖.系列1X1的散點圖0123456y對X2的散點圖從圖中可以發(fā)現(xiàn),隨著XI的增加,y的值增長減小.我們對上面的模型引入自變量的X1的平方項.模型如下y二cO+c1X1+c2X4+c3X2+(3)其中cO,cl,c2,c3是待估計的回歸系數(shù),是隨機誤差。它是由眾多的未加考慮的因素(包括隨機因素)所產(chǎn)生的影響。利用Matlab統(tǒng)計工具可以得到回歸系數(shù)及其置信區(qū)間(置信水平a=0.05),檢驗統(tǒng)計的量R2,F,p的結果見圖3參數(shù)參數(shù)估計值參數(shù)置信區(qū)間C06.911465907047196.86302176549634,6.95991004859805c10.0042239230

16、00730.00364401902828,0.00480382697319c20.089979714416370.07302164681304,0.10693778201969c3-0.00000608009796-0.00000740826516,-0.00000475193076R2=0.8917F=236.0527p0.0001s2=0.0093可以看到R2擬合度增高,因此模型更優(yōu)模型四前面的模型我們假設各個因素之間沒有交互作用,但是現(xiàn)實中可能存在交互作用.我們應該在模型中加入交互項,以提高模型準確度.在模型三基礎上增加X1與X4的交互項模型記為y二d0+dlXl+d2X4+d3X2+d

17、4XlX4(4)利用Matlab統(tǒng)計工具可以得到回歸系數(shù)及其置信區(qū)間(置信水平a=0.05),檢驗統(tǒng)計的量R2,F,p的結果見圖3參數(shù)參數(shù)估計值參數(shù)置信區(qū)間d06.910666335209976.86168392730437,6.95964874311557di0.004217347791210.00363272448148,0.00480197110094d20.095065074802230.05805279003974,0.13207735956472d3-0.00000603312814-0.00000740260117,-0.00000466365512d4-0.0000284494

18、8544-0.00021222974895,0.00015533077807R2=0.8918F=175.1996p0.05,可知在顯著性水平a=0.05下接受:十:m=2。lambda二0.40390.83350.40560.89960.51710.70630.66910.58180.72680.56970.88570.44900.89990.42500.86430.4074圖4因子載荷矩陣psi二0.14220.02620.23310.21380.14720.01390.00950.0870圖5方差估計值由圖4可得因子模型如下=0.4039+0.8335+=0.4056+0.8996=0.

19、5171+0.7068=0.6691+0.5818=0.7268+0.5697=0.8857+0.4490=0.8999+0.4250=0.8643+0.4074且由圖5,可知特殊方差的估計值為8*=(0.1422,0.0262,0.2331.0.213&0.1472,0.01308970)095,0.(第四問)表3:得分最低五位表4得分最高五位表5:得分最低五位表6:得分最高五位29-1.6455471.671248-1.1126341.68574-1.003752.046544-0.9104113.411835-0.9058463.439154-2.6269531.357534-1.648

20、1311.90136-1.5425411.986427-1.5421362.173720-1.4387112.3677四、運行結果分析由表1,可以看出第一主成分Y的方差貢獻率為83.6275%,前兩個主成分的累積方差貢獻率為91.5625%,所以只用前兩個主成分就可以了.從y1的表達式看,它在每個標準化變量上有相近的正載荷.說明每個標準化變量對的重要性都差不多,反映了徑賽項目均衡水平,故可以解釋為徑賽的“優(yōu)異水平成分”從y2的表達式看,它在標準化變量:和&上都有中等程度的正載荷在后5個標準化變量上均為負載有,恰好反映了徑賽中短距離項目與長距離項目的對照,故可以解釋為競賽的“距離成分”從“優(yōu)異水

21、平成分”y的排序,由于徑賽成績越小越優(yōu)秀。由計算結果得到,“優(yōu)異水平成分”排名前5位的國家或地區(qū)分別為美國、英國、意大利、肯尼亞和法國。最后5位的國家或地區(qū)分別為庫克群島、薩摩亞、新加坡巴布業(yè)新兒內(nèi)亞和緬甸,這種排序與最初對不同國家或地區(qū)的運動水平的看法基本一致。因子載荷矩陣的估計中發(fā)現(xiàn).標準化變量*(500m):-(1000m)4(馬拉松)的成績在第一公共因子上的載荷較大.說明它主要反映運動員的耐力,可以解釋為“耐力因子”(100m):(200m)的成績在第二公共因子二上的載荷較大,說明它主要反映運動員的速度,可以解釋為“速度因子”。“耐力因子”二越小的越擅長于長跑項目,由二得分可知,在長跑項目更具有優(yōu)勢的國家或地區(qū)依次為:肯尼亞、西班牙、比利

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論