醫(yī)藥信息分析與決策回歸分析課件_第1頁
醫(yī)藥信息分析與決策回歸分析課件_第2頁
醫(yī)藥信息分析與決策回歸分析課件_第3頁
醫(yī)藥信息分析與決策回歸分析課件_第4頁
醫(yī)藥信息分析與決策回歸分析課件_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

醫(yī)藥信息分析與決策第二章回歸分析本章要點(diǎn)一、概述二、回歸分析三、時(shí)間序列分析四、MicrosoftSQLServer2005實(shí)踐回歸分析與時(shí)間序列分析2*一、概述現(xiàn)實(shí)生活中的許多現(xiàn)象之間存在著相互依賴、相互制約的關(guān)系,這些關(guān)系在量上主要有兩種類型:確定性關(guān)系非確定性關(guān)系3*二、回歸分析編號(hào)NO體重(kg)肺活量(ml)編號(hào)NO體重(kg)肺活量(ml)編號(hào)NO體重(kg)肺活量(ml)160.145081156.9541812155.114238260.3844691257.2240972253.244523359.7443981355.9640632360.14516458.0440681457.8743342460.54473559.6743391556.8743012559.044297659.4443931655.9741412659.014123758.743891756.0739052759.74216859.7543061855.2839432859.064077960.543951955.7941952959.1242871058.7244622054.5640393054.2142015體重與肺活量之間有何關(guān)系,這里面的人都正常嗎?如何處理?*回歸分析6*回歸分析7*二、回歸分析

一元線性回歸9*二、回歸分析

最小二乘法10最小二乘法*二、回歸分析

最小二乘法最小二乘法:擬合回歸模型的原則是尋求代表性最好的模型是一個(gè)隨機(jī)變量;的均值為零,即;在每一個(gè)時(shí)期中,的方差為常量,即各個(gè)相互獨(dú)立;與自變量無關(guān)。11*二、回歸分析

最小二乘法利用EXCEL計(jì)算:?jiǎn)螕舨藛螜谥小肮ぞ摺薄凹虞d宏”命令,選擇相應(yīng)的“分析工具庫(kù)”和“分析工具庫(kù)–VBA函數(shù)”復(fù)選框,單擊“確定”按鈕,完成加載。13*二、回歸分析

最小二乘法利用EXCEL計(jì)算:?jiǎn)螕簟肮ぞ摺薄皵?shù)據(jù)分析”命令,選中“回歸”選項(xiàng),單擊“確定”按鈕。14Y=760.25+60.18x*15*二、回歸分析

假設(shè)檢驗(yàn)回歸系數(shù)顯著性檢驗(yàn)檢驗(yàn)假設(shè):檢驗(yàn)統(tǒng)計(jì)量:檢驗(yàn)規(guī)則:給定顯著性水平α,若,則回歸系數(shù)顯著。17*二、回歸分析

假設(shè)檢驗(yàn)回歸模型的顯著性檢驗(yàn)檢驗(yàn)假設(shè):回歸方程不顯著回歸方程顯著檢驗(yàn)統(tǒng)計(jì)量:檢驗(yàn)規(guī)則:給定顯著性水平,若,則回歸系數(shù)顯著。18*二、回歸分析

假設(shè)檢驗(yàn)檢驗(yàn)之間是否存在自相關(guān)關(guān)系當(dāng)時(shí),如果,認(rèn)為存在正自相關(guān);如果,認(rèn)為無自相關(guān);當(dāng)時(shí),如果,認(rèn)為存在負(fù)自相關(guān);如果,認(rèn)為無自相關(guān);如果,不能確定是否自相關(guān);當(dāng)D.W.值在2左右時(shí),模型不存在一階自相關(guān)。19*二、回歸分析

非線性回歸分析非線性回歸分析*21三、時(shí)間序列分析TimeSeriesAtimeseriesisasequenceofdatavaluesforavariableY1,Y2,…,Ynthatareseparatedbyequaltimeintervals.Ytisthenotationforthevalueoftimeseriesattimet.回歸分析中,如果自變量是時(shí)間變量,則將按時(shí)間順序產(chǎn)生和排列的離散型觀測(cè)數(shù)據(jù)序列()(t=1,2,…,T)稱作時(shí)間序列,t通常用年、月、季或天來計(jì)量。根據(jù)時(shí)間序列,揭示相應(yīng)系統(tǒng)的內(nèi)在統(tǒng)計(jì)特性和發(fā)展規(guī)律的統(tǒng)計(jì)方法,就稱時(shí)間序列分析。*22三、時(shí)間序列分析Example:NumberofpeopleemployedatInternationalSystemsCorporationfor20quarters.QuarterFiveYearsAgoFourYearsAgoThreeYearsAgoTwoYearsAgoLastYear1st1501601751802002nd1751902002202503rd4504604804955204th140145160180190*23三、時(shí)間序列分析Example:NumberofpeopleemployedatInternationalSystemsCorporationfor20quarters.*25三、時(shí)間序列分析Example:thefollowingdataindicatethenumberofmergersthattookplaceinanindustryovera19-yearperiod.*26三、時(shí)間序列分析FourComponentsofTimeSeriesTrends(長(zhǎng)期趨勢(shì)):Trendsintimeseriesarethelong-termmovementsoftheseriesthatcanbecharacterizedbysteadyoronlyslightlyvariableratesofchange.*29三、時(shí)間序列分析FourComponentsofTimeSeriesSeasonalvariations(季節(jié)變):Seasonalvariationsinatimeseriesarethosevariationsthatoccurratherpredictablyataparticulartimeeachyear.*30三、時(shí)間序列分析FourComponentsofTimeSeriesCyclicalvariations(周期變化):Cyclicalvariationsaremovementsinatimeseriesthatarerecurrentbutthatoccurincyclesoflongerthanayear.*31三、時(shí)間序列分析FourComponentsofTimeSeriesIrregularvariations(不規(guī)則變化):Irregularvariationsconstitutetheclassoftimeseriesmovementsthatdonotfitintotheotherthreecategories.*32三、時(shí)間序列分析ClassicalTimeSeriesModel(1)MultiplicativeTimeSeriesModel Y=T×S×C×I(2)AdditiveTimeSeriesModel Y=T+S+C+I(xiàn)(3)MixedTimeSeriesModel Y=T×S+C×I*331.趨勢(shì)外推法趨勢(shì)外推法(Trendextrapolation)是根據(jù)過去和現(xiàn)在的發(fā)展趨勢(shì)推斷未來的一類方法的總稱?;驹硎腔貧w分析,即以時(shí)間為自變量,以時(shí)間系列為因變量進(jìn)行回歸分析。*342.移動(dòng)平均法對(duì)于平穩(wěn)型時(shí)間數(shù)列可取最近n期數(shù)值的算術(shù)平均作為后期的預(yù)測(cè)值。其基本原理是:首先選擇一個(gè)固定的時(shí)間周期n,將最近n期的數(shù)據(jù)加以平均作為下一期的預(yù)測(cè)值。*352.移動(dòng)平均法移動(dòng)平均方法具有以下的特點(diǎn):1.當(dāng)時(shí)間序列的波動(dòng)較大時(shí),最近期的觀察值應(yīng)該賦予最大的權(quán)數(shù),較遠(yuǎn)時(shí)期的觀察值賦予的權(quán)數(shù)應(yīng)該依次遞減;當(dāng)時(shí)間序列的波動(dòng)不是很大時(shí),對(duì)各期的觀察值應(yīng)賦予近似相等的權(quán)數(shù)。只使用最近期的數(shù)據(jù),在每次計(jì)算移動(dòng)平均值時(shí),移動(dòng)的間隔都為固定的k;2.主要適合對(duì)較為平穩(wěn)的時(shí)間序列進(jìn)行預(yù)測(cè);3.移動(dòng)間隔和權(quán)數(shù)的選擇是該方法的關(guān)鍵。*363.指數(shù)平滑法它是加權(quán)平均的一種特殊形式,觀察值距離預(yù)測(cè)時(shí)期越久遠(yuǎn),權(quán)數(shù)變得越小,且呈現(xiàn)指數(shù)下降趨勢(shì),因此稱為指數(shù)平滑。指數(shù)平滑法根據(jù)平滑的次數(shù)包括一次指數(shù)平滑、二次指數(shù)平滑、三次指數(shù)平滑等.用的最多的是一次平滑法,下面對(duì)一次平滑進(jìn)行介紹。*373.指數(shù)平滑法指數(shù)平滑法具有以下的特點(diǎn):不同的會(huì)對(duì)預(yù)測(cè)結(jié)果產(chǎn)生不同的影響,阻尼系數(shù)也是如此;在實(shí)際應(yīng)用中,當(dāng)時(shí)間序列有較大的隨機(jī)波動(dòng)時(shí),宜選用較大的值(如0.9),以便能很快跟上近期的變化;當(dāng)時(shí)間序列比較平穩(wěn)時(shí),宜選用較小的;選擇平滑系數(shù)時(shí),還應(yīng)考慮預(yù)測(cè)誤差。確定時(shí),可嘗試選擇幾個(gè)進(jìn)行預(yù)測(cè),然后找出預(yù)測(cè)誤差最小的那個(gè)作為最后的值。*38例:某市某一惡性疾病死亡率統(tǒng)計(jì)數(shù)據(jù)表年度死亡率年度死亡率年度死亡率199045.12199659.71200265.5199151.56199755.5200358.69199259.21199859.11200464.79199356.68199964.93200569.11199442.71200058.63200661.37199561.15200165.41200772.82*39某市某一惡性疾病死亡率*403.指數(shù)平滑法據(jù)此預(yù)測(cè)2008年該病的死亡率,以便做出相應(yīng)的預(yù)防措施。

*414.隨機(jī)時(shí)間序列分析隨機(jī)時(shí)間序列分析是指僅用它的過去值及隨機(jī)擾動(dòng)項(xiàng)所建立起來的模型進(jìn)行分析,即描述序列{xt}某一時(shí)刻t和前p個(gè)時(shí)刻序列值之間的相互關(guān)系的分析方法,一般的p階自回歸過程AR(p)為:*424.隨機(jī)時(shí)間序列分析建立具體的時(shí)間序列模型時(shí),需解決如下三個(gè)問題:1)模型的具體形式。2)時(shí)序變量的滯后期。3)隨機(jī)擾動(dòng)項(xiàng)的結(jié)構(gòu)。例如,取線性方程、一期滯后以及白噪聲隨機(jī)擾動(dòng)項(xiàng),模型將是一個(gè)1階自回歸過程:*434.隨機(jī)時(shí)間序列分析*44四、MicrosoftSQLServer2005實(shí)踐回歸分析與時(shí)間序列分析1.建立數(shù)據(jù)庫(kù)2.導(dǎo)入數(shù)據(jù)3.建立數(shù)據(jù)挖掘模型4.數(shù)據(jù)挖掘查看器45*北京市SARS傳播部分統(tǒng)計(jì)數(shù)據(jù)表日期已確診病例累計(jì)現(xiàn)有疑似病例死亡累計(jì)治愈出院累計(jì)日期已確診病例累計(jì)現(xiàn)有疑似病例死亡累計(jì)治愈出院累計(jì)4月20日33940218335月23日246511791605824月21日48261025435月24日249011341636674月22日58866628465月25日249911051677044月23日69378235555月26日250410691687474月24日77486339645月27日251210051728284月25日87795442735月28日25149411758664月26日988109348765月29日25178031769284月27日1114125556785月30日252076017710064月28日1199127559785月31日252174718110874月29日1347135866836月1日252273918111244月30日1440140875906月2日252273418111575月1日15531415821006月3日252272418111895月2日16361468911096月4日252271818112635月3日17411493961156月5日252271618113215月4日180315371001186月6日252271318314035月5日189715101031216月7日252366818314465月6日196015231071346月8日252255018415435月7日204915141101416月9日252245118416535月8日213614861121526月10日252235118617475月9日217714251141686月11日252325718618215月10日222713971161756月12日252315518718765月11日226514111201866月13日25227118719445月12日230413781292086月14日252241891994

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論