回歸分析法簡單線性回歸

上傳人：a*** IP屬地：湖北上傳時間：2025-01-12 格式：PPT 頁數：107 大?。?.34MB 積分：23 舉報 版權申訴

已閱讀5頁，還剩102頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

Chapter5信息分析方法（二）傳統(tǒng)的預測方法主要是統(tǒng)計預測方法，對歷史數據通過經濟模型、回歸分析和時間序列等方法預測未來的趨勢。在擁有大量歷史數據，而且關鍵變量間的關系在未來保持不變時，統(tǒng)計預測方法比較有效。但在動蕩多變和錯綜復雜的環(huán)境下，統(tǒng)計預測方法因其基于關鍵變量間的歷史聯系的假設跟實際情況不符而很難奏效。而情景分析法則通過對未來詳細地、嚴密地推理和描述來構想未來各種可能的方案，從而能夠較好的輔助決策。2025/1/625.1情景分析法5.1.1情景分析法概述情景（Scenario）一詞有概要、劇本、劇情、情節(jié)或情況等意思。關于情景的定義，聯合國環(huán)境規(guī)劃署、千年生態(tài)評估項目等國際組織和機構以及國內外研究人員給出了數十種不盡相同的表述。具有以下幾個典型特點：情景是關于將來的；情景是描述性的；情景提供了一個可選擇的、多樣化的未來；情景分析需要系統(tǒng)性的過程。情景是一種基于對高驅動力和高不確定性因素的假設，通過系統(tǒng)性的分析，對未來做出可選擇的、多樣化的描述。情景并不是預測將來會怎么樣，而是描繪將來將如何展開；情景是探討未來的可能性，而不是討論未來應該怎么樣（婁偉，2012）。2025/1/632025/1/642025/1/651972年，殼牌石油（SHELL）公司規(guī)劃人員PierreWack領導了一個名為“團體規(guī)劃”（GroupPlanning）的研究小組，運用情景分析法分析了中東局勢，得出將爆發(fā)石油危機的結論。殼牌公司據此調整了企業(yè)戰(zhàn)略，及時、成功地應對了70年代石油危機。70年代中后期，得到迅速發(fā)展和廣泛運用，出現了多種不同的模式及知名研究報告羅馬俱樂部（ClubofRome）的《增長的極限》（TheLimitstoGrowth）和《人類的轉折點》（MankindattheTurningPoint）此后，情景分析經歷了兩次飛躍20世紀80年代后期，情景分析的進步隨著復雜性理論的興起而升級。20世紀90年代，情景分析者把規(guī)劃的焦點集中在組織學習上，情景分析隨著組織學習理論的興起而得到進一步完善。2025/1/66情景分析的學派直覺邏輯學派（Intuitivelogicsschool）主要依靠利益相關者及專家的直覺構建情景。當然，也可以同多種模型相結合，以提升情景分析的科學性。代表性的直覺邏輯情景分析主要有斯坦福研究院（SRI）、全球商業(yè)網（GlobalBusinessNetwork），以及殼牌石油（Shell）公司等機構發(fā)展的方法。2025/1/67概率修正趨勢學派（Probabilisticmodifiedtrendsschool）需要借助決策樹、蒙特卡羅模擬、貝葉斯決策理論、馬爾科夫決策分析等方法。該學派又分為趨勢影響分析和交叉影響分析趨勢影響分析（TrendImpactAnalysis，TIA）是一種實用有效的預測方法，它是為了彌補趨勢外推法的不足而發(fā)展起來的。一般認為，這種方法的出現同位于美國康涅狄格州的未來集團（FuturesGroup）密不可分。交叉影響分析（Cross-impactanalysis，CIA）又稱交叉影響模型、交叉概率法。從1968年Gordon提出基于蒙特卡羅仿真模擬的交叉影響分析模式后，先后出現了用于預見事件發(fā)生概率、用于預見事件發(fā)展趨勢和用于選取關鍵事件等三種具有不同功能的模式。2025/1/68遠景學派（La

Prospective）所謂遠景，主要是指戰(zhàn)略情景構建遠景學派由法國哲學家GastonBerger最早發(fā)展此后，20世紀70年代以來，MichelGodet開發(fā)的以MICMAC和MACTOR等為代表的一系列情景分析工具得到了廣泛的應用，從而成為遠景學派的代表。MICMAC通過變換代表了事件之間相互影響的交叉影響矩陣，進而發(fā)現隱藏在事件之間直接影響之下的間接影響。MACTOR則專注于定量與定性結合的角色戰(zhàn)略分析。2025/1/69

直覺邏輯學派遠景學派概率修正趨勢學派情景目的戰(zhàn)略決策、組織學習支持政策制定、戰(zhàn)略決策以及具體行動規(guī)劃外推預測和政策評估情景表述描述性或規(guī)范性通常是描述性的，也可以是規(guī)范性的描述性的情景范圍范圍可寬可窄，從全球、區(qū)域、國家，到一家企業(yè)通常范圍較窄，但在一定范圍內要廣泛考慮各要素范圍較窄，并依據特定事件的發(fā)展趨勢關注其未來可能動向和影響時間跨度變化：3-20年變化：3-20年變化：3-20年方法論過程導向：歸納或演繹，基本上是主觀的，依賴有約束的直覺進行定性分析結果導向：有指導的和客觀的。定量化(有一些主觀性)，依賴復雜的計算機和數學模型結果進行計算結果導向：有指導的和客觀的。定量化(有一些主觀性)，依賴復雜的計算機和數學模型進行外推模擬常用工具通用的：頭腦風暴，STEEP分析，聚類分析．矩陣，系統(tǒng)動力學和利益相關者分析專有的：結構和角色扮演分析，形態(tài)分析，德爾菲法，以及MICMAC、MACTOR等趨勢影響分析和交叉影響分析，蒙特卡羅模擬情景出發(fā)點特定的管理決策，普遍關注的議題或領域關注具體現象決策/問題的，針對詳細的、可靠的時間序列數據進行決策2025/1/6102025/1/611

直覺邏輯學派遠景學派概率修正趨勢學派識別/選擇關鍵驅動力直覺:頭腦風暴技術，STEEP要素分析，同不尋常人物進行討論、研究利用角色分析進行討論，利用先進的計算機工具進行全面的結構分析利用歷史時間序列數據的擬合曲線識別發(fā)展趨勢，使用專家判斷創(chuàng)建可能的高度影響不確定未來的事件數據庫建立情景框架界定情景邏輯作為主題或原則(常常以矩陣形式)基于關鍵變量，利用矩陣等手段創(chuàng)建可能的假定基于關鍵指標的預測，利用蒙特卡羅模擬構建不確定包情景輸出定性的：基于圖標、有限的量化分析，構建若干個平行的情景故事。啟示、戰(zhàn)略選擇、早期預警越來越多地成為情景輸出內容定性的和定量的：基于綜合分析可能的行動及其后果，構建多個可供選擇的情景定量的：基準情景，加上上下調整的時間序列預測?？梢员缓喍痰那榫肮适滤阑榫案怕首兓?，所有的方案必須具有同樣的可能是的，變量發(fā)展的概率取決于參與者的認知未來事件的發(fā)生概率受制于各類前提條件生成情景數量一般2～4個多個依賴模擬的數量，通常3～6個情景評價標準連貫性，綜合性，內部一致性，新穎性，結構分析和邏輯基礎的嚴謹性。所有的情景同等重要連貫性，綜合性，內部一致性，嚴謹的結構。以數據分析為基礎，合理的，并且可重復合理的，并且可重復2025/1/612組織錯誤(Organizationalerrors)直到情景大部分或者全部建立以后,才把關鍵決定制定者包括在內;采用那些只反映了很少多樣性的條件;抵制或禁止組織外在個體的參與;不包括那些對確定競爭者知之甚少的個體(不管這些個體是處于組織內還是組織外);在情景構建和分析中拒絕使用外部專家;設定不切實際的截止日期或者里程碑,導致情景結果變得搖搖欲墜。情景分析的局限性過程復雜。情景分析法在一定程度上依賴于管理者的直覺,而缺乏程序化模式,操作起來比較困難。而且環(huán)境中一些極其重要的變化往往逐漸演變,不易察覺。近期效果不顯著。運用情景分析法進行預測一般需要高層管理者投入大量寶貴的時間,而且使用者常常經過幾年時間才能對情景分析法有深入的理解和信任。2025/1/6135.1.2情景分析的一般操作步驟關于情景分析法的操作步驟，目前存在一些不同的版本。這些版本雖然表述不同，但大多具有類似的步驟，并有一個顯著的共同點，就是對情景關鍵因素的分析，并一致認為這一步驟是否完善將導致對最后各個情景預測的可信性與準確性。2025/1/614提出者操作步驟Gilbert提出的10個步驟提出規(guī)劃的前提假設；定義時間軸和決策空間；回顧歷史；確定普通和相矛盾的假設；為結構變量決定連接到多樣性的指示；為填充決策空間而構建情景草案；為所有的競爭者草擬策略；將策略映射到情景；使替代的策略有效；選擇或者適應最好的策略。Fink提出的5個階段情景準備；情景域分析；情景預測；情景發(fā)展；情景傳遞。斯坦福研究院擬定的

6項步驟明確決策焦點；識別關鍵因素；分析外在驅動力量；選擇不確定的軸向；發(fā)展情景邏輯；分析情景的內容。國際能源署（InternationalEnergyAgency，IEA）情景構建方案得到了較為廣泛的應用，可以作為一般性模板予以參考。并不是每次情景分析都需要所有步驟，具體要根據分析的對象，以及資料的多少來決定分析的步驟及方法。2025/1/6152025/1/6162025/1/617篩選關鍵的不確定性思考每個驅動力的不確定性程度及其程度的大小，以及對未來可能的影響方式會產生怎樣的變化；思考每個驅動力對未來的可能影響（或重要性）及其影響的大小；識別具有最大影響和最大不確定性的指標（通常為2～3個指標）。構建情景框架2025/1/618兩個最關鍵的不確定性（CU1和CU2）及其未來不同的發(fā)展趨勢詳述情景現狀與趨勢。就現狀所代表的未來情景的特征展開討論。預期結果。就情景的預期結果展開討論。一旦關鍵的不確定性被解決了，那時世界將會是什么樣子。添加細節(jié)和內容，以豐富情景的預期結果，并創(chuàng)建一個綜合的、首尾呼應的情景。思考每個主題和驅動力，并提供具體內容。思考哪些方面將變得更好或更糟。思考有哪些挑戰(zhàn)已經解決，又有哪些挑戰(zhàn)依然懸而未決。時間軸。運用現狀、預期結果和時間表。為每個情景命名。2025/1/619定量分析通過定量信息來加強情景的定性描述。其預期產出是“具體的、有科學說服力的定量信息”。確定定量分析方法、收集所需數據及其相互關系、運用工具和模型產出定量估計。2025/1/620聯合國環(huán)境規(guī)劃署出版的全球環(huán)境展望（GlobalEnvironmentOutlook，GEO）系列報告3中通過應用PoleStar軟件來對兩個情景進行定量分析。盡管PoleStar為備選情景在組織經濟、資源和環(huán)境信息等方面提供了一個靈活簡單的核算框架，但情景作者仍認為，定量分析需要更多環(huán)境影響方面的信息來加以補充。因此，其它模型（即RIVM的IMAGE模型、CSER的WaterGAP模型以及NIES的AIM模型）也被引入情景過程，以使不同區(qū)域之間和定性描述上的數據變得更為連貫，從而統(tǒng)一模型的輸入數據（例如，人均GDP增長率）。2025/1/6212025/1/6222025/1/6232025/1/624牛長振．2012．國際關系中的情景分析．國際政治科學,(3):61~83在這種情況下，南非各利益集團于1991-1992年在南非開普敦市蒙特佛利國際會議中心召開了蒙特佛利會議（MontFleurConference），以探討國家變革。該會議的主要目的是探討南非未來10年可能的發(fā)展狀況。會議總召集人，南非西開普敦大學（UniversityoftheWesternCape）教授皮爾特·拉諾斯（PieterLeRoux）邀請了22位在南非較具影響力、來自不同利益團體的人物。包括左翼政治激進分子、非國大官員、主流經濟學家、工會代表、資深學者和開明的白人企業(yè)家等。會議要求與會者遵循兩大規(guī)則：一是自由暢談南非未來如何發(fā)展，不要去管自己或自己的利益團體是否喜歡;二是認真傾聽“異見”、反省深思，不允許在討論時說“這個情景不可能發(fā)生”或“我不想讓這種情景出現”之類的話，而只允許提出“為什么這種情況會發(fā)生”或“接下來會發(fā)生什么事情”等之類的問題。2025/1/625蒙特佛利會議總共召開了四次1991年9月，開發(fā)出30種情景，后經過整合縮減為9種。之后，會議成員分為四個小組，從社會、政治、經濟和國際四個層面，為這9種情景增添內容。1991年11月，選出了4種最能反映真實情況的情景。1992年3月，確定了這4種情景的最終方案。1992年8月，向各利益集團進行了匯報。2025/1/6262025/1/6272025/1/6282025/1/629如果書刊經銷商想對某一專著銷售量進行預測，該如何做呢？某個經銷商選擇了若干書店經理、書評家、讀者、編審、銷售代表和海外公司經理組成專家小組。將該專著和一些相應的背景材料發(fā)給各位專家，要求各自給出專著最低銷售量、最可能銷售量和最高銷售量三個數字，同時說明自己作出判斷的主要理由。將專家們的意見收集起來，歸納整理后返回給各位專家，然后要求專家們參考他人的意見對自己的預測重新考慮。專家們完成第一次預測并得到第一次預測的匯總結果以后，除了書店經理B，其他專家在第二次預測中都做了不同程度的修正。重復進行，在第三次預測中，大多數專家又一次修改了自己的看法。第四次預測時，所有專家都不再修改自己的意見。因此，專家意見收集過程在第四次以后停止。取小組平均數，最終結果為最低銷售量26萬冊、最高銷售量60萬冊、可能銷售量46萬冊。2025/1/6305.2德爾菲法2025/1/631德爾菲法依據系統(tǒng)的程序，采用匿名發(fā)表意見的方式，通過多輪次調查專家對問卷所提問題的看法，經過反復征詢、歸納、修改，最后匯總成專家基本一致的看法，作為預測的結果。信息的收集與反饋在這個雙向交流中是非常重要的。盡量避免信息的失真，保障信息的準確性是德爾菲法實施的初衷。匿名性、反饋性和統(tǒng)計性是德爾菲法的特點。德爾菲方法隱含了這樣一個前提，即建立在滿足一致性條件的專家群體意見的統(tǒng)計結果才是有意義的，所以它通過“專家意見形成——統(tǒng)計反饋——意見調整”這樣一個多次與專家交互交流的循環(huán)過程，使分散的意見逐次收斂在協(xié)調一致的結果上，充分發(fā)揮了信息反饋和信息控制的作用?！皥F體沉思”指在團體從眾的壓力下，會阻礙一些不尋常、少數或少見的觀點；“團體偏移”則指團體在討論各種替代方案時，會使最后的決定比他們最初所持有的主張更為夸大或更為保守。2025/1/6322025/1/6332025/1/6342025/1/6352025/1/6365.2.3德爾菲法的關鍵問題專家組的形成專家篩選一般應注意：對專家自身的要求、專家樣本結構的代表性以及專家的人數。國外有資料認為，在一定領域連續(xù)工作10年以上的有關人士都可稱為專家。可以建立一個完備的評價專家?guī)?，包括專家基本信息（姓名、年齡、學歷、學位、研究方向、特長、從事工作等）和專家特殊信息（代表性研究成果、承擔課題情況、獲獎情況等）。一般可按本領域專家、相關領域專家、管理專家各占一定的比例來選擇。同時，專家的學派、單位、地區(qū)、經歷、年齡結構等在選擇時都要注意代表性。

德爾菲法選擇專家的人數依課題性質和規(guī)模而定，一般的人數范圍是10-20人，某些涉及面寬的重大課題，專家人數有時可以超過100人。2025/1/637調查表的設計調查表的設計沒有固定的格式，它因研究課題的不同而不同。一般，一份完整的德爾菲法調查表，應包括提問主體和附件兩部分。提問主體即具體的調查內容；附件常包括調查的目的意義、具體要求、背景材料、專家回執(zhí)等。應根據課題的性質、內容、要求來設計調查表的格式、項目、問題和表達方式，而且隨著課題研究的進程，在原先一輪調查表和專家意見的基礎上，設計新的一輪調查表，直至完成本課題的研究。與一般的社會調查表相類似，要求陳述要清楚、用詞要準確、避免組合事件，力求簡明。此外，為了便于對專家意見的統(tǒng)計處理，調查表的設計應盡可能地采用表格化、符號化、數字化，有利于將一般定性問題用定量化方法處理，并以定量結果表述。2025/1/638數據處理和表達描述性統(tǒng)計中的大多數內容都可以應用在德爾菲法的數據處理和表達中。德爾菲方法中主要使用的一些參數：積極系數。調查表的回收率，表明專家對該項目關心程度，通常要達到50%以上。權威系數（Cr）。用以反映專家對某咨詢問題的權威程度，一般由專家對指標做出判斷的依據（Ca）和專家對指標的熟悉程度（Cs）兩個部分構成，即Cr=（Ca+Cs）/2。一般認為權威系數大于0.7較好。2025/1/639專家對指標做出判斷的依據賦值（分）可以從理論分析層面進行判斷0.8-1按照實踐經驗判斷0.6-0.8按照國內外同行的了解0.4-0.6按照直覺0.2-0.4專家對指標熟悉程度賦值很熟悉1熟悉0.8比較熟悉0.6一般熟悉0.4不太熟悉0.2不熟悉0專家意見的集中程度。一般用各指標評分均數和滿分比來表示。滿分比指認為該指標非常重要的專家占專家總數的百分比。評分均數和滿分比越大說明專家意見集中，該咨詢問題重要。協(xié)調程度。由b個專家對k個觀察對象或觀察指標進行評分，檢驗b個評判員的評價結果是否具有一致性，可以使用KendallsW來進行衡量，

Kendalls

是Friedman統(tǒng)計量的標準化形式，可解釋為協(xié)調系數，是評分者之間一致程度的測量，其范圍從0（完全不一致）到1（完全一致）。使用SPSS進行計算時，可以依次選擇:Analyze—NonparametricTests--KRelatedSamples，打開TestsforSeveralRelatedSamples對話框，在TestVaribles中選入相應變量，同時選定KendallsW復選框。變異系數。說明專家對某一咨詢問題認識的波動程度。變異系數越小，專家一致程度越高。標準差除以平均值即為變異系數的值。2025/1/6402025/1/6412025/1/6422025/1/643第二輪問卷調查及其統(tǒng)計結果鑒于一些專家在開放式問卷中列出的領域與封閉式問卷中列出的領域有較多重復或高度相關，故將兩份問卷列出的領域加以合并，對個別領域的名稱做了小的調整。對于認可度較低的領域：“信息網格與內容網格”和“小世界現象（六度分隔）”，在第二輪問卷設計中不再列入。由此形成第二輪問卷，其中被調查的有30個領域。請專家對所列每個領域屬于情報學研究前沿的程度予以評分，分值為0-100，分值愈高表示該領域屬于情報學研究前沿的程度愈高。同時，還請專家對“判斷依據”和“對該領域的熟悉程度”兩個欄目進行打勾選擇?！芭袛嘁罁睓诹谐?個選擇項：“理論分析”、“工作經驗”、“參考國內著作”、“參考國外著作”、“直覺”。“熟悉程度”欄目列出4個選擇項：“最熟悉”、“相當熟悉”、“一般”、“不太熟悉”。2025/1/6442025/1/6452025/1/646三輪問卷調查數據的綜合比較分析第二輪平均分與第三輪平均分呈現出很強的正相關關系；第二輪平均分與第三輪等級和呈現出很強的負相關關系；而第二輪加權平均分與第三輪的平均分表現出較強的正相關；第二輪加權平均分與第三輪的等級和表現出較強的負相關。這些統(tǒng)計數據表明，第二輪的調查結果與第三輪的調查結果呈現出高度相關的關系，在解釋和判定情報學前沿領域上有著很強的一致性。結論23個領域的變異系數相對來說都較低，只有2個領域變異系數在0.3以上，表明就問卷中每一個情報學前沿領域而言，專家意見的協(xié)調程度較高，意見較為一致。各領域滿分頻率均普遍偏低，這表明我國情報學界對篩選出來的這23領域是否屬于前沿領域，肯定度還不夠高，需要進一步對這23個領域做調查和論證。2025/1/647在現實生活中，我們面臨的預測問題往往影響因素眾多、相互作用復雜，很難直接找到描述系統(tǒng)發(fā)展變化規(guī)律的函數，使用其他的預測方法有時難以得到滿意的結果。人工神經網絡的出現，為解決這一類問題提供了有力工具。人工神經網絡對人腦神經系統(tǒng)進行仿生，從而具有感知學習和推理的能力，非常適合模擬復雜的非線性系統(tǒng)。2025/1/6485.3人工神經網絡5.3.1人工神經網絡概述生物神經元人類大腦皮層包含約1011-1012個神經元，神經元由細胞及其發(fā)出的許多突起構成。細胞體內有細胞核，突起的作用是傳遞信息。輸入信號的若干個突起稱為“樹突”或“晶枝”（dendrite），輸出端的突起只有一個稱為“軸突”（axon）。樹突是細胞體的延伸部，它由細胞體發(fā)出后逐漸變細，全長各部位都可與其它神經元的軸突末稍相互聯系，形成所謂“突觸”（synapse）。在突觸處兩神經元并未連通，它只是發(fā)生信息傳遞功能的結合部。每個神經元的突觸數目不同，最高可達105個，各神經元之間的連接強度和極性不同，并且都可調整，基于這一特性，人腦具有存儲信息的功能。2025/1/649人工神經網絡的基本原理1943年，神經生物學家McCullochW.S.和青年數學家PittsW.A.合作，提出了第一個人工神經元模型，并在此基礎上抽象出神經元的數理模型。第一家神經計算機公司的創(chuàng)立者與領導人RobertHecht-Neilsen認為人工神經網絡是一個并行、分布處理結構，它由處理單元及稱為聯接的無向信號通道互連而成。處理單元（ProcessingElement）具有局部內存，可完成局部操作。每個處理單元有單一的輸出聯接，這個輸出可根據需要被分支成希望個數的并行聯接，這些并行聯接輸出相同的信號，即相應處理單元的信號，信號大小不因分支多少而變化。處理單元的輸出信號可以是任何需要的數學模型，每個處理單元中進行的操作必須是完全局部的。也就是說，它必須僅僅依賴于經過輸入聯接到達處理單元的所有輸入信號的當前值和存儲在處理單元局部內存中的值。2025/1/650該定義主要強調了四個方面的內容：并行、分布處理結構；一個處理單元（人工神經元，ArtificialNeuron）的輸出可以被任意分支，且大小不變；輸出信號可以是任意的數學模型；處理單元完全的局部操作。神經元是構成神經網絡的最基本單元（構件）。因此，要想構造一個人工神經網絡系統(tǒng)，首要任務是構造人工神經元模型。2025/1/651MeCulloch-Pitts模型1943年W.McCulloch和W.Pitts合作提出對于第j個神經元，接受多個其它神經元的輸入xi。Wij為突觸強度，既第i個神經元對第j個神經元作用的加權利用某種運算把輸入信號的作用結合起來，給出它們的總效果，稱為“凈輸入”，以Netj或Ij表示。凈輸入表達式有多種類型，其中，最簡單的一種形式是線性加權求和，即：此作用引起神經元j的狀態(tài)變化，而神經元j的輸出yj是其當前狀態(tài)的函數2025/1/652M-P模型的數學表達式為：θj為閾值，sgn是符號函數，當凈輸入超過閾值，yj取+1輸出，反之為-1輸出。如果考慮輸出與輸入的延時作用，表達式可修正為2025/1/6535.3.2人工神經網絡的基本要素Rumellhart、McClell和Hinton等曾經提出了著名的的PDP（ParallelDistributedProcessing）框架，認為人工神經網絡由八個方面的要素組成：一組處理單元、處理單元的激活狀態(tài)、每個處理單元的輸出函數、處理單元之間的聯接模式、傳遞規(guī)則、把處理單元的輸入及當前狀態(tài)結合起來產生激活值的激活規(guī)則、通過經驗修改聯接強度的學習規(guī)則以及系統(tǒng)運行的環(huán)境（樣本集合）?；疽氐牟煌M合構成了各種各樣的神經網絡，目前已產生了上百種模型。實踐中常用的基本神經網絡模型主要有：感知器神經網絡、線性神經網絡、BP神經網絡、徑向基神經網絡、自組織神經網絡和帶有反饋功能的Elman網絡和Hopfield網絡等。下面我們從人工神經網絡設計的角度選擇其中主要的三個部分予以介紹。2025/1/654神經元功能函數神經元在輸入信號作用下產生輸出信號的規(guī)律由神經元功能函數（fActivationFunction）給出，也稱激活函數，或稱轉移函數。f函數形式多樣，利用它們的不同特性可以構成功能各異的神經網絡。例如，線性函數、非線性斜面函數、階躍函數、S型函數、硬限幅函數、競爭函數等。2025/1/655神經元之間的聯接形式網絡中的神經元分成不同的組（塊）進行組織的。在拓撲表示中，不同的塊可以被放入不同層。層次（又稱為“級”）的劃分，導致了神經元之間三種不同的互聯模式。層內聯接是本層內的神經元到本層內的神經元之間的聯接，可用來加強和完成層內神經元之間的競爭：當需要組內加強時，這種聯接的聯接權取正值；在需要實現組內競爭時，這種聯接權取負值。循環(huán)聯接循環(huán)聯接在這里特指神經元到自身的聯接，用于不斷加強自身的激活值，使本次的輸出與上次的輸出相關，是一種特殊的反饋信號。2025/1/656層間聯接層間聯接指不同層中的神經元之間的聯接。這種聯接用來實現層間的信號傳遞。在復雜的網絡中，層間的信號傳遞既可以是向前的（前饋信號），又可以是向后的（反饋信號）。一般地，前饋信號只被允許在網絡中向一個方向傳送；反饋信號的傳送則可以自由一些，它甚至被允許在網絡中循環(huán)傳送。在反饋方式中，一個輸入信號通過網絡變換后，產生一個輸出，然后該輸出又被反饋到輸入端，對應于這個“新的”輸入，網絡又產生一個新的輸出，這個輸出又被再次反饋到輸入端，如此重復下去。隨著這種循環(huán)的進行，在某一時刻，若輸入和輸出不再發(fā)生變化，那么表示網絡穩(wěn)定了下來，此時的輸出將是網絡能夠給出的最為理想的輸出。2025/1/657人工神經網絡的學習神經網絡的學習就是對它的訓練過程。即將由樣本向量構成的樣本集合（樣本集、訓練集）輸入人工神經網絡模型，按照一定方式調整神經元間聯接權重，使網絡能將樣本集的內涵以聯接權重矩陣的方式存儲，從而在網絡接受輸入時，給出適當的輸出。四十年代末，D.O.Hebb提出Hebb規(guī)則。以此為基礎，出現了多種形式的學習算法Hebb規(guī)則中，學習信號簡單地等于神經元的輸出：權向量的調整公式為：2025/1/658權值調整量與輸入輸出的乘積成正比。顯然，經常出現的輸入模式將對權向量有較大的影響。這種情況下，Hebb學習規(guī)則需預先設置權飽和值，以防止輸入和輸出正負始終一致時出現權值無約束增長。Hebb學習規(guī)則代表一種純前饋﹑無導師學習。2025/1/6592025/1/660基于人工神經網絡的房價預測為了對某區(qū)域的房價進行預測，統(tǒng)計了506個房屋的相關信息，包括房屋價格和每個房屋的13個屬性，這些屬性對房屋的價格產生影響。打開MATLAB提供的人工神經網絡圖形界面（啟動MATLAB，在命令行輸入nnstart）2025/1/661選擇曲線擬合，打開曲線擬合對話框將采用兩層前饋網絡模型（two-layerfeed-forwardnetwork）構建神經網絡，選用sigmoid函數作為激活函數，網絡訓練算法為Levenberg-Marquardt反向傳播算法（Levenberg-Marquardtbackpropagationalgorithm）。如果沒有足夠的運算空間，將改用尺度化共軛梯度反向傳播算法（scaledconjugategradientbackpropagation）。2025/1/662選擇數據進入數據選擇窗口，指定輸入數據（input）和目標數據（targets）。在這個例子中，前者是506個房屋的13個屬性構成的13*506的矩陣，后者則為506個房屋的價格，為1*506的矩陣。可以直接讀取保持在excel中的數據，但需要注意的是，讀入的數據都被命名為data，需要及時改名（例如可命名為house_input，house_target），否則后面讀入的文件會把上一個data里存的內容覆蓋掉。本例采用Matlab自帶的樣本數據集，點擊“LoadSampleDataSet”，選擇其中的HousePricing即可載入。2025/1/663指定訓練集、驗證集和測試集進入驗證和測試窗口（ValidationandTestDatawindow），輸入數據被隨機分成訓練集、驗證集和測試集。一般默認為訓練集占70%，驗證集和測試集分別為15%。當然也可以根據需要予以調整。2025/1/664指定網絡結構進入網絡結構窗口，指定隱藏層神經元的個數，系統(tǒng)默認為10，如果運行結果不理想，可以返回進行調整。2025/1/665訓練神經網絡點擊訓練按鈕，開始訓練神經網絡。在較新的MATLAB版本中（例如MATLAB2015），還可以在這個窗口指定訓練算法。對于大多數問題，可以采用Levenberg-Marquardt算法如果數據集較小噪音較大，可以考慮貝葉斯正則化算法（BayesianRegularization）如數據集很大，則可使用標度共軛梯度算法（ScaledConjugateGradient）。2025/1/666訓練結果如連續(xù)6次迭代都沒能降低驗證誤差，訓練就會自動結束（validationstop），并顯示結果主窗口。在這個窗口中，可以查看訓練用時，訓練性能等信息。系統(tǒng)默認使用均方差衡量訓練性能。在這個例子中，訓練在迭代了20次后結束，用時1秒（這個時間會因為機器配置等原因有所不同）。2025/1/6672025/1/668結果保存與使用如果對訓練結果比較滿意，則進入保存窗口，輸出訓練好的網絡以及相關的數據。甚至可以生成腳本和simulink模塊，以供進一步的使用。需要注意的是，選中保存所有值（saveallselectedvaluesabovetoMATLABstructnamed）選項并不寫為外部文件，在關閉程序并重啟后結果即不可見。使用save命令則可以保存為外部文件以備下次調用，例如：在MATLAB命令行輸入：savemynet1。但必須先選中對net的保存，并執(zhí)行保存結果（SaveResults）選項，注意不能同時選保存所有值選項（saveallselectedvaluesabovetoMATLABstructnamed）。2025/1/669保存以后的神經網絡訓練結果可以在以后進行調用，并使用新的input數據集來求得相應的output數據集。具體可以通過下列MATLAB命令來實現。>>savemynet1>>loadmynet1>>myinput=xlsread('House_input.xlsx');>>myoutput=net(myinput)其中，第三行命令后面加“；”號，表示不在屏幕上顯示結果；數據集的名字中不可以使用用中劃線，但可以用下劃線；一般情況下，MATLAB禁止在bin文件夾下保存結果。此外，使用新的數據集來進行預測時，存在excel表格中的行表示屬性，列表示實例，與SPSS中的數據相反。2025/1/670回歸分析就是用數學表達式來描述相關變量之間的關系，對未來進行預測的一種數學方法。主要解決以下兩個問題：確定幾個變量之間是否存在相關關系，如果存在，分析研究一個或幾個變量的變動對另一個變量變動的影響程度，找出他們之間適當的數學表達式；用自變量的已知值去推測因變量的值或范圍，且要估計這種預測可以達到何種精確度。2025/1/6715.4回歸分析法5.4.1簡單線性回歸模型構建實際模型必然包括能夠反映隨機性的方法，隨機性是真實世界中的各種過程的一部分。這樣的模型稱為概率模型（probabilisticmodel）。為了建立概率模型，可以從與我們想建立的模型關系較為接近的確定性模型開始。然后增加一個隨機項，以衡量確定性成分的誤差。一階線性回歸模型：y=β0+β1x+

ε（其中，y=因變量；x=自變量；β0=截距；β1=斜率；ε=誤差變量）估計系數——最小二乘法根據觀測得到的自變量和因變量之間的一組對應關系，找出一個給定類型的函數y=f(x)，使得它在各個觀測點處所取值與觀測值在某種尺度下最接近，即在各點處的總的偏差（變差、誤差）平方和（SSE）達到最小。2025/1/672誤差變量誤差變量的概率分布必須滿足下面四個條件：回歸診斷（regressiondiagnostics）2025/1/673評估模型如果擬合程度低，就應該放棄線性模型而采用其他的模型。斜率的t檢驗：假設變量間沒有線性關系，即斜率為0。零假設為斜率等于0；備擇假設為斜率不等于0；檢驗統(tǒng)計量為t：

（其中，Sb1是b1的標準偏差）判定系數：在許多情況下，衡量線性關系的強弱也很有用，特別是在比較不同模型的時候。具有這個作用的統(tǒng)計量是判定系數，用R2表示。2025/1/674簡單線性回歸的應用模型通過評價為我們接受以后，就可以用它來預測和估計因變量的值。給出一個x的值，帶入回歸方程得到的對應的y值稱為點預測。點預測本身并不能說明這個值與真實值的接近程度。為此,需要計算特定y值預測區(qū)間的置信區(qū)間估計：其中，xg為給定的x值，且有時需要預測給定x條件下y期望值的置信區(qū)間估計：2025/1/6755.4.2多元線性回歸回歸模型與必要條件

（應符合的必要條件與單元線性回歸一樣）估計系數與評價模型估計系數的方法：最小二乘法2025/1/676系數的檢驗：假設變量間沒有線性關系（其中，i=1,2,……,k）R2和調整后的R2調整后的R2也叫做調整自由度的判定系數。它考慮了樣本變量和自變量的個數。如果自變量的個數相對于樣本容量來說較大，那么未調整的R2可能會高的沒有實際意義。2025/1/677檢驗模型的有效性H1：至少有一個βi不等于0如果原假設為真，自變量中沒有一個與因變量相關，模型無效。如果備擇假設為真，即至少有一個βi不等于零，那么模型還是有一定的效果。檢驗統(tǒng)計量:2025/1/678回歸診斷同簡單線性回歸一樣，需要計算殘差，并繪制殘差的直方圖，檢驗誤差變量是否服從正態(tài)分布繪制殘差與y的預測值的散點圖，檢驗誤差變量的方差是否為常數；如出現非正態(tài)性或異方差性，可對因變量予以變換，例如對數變換、倒數變換等繪制殘差與時間的關系圖，檢驗誤差項是否獨立（時間序列數據）多元線性回歸特殊的問題：多元共線性，又稱為共線性或組間相關。是自變量之間相關的一種情況。多元共線性會產生兩個不利的影響：估計回歸系數時將產生較大的抽樣誤差會影響系數的t檢驗，使依據t檢驗做出的是否線性相關的推斷發(fā)生錯誤慶幸的是，多元共線性不會影響F檢驗。2025/1/6792025/1/680調用SPSS主菜單的Analyze—〉Regression—〉Linear命令，打開對話框，指定因變量（客戶壽命Longevit）和自變量（客戶的祖父、客戶的祖母、客戶的父親、客戶的母親去世時的年齡），以及回歸方式：逐步回歸。2025/1/681在Statistics欄中，選擇Estimates以輸出回歸系數B的估計值、t統(tǒng)計量等；選擇Durbin-Watson進行DW檢驗；選擇Modelfit輸出擬合優(yōu)度，F統(tǒng)計量值等。2025/1/682在Plots欄中選擇Histogram繪制標準化殘差的直方圖；選擇Normalprobabilityplot繪制標準化殘差分布與正態(tài)概率比較圖；繪制殘差與y的預測值的散點圖，檢驗誤差變量的方差是否為常數。2025/1/683提交運行，并在輸出窗口中查看結果系統(tǒng)在進行逐步回歸過程中產生了兩個回歸模型，模型1先將與因變量（客戶壽命Longevit）線性關系最密切的自變量MOTHER引入模型，建立它們之間的一元線性回歸模型。而后再逐步引入其他變量，模型2表明又將自變量FATHER引入，建立了二元線性回歸模型?？梢?，客戶祖父母的壽命對客戶壽命的影響相對較小?；貧w模型概述表中給出了兩個模型各自的R2和調整后的R2。第一個模型中客戶壽命中有49.3%的變異可以用客戶母親壽命的變異來解釋。第二個模型中客戶母親壽命和客戶父親壽命的變異可以解釋客戶壽命中73.1%的變異。兩個模型都通過了F檢驗。此外，F統(tǒng)計量的值較大，t統(tǒng)計量的值也通過了檢驗，不存在嚴重的多元共線性問題。2025/1/6842025/1/685回歸殘差的直方圖與圖上的正態(tài)分布曲線相比較，可以認為殘差基本服從正態(tài)分布。2025/1/686觀測量累計概率圖：縱坐標為期望累計概率分布，橫坐標為觀測量累計概率分布，圖中的斜線對應著一個均值為0的正態(tài)分布。如果散點密切地散布在這條斜線附近，說明殘差服從正態(tài)分布。如果偏離這條線太遠，應該懷疑殘差的正態(tài)性。2025/1/687殘差與y的預測值的散點圖用以檢驗誤差變量的方差是否為常數，隨著的變化，殘差無明顯變化，因此誤差變量的方差為常數，不具有異方差性。進行預測

在原始數據中回歸模型的自變量下方輸入給定的值，相應的因變量將產生缺失值；選擇主菜單Analyze—〉Regression—〉Linear，打開LinearRegression對話框。指定自變量和因變量；單擊Save按鈕，選擇PredictedValues欄中的Unstandardized，保存非標準化預測值在一個新變量中；選擇PredictionIntervals欄中的Mean和Individual，并在ConfidenceInterval框中輸入置信度，保存所輸入的置信度條件下y期望值和特定y值預測區(qū)間的上下；提交運行，除了輸出回歸分析結果外，還將在數據文件中生成pre_1、lmci_1、umci_1、lici_1和uici_1等變量。其中，pre_1保存點預測值，lmci_1和umci_1分別保存y期望值預測區(qū)間的下限和上限，lici_1和uici_1分別保存特定y值預測區(qū)間的下限和上限。2025/1/6885.4.3非線性回歸非線性回歸（NonlinearRegressionAnalysis）是尋求因變量與一組自變量之間的非線性相關模型的統(tǒng)計分析方法。如不能確定一個適當的模型，可借助曲線估計過程預先分析，或借助散點圖，直觀觀察變量的變化，將有助于確定一個合用的函數關系。在一般統(tǒng)計軟件中，會提供常用的非線性回歸模型，供使用者參考。2025/1/689練習：某研究機構為研究兒童的智力狀況，調查了16所小學的平均語言測試得分（y）與家庭社會經濟狀況綜合指標（x1）、教師語言測試得分（x2）及母親教育水平（x3）的數據，試進行多元回歸分析（linearregression2.sav）。旅游業(yè)的經營易受季節(jié)的影響，某旅游勝地的一家旅館記錄了最近5年每個季度的入住率。旅館經理關心下列問題：五年來，這家旅館的入住率是否呈現上升或下降趨勢？下一年，每個季度的入住率分別是多少？對于這樣的問題，時間序列分析是很好的解決方法。2025/1/6905.5時間序列分析5.5.1時間序列的概念及構成因素時間序列（timeseries）數據按照一定的先后順序（例如時間）建立起來的同一變量的一組數列或一組觀察數據就是時間序列數據?？梢允菚r間順序，也可以是具有各種不同意義的單調遞增的量，如溫度或速度。時間序列只強調順序的重要性，而并非強調必須以時間順序排列。序列中的數據或數據點的位置依賴于“時間”，即數據的取值依賴于“時間”的變化，但不一定是“時間”t的嚴格函數；每一時刻上的取值或數據點的位置具有隨機性，不可能完全準確地用歷史值預測；前后時刻（不一定是相鄰時刻）的數值或數據點的位置有一定的相關性，這種相關性就是系統(tǒng)的動態(tài)規(guī)律性；時間序列往往呈現某種趨勢性或出現周期性變化的現象。2025/1/691大量事實表明，一個時間序列往往是以下幾類因素（或成分）的疊加或耦合長期趨勢運動（Tt

）。指時間序列的長期發(fā)展趨勢。循環(huán)運動（Ct

）。也稱循環(huán)變差，指時間序列圍繞趨勢線或趨勢曲線的長期振動或擺動。通常是指周期為一年以上，由非季節(jié)因素引起的漲落起伏波形相似的變動。季節(jié)運動（St）?；蚍Q季節(jié)變差，指一年或更短的時間之內，由于受某種固定周期性因素（如自然、生產、消費等季節(jié)性因素）的影響而呈現出有規(guī)律的周期性波動。隨機波動（Rt）。隨機波動是指由于大量的隨機因素產生的宏觀影響。隨機波動往往掩蓋了其他相對比較容易預測的時間序列成分因子。根據中心極限定理，通常認為隨機變動近似服從正態(tài)分布。2025/1/692時間序列分析每一個時間序列都包含了產生該序列的系統(tǒng)歷史行為的全部信息。時間序列分析就是一種根據動態(tài)數據揭示系統(tǒng)動態(tài)結構和規(guī)律的統(tǒng)計方法。其基本思想是根據系統(tǒng)的有限長度的運行記錄（觀察數據），發(fā)現其中蘊含的規(guī)律，建立能夠比較精確地反映時間序列中所包含的動態(tài)依存關系的數學模型，從而預測出未來的時間序列變量值。2025/1/6935.5.2時間序列數據的預處理缺失值替換轉換（transform）

缺失值替換（replacemissingvalues）定義時間變量數據（Data）

定義日期（DefineDates）2025/1/694時間序列.sav；移動平均.sav2025/1/695指數平滑（exponentialsmoothing）移動平均法存在兩個缺陷：第一，沒法計算原始時間序列首尾部分時刻對應的值，有的時候，這些值的缺失會損失重要信息；第二，忽略了時間序列前面時期的信息，主要依據最近的幾個值得出新的序列。為了解決這些問題，可以使用指數平滑。指數平滑最早是由在1958年左右提出來的。它最初只應用于無趨勢、非季節(jié)作為基本形式的時間序列的分析，后經Brown、Winter等統(tǒng)計學家的深入研究和發(fā)展。使指數平滑涉及的數據內部構成更豐富，相應的數據處理方法也更多，指數平滑法的估計是非線性的，其目標是使預測值和實測值間的均方差（MSE）最小。常用的指數平滑模型主要有簡單指數平滑、Holt指數平滑、Winters指數平滑等。它們在趨勢和季節(jié)構成方面是不同的，根據對趨勢和季節(jié)的不同假設，予以選用。2025/1/696這里只具體介紹簡單指數平滑：它改變了移動平均用來預測的n個過去觀測值中每一個權數都相等而早于（t-n-1）期的觀測值的權數等于零的缺陷，最近的觀測值要比早期的觀測值影響更大，在預測時應賦予更大的權數的思想。其中，

為第t個時期簡單指數平滑后的時間序列

為第t個時期的時間序列

為平滑系數，

較小的平滑系數將產生較大的平滑度，但是多大的平滑系數是合適的呢？可根據輸出結果中誤差平方和（SSE）的大小來判斷。誤差平方和越小，

人人文庫> 全部分類> 應用文書 > 年終總結

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

回歸分析法簡單線性回歸

文檔簡介

溫馨提示

最新文檔

評論

回歸分析法簡單線性回歸

文檔簡介

溫馨提示

最新文檔

評論

相關文檔