航班延誤預(yù)測1 - 副本_第1頁
航班延誤預(yù)測1 - 副本_第2頁
航班延誤預(yù)測1 - 副本_第3頁
航班延誤預(yù)測1 - 副本_第4頁
航班延誤預(yù)測1 - 副本_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、長春工業(yè)大學(xué)長春工業(yè)大學(xué)勁風(fēng)隊勁風(fēng)隊航班航班延誤預(yù)測延誤預(yù)測第五第五屆屆 中國軟件杯中國軟件杯 大學(xué)生軟件設(shè)計大賽大學(xué)生軟件設(shè)計大賽整體流程整體流程勁風(fēng)隊勁風(fēng)隊v 導(dǎo)入歷史導(dǎo)入歷史數(shù)據(jù)數(shù)據(jù)v 數(shù)據(jù)降維數(shù)據(jù)降維v 特征提取特征提取v 生成分生成分類類模型模型v 導(dǎo)導(dǎo)入待測入待測數(shù)據(jù)數(shù)據(jù)v 分類預(yù)測分類預(yù)測v 輸出輸出預(yù)測結(jié)果預(yù)測結(jié)果訓(xùn)練階段訓(xùn)練階段1預(yù)測階段預(yù)測階段2整體流程整體流程勁風(fēng)隊勁風(fēng)隊預(yù)測模型預(yù)測模型預(yù)測結(jié)果預(yù)測結(jié)果歷史歷史 數(shù)據(jù)數(shù)據(jù)待預(yù)測數(shù)據(jù)待預(yù)測數(shù)據(jù)訓(xùn)練階段訓(xùn)練階段測試階段測試階段數(shù)據(jù)處理數(shù)據(jù)處理勁風(fēng)隊勁風(fēng)隊加載數(shù)據(jù)加載數(shù)據(jù)(Excel)解析數(shù)據(jù)解析數(shù)據(jù)去除臟數(shù)據(jù)去除臟數(shù)據(jù)數(shù)據(jù)入庫

2、數(shù)據(jù)入庫u 數(shù)據(jù)入庫數(shù)據(jù)入庫數(shù)據(jù)處理數(shù)據(jù)處理v 歷史數(shù)據(jù)歷史數(shù)據(jù)變量數(shù)過多,引發(fā)變量數(shù)過多,引發(fā)維數(shù)災(zāi)難,維數(shù)災(zāi)難,難計算難計算。v 多列之間具有直接或間接依多列之間具有直接或間接依賴關(guān)系,數(shù)據(jù)冗余較多賴關(guān)系,數(shù)據(jù)冗余較多。v 數(shù)據(jù)可進(jìn)行手工降維處理。數(shù)據(jù)可進(jìn)行手工降維處理。勁風(fēng)隊勁風(fēng)隊u 數(shù)據(jù)降維數(shù)據(jù)降維特征選擇特征選擇特征提取特征提取得到得到2424個變量個變量得到得到1212個變量個變量原數(shù)據(jù)原數(shù)據(jù)4040個變個變量量屬性分類屬性分類多少通過觀察可以發(fā)現(xiàn),周六和周三為延誤高峰期,周多少通過觀察可以發(fā)現(xiàn),周六和周三為延誤高峰期,周一周二為低峰期,其它日期則相差不大。據(jù)此將星期分為三一周二為

3、低峰期,其它日期則相差不大。據(jù)此將星期分為三類。類。勁風(fēng)隊勁風(fēng)隊 星期星期分類值分類值描述描述d11,21低峰期d23,62高峰期d34,5,73正常期屬性分類屬性分類1 1、研究發(fā)現(xiàn),航班延誤情況與當(dāng)天是星期幾有關(guān),根據(jù)歷史數(shù)據(jù)研究發(fā)現(xiàn),航班延誤情況與當(dāng)天是星期幾有關(guān),根據(jù)歷史數(shù)據(jù)得出如下統(tǒng)計結(jié)果得出如下統(tǒng)計結(jié)果。勁風(fēng)隊勁風(fēng)隊303660554666420102030405060701234567平均延誤時間1041136015511442232517841386記錄數(shù)屬性分類屬性分類2 2、由下圖可知航班、由下圖可知航班延誤與起飛延誤與起飛時刻之間有著一定的關(guān)系。時刻之間有著一定的關(guān)系。勁

4、風(fēng)隊勁風(fēng)隊213034445150556049515653565351 5141200102030405060700123456789101112131415161718192021222324平均延誤時間時間段時間段平均延遲時間平均延遲時間通過通過對上表對上表分析分析6868點,點,22232223點為延誤低峰期,其它時點為延誤低峰期,其它時刻無明顯特點。據(jù)此將起飛時刻屬性分為兩刻無明顯特點。據(jù)此將起飛時刻屬性分為兩類。類。勁風(fēng)隊勁風(fēng)隊 時刻時刻分類值分類值描述描述d168,22231低峰期d2其它2正常期屬性分類屬性分類屬性分類屬性分類3 3、由、由航班延誤與天氣之間航班延誤與天氣之間的歷

5、史數(shù)據(jù)分析關(guān)系的歷史數(shù)據(jù)分析關(guān)系得出下得出下圖。圖。勁風(fēng)隊勁風(fēng)隊05001000150020002500暴雨小雨大到暴雨大到暴雨陣雨大雨大雨小到中雨大雨陰大雨中雨多云大雨多云雷陣雨多云晴多云小雨多云陣雨浮塵雷陣雨大雨雷陣雨陰雷陣雨中到大雨霾晴晴多云晴陰晴中雨霧多云小到中雨小到中雨小雨小到中雨陣雨小雨小雨多云小雨陰小雨中雨陰陰浮塵陰小到中雨陰陣雨陣雨陣雨多云陣雨晴陣雨陰中到大雨中到大雨小到中雨中到大雨中雨中雨大到暴雨中雨雷陣雨中雨小雨中雨陣雨平均延誤時間記錄數(shù)通過對上圖分析并綜合考慮后,本文將天氣劃分為四類。通過對上圖分析并綜合考慮后,本文將天氣劃分為四類。勁風(fēng)隊勁風(fēng)隊 天氣天氣分類值分類值描述

6、描述d1大雨及以上1嚴(yán)重惡劣天氣d2小到中雨2中等惡劣天氣d3陰/晴3正常天氣d4其它4其它天氣屬性分類屬性分類勁風(fēng)隊勁風(fēng)隊針對項目初步針對項目初步確立了以下方案確立了以下方案1非線性回歸非線性回歸概率統(tǒng)計概率統(tǒng)計貝葉斯分類貝葉斯分類線性回歸線性回歸歷史數(shù)據(jù)龐大難編寫計算程序高維矩陣的不穩(wěn)定性回歸效果差顯示方程回歸方程形式難以確立軟計算程序編寫復(fù)雜,時間開銷大時間復(fù)雜度O(n)算法簡單可靠程序編寫復(fù)雜度低最終選擇建模算法設(shè)計建模算法設(shè)計建模算法設(shè)計勁風(fēng)隊勁風(fēng)隊06以Max(P(X|Yi) P(Yi)做為做為X所屬類別所屬類別05對對每個每個類別計算類別計算P(X|Yi) P(Yi)04對每個特

7、征屬性計算所劃分的條件概率對每個特征屬性計算所劃分的條件概率03對每個類別計算對每個類別計算P(Yi)02獲取訓(xùn)練樣本獲取訓(xùn)練樣本01確定特征屬性確定特征屬性準(zhǔn)備工作準(zhǔn)備工作階段階段應(yīng)用階段應(yīng)用階段分類器訓(xùn)練分類器訓(xùn)練階段階段樸素貝葉斯分類流程圖樸素貝葉斯分類流程圖勁風(fēng)隊勁風(fēng)隊成果確立特征屬性對待分類項進(jìn)行分類對屬性進(jìn)行分類訓(xùn)練模型進(jìn)行預(yù)測將上述算法應(yīng)用于航班延誤預(yù)測問題,對應(yīng)的工作如下:建模算法設(shè)計程序結(jié)構(gòu)程序結(jié)構(gòu)勁風(fēng)隊勁風(fēng)隊TextText數(shù)據(jù)庫數(shù)據(jù)庫模型文件模型文件預(yù)測程序預(yù)測程序JSON處理處理模型加載模型加載延誤預(yù)測延誤預(yù)測建模程序建模程序數(shù)據(jù)導(dǎo)入數(shù)據(jù)導(dǎo)入數(shù)據(jù)導(dǎo)出數(shù)據(jù)導(dǎo)出模型訓(xùn)練模型訓(xùn)練模型測試模型測試參數(shù)設(shè)置參數(shù)設(shè)置本程序基于貝本程序基于貝葉斯分類算法葉斯分類算法實現(xiàn),完整的實現(xiàn),完整的程序源代碼總程序源代碼總共

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論