算法賽top5思路代碼大熊座epsilon團隊航空_第1頁
算法賽top5思路代碼大熊座epsilon團隊航空_第2頁
算法賽top5思路代碼大熊座epsilon團隊航空_第3頁
算法賽top5思路代碼大熊座epsilon團隊航空_第4頁
算法賽top5思路代碼大熊座epsilon團隊航空_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、一,利用的數(shù)據(jù)本場賽題共有六張表的數(shù)據(jù):表 GOXVUXZEMEOLOEGV,H 安檢旅客過關(guān)人數(shù)表 GOXVUXZEMEYKIXOZ_EINKIQ,I旅客進入離開機場的行程表 GOXVUXZEMEJKVGXZXK,J 航班排班表 GOXVUXZEMELROMNZY。K 機場登機口區(qū)域表 GOXVUXZEMEMGZKY L 機場 =/,/ 接入點坐標(biāo)表 GOXVUXZEMEOLOEIUUX 考慮到要未來兩天的=/,/ 6 連接數(shù)量,連接=/,/ 6 (IY 6U)的人數(shù)表無疑是最有利用價值的一張表,而安檢旅客過關(guān)人數(shù)表和旅客進入離開機場的行程表對于未來幾個小時內(nèi)的很有價值,但是對于未來兩天這樣

2、長的時間段應(yīng)該作用不大。 航班排班表與 =/,/ 6 連接情況尤其是登機口附近的=/,/ 6 相關(guān)性很大,配合機場登機口區(qū)域表和機場=/,/ 接入點坐標(biāo)表應(yīng)該能較好地從時間和空間上=/,/ 6 的連接情況。所以,選用 G J K L 這四張表來進行建模。二,數(shù)據(jù)預(yù)處理本賽題的數(shù)據(jù)預(yù)處理主要包含: ,連接 =/,/ 6 (IY 6U)的人數(shù)表存在缺失數(shù)據(jù)情況,對于個別時間段的數(shù)據(jù)缺失,可以利用填充 或者前后幾天均值來進行填充,對于大段時間段的數(shù)據(jù)缺失,考慮以天為刪除數(shù)據(jù),不予利用。 ,航班排班表中的計劃起飛時間和實際起飛時間與其他表的時間有八小時誤差,進行了處理。 ,機場=/,/ 接入點坐標(biāo)表中

3、=/,/ 6 坐標(biāo)沒有辦法直接和登機口聯(lián)系起來,先將這些點的坐標(biāo)回歸擬坐標(biāo),然后可以和登機口坐標(biāo)聯(lián)系起來,如圖一。G連接 =/,/ 6 ( IY 6U )的人數(shù) 圖一:WIFI AP 和登機口位置信息三,方案1, 整體,每個 WIFI AP 的在某一時間段的連接數(shù)具有很強的時間周期性,所以用歷史數(shù)據(jù)來進行回歸對于絕大多數(shù) AP 來說就已經(jīng)能很好地擬合,而且過擬合的情況不嚴(yán)重。2, 通過第一步的整體,大部分的 WIFI AP 已經(jīng)的到了一個相對較優(yōu)的值,但是對于一些AP,尤其是在登機口附近的 WIFI AP 由于受到飛機航班起降的影響非常嚴(yán)重,地不是很好,需要進一步進行修正學(xué)習(xí)。第一步的值和實際

4、值作為一個殘差,學(xué)習(xí)并這個殘差,就可以進一步提高的精度,而每一個 WIFI AP 附近的登機口是不同的,而且由于其他空間的影響,不同WIFI AP之間的數(shù)據(jù)幾乎無法互相利用,所以需要對于每個 WIFI AP 單獨建模,回歸出殘差。對于 E1,E2,E3,W1,W1,W3 這六個區(qū)域的WIFI AP,是直接的候機休息區(qū),會直接收到距離其很近的登機口的航班起落影響,于是根據(jù)WIFI AP 和登機口的坐標(biāo),計算距離,求出每個 WIFI AP 可能會受到那幾個登機口的影響,進一步提取特征,訓(xùn)練模型。對于 EC 和WC 區(qū)域,是候機區(qū)的通道,會受到某一個區(qū)域所有航班的影響,其細(xì)分成了六個區(qū)域(如圖一),

5、分別提取特征,每個 WIFI AP 單獨訓(xùn)練,各自殘差。圖二:EC 和 WC 區(qū)域細(xì)分 , 登機口附近 6 的線性回歸方案。在登機口附近的 6 的 OLO 連接人數(shù),可以近似認(rèn)為和等待登機的人數(shù)成正比。當(dāng)然某個 6 可能受到不止一個登機口的影響。即其中其中 _ Z 為 Z 時刻某 6 的 OLO 連接人數(shù),O Z 是登機口等待登機人數(shù),GO 是相關(guān)系數(shù),O 代表某 6 附近的O 個登機口。顯然這是一個容易求解的線性回歸問題。那么是否可以通過航班的起飛時間和登機人數(shù),大致估算出每一時刻,等待登機的人數(shù)呢?既求取函數(shù) L:其中 O 是登機口對應(yīng)的航班信息,包括航班起飛時間和登機人數(shù)。注意到一層的登

6、機口非常密集,而等待區(qū)是一個獨立而封閉的區(qū)域。可以將一個區(qū)域看成是一個整體,那么有其中 P 代表一個區(qū)域內(nèi)的 6 數(shù)量,Q 代表一個區(qū)域內(nèi)登機口的數(shù)量。根據(jù) ,我們可以通過最優(yōu)化問題求解 L :其中 IU 是 相關(guān)系數(shù)。具體求解使用了粒子群優(yōu)化算法 695 。求解結(jié)果max (cov( yj(t) , f(xk, t) yj(t) a1 zk(t) = a1 f(xk, t)( )zi(t) = f(xi, t)( )y(t) = aizi(t)( )四,特征提取史連接情況,最大值,最小值,平均值,中位數(shù)等等;可能影響該 =/,/ 6 的幾個登機口的過去一段時間(過去三小時,過去一小時,過去,過去十分鐘) 最近一段時間(最近三小時,最近一小時,最近,最近十分鐘),未來一段時間(未來三小時,未來一小時,未來,未來十分鐘),各有多少個航班起降;距離該 =/,/ 6 的最近的登機口在過去,最近,未來的飛機起飛情況;距離該 =/,/ 6 的第二近的登機口在過去,最近,未來的飛機起飛情況等等。五,模型選擇由于每個 =/,/ 6 需要單獨建模,其實每個模型的數(shù)據(jù)實際上非常有限,數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論