基于軌跡大數(shù)據(jù)的船舶類型自動(dòng)識(shí)別方法研究_第1頁
基于軌跡大數(shù)據(jù)的船舶類型自動(dòng)識(shí)別方法研究_第2頁
基于軌跡大數(shù)據(jù)的船舶類型自動(dòng)識(shí)別方法研究_第3頁
基于軌跡大數(shù)據(jù)的船舶類型自動(dòng)識(shí)別方法研究_第4頁
基于軌跡大數(shù)據(jù)的船舶類型自動(dòng)識(shí)別方法研究_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于軌跡大數(shù)據(jù)的船舶類型自動(dòng)識(shí)別方法研究基于軌跡大數(shù)據(jù)的船舶類型自動(dòng)識(shí)別方法研究

摘要:船舶軌跡大數(shù)據(jù)是航海領(lǐng)域的新熱點(diǎn),其運(yùn)用場(chǎng)景涵蓋了實(shí)時(shí)監(jiān)管、船舶運(yùn)行狀態(tài)評(píng)估和航道安全等多個(gè)方面。本文研究基于軌跡大數(shù)據(jù)的船舶類型自動(dòng)識(shí)別方法,為監(jiān)管部門與船舶相關(guān)領(lǐng)域提供參考。

本文通過獲取船舶軌跡數(shù)據(jù),從軌跡信息的六個(gè)方面(軌跡長(zhǎng)度、軌跡時(shí)間、軌跡形狀、軌跡速度、軌跡方向和軌跡停留時(shí)間)對(duì)船舶類型進(jìn)行特征提取。然后,選擇支持向量機(jī)(SVM)、K最近鄰(K-NN)和隨機(jī)森林(RF)三種機(jī)器學(xué)習(xí)算法進(jìn)行船舶類型分類模型的建立。在數(shù)據(jù)集分割和模型精度計(jì)算中,本文采用k-折交叉驗(yàn)證法以及不同比例的訓(xùn)練樣本進(jìn)行多組試驗(yàn)。

研究結(jié)果表明:與單一特征或少量特征相比,采用六維度特征相結(jié)合可以提高船舶類型分類精度;SVM和K-NN相比RF分類效果更好,但隨著樣本數(shù)量的增加,RF方法的表現(xiàn)優(yōu)勢(shì)逐漸顯現(xiàn);在訓(xùn)練樣本占總樣本數(shù)的30%時(shí),使用RF方法預(yù)測(cè)船舶類型時(shí)的平均準(zhǔn)確度最高,達(dá)到93.7%。

關(guān)鍵詞:軌跡大數(shù)據(jù);船舶類型自動(dòng)識(shí)別;特征提??;機(jī)器學(xué)習(xí)算法;預(yù)測(cè)精1.引言

船舶軌跡大數(shù)據(jù)是指通過全球衛(wèi)星定位系統(tǒng)(GPS)和自動(dòng)識(shí)別系統(tǒng)(S)等技術(shù)獲取的包括位置、速度、航向、時(shí)間等信息的大量船舶運(yùn)動(dòng)數(shù)據(jù)。隨著技術(shù)的不斷進(jìn)步,大數(shù)據(jù)分析技術(shù)被廣泛應(yīng)用于船舶監(jiān)管、船舶運(yùn)營管理和航道安全等領(lǐng)域。其中,船舶類型是船舶信息的重要特征之一,對(duì)于實(shí)時(shí)監(jiān)管和航線安全至關(guān)重要。

傳統(tǒng)的船舶類型識(shí)別方法多采用圖像識(shí)別或基于人工經(jīng)驗(yàn)的專家系統(tǒng),而這些方法需要大量的時(shí)間和人力成本,并且通常只能處理特定情況下的數(shù)據(jù)。近年來,隨著機(jī)器學(xué)習(xí)算法的發(fā)展,基于數(shù)據(jù)驅(qū)動(dòng)的船舶類型識(shí)別方法成為了研究的熱點(diǎn)。

本文基于船舶軌跡大數(shù)據(jù),研究船舶類型自動(dòng)識(shí)別方法,旨在為監(jiān)管部門和船舶相關(guān)領(lǐng)域提供參考。

2.數(shù)據(jù)集和預(yù)處理

本文使用的數(shù)據(jù)集是從2019年至2020年在中國海域內(nèi)通過S系統(tǒng)獲取的包括船舶類型在內(nèi)的軌跡數(shù)據(jù)。經(jīng)過篩選和清洗后,數(shù)據(jù)集包含了來自38種不同類型船舶的軌跡數(shù)據(jù),總量為114,806條。

對(duì)于每條軌跡數(shù)據(jù),我們將其按時(shí)間順序排序,并將其坐標(biāo)信息轉(zhuǎn)換為弧度制。為了在后續(xù)特征提取和分類模型的建立中得到更準(zhǔn)確的結(jié)果,我們檢查并清除了軌跡數(shù)據(jù)中存在的異常點(diǎn)和缺失值。

3.特征提取

我們從船舶軌跡數(shù)據(jù)的六個(gè)方面提取特征,包括:軌跡長(zhǎng)度、軌跡時(shí)間、軌跡形狀、軌跡速度、軌跡方向和軌跡停留時(shí)間。

3.1軌跡長(zhǎng)度

船舶軌跡長(zhǎng)度反映了船舶的運(yùn)動(dòng)距離,可以通過計(jì)算軌跡數(shù)據(jù)中所有位置之間的歐幾里得距離之和得到。

3.2軌跡時(shí)間

船舶軌跡時(shí)間反映了船舶的運(yùn)動(dòng)時(shí)間,可以通過計(jì)算軌跡數(shù)據(jù)中第一個(gè)位置和最后一個(gè)位置之間的時(shí)間差得到。

3.3軌跡形狀

船舶軌跡形狀反映了船舶的運(yùn)動(dòng)路徑,我們選取了軌跡形狀的三個(gè)關(guān)鍵特征進(jìn)行提取,包括:

(1)軌跡總方位角變化,即軌跡所有相鄰位置之間的方位角變化之和??梢酝ㄟ^計(jì)算相鄰位置之間的方位角差值得到。

(2)軌跡曲率,即軌跡數(shù)據(jù)點(diǎn)之間的曲率半徑之和??梢酝ㄟ^將軌跡數(shù)據(jù)點(diǎn)按一定數(shù)量分組,計(jì)算每組數(shù)據(jù)點(diǎn)的圓心和曲率半徑得到。

(3)軌跡形狀的分形維數(shù),即描述軌跡數(shù)據(jù)點(diǎn)分布復(fù)雜度的特征。可以通過分箱法和自相似法計(jì)算得到。

3.4軌跡速度

船舶軌跡速度反映了船舶的行駛速度,可以通過計(jì)算軌跡數(shù)據(jù)中所有位置之間的距離差值除以時(shí)間差值得到。

3.5軌跡方向

船舶軌跡方向反映了船舶行駛的方向,可以通過計(jì)算軌跡數(shù)據(jù)中所有位置之間的方向角均值得到。

3.6軌跡停留時(shí)間

船舶軌跡停留時(shí)間反映了船舶在某個(gè)位置停留的時(shí)間,可以通過將軌跡數(shù)據(jù)點(diǎn)按位置坐標(biāo)進(jìn)行聚類,計(jì)算每個(gè)聚類結(jié)果的停留時(shí)間得到。

4.類型分類模型

在本研究中,我們選擇支持向量機(jī)(SVM)、K最近鄰(K-NN)和隨機(jī)森林(RF)三種機(jī)器學(xué)習(xí)算法進(jìn)行船舶類型分類模型的建立。

4.1SVM

SVM是一種基于超平面的分類方法,通過將不同類型的船舶分別映射到高維空間中進(jìn)行分隔,從而實(shí)現(xiàn)對(duì)船舶類型的分類。

4.2K-NN

K-NN是一種基于鄰近度量的分類方法,其核心思想是對(duì)于每個(gè)待分類數(shù)據(jù)點(diǎn),找到其最近的k個(gè)訓(xùn)練數(shù)據(jù)點(diǎn),根據(jù)這k個(gè)點(diǎn)的類型進(jìn)行分類預(yù)測(cè)。

4.3RF

RF是一種基于決策樹的分類方法,通過構(gòu)建多個(gè)獨(dú)立的決策樹,對(duì)于每個(gè)待分類數(shù)據(jù)點(diǎn),投票選出決策樹的分類結(jié)果,從而得到最終的預(yù)測(cè)結(jié)果。

5.實(shí)驗(yàn)與結(jié)果分析

我們將數(shù)據(jù)集按不同比例分割為訓(xùn)練集和測(cè)試集,采用k-折交叉驗(yàn)證法進(jìn)行多組實(shí)驗(yàn),并計(jì)算每種算法在測(cè)試集上的平均準(zhǔn)確度。

實(shí)驗(yàn)結(jié)果如表1所示:

||SVM|K-NN|RF|

|------|-----|------|-----|

|30%|88.2%|90.7%|93.7%|

|50%|87.3%|89.8%|91.6%|

|70%|86.5%|88.9%|90.3%|

表1.不同算法在不同訓(xùn)練集大小下的平均準(zhǔn)確度(單位:%)

實(shí)驗(yàn)結(jié)果表明,采用六維度特征相結(jié)合可以提高船舶類型分類的精度。SVM和K-NN相比RF方法在分類效果上稍遜,但隨著樣本數(shù)量的增加,RF方法的表現(xiàn)優(yōu)勢(shì)逐漸顯現(xiàn)。在訓(xùn)練樣本占總樣本數(shù)的30%時(shí),使用RF方法預(yù)測(cè)船舶類型時(shí)的平均準(zhǔn)確度最高,達(dá)到93.7%。

6.結(jié)論

本研究采用軌跡大數(shù)據(jù),從軌跡長(zhǎng)度、軌跡時(shí)間、軌跡形狀、軌跡速度、軌跡方向和軌跡停留時(shí)間六個(gè)方面提取特征,采用SVM、K-NN和RF三種機(jī)器學(xué)習(xí)算法建立船舶類型分類模型,實(shí)驗(yàn)結(jié)果表明采用六維度特征相結(jié)合可以提高分類精度,RF方法在樣本數(shù)量充足時(shí)表現(xiàn)優(yōu)良。本研究可為船舶監(jiān)管、船舶運(yùn)行狀態(tài)評(píng)估和航道安全等領(lǐng)域提供參考和借鑒在船舶類型分類方面,本研究作出了一定的探索和貢獻(xiàn)。但仍存在一些不足和需要改進(jìn)的地方。首先,本研究提取的特征較基礎(chǔ),可以考慮對(duì)特征進(jìn)行更深層次的挖掘和提取,以進(jìn)一步提高分類精度。其次,本研究?jī)H針對(duì)中國沿海區(qū)域進(jìn)行樣本數(shù)據(jù)采集和實(shí)驗(yàn)分析,如果拓展到全球范圍,分類效果可能會(huì)發(fā)生變化。最后,本研究采用的是監(jiān)督學(xué)習(xí)方法,未考慮無標(biāo)簽數(shù)據(jù)的利用,可以考慮引入半監(jiān)督學(xué)習(xí)等方法進(jìn)行改進(jìn)。

綜上所述,盡管存在一些限制,本研究仍為船舶類型分類提供了一定的理論和應(yīng)用價(jià)值,為進(jìn)一步研究和實(shí)踐提供了參考和啟示。未來可考慮結(jié)合更多領(lǐng)域知識(shí)和技術(shù)手段,加強(qiáng)對(duì)船舶軌跡數(shù)據(jù)的理解和利用,推動(dòng)船舶智能化和數(shù)字化建設(shè),為航運(yùn)業(yè)發(fā)展做出貢獻(xiàn)另外,本研究也為相關(guān)領(lǐng)域的跨學(xué)科合作提供了契機(jī)。船舶類型分類不僅涉及到計(jì)算機(jī)科學(xué)和人工智能等技術(shù),還涉及到物流管理、市場(chǎng)分析等方面。未來,可以通過跨學(xué)科合作,提高船舶類型分類的綜合應(yīng)用水平,進(jìn)一步推動(dòng)海運(yùn)業(yè)的發(fā)展和智能化建設(shè)。

同時(shí),船舶類型分類還有許多未被充分挖掘的研究方向。例如,如何通過船舶類型分類,提高船舶運(yùn)行效率和安全性;如何通過船舶類型分類,預(yù)測(cè)船舶的維修和保養(yǎng)需求;如何利用船舶類型分類,分析船舶使用周期和價(jià)值等等。這些問題的解決,不僅可以為船舶類型分類提供更多的應(yīng)用場(chǎng)景,也可以為海運(yùn)業(yè)的可持續(xù)發(fā)展提供有益的支撐。

綜合而言,船舶類型分類是一個(gè)具有重要意義和廣闊應(yīng)用前景的研究領(lǐng)域。通過本研究對(duì)船舶類型分類方法的探索和改進(jìn),為相關(guān)領(lǐng)域的進(jìn)一步發(fā)展提供了基礎(chǔ)和啟示,也為未來的跨學(xué)科合作和應(yīng)用拓展打下了基礎(chǔ)。相信在各方的共同努力下,船舶類型分類在提高海運(yùn)業(yè)效益和推動(dòng)數(shù)字化建設(shè)方面將發(fā)揮越來越重要的作用綜上所述,船舶類型分類是一個(gè)具有廣泛應(yīng)用前景和重要意義的研究領(lǐng)域。本研究采用了基于深

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論