面向船舶狀態(tài)數(shù)據(jù)的數(shù)據(jù)清洗與修復(fù)方法研究
發(fā)布時(shí)間:2020-03-25 23:11
【摘要】:船舶狀態(tài)數(shù)據(jù)中包含了大量有重要價(jià)值的信息,針對(duì)船舶狀態(tài)數(shù)據(jù)的數(shù)據(jù)挖掘工作可以為智慧水運(yùn)的發(fā)展做出有力支持。然而這些數(shù)據(jù)中存在大量的問(wèn)題數(shù)據(jù),在挖掘之前對(duì)這些問(wèn)題數(shù)據(jù)進(jìn)行清洗和修復(fù)是必不可少的步驟,F(xiàn)有的數(shù)據(jù)清洗和修復(fù)方法如果直接應(yīng)用到船舶狀態(tài)數(shù)據(jù)中,效果并不理想。為保證數(shù)據(jù)清洗和修復(fù)工作的精確性,每一種問(wèn)題數(shù)據(jù)都需要制定特定的方法來(lái)進(jìn)行清洗或修復(fù);诖,本文將重點(diǎn)研究目前船舶狀態(tài)數(shù)據(jù)中對(duì)數(shù)據(jù)挖掘工作影響最為嚴(yán)重的兩類(lèi)問(wèn)題,即重復(fù)問(wèn)題以及軌跡數(shù)據(jù)的缺失問(wèn)題。本文的主要研究工作如下:(1)針對(duì)現(xiàn)有的相似重復(fù)數(shù)據(jù)檢測(cè)算法-SNM算法(Sorted-Neighborhood Method,SNM)檢測(cè)效率低的問(wèn)題,提出一種改進(jìn)的滑動(dòng)窗口策略,然后結(jié)合基于Top-K的過(guò)濾策略來(lái)提高檢測(cè)效率。改進(jìn)的滑動(dòng)窗口策略即滑動(dòng)窗口大小動(dòng)態(tài)可變策略,窗口大小可以根據(jù)檢測(cè)的情況隨時(shí)改變,既減少不必要的比較,又減少漏配現(xiàn)象;基于Top-K的過(guò)濾策略使不滿(mǎn)足條件的數(shù)據(jù)提前結(jié)束比較,大大縮短檢測(cè)時(shí)間。通過(guò)對(duì)比實(shí)驗(yàn)驗(yàn)證了本文的改進(jìn)算法在檢測(cè)效率上要優(yōu)于其他算法。(2)針對(duì)由于字段權(quán)重設(shè)置主觀性過(guò)強(qiáng)導(dǎo)致SNM算法檢測(cè)精確度低的問(wèn)題,提出一種改進(jìn)的字段權(quán)重計(jì)算方法。改進(jìn)方法綜合主觀經(jīng)驗(yàn)較強(qiáng)的等級(jí)法和客觀性的統(tǒng)計(jì)法來(lái)計(jì)算字段的權(quán)重,使字段權(quán)重的設(shè)置更加科學(xué)合理,進(jìn)而有助于提高數(shù)據(jù)相似度計(jì)算的精確度。同時(shí),改進(jìn)的滑動(dòng)窗口策略也有助于算法檢測(cè)精確度的提升。通過(guò)對(duì)比實(shí)驗(yàn)驗(yàn)證了本文的改進(jìn)算法在查全率,查準(zhǔn)率等評(píng)價(jià)指標(biāo)上均優(yōu)于其他算法。(3)針對(duì)現(xiàn)有的船舶軌跡缺失數(shù)據(jù)修復(fù)算法修復(fù)精確度低的問(wèn)題,首先解決了由軌跡數(shù)據(jù)中的錯(cuò)誤數(shù)據(jù)引起的偽連續(xù)問(wèn)題,然后提出一種針對(duì)船舶軌跡缺失數(shù)據(jù)的修復(fù)算法。首先構(gòu)建船舶運(yùn)動(dòng)狀態(tài)矢量模型,將船舶的空間位置與時(shí)間聯(lián)系起來(lái),然后基于多項(xiàng)式插值的思想,構(gòu)建船舶空間位置的插值函數(shù),充分結(jié)合已有的船舶信息來(lái)優(yōu)化參數(shù),以實(shí)現(xiàn)對(duì)軌跡缺失數(shù)據(jù)的精確修復(fù)。通過(guò)對(duì)比實(shí)驗(yàn)驗(yàn)證了本文的修復(fù)算法在修復(fù)精確度上要優(yōu)于其他算法。
【圖文】:
11數(shù)據(jù)庫(kù)數(shù)據(jù)接收服務(wù)器圖 2-1AIS 系統(tǒng)數(shù)據(jù)采集示意圖船舶的監(jiān)控主要采用的是 AIS 設(shè)備及系統(tǒng)。隨著越多的船舶裝上了 AIS 設(shè)備,海事局等監(jiān)管單位通過(guò)互聯(lián)網(wǎng)收集起來(lái)[49]。AIS 系統(tǒng)數(shù)據(jù)采集示意圖以看出,AIS 數(shù)據(jù)采集有兩種方式,一是通過(guò)分布收;二是通過(guò)低軌道衛(wèi)星來(lái)接收,主要是接收海船
Maritime Organization, IMO)、船舶類(lèi)型等信息;(3)船舶航次數(shù)據(jù),這部分?jǐn)?shù)據(jù)主要包含船舶吃水、危險(xiǎn)貨物(類(lèi)型)、目的地等信息。船舶狀態(tài)數(shù)據(jù)主要由動(dòng)態(tài)數(shù)據(jù)和靜態(tài)數(shù)據(jù)構(gòu)成,其實(shí),航次數(shù)據(jù)也屬于靜態(tài)數(shù)據(jù)的一種,這些數(shù)據(jù)具有維度高的特點(diǎn),,而且在采集以及傳輸?shù)冗^(guò)程中容易出現(xiàn)問(wèn)題。2.1.2 數(shù)據(jù)質(zhì)量問(wèn)題船舶狀態(tài)數(shù)據(jù)中存在的主要質(zhì)量問(wèn)題有:重復(fù)問(wèn)題,缺失問(wèn)題,還有錯(cuò)誤問(wèn)題。下面將以船舶動(dòng)態(tài)數(shù)據(jù)為例詳細(xì)分析說(shuō)明船舶狀態(tài)數(shù)據(jù)中的各種問(wèn)題。(1)重復(fù)問(wèn)題船舶狀態(tài)數(shù)據(jù)中存在重復(fù)數(shù)據(jù)是一個(gè)常見(jiàn)問(wèn)題,需要說(shuō)明的是,船舶數(shù)據(jù)中存在的重復(fù)問(wèn)題不僅僅是完全重復(fù)問(wèn)題,也有代表著同一信息的相似重復(fù)問(wèn)題,具體將在第 3 章進(jìn)行研究說(shuō)明。如圖 2-2 所示,是船舶動(dòng)態(tài)數(shù)據(jù)中的部分信息。
【學(xué)位授予單位】:武漢理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:TP311.13;U672
本文編號(hào):2600577
【圖文】:
11數(shù)據(jù)庫(kù)數(shù)據(jù)接收服務(wù)器圖 2-1AIS 系統(tǒng)數(shù)據(jù)采集示意圖船舶的監(jiān)控主要采用的是 AIS 設(shè)備及系統(tǒng)。隨著越多的船舶裝上了 AIS 設(shè)備,海事局等監(jiān)管單位通過(guò)互聯(lián)網(wǎng)收集起來(lái)[49]。AIS 系統(tǒng)數(shù)據(jù)采集示意圖以看出,AIS 數(shù)據(jù)采集有兩種方式,一是通過(guò)分布收;二是通過(guò)低軌道衛(wèi)星來(lái)接收,主要是接收海船
Maritime Organization, IMO)、船舶類(lèi)型等信息;(3)船舶航次數(shù)據(jù),這部分?jǐn)?shù)據(jù)主要包含船舶吃水、危險(xiǎn)貨物(類(lèi)型)、目的地等信息。船舶狀態(tài)數(shù)據(jù)主要由動(dòng)態(tài)數(shù)據(jù)和靜態(tài)數(shù)據(jù)構(gòu)成,其實(shí),航次數(shù)據(jù)也屬于靜態(tài)數(shù)據(jù)的一種,這些數(shù)據(jù)具有維度高的特點(diǎn),,而且在采集以及傳輸?shù)冗^(guò)程中容易出現(xiàn)問(wèn)題。2.1.2 數(shù)據(jù)質(zhì)量問(wèn)題船舶狀態(tài)數(shù)據(jù)中存在的主要質(zhì)量問(wèn)題有:重復(fù)問(wèn)題,缺失問(wèn)題,還有錯(cuò)誤問(wèn)題。下面將以船舶動(dòng)態(tài)數(shù)據(jù)為例詳細(xì)分析說(shuō)明船舶狀態(tài)數(shù)據(jù)中的各種問(wèn)題。(1)重復(fù)問(wèn)題船舶狀態(tài)數(shù)據(jù)中存在重復(fù)數(shù)據(jù)是一個(gè)常見(jiàn)問(wèn)題,需要說(shuō)明的是,船舶數(shù)據(jù)中存在的重復(fù)問(wèn)題不僅僅是完全重復(fù)問(wèn)題,也有代表著同一信息的相似重復(fù)問(wèn)題,具體將在第 3 章進(jìn)行研究說(shuō)明。如圖 2-2 所示,是船舶動(dòng)態(tài)數(shù)據(jù)中的部分信息。
【學(xué)位授予單位】:武漢理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:TP311.13;U672
【參考文獻(xiàn)】
相關(guān)博士學(xué)位論文 前1條
1 傅貴;城市智能交通動(dòng)態(tài)預(yù)測(cè)模型的研究及應(yīng)用[D];華南理工大學(xué);2014年
本文編號(hào):2600577
本文鏈接:http://sikaile.net/kejilunwen/chuanbolw/2600577.html
最近更新
教材專(zhuān)著