天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 船舶論文 >

面向船舶狀態(tài)數(shù)據(jù)的數(shù)據(jù)清洗與修復(fù)方法研究

發(fā)布時間:2020-03-25 23:11
【摘要】:船舶狀態(tài)數(shù)據(jù)中包含了大量有重要價值的信息,針對船舶狀態(tài)數(shù)據(jù)的數(shù)據(jù)挖掘工作可以為智慧水運的發(fā)展做出有力支持。然而這些數(shù)據(jù)中存在大量的問題數(shù)據(jù),在挖掘之前對這些問題數(shù)據(jù)進(jìn)行清洗和修復(fù)是必不可少的步驟,F(xiàn)有的數(shù)據(jù)清洗和修復(fù)方法如果直接應(yīng)用到船舶狀態(tài)數(shù)據(jù)中,效果并不理想。為保證數(shù)據(jù)清洗和修復(fù)工作的精確性,每一種問題數(shù)據(jù)都需要制定特定的方法來進(jìn)行清洗或修復(fù);诖,本文將重點研究目前船舶狀態(tài)數(shù)據(jù)中對數(shù)據(jù)挖掘工作影響最為嚴(yán)重的兩類問題,即重復(fù)問題以及軌跡數(shù)據(jù)的缺失問題。本文的主要研究工作如下:(1)針對現(xiàn)有的相似重復(fù)數(shù)據(jù)檢測算法-SNM算法(Sorted-Neighborhood Method,SNM)檢測效率低的問題,提出一種改進(jìn)的滑動窗口策略,然后結(jié)合基于Top-K的過濾策略來提高檢測效率。改進(jìn)的滑動窗口策略即滑動窗口大小動態(tài)可變策略,窗口大小可以根據(jù)檢測的情況隨時改變,既減少不必要的比較,又減少漏配現(xiàn)象;基于Top-K的過濾策略使不滿足條件的數(shù)據(jù)提前結(jié)束比較,大大縮短檢測時間。通過對比實驗驗證了本文的改進(jìn)算法在檢測效率上要優(yōu)于其他算法。(2)針對由于字段權(quán)重設(shè)置主觀性過強導(dǎo)致SNM算法檢測精確度低的問題,提出一種改進(jìn)的字段權(quán)重計算方法。改進(jìn)方法綜合主觀經(jīng)驗較強的等級法和客觀性的統(tǒng)計法來計算字段的權(quán)重,使字段權(quán)重的設(shè)置更加科學(xué)合理,進(jìn)而有助于提高數(shù)據(jù)相似度計算的精確度。同時,改進(jìn)的滑動窗口策略也有助于算法檢測精確度的提升。通過對比實驗驗證了本文的改進(jìn)算法在查全率,查準(zhǔn)率等評價指標(biāo)上均優(yōu)于其他算法。(3)針對現(xiàn)有的船舶軌跡缺失數(shù)據(jù)修復(fù)算法修復(fù)精確度低的問題,首先解決了由軌跡數(shù)據(jù)中的錯誤數(shù)據(jù)引起的偽連續(xù)問題,然后提出一種針對船舶軌跡缺失數(shù)據(jù)的修復(fù)算法。首先構(gòu)建船舶運動狀態(tài)矢量模型,將船舶的空間位置與時間聯(lián)系起來,然后基于多項式插值的思想,構(gòu)建船舶空間位置的插值函數(shù),充分結(jié)合已有的船舶信息來優(yōu)化參數(shù),以實現(xiàn)對軌跡缺失數(shù)據(jù)的精確修復(fù)。通過對比實驗驗證了本文的修復(fù)算法在修復(fù)精確度上要優(yōu)于其他算法。
【圖文】:

示意圖,示意圖,低軌道衛(wèi)星,海事局


11數(shù)據(jù)庫數(shù)據(jù)接收服務(wù)器圖 2-1AIS 系統(tǒng)數(shù)據(jù)采集示意圖船舶的監(jiān)控主要采用的是 AIS 設(shè)備及系統(tǒng)。隨著越多的船舶裝上了 AIS 設(shè)備,海事局等監(jiān)管單位通過互聯(lián)網(wǎng)收集起來[49]。AIS 系統(tǒng)數(shù)據(jù)采集示意圖以看出,AIS 數(shù)據(jù)采集有兩種方式,一是通過分布收;二是通過低軌道衛(wèi)星來接收,主要是接收海船

重復(fù)數(shù),示例,問題,狀態(tài)數(shù)據(jù)


Maritime Organization, IMO)、船舶類型等信息;(3)船舶航次數(shù)據(jù),這部分?jǐn)?shù)據(jù)主要包含船舶吃水、危險貨物(類型)、目的地等信息。船舶狀態(tài)數(shù)據(jù)主要由動態(tài)數(shù)據(jù)和靜態(tài)數(shù)據(jù)構(gòu)成,其實,航次數(shù)據(jù)也屬于靜態(tài)數(shù)據(jù)的一種,這些數(shù)據(jù)具有維度高的特點,,而且在采集以及傳輸?shù)冗^程中容易出現(xiàn)問題。2.1.2 數(shù)據(jù)質(zhì)量問題船舶狀態(tài)數(shù)據(jù)中存在的主要質(zhì)量問題有:重復(fù)問題,缺失問題,還有錯誤問題。下面將以船舶動態(tài)數(shù)據(jù)為例詳細(xì)分析說明船舶狀態(tài)數(shù)據(jù)中的各種問題。(1)重復(fù)問題船舶狀態(tài)數(shù)據(jù)中存在重復(fù)數(shù)據(jù)是一個常見問題,需要說明的是,船舶數(shù)據(jù)中存在的重復(fù)問題不僅僅是完全重復(fù)問題,也有代表著同一信息的相似重復(fù)問題,具體將在第 3 章進(jìn)行研究說明。如圖 2-2 所示,是船舶動態(tài)數(shù)據(jù)中的部分信息。
【學(xué)位授予單位】:武漢理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP311.13;U672

【參考文獻(xiàn)】

相關(guān)博士學(xué)位論文 前1條

1 傅貴;城市智能交通動態(tài)預(yù)測模型的研究及應(yīng)用[D];華南理工大學(xué);2014年



本文編號:2600577

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/chuanbolw/2600577.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶70cb1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com