天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 測繪論文 >

視覺SLAM的半稠密認(rèn)知地圖創(chuàng)建方法研究及實現(xiàn)

發(fā)布時間:2020-09-04 16:50
   地圖是人類理解世界的重要工具,它不僅描繪了環(huán)境的地理地形,而且能夠用于任務(wù)規(guī)劃。隨著移動機器人被廣泛地應(yīng)用到人類的生產(chǎn)生活中,機器人要理解環(huán)境同樣離不開地圖。同時定位與地圖創(chuàng)建是移動機器人理解未知環(huán)境的關(guān)鍵技術(shù),機器人通過自身搭載的傳感器,在運動的過程中估計自身的位姿,同時創(chuàng)建環(huán)境的地圖。視覺SLAM(Simultaneous Localization and Mapping),由于相機成本低、圖像信息豐富、技術(shù)難度大等原因,近幾年受到了廣泛地關(guān)注和研究。本文提出了一種用于視覺SLAM的半稠密認(rèn)知地圖創(chuàng)建方法,利用視覺SLAM獲取的位姿信息,不僅能估計出環(huán)境的較稠密的逆深度信息,而且能識別出環(huán)境中的感興趣物體。本文的主要研究工作包括:1)基于深度濾波器實現(xiàn)地圖點的逆深度估計,從像素層面估計逆深度。在關(guān)鍵幀中選取合適的地圖點,采用一種“粗糙-精確”的匹配方式在參考幀中觀測并更新地圖點的逆深度估計。根據(jù)逆深度估計表示方法,提出一種關(guān)鍵幀選取策略。2)基于圖像金字塔實現(xiàn)關(guān)鍵幀的逆深度圖估計,從圖像層面估計逆深度,主要包括逆深度圖更新和逆深度圖傳遞。在估計的過程中,并行地估計關(guān)鍵幀圖像金字塔每一層的逆深度圖;在估計結(jié)束后,將金字塔的逆深度圖自上而下地傳遞到最底層。3)基于Mask R-CNN(Region-based Convolutional Neural Network)實現(xiàn)感興趣物體的三維識別。將關(guān)鍵幀圖像識別結(jié)果轉(zhuǎn)換為一種特定形式的圖像作為環(huán)境認(rèn)知信息,同時使用一種新穎的地圖表示方式融合關(guān)鍵幀的位姿、圖像、逆深度、誤差方差和物體識別等信息。4)設(shè)計并實現(xiàn)一套完整的用于視覺SLAM的半稠密認(rèn)知地圖創(chuàng)建系統(tǒng),系統(tǒng)主要包括系統(tǒng)啟動模塊、逆深度圖估計模塊和地圖模塊。地圖的“半稠密”在逆深度圖估計模塊中實現(xiàn),地圖的“認(rèn)知”在地圖模塊中實現(xiàn),并通過地圖模塊融為一體。實驗結(jié)果表明,本文提出的用于視覺SLAM的半稠密認(rèn)知地圖創(chuàng)建方法能夠較準(zhǔn)確地估計關(guān)鍵幀的逆深度圖并較完整地識別出關(guān)鍵幀中的感興趣物體;本文提出的地圖表示方式能夠有效地融合關(guān)鍵幀的各種信息,其轉(zhuǎn)換得到的半稠密認(rèn)知點云地圖不僅能準(zhǔn)確地還原環(huán)境而且能標(biāo)識出環(huán)境中的感興趣的物體。
【學(xué)位單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP391.41;P283
【部分圖文】:

地圖,傳感器,機器人,環(huán)境信息


機器人也越來越智能化,逐漸從實驗室走到人類的日常生活中。人類在享受機器人提供的服務(wù)的同時,對機器人的智能水平提出了更高的要求,希望機器人能夠提高自主性,實現(xiàn)智能感知、智能學(xué)習(xí)、智能決策、智能行動等。智能感知是指移動機器人通過自身搭載的傳感器獲取其所處的環(huán)境信息,是機器人與外界環(huán)境聯(lián)系的橋梁,是實現(xiàn)機器人智能化的關(guān)鍵。同時定位與地圖創(chuàng)建[2, 3](SimultaneousLocalizationandMapping,SLAM)是實現(xiàn)機器人智能感知的一種重要方式,1986 年在 IEEE 機器人和自動化會議上被首次提出[4]。在未知環(huán)境中,移動機器人通過傳感器獲取環(huán)境信息,在運動的過程中估計自身的位姿,并同時創(chuàng)建環(huán)境的地圖。不同的傳感器可以獲取到不同類型的環(huán)境信息,形成了多種多樣的 SLAM 算法。如圖 1-1 所示,傳感器的類型主要包括超聲波傳感器、相機、激光、RGB-D 相機、慣性測量單元等; SLAM 的應(yīng)用已經(jīng)被廣泛地應(yīng)用于地圖創(chuàng)建、3D 建模、自動駕駛、增強現(xiàn)實(Augmented Reality,AR)、虛擬現(xiàn)實(Virtual Reality,VR)等。

二維圖像,針孔模型


和姿態(tài)(朝向)。在 SLAM 中,通常使用機器人的位姿(Pose)描述和姿態(tài)。特別的,在視覺 SLAM 中,由于相機是視覺 SLAM 獲取外載體,且通常相機固定在移動機器人上,所以一般情況下視覺 SLAM機的位姿。機模型將三維空間映射為一個二維圖像,這個過程被稱為投影;相反的,將三維空間中的過程被稱為逆投影。相機模型描述了三維相機坐標(biāo)系與二維像素坐標(biāo)系之間的變換。模型[46]是一種最常用的相機模型,它描述了一束光線穿過針孔后,在面上投影成像的關(guān)系。針孔模型主要由相機光心、主光軸和成像平成像平面的距離被稱為焦距。

框架圖,增量式,視覺,框架


圖 2-2 視覺 SLAM 的增量式框架1. 初始化在初始化階段,首先需要定義一個全局坐標(biāo)系,一般以第一幀圖像的相機坐標(biāo)系作為全局坐標(biāo)系,對于雙目視覺而言,一般以左相機的第一幀圖像的相機坐標(biāo)系作為全局坐標(biāo)系;然后在全局坐標(biāo)系中創(chuàng)建環(huán)境的初始化地圖以及估計第一幀圖像和第二幀圖像之間的位姿變換。初始化只會在視覺 SLAM 啟動時運動一次,在隨后的 SLAM 過程中不會再運行。由于雙目相機和 RGB-D 相機都能在不同程度上獲得圖像的深度信息,可以直接通過 3D-2D 或 3D-3D 等方式較好地初始化。但是,單目相機只能獲取到圖像信息,因此初始化問題主要集中在單目視覺 SLAM 中。在早期的視覺 SLAM 中,通過一個人工設(shè)置的特定場景進行初始化,如將相機放置在一個與二維正方形平面相距固定距離的位置,并輸入相關(guān)數(shù)據(jù)[9]。這種方式需要人工

【參考文獻】

相關(guān)期刊論文 前1條

1 朱博;高翔;趙燕喃;;機器人室內(nèi)語義建圖中的場所感知方法綜述[J];自動化學(xué)報;2017年04期



本文編號:2812355

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/dizhicehuilunwen/2812355.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶00040***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com