移動機器人在復雜環(huán)境下的動態(tài)避障
發(fā)布時間:2021-10-11 02:50
近年來,機器人在人類社會中扮演著越來越重要的角色,尤其是移動機器人正慢慢融入人們的日常生活。然而不論是室內(nèi)使用的掃地機器人,還是在戶外使用的外賣機器人、快遞機器人、巡邏機器人等都面臨著避障問題,它們的應用場景中不僅有靜態(tài)的障礙物,還往往有人、動物以及其它交通工具等動態(tài)的障礙物,避開靜態(tài)以及動態(tài)障礙物是對移動機器人的基本要求,也是機器人領域研究的一個核心問題。本文首先針對動態(tài)環(huán)境下的移動機器人避障問題提出了一種基于深度強化學習的端到端的動態(tài)避障算法。該算法提出了一種新型策略網(wǎng)絡,該網(wǎng)絡創(chuàng)造性地將處理文本時序信息的長短期記憶單元與處理圖像信息的卷積層相結(jié)合構(gòu)成新的特征提取網(wǎng)絡。在此基礎上本文設計了新型的獎賞函數(shù),結(jié)合增加正則項的近端策略優(yōu)化,經(jīng)過訓練得到了優(yōu)化的避障策略模型。該算法輸入為激光雷達掃描數(shù)據(jù)、目標位置坐標參數(shù)以及機器人本體的速度信息,基于這些參數(shù)可直接輸出用于機器人靈活避障的速度指令,在本文仿真實驗部分中設置的多種復雜仿真環(huán)境的綜合平均避障成功率可達70%以上。硬件部分創(chuàng)新性地使用3D激光雷達與超寬帶定位系統(tǒng)相結(jié)合的導航避障傳感系統(tǒng),同時優(yōu)化了傳感器的連接與供電方案,使得傳感器...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景
1.2 國內(nèi)外研究現(xiàn)狀分析
1.2.1 經(jīng)典路徑規(guī)劃算法
1.2.2 群體智能算法
1.2.3 深度強化學習類算法
1.3 本文的主要研究內(nèi)容
第2章 基于深度強化學習的動態(tài)避障算法研究
2.1 引言
2.2 強化學習基本數(shù)學模型
2.3 移動機器人動態(tài)避障建模
2.3.1 觀測空間設計
2.3.2 動作空間設計
2.3.3 獎賞函數(shù)設計
2.3.4 基于近端策略優(yōu)化的建模
2.4 神經(jīng)網(wǎng)絡結(jié)構(gòu)
2.5 訓練算法描述
2.6 仿真環(huán)境的配置
2.7 訓練結(jié)果
2.8 本章小結(jié)
第3章 基于改進動態(tài)窗口法的動態(tài)避障算法研究
3.1 引言
3.2 動態(tài)窗口法基本原理
3.2.1 機器人運動學模型推導
3.2.2 速度選取空間與預測軌跡評價函數(shù)
3.3 動態(tài)窗口法DWA的改進
3.4 動態(tài)窗口法改進算法的仿真
3.5 本章小結(jié)
第4章 基于萊卡狗機器人的實驗驗證
4.1 引言
4.2 機器人硬件平臺
4.3 對基于深度強化學習的動態(tài)避障算法的實驗驗證
4.3.1 傳感器方案
4.3.2 真實環(huán)境中的實驗驗證
4.4 對基于改進DWA的動態(tài)避障算法的實驗驗證
4.4.1 傳感器方案
4.4.2 真實環(huán)境中的實驗方案
4.5 兩套避障方案的對比分析
4.5.1 硬件部分的對比與分析
4.5.2 算法部分的對比與分析
4.6 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的研究成果
致謝
【參考文獻】:
期刊論文
[1]“絕影”機器人助力智慧安防[J]. 朱秋國. 中國測繪. 2019(03)
碩士論文
[1]基于深度強化學習的未知環(huán)境下機器人路徑規(guī)劃的研究[D]. 卜祥津.哈爾濱工業(yè)大學 2018
[2]基于RGB-D相機中型組足球機器人的目標檢測方法研究[D]. 程球.國防科學技術(shù)大學 2016
本文編號:3429643
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景
1.2 國內(nèi)外研究現(xiàn)狀分析
1.2.1 經(jīng)典路徑規(guī)劃算法
1.2.2 群體智能算法
1.2.3 深度強化學習類算法
1.3 本文的主要研究內(nèi)容
第2章 基于深度強化學習的動態(tài)避障算法研究
2.1 引言
2.2 強化學習基本數(shù)學模型
2.3 移動機器人動態(tài)避障建模
2.3.1 觀測空間設計
2.3.2 動作空間設計
2.3.3 獎賞函數(shù)設計
2.3.4 基于近端策略優(yōu)化的建模
2.4 神經(jīng)網(wǎng)絡結(jié)構(gòu)
2.5 訓練算法描述
2.6 仿真環(huán)境的配置
2.7 訓練結(jié)果
2.8 本章小結(jié)
第3章 基于改進動態(tài)窗口法的動態(tài)避障算法研究
3.1 引言
3.2 動態(tài)窗口法基本原理
3.2.1 機器人運動學模型推導
3.2.2 速度選取空間與預測軌跡評價函數(shù)
3.3 動態(tài)窗口法DWA的改進
3.4 動態(tài)窗口法改進算法的仿真
3.5 本章小結(jié)
第4章 基于萊卡狗機器人的實驗驗證
4.1 引言
4.2 機器人硬件平臺
4.3 對基于深度強化學習的動態(tài)避障算法的實驗驗證
4.3.1 傳感器方案
4.3.2 真實環(huán)境中的實驗驗證
4.4 對基于改進DWA的動態(tài)避障算法的實驗驗證
4.4.1 傳感器方案
4.4.2 真實環(huán)境中的實驗方案
4.5 兩套避障方案的對比分析
4.5.1 硬件部分的對比與分析
4.5.2 算法部分的對比與分析
4.6 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的研究成果
致謝
【參考文獻】:
期刊論文
[1]“絕影”機器人助力智慧安防[J]. 朱秋國. 中國測繪. 2019(03)
碩士論文
[1]基于深度強化學習的未知環(huán)境下機器人路徑規(guī)劃的研究[D]. 卜祥津.哈爾濱工業(yè)大學 2018
[2]基于RGB-D相機中型組足球機器人的目標檢測方法研究[D]. 程球.國防科學技術(shù)大學 2016
本文編號:3429643
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3429643.html
最近更新
教材專著