深度強化學習在室內無人機目標搜索中的應用
發(fā)布時間:2023-04-18 20:47
針對室內無人機隨機目標搜索效率不高、準確率低等問題,提出了一種基于空間位置標注的好奇心驅動的深度強化學習方法。用正六邊形對探索空間進行區(qū)域劃分,并標記無人機在各區(qū)域的訪問次數(shù),將其作為好奇心,產生內部獎勵,以鼓勵無人機不斷探索新領域,有效避免其陷入到局部區(qū)域;訓練時采用近端策略優(yōu)化算法(PPO)優(yōu)化神經網絡參數(shù),該算法能使無人機更快找到最優(yōu)搜索策略,較好躲避障礙物,有效縮短訓練周期,提升搜索效率和準確率。
【文章頁數(shù)】:5 頁
【文章目錄】:
1 引言
2 仿真環(huán)境和任務介紹
3 基于深度強化學習的室內無人機目標搜索
3.1 PPO算法
3.2 好奇心驅動模型
3.3 基于空間位置標注的好奇心驅動方法
4 仿真實例
4.1 Agent狀態(tài)空間及獎勵規(guī)則設置
4.2 實驗結果及分析
5 結束語
本文編號:3793007
【文章頁數(shù)】:5 頁
【文章目錄】:
1 引言
2 仿真環(huán)境和任務介紹
3 基于深度強化學習的室內無人機目標搜索
3.1 PPO算法
3.2 好奇心驅動模型
3.3 基于空間位置標注的好奇心驅動方法
4 仿真實例
4.1 Agent狀態(tài)空間及獎勵規(guī)則設置
4.2 實驗結果及分析
5 結束語
本文編號:3793007
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3793007.html
教材專著