基于深度強化學習的旋翼無人機端到端伺服控制研究

發(fā)布時間：2021-08-01 16:28

　　無人機集群在軍民領域中具有巨大的應用前景,吸引了越來越多的研究人員對其關鍵技術進行攻關。集群中無人機數(shù)量眾多,在諸如無人機群自主續(xù)航、自主回收等場合,無人機自主降落是集群高效管理的核心技術之一。本課題針對無人機自主降落問題,采用深度強化學習實現(xiàn)魯棒的無人機自主降落,即在深度強化學習的框架下,以圖像作為模型的輸入,設計端到端的無人機自主降落伺服控制方法,以提高無人機自主降落的智能化水平。課題的主要研究內(nèi)容如下:（1）在深度強化學習框架下,設計并實現(xiàn)用于解決無人機自主降落問題的值函數(shù)Q-learning學習算法。首先將無人機的降落問題描述為馬爾科夫決策過程,將無人機下視圖像直接作為無人機狀態(tài),離散化動作作為無人機行為,并利用無人機位置信息構建獎勵回報函數(shù)。借助無人機與環(huán)境的交互迭代,完成深度強化學習神經(jīng)網(wǎng)絡的訓練,實現(xiàn)無人機自主降落的端到端控制。訓練過程包括原始Q-learning算法,3DQN（Dueling-Double-Deep Q-learning Network）算法等。為提高訓練速度,加速模型收斂,算法進一步引入外部控制器、使用數(shù)據(jù)庫預訓練等方式。仿真驗證表明,提出的端對端控制...

【文章來源】：國防科技大學湖南省 211工程院校 985工程院校

【文章頁數(shù)】：117 頁

【學位級別】：碩士

【部分圖文】：

無人機

示意圖,無人機,平臺

示意圖,無人機

國防科技大學研究生院碩士學位論文第4頁圖1.2系留無人機平臺(a)AtlasNEST智能無人機場及AtlasPro機場專用無人機(b)Airobotics公司用于續(xù)航的機場平臺圖1.3兩種無人機續(xù)航管理平臺產(chǎn)品示意圖無人機集群的回收，是無人機系統(tǒng)在實際應用過程中需要考慮的重點問題，因為無人機的損毀事故80%發(fā)生在起降階段[4]。一般有有遙控降落回收、傘降、空中捕獲、跑道滑跑著陸、攔阻網(wǎng)或“天鉤”回收、垂直著陸等方法。圖1.4是四種經(jīng)典的回收方式。其中遙控降落回收、跑道滑跑著陸的最后階段，還需要飛手接管、遙控操作，對于飛機數(shù)量眾多的無人機集群來說，勢必會占用大量人力、物力。傘降、撞網(wǎng)、或者掛索回收過程復雜，操作控制難度大，容易造成無人機損壞。其中垂直降落回收只需要小面積回收場地，不受回收區(qū)地形條件的限制。

【參考文獻】：
期刊論文
[1]深度學習優(yōu)缺點的剖析[J]. 孫暉.  電子制作. 2018(18)
[2]深度強化學習研究綜述[J]. 趙星宇,丁世飛.  計算機科學. 2018(07)
[3]未來觸手可及——AlphaZero學棋記[J]. 陳軼翔.  世界科學. 2018(02)
[4]深度強化學習進展:從AlphaGo到AlphaGo Zero[J]. 唐振韜,邵坤,趙冬斌,朱圓恒.  控制理論與應用. 2017(12)
[5]從監(jiān)督學習到強化學習,四種深度學習方式原理知多少[J]. 房曉楠.  機器人產(chǎn)業(yè). 2017(04)
[6]深度學習研究與進展[J]. 孫志遠,魯成祥,史忠植,馬剛.  計算機科學. 2016(02)
[7]基于Q學習的無人機三維航跡規(guī)劃算法[J]. 郝釧釧,方舟,李平.  上海交通大學學報. 2012(12)
[8]基于Q學習的變體無人機控制系統(tǒng)設計[J]. 徐小野,李愛軍,張叢叢,姚宗信.  西北工業(yè)大學學報. 2012(03)
[9]一種基于強化學習的UAV目標搜索算法[J]. 張晶晶,周德云,張堃.  計算機應用研究. 2011(10)
[10]機器學習的主要策略綜述[J]. 閆友彪,陳元琰.  計算機應用研究. 2004(07)

碩士論文
[1]多旋翼無人機視覺引導降落研究[D]. 樊瓏.哈爾濱工業(yè)大學 2016
[2]基于視覺引導的無人直升機自主著艦技術研究[D]. 陳銀軍.南昌航空大學 2015
[3]基于紅外探測器的無人機地基視覺引導著陸關鍵技術研究[D]. 張宇.國防科學技術大學 2013

本文編號：3315857

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3315857.html

上一篇：基于深度卷積神經(jīng)網(wǎng)絡的高分辨率遙感影像建筑物提取方法研究
下一篇：基于深度神經(jīng)網(wǎng)絡對抗與集成的不平衡數(shù)據(jù)分類方法研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度強化學習的旋翼無人機端到端伺服控制研究