基于深度強化學習的旋翼無人機端到端伺服控制研究
發(fā)布時間:2021-08-01 16:28
無人機集群在軍民領域中具有巨大的應用前景,吸引了越來越多的研究人員對其關鍵技術進行攻關。集群中無人機數(shù)量眾多,在諸如無人機群自主續(xù)航、自主回收等場合,無人機自主降落是集群高效管理的核心技術之一。本課題針對無人機自主降落問題,采用深度強化學習實現(xiàn)魯棒的無人機自主降落,即在深度強化學習的框架下,以圖像作為模型的輸入,設計端到端的無人機自主降落伺服控制方法,以提高無人機自主降落的智能化水平。課題的主要研究內(nèi)容如下:(1)在深度強化學習框架下,設計并實現(xiàn)用于解決無人機自主降落問題的值函數(shù)Q-learning學習算法。首先將無人機的降落問題描述為馬爾科夫決策過程,將無人機下視圖像直接作為無人機狀態(tài),離散化動作作為無人機行為,并利用無人機位置信息構建獎勵回報函數(shù)。借助無人機與環(huán)境的交互迭代,完成深度強化學習神經(jīng)網(wǎng)絡的訓練,實現(xiàn)無人機自主降落的端到端控制。訓練過程包括原始Q-learning算法,3DQN(Dueling-Double-Deep Q-learning Network)算法等。為提高訓練速度,加速模型收斂,算法進一步引入外部控制器、使用數(shù)據(jù)庫預訓練等方式。仿真驗證表明,提出的端對端控制...
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:117 頁
【學位級別】:碩士
【部分圖文】:
無人機
國防科技大學研究生院碩士學位論文第4頁圖1.2系留無人機平臺(a)AtlasNEST智能無人機場及AtlasPro機場專用無人機(b)Airobotics公司用于續(xù)航的機場平臺圖1.3兩種無人機續(xù)航管理平臺產(chǎn)品示意圖無人機集群的回收,是無人機系統(tǒng)在實際應用過程中需要考慮的重點問題,因為無人機的損毀事故80%發(fā)生在起降階段[4]。一般有有遙控降落回收、傘降、空中捕獲、跑道滑跑著陸、攔阻網(wǎng)或“天鉤”回收、垂直著陸等方法。圖1.4是四種經(jīng)典的回收方式。其中遙控降落回收、跑道滑跑著陸的最后階段,還需要飛手接管、遙控操作,對于飛機數(shù)量眾多的無人機集群來說,勢必會占用大量人力、物力。傘降、撞網(wǎng)、或者掛索回收過程復雜,操作控制難度大,容易造成無人機損壞。其中垂直降落回收只需要小面積回收場地,不受回收區(qū)地形條件的限制。
國防科技大學研究生院碩士學位論文第4頁圖1.2系留無人機平臺(a)AtlasNEST智能無人機場及AtlasPro機場專用無人機(b)Airobotics公司用于續(xù)航的機場平臺圖1.3兩種無人機續(xù)航管理平臺產(chǎn)品示意圖無人機集群的回收,是無人機系統(tǒng)在實際應用過程中需要考慮的重點問題,因為無人機的損毀事故80%發(fā)生在起降階段[4]。一般有有遙控降落回收、傘降、空中捕獲、跑道滑跑著陸、攔阻網(wǎng)或“天鉤”回收、垂直著陸等方法。圖1.4是四種經(jīng)典的回收方式。其中遙控降落回收、跑道滑跑著陸的最后階段,還需要飛手接管、遙控操作,對于飛機數(shù)量眾多的無人機集群來說,勢必會占用大量人力、物力。傘降、撞網(wǎng)、或者掛索回收過程復雜,操作控制難度大,容易造成無人機損壞。其中垂直降落回收只需要小面積回收場地,不受回收區(qū)地形條件的限制。
【參考文獻】:
期刊論文
[1]深度學習優(yōu)缺點的剖析[J]. 孫暉. 電子制作. 2018(18)
[2]深度強化學習研究綜述[J]. 趙星宇,丁世飛. 計算機科學. 2018(07)
[3]未來觸手可及——AlphaZero學棋記[J]. 陳軼翔. 世界科學. 2018(02)
[4]深度強化學習進展:從AlphaGo到AlphaGo Zero[J]. 唐振韜,邵坤,趙冬斌,朱圓恒. 控制理論與應用. 2017(12)
[5]從監(jiān)督學習到強化學習,四種深度學習方式原理知多少[J]. 房曉楠. 機器人產(chǎn)業(yè). 2017(04)
[6]深度學習研究與進展[J]. 孫志遠,魯成祥,史忠植,馬剛. 計算機科學. 2016(02)
[7]基于Q學習的無人機三維航跡規(guī)劃算法[J]. 郝釧釧,方舟,李平. 上海交通大學學報. 2012(12)
[8]基于Q學習的變體無人機控制系統(tǒng)設計[J]. 徐小野,李愛軍,張叢叢,姚宗信. 西北工業(yè)大學學報. 2012(03)
[9]一種基于強化學習的UAV目標搜索算法[J]. 張晶晶,周德云,張堃. 計算機應用研究. 2011(10)
[10]機器學習的主要策略綜述[J]. 閆友彪,陳元琰. 計算機應用研究. 2004(07)
碩士論文
[1]多旋翼無人機視覺引導降落研究[D]. 樊瓏.哈爾濱工業(yè)大學 2016
[2]基于視覺引導的無人直升機自主著艦技術研究[D]. 陳銀軍.南昌航空大學 2015
[3]基于紅外探測器的無人機地基視覺引導著陸關鍵技術研究[D]. 張宇.國防科學技術大學 2013
本文編號:3315857
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:117 頁
【學位級別】:碩士
【部分圖文】:
無人機
國防科技大學研究生院碩士學位論文第4頁圖1.2系留無人機平臺(a)AtlasNEST智能無人機場及AtlasPro機場專用無人機(b)Airobotics公司用于續(xù)航的機場平臺圖1.3兩種無人機續(xù)航管理平臺產(chǎn)品示意圖無人機集群的回收,是無人機系統(tǒng)在實際應用過程中需要考慮的重點問題,因為無人機的損毀事故80%發(fā)生在起降階段[4]。一般有有遙控降落回收、傘降、空中捕獲、跑道滑跑著陸、攔阻網(wǎng)或“天鉤”回收、垂直著陸等方法。圖1.4是四種經(jīng)典的回收方式。其中遙控降落回收、跑道滑跑著陸的最后階段,還需要飛手接管、遙控操作,對于飛機數(shù)量眾多的無人機集群來說,勢必會占用大量人力、物力。傘降、撞網(wǎng)、或者掛索回收過程復雜,操作控制難度大,容易造成無人機損壞。其中垂直降落回收只需要小面積回收場地,不受回收區(qū)地形條件的限制。
國防科技大學研究生院碩士學位論文第4頁圖1.2系留無人機平臺(a)AtlasNEST智能無人機場及AtlasPro機場專用無人機(b)Airobotics公司用于續(xù)航的機場平臺圖1.3兩種無人機續(xù)航管理平臺產(chǎn)品示意圖無人機集群的回收,是無人機系統(tǒng)在實際應用過程中需要考慮的重點問題,因為無人機的損毀事故80%發(fā)生在起降階段[4]。一般有有遙控降落回收、傘降、空中捕獲、跑道滑跑著陸、攔阻網(wǎng)或“天鉤”回收、垂直著陸等方法。圖1.4是四種經(jīng)典的回收方式。其中遙控降落回收、跑道滑跑著陸的最后階段,還需要飛手接管、遙控操作,對于飛機數(shù)量眾多的無人機集群來說,勢必會占用大量人力、物力。傘降、撞網(wǎng)、或者掛索回收過程復雜,操作控制難度大,容易造成無人機損壞。其中垂直降落回收只需要小面積回收場地,不受回收區(qū)地形條件的限制。
【參考文獻】:
期刊論文
[1]深度學習優(yōu)缺點的剖析[J]. 孫暉. 電子制作. 2018(18)
[2]深度強化學習研究綜述[J]. 趙星宇,丁世飛. 計算機科學. 2018(07)
[3]未來觸手可及——AlphaZero學棋記[J]. 陳軼翔. 世界科學. 2018(02)
[4]深度強化學習進展:從AlphaGo到AlphaGo Zero[J]. 唐振韜,邵坤,趙冬斌,朱圓恒. 控制理論與應用. 2017(12)
[5]從監(jiān)督學習到強化學習,四種深度學習方式原理知多少[J]. 房曉楠. 機器人產(chǎn)業(yè). 2017(04)
[6]深度學習研究與進展[J]. 孫志遠,魯成祥,史忠植,馬剛. 計算機科學. 2016(02)
[7]基于Q學習的無人機三維航跡規(guī)劃算法[J]. 郝釧釧,方舟,李平. 上海交通大學學報. 2012(12)
[8]基于Q學習的變體無人機控制系統(tǒng)設計[J]. 徐小野,李愛軍,張叢叢,姚宗信. 西北工業(yè)大學學報. 2012(03)
[9]一種基于強化學習的UAV目標搜索算法[J]. 張晶晶,周德云,張堃. 計算機應用研究. 2011(10)
[10]機器學習的主要策略綜述[J]. 閆友彪,陳元琰. 計算機應用研究. 2004(07)
碩士論文
[1]多旋翼無人機視覺引導降落研究[D]. 樊瓏.哈爾濱工業(yè)大學 2016
[2]基于視覺引導的無人直升機自主著艦技術研究[D]. 陳銀軍.南昌航空大學 2015
[3]基于紅外探測器的無人機地基視覺引導著陸關鍵技術研究[D]. 張宇.國防科學技術大學 2013
本文編號:3315857
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3315857.html
最近更新
教材專著