天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 航空航天論文 >

基于強(qiáng)化學(xué)習(xí)的四旋翼無人機(jī)路徑規(guī)劃方法研究

發(fā)布時(shí)間:2021-03-04 07:57
  路徑規(guī)劃是機(jī)器人導(dǎo)航控制中非常重要的環(huán)節(jié)之一,是指機(jī)器人按照時(shí)間,距離等性能指標(biāo),搜索一條從起點(diǎn)到終點(diǎn)的最優(yōu)、近似最優(yōu)或者次優(yōu)的路線。路徑規(guī)劃問題由來已久且具有較為豐富的算法,但目前的算法中大都需要已知環(huán)境,然而在多數(shù)情況下,環(huán)境模型難以描述和獲取。另一方面由于多數(shù)方法中路徑拐點(diǎn)較多且只能夠沿著四個(gè)方向運(yùn)動(dòng),極大程度的限制的路徑的平滑程度并且給機(jī)器人的導(dǎo)航控制帶來了巨大挑戰(zhàn)。針對(duì)以上問題,本文在柵格地圖的基礎(chǔ)之上,將四個(gè)方向增加至八個(gè)方向,能夠進(jìn)一步平滑路徑且獲取距離更短的路徑,并進(jìn)行了一下研究:首先,在諸多強(qiáng)化學(xué)習(xí)方法中,以時(shí)間差分方法中的異策略的Q-learning方法為基礎(chǔ),以柵格為狀態(tài)集,八個(gè)動(dòng)作為動(dòng)作集,不需要環(huán)境模型,依靠自身與環(huán)境交互即可完成路徑規(guī)劃任務(wù)。其次,由于Q-learning產(chǎn)生動(dòng)作的策略與評(píng)估的策略不同,可以利用其它經(jīng)驗(yàn)幫助自身學(xué)習(xí),因此,引入譜圖理論和流形學(xué)習(xí)的思想,借此獲取能夠清晰反應(yīng)起點(diǎn)到終點(diǎn)距離關(guān)系的先驗(yàn)知識(shí),與Q-learning方法融合共同指導(dǎo)智能體尋找最優(yōu)路徑。再次,引入Dyna框架,智能體通過與環(huán)境交互獲取實(shí)際經(jīng)驗(yàn),一方面,這些數(shù)據(jù)會(huì)被直接強(qiáng)化... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:73 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于強(qiáng)化學(xué)習(xí)的四旋翼無人機(jī)路徑規(guī)劃方法研究


Theta*與A*的對(duì)比

示意圖,路徑規(guī)劃,示意圖,路徑規(guī)劃算法


器人完成搜救、測繪和編隊(duì)等任務(wù)的前實(shí)踐的鴻溝,在實(shí)際生產(chǎn)生活應(yīng)用中最搜索方法的設(shè)計(jì),路徑規(guī)劃算法[30]自傳統(tǒng)路徑規(guī)劃算法多是基于圖和歐氏距中動(dòng)物的行為漸漸發(fā)展出仿生學(xué)方法,和廣泛應(yīng)用,智能路徑規(guī)劃方法亦有長題描述路徑規(guī)劃技術(shù),就是根據(jù)機(jī)器人自身?xiàng)l安全可靠的運(yùn)動(dòng)路徑,躲避障礙物2-1 。路徑規(guī)劃所要解決的問題,簡而被控對(duì)象)能從起點(diǎn)運(yùn)動(dòng)到目的地。(2)一定的方法保證機(jī)器人能夠躲避障礙物規(guī)劃出簡單優(yōu)化平滑的路徑。

示意圖,方法,示意圖,引力場


圖 2-2 Dijkstra 方法搜索示意圖了由機(jī)器人自身體積引發(fā)的節(jié)點(diǎn)限制,與 Dijkstra 算法相同的環(huán)境中,搜索原理圖 2-3 A* 算法搜索示意圖場法源于物理學(xué)中“場”的概念,將機(jī)器人抽象的人工的引力場中的運(yùn)動(dòng),目標(biāo)個(gè)引力場,而障礙物對(duì)機(jī)器人會(huì)產(chǎn)生“斥的疊加,求解出這兩種力的合力得出機(jī)

【參考文獻(xiàn)】:
期刊論文
[1]路徑規(guī)劃算法及其應(yīng)用綜述[J]. 張廣林,胡小梅,柴劍飛,趙磊,俞濤.  現(xiàn)代機(jī)械. 2011(05)
[2]蟻群算法研究綜述[J]. 于艷艷.  科技廣場. 2009(01)
[3]基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)在避障中的應(yīng)用[J]. 喬俊飛,侯占軍,阮曉鋼.  清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(S2)
[4]基于偏向信息學(xué)習(xí)的雙層強(qiáng)化學(xué)習(xí)算法[J]. 林芬,石川,羅杰文,史忠植.  計(jì)算機(jī)研究與發(fā)展. 2008(09)
[5]基于神經(jīng)網(wǎng)絡(luò)和粒子群算法的移動(dòng)機(jī)器人路徑規(guī)劃[J]. 姜明洋,胡玉蘭.  沈陽理工大學(xué)學(xué)報(bào). 2007(06)
[6]一種在線自學(xué)習(xí)的移動(dòng)機(jī)器人模糊導(dǎo)航方法[J]. 赫東鋒,孫樹棟.  西安工業(yè)大學(xué)學(xué)報(bào). 2007(04)
[7]戰(zhàn)術(shù)飛行路徑規(guī)劃算法[J]. 張永芳,張安,張志禹,張九龍.  交通運(yùn)輸工程學(xué)報(bào). 2006(04)
[8]基于模糊邏輯的機(jī)器人路徑規(guī)劃[J]. 畢盛,朱金輝,閔華清,鐘漢如.  機(jī)電產(chǎn)品開發(fā)與創(chuàng)新. 2006(01)
[9]基于柵格法的機(jī)器人快速路徑規(guī)劃[J]. 于紅斌,李孝安.  微電子學(xué)與計(jì)算機(jī). 2005(06)
[10]飛行器航跡規(guī)劃算法綜述[J]. 杜萍,楊春.  飛行力學(xué). 2005(02)

博士論文
[1]基于譜圖理論的強(qiáng)化學(xué)習(xí)研究[D]. 朱美強(qiáng).中國礦業(yè)大學(xué) 2012
[2]基于勢場法和遺傳算法的機(jī)器人路徑規(guī)劃技術(shù)研究[D]. 劉傳領(lǐng).南京理工大學(xué) 2012
[3]流形學(xué)習(xí)算法及其應(yīng)用研究[D]. 雷迎科.中國科學(xué)技術(shù)大學(xué) 2011
[4]加速強(qiáng)化學(xué)習(xí)方法研究[D]. 金釗.云南大學(xué) 2010
[5]流形學(xué)習(xí)的譜方法相關(guān)問題研究[D]. 曾憲華.北京交通大學(xué) 2009
[6]強(qiáng)化學(xué)習(xí)方法及其應(yīng)用研究[D]. 黃炳強(qiáng).上海交通大學(xué) 2007
[7]基于強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人自主學(xué)習(xí)及導(dǎo)航控制[D]. 陳春林.中國科學(xué)技術(shù)大學(xué) 2006
[8]增強(qiáng)學(xué)習(xí)及其在移動(dòng)機(jī)器人導(dǎo)航與控制中的應(yīng)用研究[D]. 徐昕.國防科學(xué)技術(shù)大學(xué) 2002

碩士論文
[1]基于強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人路徑規(guī)劃研究[D]. 許亞.山東大學(xué) 2013
[2]有關(guān)強(qiáng)化學(xué)習(xí)的若干問題研究[D]. 趙昀.南京理工大學(xué) 2009
[3]基于量子粒子群算法的移動(dòng)機(jī)器人的路徑規(guī)劃的研究[D]. 王坤.江南大學(xué) 2009
[4]基于蟻群算法的路徑規(guī)劃研究[D]. 董金明.陜西師范大學(xué) 2009
[5]基于蟻群算法的機(jī)器人路徑規(guī)劃及其仿真系統(tǒng)研究[D]. 王濤.西安科技大學(xué) 2009
[6]復(fù)雜動(dòng)態(tài)環(huán)境下移動(dòng)機(jī)器人的全局路徑規(guī)劃算法研究[D]. 徐培培.北京郵電大學(xué) 2009



本文編號(hào):3062852

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/hangkongsky/3062852.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ebbf6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com