天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于深度強化學(xué)習(xí)的端到端自動駕駛技術(shù)研究

發(fā)布時間:2021-06-07 22:34
  自動駕駛的任務(wù)是車輛通過各種傳感器感知道路環(huán)境,在沒有人為進行干預(yù)的情況下,實時地改變駕駛的行為,包括轉(zhuǎn)向、加速和制動等。實現(xiàn)自動駕駛可以使交通事故的發(fā)生減少,道路交通資源得到更合理的利用,因此研究自動駕駛技術(shù)具有非常重要的意義。由于端到端的自動駕駛不需要人為指定規(guī)則,而直接學(xué)習(xí)駕駛動作,所以端到端方法的研究是自動駕駛領(lǐng)域的重要研究方向之一。深度強化學(xué)習(xí)方法通過和環(huán)境交互學(xué)習(xí)策略與人類學(xué)習(xí)駕駛的方式相似,被廣泛用于端到端駕駛?cè)蝿?wù)中。本文利用深度強化學(xué)習(xí)算法,對虛擬環(huán)境下車輛的自動駕駛進行研究。該算法是基于深度確定性策略梯度算法的改進,針對訓(xùn)練樣本利用率低的問題,將優(yōu)先經(jīng)驗回放方法與深度確定性策略梯度算法相結(jié)合,從仿真環(huán)境中獲取原始的傳感器輸入,模型輸出連續(xù)的加速、轉(zhuǎn)向、制動行為,并將訓(xùn)練數(shù)據(jù)存入緩沖區(qū)中,通過優(yōu)先經(jīng)驗回放的高效采樣方法,實現(xiàn)訓(xùn)練速度的加快。由于深度強化學(xué)習(xí)需要車輛與環(huán)境進行多次交互,訓(xùn)練過程中會出現(xiàn)錯誤的駕駛行為,在現(xiàn)實中訓(xùn)練自動駕駛會對車輛和周圍環(huán)境造成不可估量的損害,所以本實驗是在仿真平臺的虛擬環(huán)境中實現(xiàn)的,然而端到端駕駛的最終目標是使真實車輛在現(xiàn)實環(huán)境中自主做出駕... 

【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院大學(xué)人工智能學(xué)院)北京市

【文章頁數(shù)】:80 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于深度強化學(xué)習(xí)的端到端自動駕駛技術(shù)研究


圖1.1深度Q網(wǎng)絡(luò)基本結(jié)構(gòu)i5l??

模型圖,模型,圍棋,算法


?基于深度強化學(xué)習(xí)的端到端自動駕駛技術(shù)研究???Global?Network??r'—一邊??'?^??_(s)??z?/?\?、???戀麵麵?SI??r.:l?;:.:;:l?它?I?…?::l??Worker?1?Worker?2?Worker?3?Wort?rn??I?t?t?f??Enwroomern?1?Envifoomaw?2?Env*t>om〇nt3?...?£nv*〇wneMn??圖1.2A3C模型??Figure?1.2?The?model?of?A3C??2014?年,Sliver?提出了確定性策略搜索(Deterministic?Policy?Gradient,?DPG)??算法111],采用確定性的動作代替隨機動作的選擇。2016年,Lillicrap等在此基礎(chǔ)??上提出了深度確定性策略梯度(Deep?Deterministic?Policy?Gradient,?DDPG)算法??[12】。DDPG算法整體上采用的是Actor-Critic框架,Critic部分應(yīng)用DQN算法,??采用隨機采樣和單獨的目標網(wǎng)絡(luò)方法,減少樣本數(shù)據(jù)之間的關(guān)聯(lián)性,并利用基于??DPG的Actor-Critic算法處理連續(xù)動作空間。2016年,Silver等[13]將深度強化學(xué)??習(xí)算法應(yīng)用到圍棋游戲中,利用蒙特卡洛樹搜索算法訓(xùn)練智能圍棋“Alpha?Go”,??并與圍棋冠軍李世石對賽,取得了四比一的勝利。這一事件代表了人工智能技術(shù)??應(yīng)用的潛力,深度強化學(xué)習(xí)取得了學(xué)術(shù)領(lǐng)域和工程領(lǐng)域等專家的關(guān)注。??近兩年,國內(nèi)外研宄人員嘗試將深度強化學(xué)習(xí)應(yīng)用到各個領(lǐng)域,在無人機、??物流機器人、機器

基于深度強化學(xué)習(xí)的端到端自動駕駛技術(shù)研究


圖1.3混合CNN-RNN的結(jié)構(gòu)丨17丨??

【參考文獻】:
期刊論文
[1]域自適應(yīng)學(xué)習(xí)研究進展[J]. 劉建偉,孫正康,羅雄麟.  自動化學(xué)報. 2014(08)



本文編號:3217438

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3217438.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶28a01***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com