對(duì)抗場景中的意圖理解與決策設(shè)計(jì)方法研究

發(fā)布時(shí)間：2022-08-23 22:22

　　在對(duì)抗場景下,機(jī)器人自主理解敵方意圖,并根據(jù)理解到的意圖進(jìn)行決策是實(shí)現(xiàn)機(jī)器人自主控制的核心技術(shù)。ICRA RoboMaster人工智能挑戰(zhàn)賽是首次將人工智能與機(jī)器人結(jié)合起來的嘗試,對(duì)未來機(jī)器人智能化有著重要的意義。本文以ICRA RoboMaster人工智能挑戰(zhàn)賽為背景,對(duì)對(duì)抗場景下的敵方機(jī)器人意圖理解和我方機(jī)器人決策算法設(shè)計(jì)進(jìn)行研究。論文的主要工作如下:首先,給出坐標(biāo)系的定義及坐標(biāo)系間轉(zhuǎn)換關(guān)系,建立輪式機(jī)器人的運(yùn)動(dòng)學(xué)模型,給出意圖理解和決策問題的數(shù)學(xué)描述。其次,基于數(shù)據(jù)驅(qū)動(dòng)的方法構(gòu)建了意圖理解問題框架,使用仿真環(huán)境和實(shí)驗(yàn)環(huán)境中采集到的數(shù)據(jù)進(jìn)行了層次化數(shù)據(jù)集構(gòu)建。再次,提出了基于熱度地圖的敵方意圖抽象;設(shè)計(jì)了基于長短時(shí)記憶和基于序列相似性分析的兩種意圖理解算法,仿真結(jié)果說明了意圖理解算法的有效性。然后,提出了基于意圖理解的分層有限狀態(tài)機(jī)和強(qiáng)化學(xué)習(xí)兩種決策算法,仿真結(jié)果說明了算法的有效性和穩(wěn)定性。最后,搭建了RoboMaster AI實(shí)驗(yàn)平臺(tái),設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證了所提出的意圖理解算法和決策算法的有效性,并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了分析。

【文章頁數(shù)】：86 頁

【學(xué)位級(jí)別】：碩士

【文章目錄】：
摘要
ABSTRACT
第1章緒論
    1.1 課題研究背景與意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 意圖理解
        1.2.2 決策方法
        1.2.3 目前研究存在的問題
    1.3 論文主要內(nèi)容及章節(jié)安排
第2章對(duì)抗場景下意圖理解與決策問題描述
    2.1 引言
    2.2 坐標(biāo)系定義及轉(zhuǎn)換關(guān)系
    2.3 機(jī)器人運(yùn)動(dòng)學(xué)建模
    2.4 問題描述
        2.4.1 問題分析
        2.4.2 意圖理解問題描述
        2.4.3 決策問題描述
    2.5 本章小結(jié)
第3章對(duì)抗場景數(shù)據(jù)集構(gòu)建
    3.1 引言
    3.2 仿真生成數(shù)據(jù)
    3.3 實(shí)驗(yàn)采集數(shù)據(jù)
    3.4 數(shù)據(jù)集構(gòu)建
    3.5 本章小結(jié)
第4章敵方意圖理解算法設(shè)計(jì)
    4.1 引言
    4.2 基于熱度地圖的意圖抽象
    4.3 基于長短時(shí)記憶的意圖理解算法設(shè)計(jì)
        4.3.1 長短時(shí)記憶網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
        4.3.2 網(wǎng)絡(luò)訓(xùn)練結(jié)果
    4.4 基于序列相似性分析的意圖理解算法設(shè)計(jì)
        4.4.1 算法設(shè)計(jì)
        4.4.2 分類效果
    4.5 仿真結(jié)果及分析
    4.6 本章小結(jié)
第5章對(duì)抗場景下的決策算法設(shè)計(jì)
    5.1 引言
    5.2 基于意圖理解的分層有限狀態(tài)機(jī)算法設(shè)計(jì)
        5.2.1 分層有限狀態(tài)機(jī)算法描述
        5.2.2 單機(jī)器人狀態(tài)機(jī)設(shè)計(jì)
        5.2.3 雙機(jī)器人狀態(tài)機(jī)設(shè)計(jì)
    5.3 基于意圖理解的強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)
        5.3.1 單機(jī)器人強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)
        5.3.2 雙機(jī)器人強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)
    5.4 仿真結(jié)果及分析
        5.4.1 仿真環(huán)境設(shè)置
        5.4.2 分層有限狀態(tài)機(jī)算法仿真結(jié)果及分析
        5.4.3 強(qiáng)化學(xué)習(xí)算法仿真結(jié)果及分析
    5.5 本章小結(jié)
第6章算法實(shí)現(xiàn)與實(shí)驗(yàn)驗(yàn)證
    6.1 引言
    6.2 RoboMaster AI實(shí)驗(yàn)平臺(tái)搭建
        6.2.1 實(shí)驗(yàn)平臺(tái)硬件實(shí)現(xiàn)
        6.2.2 實(shí)驗(yàn)平臺(tái)軟件實(shí)現(xiàn)
    6.3 意圖理解實(shí)驗(yàn)與結(jié)果分析
    6.4 決策算法實(shí)驗(yàn)與結(jié)果分析
        6.4.1 決策程序各子功能運(yùn)行測(cè)試
        6.4.2 與測(cè)試算法對(duì)抗實(shí)驗(yàn)結(jié)果與分析
        6.4.3 與有人操縱機(jī)器人對(duì)抗實(shí)驗(yàn)結(jié)果與分析
    6.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其他成果
致謝

【參考文獻(xiàn)】：
期刊論文
[1]多智能體分層協(xié)作規(guī)劃及在RoboCup中的應(yīng)用[J]. 陳榮亞,陳小平.  計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(01)
[2]基于MMDP的無人作戰(zhàn)飛機(jī)任務(wù)分配模型研究[J]. 李月娟,呂永健,常遷臻,朱李云.  計(jì)算機(jī)應(yīng)用與軟件. 2013(07)
[3]交互式動(dòng)態(tài)影響圖的一種近似求解算法[J]. 李波,羅鍵,莊進(jìn)發(fā),尹華一.  華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2011(10)
[4]基于概率推理的入侵意圖識(shí)別研究[J]. 彭武,姚淑萍.  計(jì)算機(jī)科學(xué). 2010(01)
[5]基于博弈論模型的多機(jī)協(xié)同對(duì)抗多目標(biāo)任務(wù)決策方法[J]. 姚宗信,李明,陳宗基.  航空計(jì)算技術(shù). 2007(03)

本文編號(hào)：3678590

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3678590.html

上一篇：基于數(shù)據(jù)分析的網(wǎng)絡(luò)故障診斷算法研究
下一篇：多機(jī)器人區(qū)域覆蓋路徑規(guī)劃技術(shù)研究與實(shí)現(xiàn)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

對(duì)抗場景中的意圖理解與決策設(shè)計(jì)方法研究