對(duì)抗場景中的意圖理解與決策設(shè)計(jì)方法研究
發(fā)布時(shí)間:2022-08-23 22:22
在對(duì)抗場景下,機(jī)器人自主理解敵方意圖,并根據(jù)理解到的意圖進(jìn)行決策是實(shí)現(xiàn)機(jī)器人自主控制的核心技術(shù)。ICRA RoboMaster人工智能挑戰(zhàn)賽是首次將人工智能與機(jī)器人結(jié)合起來的嘗試,對(duì)未來機(jī)器人智能化有著重要的意義。本文以ICRA RoboMaster人工智能挑戰(zhàn)賽為背景,對(duì)對(duì)抗場景下的敵方機(jī)器人意圖理解和我方機(jī)器人決策算法設(shè)計(jì)進(jìn)行研究。論文的主要工作如下:首先,給出坐標(biāo)系的定義及坐標(biāo)系間轉(zhuǎn)換關(guān)系,建立輪式機(jī)器人的運(yùn)動(dòng)學(xué)模型,給出意圖理解和決策問題的數(shù)學(xué)描述。其次,基于數(shù)據(jù)驅(qū)動(dòng)的方法構(gòu)建了意圖理解問題框架,使用仿真環(huán)境和實(shí)驗(yàn)環(huán)境中采集到的數(shù)據(jù)進(jìn)行了層次化數(shù)據(jù)集構(gòu)建。再次,提出了基于熱度地圖的敵方意圖抽象;設(shè)計(jì)了基于長短時(shí)記憶和基于序列相似性分析的兩種意圖理解算法,仿真結(jié)果說明了意圖理解算法的有效性。然后,提出了基于意圖理解的分層有限狀態(tài)機(jī)和強(qiáng)化學(xué)習(xí)兩種決策算法,仿真結(jié)果說明了算法的有效性和穩(wěn)定性。最后,搭建了RoboMaster AI實(shí)驗(yàn)平臺(tái),設(shè)計(jì)實(shí)驗(yàn)驗(yàn)證了所提出的意圖理解算法和決策算法的有效性,并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了分析。
【文章頁數(shù)】:86 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 意圖理解
1.2.2 決策方法
1.2.3 目前研究存在的問題
1.3 論文主要內(nèi)容及章節(jié)安排
第2章 對(duì)抗場景下意圖理解與決策問題描述
2.1 引言
2.2 坐標(biāo)系定義及轉(zhuǎn)換關(guān)系
2.3 機(jī)器人運(yùn)動(dòng)學(xué)建模
2.4 問題描述
2.4.1 問題分析
2.4.2 意圖理解問題描述
2.4.3 決策問題描述
2.5 本章小結(jié)
第3章 對(duì)抗場景數(shù)據(jù)集構(gòu)建
3.1 引言
3.2 仿真生成數(shù)據(jù)
3.3 實(shí)驗(yàn)采集數(shù)據(jù)
3.4 數(shù)據(jù)集構(gòu)建
3.5 本章小結(jié)
第4章 敵方意圖理解算法設(shè)計(jì)
4.1 引言
4.2 基于熱度地圖的意圖抽象
4.3 基于長短時(shí)記憶的意圖理解算法設(shè)計(jì)
4.3.1 長短時(shí)記憶網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
4.3.2 網(wǎng)絡(luò)訓(xùn)練結(jié)果
4.4 基于序列相似性分析的意圖理解算法設(shè)計(jì)
4.4.1 算法設(shè)計(jì)
4.4.2 分類效果
4.5 仿真結(jié)果及分析
4.6 本章小結(jié)
第5章 對(duì)抗場景下的決策算法設(shè)計(jì)
5.1 引言
5.2 基于意圖理解的分層有限狀態(tài)機(jī)算法設(shè)計(jì)
5.2.1 分層有限狀態(tài)機(jī)算法描述
5.2.2 單機(jī)器人狀態(tài)機(jī)設(shè)計(jì)
5.2.3 雙機(jī)器人狀態(tài)機(jī)設(shè)計(jì)
5.3 基于意圖理解的強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)
5.3.1 單機(jī)器人強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)
5.3.2 雙機(jī)器人強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)
5.4 仿真結(jié)果及分析
5.4.1 仿真環(huán)境設(shè)置
5.4.2 分層有限狀態(tài)機(jī)算法仿真結(jié)果及分析
5.4.3 強(qiáng)化學(xué)習(xí)算法仿真結(jié)果及分析
5.5 本章小結(jié)
第6章 算法實(shí)現(xiàn)與實(shí)驗(yàn)驗(yàn)證
6.1 引言
6.2 RoboMaster AI實(shí)驗(yàn)平臺(tái)搭建
6.2.1 實(shí)驗(yàn)平臺(tái)硬件實(shí)現(xiàn)
6.2.2 實(shí)驗(yàn)平臺(tái)軟件實(shí)現(xiàn)
6.3 意圖理解實(shí)驗(yàn)與結(jié)果分析
6.4 決策算法實(shí)驗(yàn)與結(jié)果分析
6.4.1 決策程序各子功能運(yùn)行測(cè)試
6.4.2 與測(cè)試算法對(duì)抗實(shí)驗(yàn)結(jié)果與分析
6.4.3 與有人操縱機(jī)器人對(duì)抗實(shí)驗(yàn)結(jié)果與分析
6.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其他成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]多智能體分層協(xié)作規(guī)劃及在RoboCup中的應(yīng)用[J]. 陳榮亞,陳小平. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(01)
[2]基于MMDP的無人作戰(zhàn)飛機(jī)任務(wù)分配模型研究[J]. 李月娟,呂永健,常遷臻,朱李云. 計(jì)算機(jī)應(yīng)用與軟件. 2013(07)
[3]交互式動(dòng)態(tài)影響圖的一種近似求解算法[J]. 李波,羅鍵,莊進(jìn)發(fā),尹華一. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2011(10)
[4]基于概率推理的入侵意圖識(shí)別研究[J]. 彭武,姚淑萍. 計(jì)算機(jī)科學(xué). 2010(01)
[5]基于博弈論模型的多機(jī)協(xié)同對(duì)抗多目標(biāo)任務(wù)決策方法[J]. 姚宗信,李明,陳宗基. 航空計(jì)算技術(shù). 2007(03)
本文編號(hào):3678590
【文章頁數(shù)】:86 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 意圖理解
1.2.2 決策方法
1.2.3 目前研究存在的問題
1.3 論文主要內(nèi)容及章節(jié)安排
第2章 對(duì)抗場景下意圖理解與決策問題描述
2.1 引言
2.2 坐標(biāo)系定義及轉(zhuǎn)換關(guān)系
2.3 機(jī)器人運(yùn)動(dòng)學(xué)建模
2.4 問題描述
2.4.1 問題分析
2.4.2 意圖理解問題描述
2.4.3 決策問題描述
2.5 本章小結(jié)
第3章 對(duì)抗場景數(shù)據(jù)集構(gòu)建
3.1 引言
3.2 仿真生成數(shù)據(jù)
3.3 實(shí)驗(yàn)采集數(shù)據(jù)
3.4 數(shù)據(jù)集構(gòu)建
3.5 本章小結(jié)
第4章 敵方意圖理解算法設(shè)計(jì)
4.1 引言
4.2 基于熱度地圖的意圖抽象
4.3 基于長短時(shí)記憶的意圖理解算法設(shè)計(jì)
4.3.1 長短時(shí)記憶網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
4.3.2 網(wǎng)絡(luò)訓(xùn)練結(jié)果
4.4 基于序列相似性分析的意圖理解算法設(shè)計(jì)
4.4.1 算法設(shè)計(jì)
4.4.2 分類效果
4.5 仿真結(jié)果及分析
4.6 本章小結(jié)
第5章 對(duì)抗場景下的決策算法設(shè)計(jì)
5.1 引言
5.2 基于意圖理解的分層有限狀態(tài)機(jī)算法設(shè)計(jì)
5.2.1 分層有限狀態(tài)機(jī)算法描述
5.2.2 單機(jī)器人狀態(tài)機(jī)設(shè)計(jì)
5.2.3 雙機(jī)器人狀態(tài)機(jī)設(shè)計(jì)
5.3 基于意圖理解的強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)
5.3.1 單機(jī)器人強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)
5.3.2 雙機(jī)器人強(qiáng)化學(xué)習(xí)算法設(shè)計(jì)
5.4 仿真結(jié)果及分析
5.4.1 仿真環(huán)境設(shè)置
5.4.2 分層有限狀態(tài)機(jī)算法仿真結(jié)果及分析
5.4.3 強(qiáng)化學(xué)習(xí)算法仿真結(jié)果及分析
5.5 本章小結(jié)
第6章 算法實(shí)現(xiàn)與實(shí)驗(yàn)驗(yàn)證
6.1 引言
6.2 RoboMaster AI實(shí)驗(yàn)平臺(tái)搭建
6.2.1 實(shí)驗(yàn)平臺(tái)硬件實(shí)現(xiàn)
6.2.2 實(shí)驗(yàn)平臺(tái)軟件實(shí)現(xiàn)
6.3 意圖理解實(shí)驗(yàn)與結(jié)果分析
6.4 決策算法實(shí)驗(yàn)與結(jié)果分析
6.4.1 決策程序各子功能運(yùn)行測(cè)試
6.4.2 與測(cè)試算法對(duì)抗實(shí)驗(yàn)結(jié)果與分析
6.4.3 與有人操縱機(jī)器人對(duì)抗實(shí)驗(yàn)結(jié)果與分析
6.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其他成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]多智能體分層協(xié)作規(guī)劃及在RoboCup中的應(yīng)用[J]. 陳榮亞,陳小平. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(01)
[2]基于MMDP的無人作戰(zhàn)飛機(jī)任務(wù)分配模型研究[J]. 李月娟,呂永健,常遷臻,朱李云. 計(jì)算機(jī)應(yīng)用與軟件. 2013(07)
[3]交互式動(dòng)態(tài)影響圖的一種近似求解算法[J]. 李波,羅鍵,莊進(jìn)發(fā),尹華一. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2011(10)
[4]基于概率推理的入侵意圖識(shí)別研究[J]. 彭武,姚淑萍. 計(jì)算機(jī)科學(xué). 2010(01)
[5]基于博弈論模型的多機(jī)協(xié)同對(duì)抗多目標(biāo)任務(wù)決策方法[J]. 姚宗信,李明,陳宗基. 航空計(jì)算技術(shù). 2007(03)
本文編號(hào):3678590
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3678590.html
最近更新
教材專著