基于深度強化學(xué)習(xí)的第一人稱射擊游戲研究
發(fā)布時間:2022-01-04 00:16
深度強化學(xué)習(xí)結(jié)合了深度學(xué)習(xí)和強化學(xué)習(xí)的優(yōu)勢,近來在游戲、機器人、自動駕駛、推薦系統(tǒng)等多個領(lǐng)域有了巨大突破。其中,游戲領(lǐng)域具有簡單快捷的數(shù)據(jù)采樣優(yōu)勢,極大地方便了深度強化學(xué)習(xí)的研究。雖然深度強化學(xué)習(xí)在Atari 2600游戲和棋類游戲中展現(xiàn)了超越人類的得分能力,但是在第一人稱射擊(First-person Shooting,FPS)游戲等復(fù)雜任務(wù)中仍然面臨重要挑戰(zhàn);赩iZDoom平臺,本文分析了FPS游戲的特點,有針對性地提出了智能體分解方案,并且采用了多任務(wù)學(xué)習(xí)方法。主要研究內(nèi)容如下:(1)FPS游戲通常面臨著復(fù)雜的離散動作空間,多樣的任務(wù)挑戰(zhàn)和難以分配的游戲獎勵,本文提出智能體分解方案來解決這些問題。智能體分解是將一個智能體從動作空間、任務(wù)類型和獎勵分配三個層面進行分解,以此來應(yīng)對更復(fù)雜的任務(wù)挑戰(zhàn)。其一,本文提出語義動作空間分解方法,按照動作的組合規(guī)律和實際意義將原始動作空間分解成若干個動作子空間,每個動作子空間對應(yīng)了一個Q網(wǎng)絡(luò)分支,降低了原始動作空間的復(fù)雜程度。其二,本文提出任務(wù)分解方法,將復(fù)合任務(wù)分解為導(dǎo)航和進攻兩個子任務(wù),每個子任務(wù)包括若干個相關(guān)的Q網(wǎng)絡(luò)分支,降低了復(fù)合任務(wù)...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
第一人稱視角和第三人稱視角游戲的對比
ViZDoom中的不同場景
學(xué)習(xí)率對實驗結(jié)果的影響
本文編號:3567262
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
第一人稱視角和第三人稱視角游戲的對比
ViZDoom中的不同場景
學(xué)習(xí)率對實驗結(jié)果的影響
本文編號:3567262
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3567262.html
最近更新
教材專著