天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于生成模型的世界模型建立與智能決策算法研究

發(fā)布時間:2022-02-19 22:07
  智能決策一直是機器人的關(guān)鍵技術(shù)之一。當前機器人技術(shù)的應用正面臨著從面向結(jié)構(gòu)化的工廠環(huán)境和任務轉(zhuǎn)換到面向如家庭室內(nèi)、辦公樓、馬路、野外等復雜日常生活環(huán)境及多變?nèi)蝿盏目简?對機器人的智能化程度提出了更高的要求。現(xiàn)有的智能算法開發(fā)模式依賴于研究人員對環(huán)境及機體的提前建模,對于新的環(huán)境和機體往往需要重新建模,因此不具有通用性,開發(fā)成本巨大,無法適應未來行業(yè)中對于智能的大量需求。本課題旨在以智能決策算法的通用性為目標,探索智能決策問題的一般化描述方法與解決方案。首先,基于強化學習中常用的POMDP過程建立智能決策問題的通用數(shù)學描述,并通過對其進行分析,將智能決策算法等價于信息的提取與利用。利用信息論對環(huán)境中信息的分布方式進行分析,最終基于世界模型概念得出解決智能決策問題的一般性框架,將世界模型按照提取的信息類型不同拆分為感知抽象和狀態(tài)預測兩個過程。并基于Mo Jo Co仿真平臺,選取了5種典型的視覺控制任務作為本文的驗證平臺。其次,推導感知抽象過程與生成模型之間的關(guān)系,利用POMDP過程中的內(nèi)部約束,將感知抽象過程轉(zhuǎn)化為生成問題,并基于變分自編碼器對感知抽象過程進行了實現(xiàn)。從理論角度對優(yōu)化目標中... 

【文章來源】:哈爾濱工業(yè)大學黑龍江省211工程院校985工程院校

【文章頁數(shù)】:76 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 課題來源及研究的背景和意義
    1.2 國內(nèi)外研究現(xiàn)狀及分析
        1.2.1 強化學習研究現(xiàn)狀
        1.2.2 表征學習研究現(xiàn)狀
        1.2.3 研究現(xiàn)狀分析
    1.3 本文研究內(nèi)容
第2章 基于POMDP與信息論的智能決策問題描述方法
    2.1 引言
    2.2 智能決策問題的一般化描述方法
    2.3 信息的存在形式
        2.3.1 信息的度量方式
        2.3.2 信息在觀測信號中的分布
    2.4 基于世界模型的智能決策算法框架
    2.5 基于MoJoCo仿真環(huán)境的任務簡介
    2.6 本章小結(jié)
第3章 基于生成模型與變分自編碼器的感知抽象算法研究
    3.1 引言
    3.2 感知抽象過程的生成模型式描述
    3.3 基于變分自編碼器的感知抽象模型
    3.4 靜態(tài)表征中的信息約束分析
    3.5 實驗及結(jié)果分析
        3.5.1 模型及默認參數(shù)設置
        3.5.2 感知抽象信息提取驗證實驗
    3.6 本章小結(jié)
第4章 基于生成模型與循環(huán)神經(jīng)網(wǎng)絡的狀態(tài)預測算法研究
    4.1 引言
    4.2 狀態(tài)預測過程的生成模型式描述
    4.3 基于循環(huán)神經(jīng)網(wǎng)絡的狀態(tài)預測模型
    4.4 實驗及結(jié)果分析
        4.4.1 模型及默認參數(shù)設置
        4.4.2 狀態(tài)預測模型的信息提取及預測能力實驗
    4.5 本章小結(jié)
第5章 基于演員-評論家框架的智能決策算法與實驗研究
    5.1 引言
    5.2 演員-評論家框架簡介
    5.3 基于世界模型的演員-評論家控制器
    5.4 實驗及結(jié)果分析
        5.4.1 模型及默認參數(shù)設置
        5.4.2 算法在線學習驗證實驗
        5.4.3 離線學習探索實驗
    5.5 本章小結(jié)
結(jié)論
參考文獻
致謝



本文編號:3633704

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3633704.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a7b1a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com