基于自適應動態(tài)規(guī)劃的分布式控制研究及應用
發(fā)布時間:2023-04-22 06:16
近幾年來,鑒于社會對復雜系統(tǒng)經濟調度、資源分配、網絡布局等優(yōu)化問題的迫切需求,分布式最優(yōu)控制已經成為控制科學領域中的一個研究熱點。分布式最優(yōu)控制問題需要對Hamilton-Jacobi-Bellman(HJB)方程進行求解,由此帶來“維數災難”問題。自適應動態(tài)規(guī)劃(Adaptive Dynamic Programming,ADP)融合了動態(tài)規(guī)劃、增強學習、神經網絡、自適應控制、最優(yōu)控制等理論和方法,是解決“維數災難”問題的有效方法之一。因此,本文利用ADP方法研究多智能體系統(tǒng)的跟蹤控制問題、包含控制問題、反同步控制問題以及下肢助行外骨骼機器人的人機協(xié)同控制問題。針對這些控制問題,我們提出了模型未知情況下的分布式控制器設計方法,并且對傳統(tǒng)的ADP算法和神經網絡結構進行了有效改進,提高了多智能體系統(tǒng)的分布式控制性能。本文的主要研究結果如下:1.研究了離散時間多智能體系統(tǒng)的最優(yōu)跟蹤控制問題。提出了一種新的ADP算法,即兩階段策略迭代算法來計算迭代控制律和迭代性能指標函數。與經典的策略迭代ADP算法相比,該算法包含一個子迭代過程來計算策略評估過程的迭代性能指標函數。其次,給出了迭代性能指標函數...
【文章頁數】:133 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 國內外研究發(fā)展與現狀
1.2.1 自適應動態(tài)規(guī)劃
1.2.1.1 傳統(tǒng)的自適應動態(tài)規(guī)劃
1.2.1.2 無模型的增強學習
1.2.2 基于ADP的多智能體系統(tǒng)控制
1.3 本文的主要研究內容及組織結構
第二章 自適應動態(tài)規(guī)劃的理論基礎
2.1 動態(tài)規(guī)劃的基本原理
2.1.1 離散時間系統(tǒng)的動態(tài)規(guī)劃
2.1.2 連續(xù)時間系統(tǒng)的動態(tài)規(guī)劃
2.2 自適應動態(tài)規(guī)劃的基本框架
2.3 近似迭代算法原理
2.3.1 值迭代算法
2.3.2 策略迭代算法
2.4 本章小結
第三章 基于數據驅動的多智能體系統(tǒng)最優(yōu)跟蹤控制
3.1 引言
3.2 最優(yōu)跟蹤控制問題建模
3.3 分布式最優(yōu)控制設計
3.3.1 離散Hamilton-Jacobi-Bellman方程
3.3.2 兩階段策略迭代算法
3.3.3 算法性能及控制系統(tǒng)穩(wěn)定性分析
3.4 基于神經網絡的在線學習實現方法
3.4.1 Critic網絡設計
3.4.2 Actor網絡設計
3.5 數值仿真分析
3.6 本章小結
第四章 基于自適應動態(tài)規(guī)劃的多智能體系統(tǒng)包含控制
4.1 引言
4.2 離散時間系統(tǒng)的包含控制問題
4.2.1 最優(yōu)包含控制問題建模
4.2.2 分布式最優(yōu)控制設計與分析
4.2.3 執(zhí)行-評價神經網絡的控制實現
4.2.4 數值仿真分析
4.3 帶有擾動的連續(xù)時間系統(tǒng)的包含控制問題
4.3.1 分布式最優(yōu)包含控制設計
4.3.2 穩(wěn)定性分析
4.3.3 最優(yōu)控制的在線學習
4.3.4 數值仿真分析
4.4 本章小結
第五章 合作-競爭網絡下多智能體系統(tǒng)的最優(yōu)輸出反同步控制
5.1 引言
5.2 最優(yōu)輸出反同步控制問題建模
5.3 基于輸入-輸出數據的多智能體系統(tǒng)模型重構
5.4 基于可測數據的分布式最優(yōu)控制設計
5.4.1 基于可測數據的值迭代算法
5.4.2 系統(tǒng)穩(wěn)定性分析
5.4.3 算法收斂性分析
5.5 增量式執(zhí)行-評價網絡在線求解方法
5.5.1 增量式Critic網絡設計
5.5.2 增量式Actor網絡設計
5.5.3 在線學習控制算法
5.6 數值仿真分析
5.7 本章小結
第六章 基于自適應動態(tài)規(guī)劃的下肢外骨骼機器人助行控制
6.1 引言
6.2 外骨骼系統(tǒng)人機協(xié)同控制問題建模
6.2.1 穿戴者-外骨骼交互機制
6.2.2 系統(tǒng)動力學建模與問題描述
6.3 基于自適應動態(tài)規(guī)劃的分布式控制策略
6.3.1 分布式助行控制算法設計
6.3.2 基于神經網絡的在線學習機制
6.4 仿真實驗分析
6.4.1 數值仿真分析
6.4.2 下肢助行外骨骼實驗驗證
6.5 本章小結
第七章 總結與展望
7.1 全文總結
7.2 后續(xù)工作展望
致謝
參考文獻
攻讀博士學位期間取得的成果
本文編號:3797082
【文章頁數】:133 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 國內外研究發(fā)展與現狀
1.2.1 自適應動態(tài)規(guī)劃
1.2.1.1 傳統(tǒng)的自適應動態(tài)規(guī)劃
1.2.1.2 無模型的增強學習
1.2.2 基于ADP的多智能體系統(tǒng)控制
1.3 本文的主要研究內容及組織結構
第二章 自適應動態(tài)規(guī)劃的理論基礎
2.1 動態(tài)規(guī)劃的基本原理
2.1.1 離散時間系統(tǒng)的動態(tài)規(guī)劃
2.1.2 連續(xù)時間系統(tǒng)的動態(tài)規(guī)劃
2.2 自適應動態(tài)規(guī)劃的基本框架
2.3 近似迭代算法原理
2.3.1 值迭代算法
2.3.2 策略迭代算法
2.4 本章小結
第三章 基于數據驅動的多智能體系統(tǒng)最優(yōu)跟蹤控制
3.1 引言
3.2 最優(yōu)跟蹤控制問題建模
3.3 分布式最優(yōu)控制設計
3.3.1 離散Hamilton-Jacobi-Bellman方程
3.3.2 兩階段策略迭代算法
3.3.3 算法性能及控制系統(tǒng)穩(wěn)定性分析
3.4 基于神經網絡的在線學習實現方法
3.4.1 Critic網絡設計
3.4.2 Actor網絡設計
3.5 數值仿真分析
3.6 本章小結
第四章 基于自適應動態(tài)規(guī)劃的多智能體系統(tǒng)包含控制
4.1 引言
4.2 離散時間系統(tǒng)的包含控制問題
4.2.1 最優(yōu)包含控制問題建模
4.2.2 分布式最優(yōu)控制設計與分析
4.2.3 執(zhí)行-評價神經網絡的控制實現
4.2.4 數值仿真分析
4.3 帶有擾動的連續(xù)時間系統(tǒng)的包含控制問題
4.3.1 分布式最優(yōu)包含控制設計
4.3.2 穩(wěn)定性分析
4.3.3 最優(yōu)控制的在線學習
4.3.4 數值仿真分析
4.4 本章小結
第五章 合作-競爭網絡下多智能體系統(tǒng)的最優(yōu)輸出反同步控制
5.1 引言
5.2 最優(yōu)輸出反同步控制問題建模
5.3 基于輸入-輸出數據的多智能體系統(tǒng)模型重構
5.4 基于可測數據的分布式最優(yōu)控制設計
5.4.1 基于可測數據的值迭代算法
5.4.2 系統(tǒng)穩(wěn)定性分析
5.4.3 算法收斂性分析
5.5 增量式執(zhí)行-評價網絡在線求解方法
5.5.1 增量式Critic網絡設計
5.5.2 增量式Actor網絡設計
5.5.3 在線學習控制算法
5.6 數值仿真分析
5.7 本章小結
第六章 基于自適應動態(tài)規(guī)劃的下肢外骨骼機器人助行控制
6.1 引言
6.2 外骨骼系統(tǒng)人機協(xié)同控制問題建模
6.2.1 穿戴者-外骨骼交互機制
6.2.2 系統(tǒng)動力學建模與問題描述
6.3 基于自適應動態(tài)規(guī)劃的分布式控制策略
6.3.1 分布式助行控制算法設計
6.3.2 基于神經網絡的在線學習機制
6.4 仿真實驗分析
6.4.1 數值仿真分析
6.4.2 下肢助行外骨骼實驗驗證
6.5 本章小結
第七章 總結與展望
7.1 全文總結
7.2 后續(xù)工作展望
致謝
參考文獻
攻讀博士學位期間取得的成果
本文編號:3797082
本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/3797082.html
最近更新
教材專著