基于非合作動態(tài)博弈的隨機切換系統(tǒng)能觀性及優(yōu)化控制
發(fā)布時間:2020-05-18 17:33
【摘要】:本文研究的是基于非合作動態(tài)博弈的隨機切換系統(tǒng)的能觀性和優(yōu)化控制問題。這類系統(tǒng)是一個等級結(jié)構(gòu):包括一個領(lǐng)導(dǎo)者和有限多個跟隨者。領(lǐng)導(dǎo)者制定自己的行動策略,跟隨者之間就形成了可能存在納什均衡的非合作動態(tài)博弈。同時這個隨機切換微分博弈系統(tǒng)是一個由多子系統(tǒng)和特定切換規(guī)則構(gòu)成的系統(tǒng)。這是一個從控制的觀點來看動態(tài)博弈問題的新方向,同時也是一個將傳統(tǒng)控制問題與博弈論相結(jié)合的新框架。論文首先研究了這類隨機切換微分博弈系統(tǒng)的精確能觀性問題。引入了代數(shù)Riccati方程,并通過構(gòu)造Hamilton方程來將系統(tǒng)模型轉(zhuǎn)化成易于分析處理的一般形式。隨后通過線性算子理論和正倒向隨機微分方程相關(guān)知識,構(gòu)造系統(tǒng)觀測器。這里的觀測器不是一般意義上由Gram矩陣構(gòu)成的,觀測器的目的是為了得到隨機切換微分博弈系統(tǒng)的對偶系統(tǒng)。然后,推理證明此類對偶的隨機微分博弈系統(tǒng)的能觀性判據(jù)。由得到的隨機系統(tǒng)能觀測判據(jù),結(jié)合系統(tǒng)能觀測的定義,給出隨機系統(tǒng)能觀性的應(yīng)用,即證明了隨機系統(tǒng)能觀性、穩(wěn)定性和Lyapunov方程的解之間的關(guān)系。其次,簡要介紹了系統(tǒng)的經(jīng)典二次型性能指標函數(shù)和跟隨者最優(yōu)控制。引入了兩類優(yōu)化控制問題:一是特殊的范數(shù)形式的線性二次型最優(yōu)函數(shù),并通過正倒向隨機微分方程相關(guān)知識證明了此類優(yōu)化控制的可解性和解的唯一性,并求解優(yōu)化函數(shù)最小數(shù)值解。另一類則是引入了算子優(yōu)化控制,研究算子的最小范數(shù)特征。然后,給出了隨機系統(tǒng)能控性,能觀性和最優(yōu)控制的等價條件,并通過開環(huán)算子理論,倒向隨機微分方程和伊藤公式給出相應(yīng)證明。最后給出隨機微分博弈系統(tǒng)在金融領(lǐng)域的一個實例,并對簡單隨機系統(tǒng)仿真分析。討論了一個等級結(jié)構(gòu)金融領(lǐng)域的最佳投資組合問題,一個投資人有預(yù)期的財富目標,兩個投資經(jīng)理在幫助投資人達到預(yù)期目標的前提下,有各自的利益最大化追求,即不同的價值指標泛函,并根據(jù)已知信息決定投資組合。對一個簡單的隨機系統(tǒng)分析,并通過推理證明設(shè)計控制器,并通過仿真驗證可行性。
【圖文】:
與此同時其他的子系統(tǒng)是停止工作的休眠狀態(tài)。切換系統(tǒng)主要存在兩種形式,逡逑一類被稱作多子系統(tǒng)切換系統(tǒng),是根據(jù)外部因素變化而改變自己工作模式的系統(tǒng),逡逑如圖1-2所示。逡逑上一級控制逡逑邐]邋[邐逡逑切決策單元h邐逡逑換邋邐逡逑信逡逑邐1邋號逡逑——H子系統(tǒng)1邋邐邋x^r逡逑——H子系統(tǒng)2邋|邐邋卜邐d邋輸出邋|邐邐邐?逡逑——子系統(tǒng)N邋|—邐+逡逑圖1-2多子系統(tǒng)切換模型逡逑Figure邋1-2邋Multi-subsystem邋switched邋model逡逑另一類如圖1-3所示,如果在控制過程中,,單一的控制器不能保證系統(tǒng)達到規(guī)逡逑定的性能指標要求,可以通過選擇控制器來達到預(yù)期結(jié)果的多控制器切換系統(tǒng)。逡逑由于加入了特定的切換規(guī)則,這類系統(tǒng)并不能單純的看成是子系統(tǒng)之間的簡逡逑單組合,它具有的各類動力學性質(zhì)超出了簡單疊加的效果。例如,因為切換信號的逡逑存在,如果子系統(tǒng)均不是穩(wěn)定的,可以通過改變規(guī)則來保證整個系統(tǒng)的穩(wěn)定性;若逡逑各子系統(tǒng)穩(wěn)定,但切換時間或者規(guī)則不合適,也有一定概率會影響系統(tǒng)的穩(wěn)定性W。逡逑切換系統(tǒng)在實際的工程系統(tǒng)和經(jīng)濟領(lǐng)域的應(yīng)用研宄內(nèi)容豐富,比如金融領(lǐng)域中的逡逑期權(quán)定價問題[5]和投資型保險的紅利分發(fā)問題[
應(yīng)用到很多實際的領(lǐng)域中,比如在金融、控制、計算機和通信網(wǎng)絡(luò)等領(lǐng)域都有廣泛逡逑應(yīng)用。例如,D2D通信的功率控制算法問題[9】、博弈論在不同電力需求側(cè)的博弈行逡逑為[1()](詳細見圖1-4)、并且在近兩年很熱的區(qū)塊鏈[11]和物聯(lián)網(wǎng)[12]方向也有相應(yīng)研逡逑究。逡逑19世紀60年代,Isaacs第一次完成了有關(guān)微分博弈(Differential邋games)的成逡逑果發(fā)布之后,引起了科學工作者的廣泛關(guān)注。那時微分博弈研究的主要是追逃、射逡逑擊、對抗等軍事理論相關(guān)問題。微分博弈即參與者進行博弈時,雙方各自控制策略逡逑和的相互作用,可以通過由狀態(tài)構(gòu)成的微分函數(shù)來描述。當系統(tǒng)存在逡逑隨機干擾變量時,隨機微分博弈函數(shù)可以表示成如下形式:逡逑3逡逑
【學位授予單位】:北京交通大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:O225;TP13
本文編號:2670077
【圖文】:
與此同時其他的子系統(tǒng)是停止工作的休眠狀態(tài)。切換系統(tǒng)主要存在兩種形式,逡逑一類被稱作多子系統(tǒng)切換系統(tǒng),是根據(jù)外部因素變化而改變自己工作模式的系統(tǒng),逡逑如圖1-2所示。逡逑上一級控制逡逑邐]邋[邐逡逑切決策單元h邐逡逑換邋邐逡逑信逡逑邐1邋號逡逑——H子系統(tǒng)1邋邐邋x^r逡逑——H子系統(tǒng)2邋|邐邋卜邐d邋輸出邋|邐邐邐?逡逑——子系統(tǒng)N邋|—邐+逡逑圖1-2多子系統(tǒng)切換模型逡逑Figure邋1-2邋Multi-subsystem邋switched邋model逡逑另一類如圖1-3所示,如果在控制過程中,,單一的控制器不能保證系統(tǒng)達到規(guī)逡逑定的性能指標要求,可以通過選擇控制器來達到預(yù)期結(jié)果的多控制器切換系統(tǒng)。逡逑由于加入了特定的切換規(guī)則,這類系統(tǒng)并不能單純的看成是子系統(tǒng)之間的簡逡逑單組合,它具有的各類動力學性質(zhì)超出了簡單疊加的效果。例如,因為切換信號的逡逑存在,如果子系統(tǒng)均不是穩(wěn)定的,可以通過改變規(guī)則來保證整個系統(tǒng)的穩(wěn)定性;若逡逑各子系統(tǒng)穩(wěn)定,但切換時間或者規(guī)則不合適,也有一定概率會影響系統(tǒng)的穩(wěn)定性W。逡逑切換系統(tǒng)在實際的工程系統(tǒng)和經(jīng)濟領(lǐng)域的應(yīng)用研宄內(nèi)容豐富,比如金融領(lǐng)域中的逡逑期權(quán)定價問題[5]和投資型保險的紅利分發(fā)問題[
應(yīng)用到很多實際的領(lǐng)域中,比如在金融、控制、計算機和通信網(wǎng)絡(luò)等領(lǐng)域都有廣泛逡逑應(yīng)用。例如,D2D通信的功率控制算法問題[9】、博弈論在不同電力需求側(cè)的博弈行逡逑為[1()](詳細見圖1-4)、并且在近兩年很熱的區(qū)塊鏈[11]和物聯(lián)網(wǎng)[12]方向也有相應(yīng)研逡逑究。逡逑19世紀60年代,Isaacs第一次完成了有關(guān)微分博弈(Differential邋games)的成逡逑果發(fā)布之后,引起了科學工作者的廣泛關(guān)注。那時微分博弈研究的主要是追逃、射逡逑擊、對抗等軍事理論相關(guān)問題。微分博弈即參與者進行博弈時,雙方各自控制策略逡逑和的相互作用,可以通過由狀態(tài)構(gòu)成的微分函數(shù)來描述。當系統(tǒng)存在逡逑隨機干擾變量時,隨機微分博弈函數(shù)可以表示成如下形式:逡逑3逡逑
【學位授予單位】:北京交通大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:O225;TP13
【參考文獻】
相關(guān)期刊論文 前2條
1 楊靜;胡俊美;;布朗運動與隨機積分的起源[J];咸陽師范學院學報;2015年02期
2 ;FORWARD-BACKWARD STOCHASTIC DIFFERENTIAL EQUATIONS, LINEAR QUADRATIC STOCHASTIC OPTIMAL CONTROL AND NONZERO SUM DIFFERENTIAL GAMES[J];Journal of Systems Science and Complexity;2005年02期
相關(guān)博士學位論文 前3條
1 曹銘;Markov機制轉(zhuǎn)移環(huán)境下投資保險問題的隨機微分博弈研究[D];廣東工業(yè)大學;2017年
2 劉教;切換正系統(tǒng)的穩(wěn)定性分析及控制綜合[D];大連理工大學;2017年
3 于志勇;隨機控制和對策理論中的一些倒向問題[D];山東大學;2008年
相關(guān)碩士學位論文 前2條
1 張婷瑞;隨機切換系統(tǒng)的納什均衡精確能控性及線性二次最優(yōu)控制[D];北京交通大學;2017年
2 王朋澎;基于ELM的Markov跳躍隨機非線性系統(tǒng)的神經(jīng)網(wǎng)絡(luò)控制研究[D];貴州大學;2017年
本文編號:2670077
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2670077.html
最近更新
教材專著