帶約束的隨機遞歸最優(yōu)控制問題的全局最大值原理
發(fā)布時間:2020-08-12 17:19
【摘要】:Pontryagiin及其團隊[1]在二十世紀五十年代首次提出了確定性最優(yōu)控制系統(tǒng)的最大值原理,但因為隨機積分的存在該原理不能平行推廣到隨機最優(yōu)控制系統(tǒng)中,Peng[5]通過對變分進行二階泰勒展開得到經(jīng)典的隨機最大值原理。Duffie和Epstein[11]引入了連續(xù)時間下遞歸效用的概念,之后,有很多學者研究了隨機遞歸最優(yōu)控制系統(tǒng)的局部最大值原理。然而,全局最大值原理卻未得到解決,Peng[21]提出如下公開問題:“當函數(shù)f非線性依賴于z時的全局最大值原理是公開問題”。該公開問題的主要難點是狀態(tài)變量的二階變分方程和二階伴隨方程未知。最終,Hu[26]通過引入兩個新的伴隨方程克服了這兩個難點,并得到隨機遞歸最優(yōu)控制系統(tǒng)的全局最大值原理。本文主要研究帶約束的隨機遞歸最優(yōu)控制系統(tǒng)的全局最大值原理,將Yong和Zhou[27]中的約束條件拓展到帶遞歸效用的情況就是本文所要求的約束條件。本文主要分為兩個部分:第一部分,研究一維情況的帶約束的隨機遞歸最優(yōu)控制系統(tǒng)的全局最大值原理。考慮由隨機微分方程和倒向隨機微分方程y(t)= Φ(x(T))+ f(s,x(s),y(s),z(s),u(s))ds-z(s)dW(s),共同描述的隨機遞歸最優(yōu)控制系統(tǒng),其中,定義代價泛函為J(u·))= y(0).同時,要求狀態(tài)過程滿足如下狀態(tài)約束:Eh(x(T),y(0))+ E ∫0T g(t,x(t),y(t),z(t),u(t))dt ∈ T,(?)其中,h和g均為給定函數(shù)。該問題可以描述為在可行控制集u[0,T]上最小化上述代價泛函。即存在一個最優(yōu)控制u(·)使得下式成立:本文的研究目標是獲得最優(yōu)控制u(·)滿足的必要條件。在推導最大值原理的過程中,首先定義懲罰代價泛函,然后利用針狀變分、Ekeland變分原理和泰勒展開,之后引入兩個新的倒向隨機微分方程和一個新的隨機微分方程,其適應解分別為(p0(.),q0(.)),(P0(.),Q0(.))和γ(·),隨后利用Ito公式,并介紹一個哈密爾頓函數(shù)來得到變分不等式,最后通過取極限得到一維情況的帶約束的隨機遞歸最大值原理和橫截條件。本文的創(chuàng)新就在于引入這三個新方程,使得上述約束條件下的隨機遞歸最大值原理得以解決。另外,在h和g同時等于零,且Γ為全集Rl的情況下,也就是說,并沒有受到狀態(tài)約束的束縛,經(jīng)過推導可以得到本文所得到的最大值原理與Hu[26]中的無約束情況的最大值原理相同。第二部分,研究多維情況的帶約束的隨機遞歸最優(yōu)控制系統(tǒng)的全局最大值原理。首先,將狀態(tài)過程(x(.),y(.),z(.))及其滿足的微分方程推廣到高維情況,代價泛函會變?yōu)閥的復合函數(shù)形式,即J(u(.))=H(y(0)),相應地,約束條件會變?yōu)槿缦滦问?Eh(x(T),H(y(0)))+ E ∫0T g(t,x(t),y(t),z(t),u(t))dt ∈T.與一維情況的定理推導過程大致相同,不同的是泰勒展開時需考慮y的復合導函數(shù)Hy(y(0)),所以一維情況中新引入的三個微分方程在推廣到高維情況后也會做出相應的一些變化。同時,也需要引入高維的哈密爾頓函數(shù)來得到多維情況的帶約束的隨機遞歸最優(yōu)控制系統(tǒng)的全局最大值原理。當各個維度都為一時,即多維情況回歸到一維情況,本文得到的兩個定理將有相同的結(jié)論。同樣,本文得到的多維情況的帶約束的隨機遞歸最大值原理經(jīng)過推導也可以縮減為Hu[26]中多維情況的無約束最大值原理。
【學位授予單位】:山東大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:F224
本文編號:2790809
【學位授予單位】:山東大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:F224
【參考文獻】
相關(guān)期刊論文 前2條
1 ;The Maximum Principle for Fully Coupled Forward-backward Stochastic Control System[J];自動化學報;2006年02期
2 ;MAXIMUM PRINCIPLE FOR OPTIMAL CONTROLPROBLEM OF FULLY COUPLEDFORWARD-BACKWARD STOCHASTIC SYSTEMS[J];Systems Science and Mathematical Sciences;1998年03期
本文編號:2790809
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/2790809.html
最近更新
教材專著