在沒有Isaacs條件下的隨機微分對策問題
發(fā)布時間:2018-06-01 14:50
本文選題:零和與非零和微分對策 + 零和與非零和隨機微分對策。 參考:《山東大學》2016年博士論文
【摘要】:微分對策問題實際上可以看作是一種雙(多)方的控制問題,而通常的控制問題可以看作是單人微分對策問題。Isaacs [53]在1954年首次利用微分方程來研究對策問題,即微分對策。自此以后,很多專家學者開始研究微分對策問題及其在經(jīng)濟、社會科學等方面的應用。Fleming, Souganidis [46] 1989年研究了二人零和隨機微分對策,證明了在Isaacs條件下,隨機微分對策的上值函數(shù)和下值函數(shù)是相等的,稱為該對策問題有值函數(shù)。他們的工作把Evans, Souganidis [40]的工作首次推廣到了隨機情形。隨著倒向隨機微分方程理論的不斷發(fā)展和成熟,有很多學者利用此理論來研究對策問題。Hamadene, Lepeltier [49]利用倒向隨機微分方程的解,構造了零和隨機微分對策的鞍點。Hamadene, Lepeltier, Peng [51]研究了非零和隨機微分對策,通過相關的倒向隨機微分方程的解,構造了對策的Nash均衡點。Buckdahn, Cardaliaguet, Rainer[9]研究了非零和隨機微分對策的Nash均衡問題,證明了等價的Nash均衡支付的存在性。Cardaliaguet [26]首次研究了帶不對稱信息的零和微分對策,證明了值函數(shù)的存在性。對于在沒有Isaacs條件下的零和隨機微分對策,其值函數(shù)的存在性問題是一個公開問題。Krasovskii, Subbotin [60]首次考慮了在沒有Isaacs條件下的零和確定性微分對策,他們利用位置策略得到值函數(shù)的存在性。Buckdahn, Li, Quincampoix [22][23]在沒有Isaacs條件下,利用帶延遲的非預期混合策略,分別研究了零和微分對策與零和隨機微分對策,均得到了值函數(shù)的存在性。本論文基于以上工作,進一步研究了在沒有Isaacs條件下的二人零和微分對策與零和隨機微分對策、非零和微分對策與非零和隨機微分對策。最后,我們考慮了一類新型的反射平均場倒向隨機微分方程,即與值函數(shù)耦合的受控的反射平均場倒向隨機微分方程。更詳細地,本論文的內(nèi)容和結構如下。在第一章中,我們給出了第二章到第五章的引言。在第二章中,我們主要考慮了在沒有Isaacs條件下的二人零和微分對策,其中代價泛函為帶不對稱信息的終端泛函。為克服Isaacs條件的缺失及保護各自的私人信息,兩個競爭者均考慮了帶延遲的非預期隨機策略。我們的策略與Buckdahn, Quincampoix, Rainer和Xu[25]中的策略不同。首先,我們的策略依賴于對策開始之前的信息,且雙方均可相互觀察;其次,我們定義在時間區(qū)間[t,T](0≤t≤T)上的帶延遲的非預期隨機策略保證了伴隨[0,T]的劃分π的一個隨機策略關于一個更細的劃分π’(π(?)π’)仍然是一個帶延遲的非預期隨機策略,基于此性質(zhì),我們研究了當兩個競爭者采取不同劃分時的上值函數(shù)和下值函數(shù)的極限行為。另一方面,我們研究了在同一個劃分下的上值函數(shù)和下值函數(shù)的性質(zhì)、相關的次-動態(tài)規(guī)劃原理,利用Fenchel變換,考慮了與相關的Hamilton-Jacobi-Isaacs方程的聯(lián)系,證明了值函數(shù)的存在性。本章的主要創(chuàng)新點:推廣了Buckdahn, Quincampoix, Rainer和Xu[25]中帶延遲的非預期隨機策略的定義,在沒有Isaacs條件下證明了帶不對稱信息的微分對策的值函數(shù)是存在的。進一步,為方便值函數(shù)的數(shù)值計算,我們給出了值函數(shù)的刻畫。第三章:在第二章的框架下,我們進一步研究了帶對稱信息的二人非零和微分對策的Nash均衡支付的存在性。我們的結論把Buckdahn, Cardaliaguet和Rainer9]的工作推廣到了不用假設Isaacs條件的情形。本章的主要創(chuàng)新點:首次考慮了在沒有Isaacs條件下的非零和微分對策,給出了Nash均衡支付的等價定義。我們研究了Nash均衡支付的刻畫性質(zhì),利用此性質(zhì)證明了Nash均衡支付的存在性。上述兩章來自于論文:J. Li, W. Li. Zero-sum and nonzero-sum differential games without Isaacs condition.已投稿。文章網(wǎng)址:http://arxiv.org/abs/1507.04989。在第四章中,我們主要研究了在沒有Isaacs條件下的二人非零和隨機微分對策的Nash均衡問題,把第三章關于微分對策的工作推廣到了隨機微分對策的情形。伴隨[0,T]的劃分π,我們選擇一適當?shù)膸а舆t的非預期隨機策略來研究非零和隨機微分對策的Nash均衡問題。我們首先證明了在沒有Isaacs條件下的零和隨機微分對策的值函數(shù)是存在的,進而給出了非零和隨機微分對策的Nash均衡支付的刻畫,利用此刻畫證明了Nash均衡支付的存在性。本章的主要創(chuàng)新點:首次考慮了在沒有Isaacs條件下的非零和隨機微分對策,給出了一新的Nash均衡支付的定義。我們研究了Nash均衡支付的刻畫性質(zhì),利用此性質(zhì)證明了Nash均衡支付的存在性。本章來自于論文:J. Li, W. Li. Nash equilibrium payoffs for nonzero-sum stochastic differential games without Isaacs condition已投稿。在第五章中,我們考慮了一類新型的反射平均場倒向隨機微分方程,即與值函數(shù)耦合的受控的反射平均場倒向隨機微分方程。利用逼近的方法,我們不僅證明了此類方程解的存在唯一性,而且給出了相關的比較定理。通過推廣Peng在[104]中引入的隨機倒向半群的定義,我們得到了相關的動態(tài)規(guī)劃原理。進一步,我們證明了與反射平均場倒向隨機微分方程耦合的值函數(shù)是相關的帶障礙的非局部拋物偏微分方程的唯一粘性解。本章的主要創(chuàng)新點:把Hao和Li[50]的工作推廣到了帶反射的情形,證明了與值函數(shù)耦合的受控的反射平均場倒向隨機微分方程解的存在唯一性,并為相關的帶障礙的拋物型偏微分方程的粘性解提供了概率解釋。本章來自于論文:J. Li. W. Li. Controlled reflected mean-field backward stochastic differential equa-tions coupled with value function and related PDEs. Mathematical Control and Related Fields,5 (3).501-516,2015.下面是本文的章節(jié)目錄和主要內(nèi)容。一、第一章引言;二、第二章在沒有Isaacs條件下的帶不對稱信息的零和微分對策;三、第三章在沒有Isaacs條件下的非零和微分對策的Nash均衡問題;四、第四章在沒有Isaacs條件下的非零和隨機微分對策的Nash均衡問題;五、第五章與值函數(shù)耦合的受控的反射平均場倒向隨機微分方程及相關的PDEs。第二章:一方面,在沒有Isaacs條件下,我們證明了當劃分π的細度趨于0時,上、下值函數(shù)W”和Vπ一致收斂于同一個函數(shù)U,即對策的值函數(shù)是存在的,且值函數(shù)U為相關的Hamilton-Jacobi-Isaacs方程的唯一對偶粘性解;另一方面,我們給出了值函數(shù)U的刻畫,證明了在Isaacs條件下,上、下值函數(shù)W和V是相等的,即成立W=U=V。對于任意給定的t ∈ [0,T], ∈ Rn,考慮如下動態(tài)系統(tǒng):對于(p,g)∈△(I)×△(J),(t,x)∈[0,T]×Rn,π={0=t0t1…tN=T)及t ∈[tk-1,tk),我們定義如下代價泛函下面我們介紹本章中要研究的上值函數(shù):和下值函數(shù):其中為得到值函數(shù)的存在性,我們研究了伴隨同一劃分π的上下值函數(shù)Wπ和Vπ。借助Buckdahn,Li[16]中引入的Girsanov變換的方法,我們可通過研究(w1π,V1π)來研究(Wπ,Vπ)。結合Cardaliaguet[26]或Buckdahn,Quincampoix,Rainer,Xu[25]中引入的Fenchel變換的方法,我們證明了(W1π,V1π)一致收斂于同一個函數(shù),從而得到了值函數(shù)的存在性。定理2.2.1對任意的(t,x,p,q) ∈[0,T]×Rn×△(I)×△(J),有其中引理2.2.2函數(shù)W1π和V1π關于(t,x,p,q)是Lipschitz連續(xù)的,關于劃分π一致。引理2.2.3對于任意的(t,x) ∈[0,T]×Rn,函數(shù)W1π(t,x,p,q)和V1π(t,x,p,q)均關于p ∈△(I)是凸的,關于q∈△(J)是凹的。引理2.2.4對于所有的(t,x,p,q)∈[0,T]×Rn×RI×△(J),V1π*(x,x,p,q)有以下表達式引理2.2.5對于時間區(qū)間[0:T]的所有劃分π,凸共軛函數(shù)V1π*(t,x,p,q)關于其所有變量(t,x,p,q)是Lipschitz的,凹共軛函數(shù)W1π#(t,x,p,q)關于其所有變量(t,x,p,q)是Lipschitz的,且Lipschitz常數(shù)與劃分π的選擇無關。引理2.2.6(次-DPP)對于所有的(t,x,p,q) ∈[tk-1,tk)×Rn×RI×△(J)和所有的l(k≤l≤N),如下不等式成立引理2.2.7存在(πn)n1的一個子序列,仍記為(πn)。1,及兩個函數(shù)V:[0,T]× Rn×RI×△(J)→R和W:[0,T]×Rn×△(I)×RJ→R使得(W1πn*,W1πn#)在[0,T]×Rn×△(I)×△(J)×Rn×RJ的緊集上一致收斂于(V,W)。引理2.2.8對所有的(p,q) ∈RI×△(J),極限函數(shù)V(t,x,p,q)是HJI方程(2.2.36)的一個粘性下解。引理2.2.9對任意的(t,x,p,q) ∈[0,T]×Rn×△(J)×RJ和所有的l(k≤l≤n),我們有且W(參考引理2.2.7)是HJI方程(2.2.36)的一個粘性上解。定理2.2.2當劃分πn的細度趨于0時,函數(shù)(V1πn)和(W1πn)在緊集上一致收斂于同一個Lipschitz函數(shù)U。此外,函數(shù)U是HJI方程(2.2.51)的唯一對偶粘性解。定理2.2.3當劃分πn的細度趨于0時,函數(shù)(Vπn)和(Wπn)在緊集上一致收斂于同一個Lipschitz函數(shù)U。此外,函數(shù)U是HJI方程(2.2.51)的唯一對偶粘性解。為研究上、下值函數(shù)W和V的性質(zhì),我們引入以下輔助函數(shù):再次利用Cardaliaguet[26]或Buckdahn,Quincampoix,Rainer,Xu[25]中引入的Fenchel變換的方法,我們得到了如下主要結論。定理2.3.1若條件(2.3.6)成立,則對于所有的劃分π。且|πn|→0,序列(Vπn)和(Wπn)在緊集上一致收斂于HJI方程(2.2.51)的唯一對偶粘性解U。定理2.3.2若條件(2.3.7)成立,則對于所有的劃分π。且|π。|→0,序列(Vπn)和(Wπn)在緊集上一致收斂于HJI方程(2.2.51)的唯一對偶粘性解U。定理2.3.3(值函數(shù)刻畫)在Isaacs條件下,對所有的(t,x,p,g) ∈[0,T]×Rn×△(I)× △(J),成立第三章:本章主要研究了在沒有Isaacs條件下的非零和微分對策的Nash均衡支付的存在性問題。我們首先給出Nash均衡支付的刻畫,進而證明Nash均衡支付的存在性。在第二章的研究框架下,我們研究了對稱信息(I=J=1)下的非零和微分對策。動態(tài)系統(tǒng)仍然為第二章中的動態(tài)系統(tǒng),但此時的支付為如下兩個泛函:競爭者1的目標是最大化J1(t,x,u,v),而競爭者2的目標是最大化J2(t,x,u,v)。利用Buckdahn,Cardaliaguet,Rainer[9]中的證明方法,結合如下值函數(shù):和在沒有Isaacs條件下,我們得到了非零和微分對策的Nash均衡支付(簡記為NEP)的存在性。引理3.2.1a)設(t,x) ∈[0,T]×Rn,∈0。對于任意的劃分x={0=t0t1… tN=T}且|π|δε(δε0足夠小)及t=tk-1,和對于任意給定的存在策略αi ∈A1π(t,T),i=k,…,N,使得對于所有的有b)設(t,x) ∈[0,T]×Rn,ε0。對于任意的劃分丌={0=t0t1…tN=T}且|π|δε(δε0足夠小)及t=tk-1,和對于任意給定的存在策略αi ∈A1π(t,T),i=k,…,N,使得對于所有的有定理3.2.1(NEP的刻畫)(e1,e2)∈R2是(t,x)處的NEP,當且僅當對所有的(?)0,存在δ(?)0使得對于任意的劃分π={0=t0t1…tN=T}且|π|δ(?)及t=tk-1,存在滿足對i=k,...,N和m=1,2,分別有和命題3.2.1對任意的(?)0,存在足夠小的δ(?)0使得對于任意的劃分π={0=t0 t1…tN=T}且|π|δ(?)及t=tk-1,存在一對控制滿足對于所有的k≤i≤l≤N和m=1,2,有其中X=Xt,x,uε,vε。定理3.2.2(NEP的存在性)對于任意的初始位置(t,x) ∈[0,T]×Rn,我們的非零和微分對策的NEP是存在的。第四章:本章主要研究了在沒有Isaacs條件下的非零和隨機微分對策的Nash均衡支付的存在性問題。我們首先研究了相關的零和隨機微分對策的值函數(shù)的存在性;其次給出非零和隨機微分對策Nash均衡支付的刻畫,進而證明了Nash均衡支付的存在性。我們的動態(tài)系統(tǒng)是如下雙受控隨機微分方程:零和隨機微分對策:對于(t,x)∈[0,T]×Rn,π={0=t0t1…tN=T}和我們定義代價泛函為伴隨劃分π的上下值函數(shù):在沒有Isaacs條件下,我們通過研究上下值函數(shù)Uπ和Wπ來得到零和隨機微分對策值函數(shù)的存在性。為此,我們首先采用Buckdahn,Li[16]中引入的方法,證明了上值函數(shù)Uπ和下值函數(shù)Wπ是確定性的。其次證明了上下值函數(shù)Uπ和Wπ關于劃分節(jié)點滿足動態(tài)規(guī)劃原理。最后,結合倒向隨機微分方程理論,我們證明了當劃分π的細度趨于0時,函數(shù)Wπ和Uπ一致收斂于同一個函數(shù),且此函數(shù)是相關的Hamilton-Jacobi-Bellman-Isaacs(簡記為HJBI)方程的唯一粘性解。定理4.2.1對所有的(t,x) ∈[0,T]×Rn和對于[0,T]的任意劃分π,我們有定理4.2.2設〗={0=t0t1…tN=T),t ∈[tk-1,tk),x ∈Rn。則對所有的k≤l≤N,我們有,P-a.s.,引理4.2.1對所有的(t,x) ∈[0,T]×Rn,成立命題4.2.1對[0,T]的所有劃分π,存在一常數(shù)C0使得對于所有的t,r ∈[0,T],x,y ∈Rn,我們有定理4.2.3(值函數(shù)的存在性)存在一有界連續(xù)函數(shù)V:[0,T]×Rn→R使得,對于[0,T]的所有劃分序列πn且|πnl→ 0,當n→+∞時,上下值函數(shù)(Vπn,Wπn)在[0,T]×R“的緊集上一致收斂于(V,V)。此外,函數(shù)V是HJBI方程(4.2.52)的唯一粘性解。非零和隨機微分對策:對任意給定的(t,x) ∈[0,T]×Rn和劃分π={0=t0t1 ...tN=T},t ∈[tk-1,tk),我們定義代價泛函為兩個競爭者的目標均是最大化其代價泛函。為得到NEP的存在性,我們分別介紹與g1和g2相聯(lián)系的值函數(shù)W1(t,x)和W2(t,x):引理4.3.2 a)設(t,x) ∈[0,T]×Rn,ε0。對于任意的劃分π={0=t0t1... tN=T)且|π|δε(δε0足夠小),t=tk-1,及對任意給定的存在NAD策略αi ∈At,Tπ,i=k-1,...,N,使得對于所有的有αi(v)三u’,在[t,ti]上,b)設(t,x)∈[0,T]×Rn,∈0.對于任意劃分π={0=t0t1…tN=T),且|π|δε(δε0足夠小),t=tk-1,及對任意給定的u' ∈ut,Tπ,存在NAD策略αi ∈At,Tπ,i=k-1,...,N,使得對于所有v ∈Vt,Tπ,P-a.s.,有αi(v)三u’,在[t,ti]上定理4.3.1(NEP的刻畫)(e1,e2) ∈R2是初始數(shù)據(jù)為(t.x)的一個NEP,當且僅當對任意的(?)0,存在足夠小的δ(?)0,使得對任意劃分π={0=t0t1...tN=T}且|π|δε,t=tk-1,存在一對可容許控制(使得,對i=k-1,....N和m=1,2,分別有命題4.3.1對任意的(?)0,存在足夠小的δ(?)0使得,對任意劃分π={0=t0 t1…tN=T}且|π|δε,t=tk-1,存在一對控制使得,對所有的k-1≤i≤l≤N和m=1,2,分別有其中X=Xt,x,uε,vε。定理4.3.2 (NEP的存在性)對于任意初始位置(t,x) ∈[0,T]×Rn,我們的非零和隨機微分對策的NEP是存在的。第五章:在本章中,我們考慮一類新型的反射平均場倒向隨機微分方程,即與值函數(shù)耦合的受控的反射平均場倒向隨機微分方程。利用逼近的方法,我們不僅證明了此類方程解的存在唯一性,而且給出了相關的比較定理。通過推廣Peng在[104]中引入的隨機倒向半群,我們證明了相關的動態(tài)規(guī)劃原理。最后,我們證明了與反射平均場倒向隨機微分方程耦合的值函數(shù)是相關的帶障礙的非局部偏微分方程的唯一粘性解。McKean-Vlasov隨機微分方程:給定(x0,v) ∈Rn×V0.T,對所有的t ∈[0,T],ζ ∈ L2(Ω,Ft,P)和v(·) ∈Vt,T,考慮如下隨機微分方程:在假設(H5.2.1)下,此方程存在唯一解Xt,ζ;v ∈SF2(t,T;Rn)?紤]如下形式的反射平均場倒向隨機微分方程,即與其值函數(shù)耦合的受控的反射平均場倒向隨機微分方程:我們利用迭代的方法證明上述方程解的存在性。令Yt,x;v,0≡0,m≥1,對于(t,x)∈[0,T]×Rn,u ∈Vt,T,考慮如下迭代方程引理5.2.1對所有的m≥1,上述迭代方程存在唯一的解進一步,函數(shù)Wm:Ω×[0,T]×Rn→R滿足(i)Wm(t,x)是Ft-可測的,(t,x) ∈[0,T]×Rn;(ii)存在一常數(shù)C獨立于m,使得對于所有的t ∈[0,T],x,x ∈Rn,P-a.s.,定理5.2.1(存在性)對所有的(t,x) ∈[0,T]×Rn,u ∈Vt,T,存在一三元組使得在中收斂到(Yt,x;v),Zt,x;v,Kt,x;v),且Wm(t,x),m≥1,在L2中收斂到進一步,是反射平均場倒向隨機微分方程(5.2.3)的解,且存在一常數(shù)C0使得對于t ∈[0,T],x,x ∈Rn,P-a.s.,有定理5.2.2(唯一性)在假設(H5.2.1)和(H5.2.2)下,與值函數(shù)耦合的反射平均場倒向隨機微分方程(5.2.3)的解是唯一的。定理5.2.3(比較定理)對于i=1,2,我們假設系數(shù)fi=fi(t,x',x,y',y,z)和障礙hi(t,x',x)滿足假設(H5.2.2)和(H5.2.3),終端值分別是帶有數(shù)據(jù)(fi,ζi,hi)的反射平均場倒向隨機微分方程(5.2.3)的唯一解。進一步,設ζ1≥ζ2,h1≥h2,f1≥f2,則且定理5.3.1(DPP)在假設(H5.2.1)和(H5.2.2)下,對于所有的t∈[0,T),x∈Rn,0≤δT-t,值函數(shù)W(t,x)有如下動態(tài)規(guī)劃原理:定理5.4.1(i)(存在性)在假設(H5.2.1)和(H5.2.2)下,由反射平均場倒向隨機微分方程(5.2.3)給出的值函數(shù)W ∈Cp([0,T]×Rn)是PDE(5.4.1)的一個粘性解。(ii)(唯一性)在(?)空間中,(i)中的值函數(shù)W是PDE(5.4.1)的唯一粘性解。
[Abstract]:......
【學位授予單位】:山東大學
【學位級別】:博士
【學位授予年份】:2016
【分類號】:O211.63
,
本文編號:1964567
本文鏈接:http://www.sikaile.net/shoufeilunwen/jckxbs/1964567.html
最近更新
教材專著