正倒向隨機系統(tǒng)的微分博弈、數(shù)值逼近及最優(yōu)保費應用
發(fā)布時間:2020-09-15 20:01
本論文主要討論正倒向隨機微分方程系統(tǒng)下的隨機微分博弈、解的數(shù)值逼近及最優(yōu)保費中的應用問題。論文包括以下四個部分:第一部分研究含脈沖控制的正倒向隨機系統(tǒng)非零和微分博弈問題,得到了其最大值原理及驗證定理;第二部分研究非對稱信息下線性二次非零和微分博弈問題,得到了幾類非對稱信息框架下微分博弈問題的納什均衡點;第三部分我們應用分支粒子系統(tǒng)給出了一類耦合的正倒向隨機微分方程解的數(shù)值逼近,并證明了其收斂性和收斂速度;第四部分研究了一個保險公司的最優(yōu)保費問題,我們顯式地給出了最優(yōu)保費策略及相應的最優(yōu)指標泛函,并給出了數(shù)值模擬來解釋理論結果。下面將進一步介紹論文的內(nèi)容及結構。第一章,對論文所研究問題的相關歷史文獻作一個簡要回顧。第二章,我們研究一類非零和隨機微分博弈問題的最大值原理和驗證定理,其中博弈系統(tǒng)是由正倒向隨機微分方程系統(tǒng)驅(qū)動的,控制變量由兩部分組成:連續(xù)控制變量和脈沖控制變量。通過分別對兩部分控制變量使用凸變分,我們得到了該博弈系統(tǒng)開環(huán)納什均衡點的最大值原理形式的必要性條件。另外,我們還得到了充分性均衡條件,用于幫助找到納什均衡點。最后,我們將該理論結果應用于一個基金管理問題中,并顯式得到了最優(yōu)投資組合和最優(yōu)脈沖消費策略。本章結果發(fā)表于論文:D. Chang and Z. Wu, Stochastic maximum principle for non-zero sum differen-tial games of FBSDEs with impulse controls and its application to finance, Journal of Industrial and Management Optimization, Vol.11 (2015),27-40.第三章,我們研究一類非對稱信息下線性二次(簡稱LQ)非零和微分博弈問題。與已有的研究結果相比,本研究工作的一個突出特色在于參與者可得的信息是非對稱的。通過最大值原理和完全平方的技巧,我們得到了幾類非對稱信息框架下微分博弈問題的納什均衡點。在證明過程中,我們引入了一些Riccati方程和正倒向隨機濾波方程,并證明了方程解的存在唯一性。最后,借助Riccati方程的解,我們將每一類非對稱信息下博弈問題的唯一納什均衡點表示成狀態(tài)過程最優(yōu)濾波的反饋形式。本章結果發(fā)表于論文:D. Chang and H. Xiao, Linear quadratic nonzero sum differential games with asym-metric information, Mathematical Problems in Engineering, vol.2014, Article ID 262314, 11 pages,2014.第四章,我們將利用隨機環(huán)境下的分支粒子系統(tǒng),給出一類耦合的正倒向隨機微分方程解的新的數(shù)值格式。首先,借助四步法,我們引入一個偏微分方程來表示正倒向隨機微分方程系統(tǒng)的解。然后,我們分別建立有窮和無窮粒子系統(tǒng)來表示該偏微分方程的近似解,其中每個粒子的位置和權重各自滿足由原正倒向隨機微分方程系統(tǒng)推導出的新的隨機微分方程。最后,我們建立一個分支粒子系統(tǒng)來定義原正倒向隨機微分方程系統(tǒng)的近似解。每個粒子的分支機制依賴于該粒子在短暫存活時間∈=n-2α內(nèi)的路徑,其中n表示初始粒子數(shù)目,α1/2是固定參數(shù)。關于該數(shù)值格式的收斂性和收斂速度我們也給出了證明。本章結果完成論文:D. Chang, H. Liu and J. Xiong, A branching particle system approximation for a class of FBSDEs, Journal of Mathematical Analysis and Applications, submitted.第五章,我們研究一個保險公司的最優(yōu)保費問題,保險公司可以通過調(diào)整其保費費率來控制公司的現(xiàn)金余額。公司目標是通過收取合適的保費金額使得公司的現(xiàn)金余額關于預設目標的方差、保費策略的經(jīng)營成本及一般的遞歸效用最小化。我們研究的問題有三個突出的特色:1.完全信息和部分信息的情形都做了研究;2.狀態(tài)含終端約束;3.通過引入一般的隨機遞歸效應,我們的最優(yōu)化問題建立在正倒向隨機微分方程的框架下。最終,我們顯式地給出了最優(yōu)保費策略及相應的最優(yōu)指標泛函,并給出了數(shù)值模擬來解釋理論結果。本章結果完成論文:D. Chang and Z. Wu, Optimal premium policy driven by FBSDEs under full and partial information, working paper.下面我們給出本論文的主要結論。1.含脈沖控制的正倒向隨機系統(tǒng)非零和微分博弈的最大值原理我們考慮下列含脈沖控制的非零和微分博弈的正倒向隨機微分方程*簡稱FBSDE)系統(tǒng):其中b:[0,T]×Rn×Rk1×Rk2→Rn,σ:[0,T]×Rn×Rk1×R2→Rn×d,f:[0,T]×Rn×Rm× Rm×d×Rk1×Rk1→Rm,g:Rn→Rm是可測映射,C1:[0,T]→Rn×d1,G2:[0,T]→Rm×d1, D1:[0,T]→Rn×d2,D2:[0,T]→Rm×d2是連續(xù)函數(shù)。v1(·)和u2(·)是參與者1和參與者2的連續(xù)控制過程。η1(·)和η72(·)是參與者1和參與者2的脈沖控制過程。接下來我們引入代價泛函:Ji(v1(·),v2(·),η1(·),η2(·))其中φi:Rn→R,ri:Rm→(i=1,2)和hi:[0,T]×Rn×Rm×Rm×d×Rk1×Rk2→R(i=1,2)是給定的可測映射。假設每個參與者都希望通過選擇合適的容許控制(vi(·),ηi(·))(i=1,2)來最大化他自己的代價泛函Ji(v1(·),v2(·),η1(·),η2(·)),則我們的問題是找到一組容許控制(v1(·),ζ1(·), v2(·),ζ(·))∈A1×A2使得我們稱這一問題為含脈沖控制的正倒向非零和隨機微分博弈。這一部分的主要結果是如下定理:定理2.1.假設(H2.1)和(H2.3)成立。令(v1(·),ζ1(·),v2(·),ζ2(·))∈A1×A2是前述博弈問題的一個納什均衡點,(x(·),y(·),z(·))是相應的狀態(tài)軌跡,(pi(·),qi(·),ki(·))(i=1,2)是伴隨方程(2.26)的解。則對(?)v1∈U1,v2∈U2,η1(·)∈K1和η2(·)∈K2,有H1v1(t,x(t),y(t),z(t),v1(t),v2(t),p1(t),g1(t),k1(t))(v1-v1(t))≤ 0 a.e.,a.s., (2.2.10) H2v2(t,x(t),y(t),:(t)v1(t),u2(t),p2(t),q2(t),k2(t))(v2-v2(t))≤0 a.e.,a.s., (2.2.12)定理2.2.假設(H2.1)-(H2.3)成立。假設函數(shù)φi,γi,ηi→(t,ηi)和(x,y,z,v1,v2)→ Hi(t,x,y,z,v1,v2,pi,qi,ki)(i=1,2)是凸的。對于K∈Rm×n和ξ∈L2(Ω,FT,P;Rm),yv1,v2,η1,η2 (T)=Kxv1,v2,η1,η2(T)+ξ,(v1(·),η1(·),V2(·),η2(·))∈A1×A2.令(pi,qi,ki)(i=1,2)是關于(v1,ζ1,v2,ζ2)∈A1×A2伴隨方程的解。若(u1,ζ1,u2,ζ2)滿足(2.2.10),(2.2.11),(2.2.12)和(2.2.13),則其為含脈沖控制正倒向非零和隨機微分博弈的一個納什均衡點。2.非對稱信息下線性二次非零和微分博弈在這一部分我們研究非對稱信息下線性二次非零和微分博弈問題。為了簡便,我們只考慮兩個參與者的情形?紤]下列一維SDE代價泛函的形式為其中a,b1,b2,c,e,g1,g2和93是關于t的有界確定性函數(shù),l1和l2是關于t的有界非負確定性函數(shù),m1和m2是關于t的有界正確定性函數(shù),r1和r2是兩個非負常數(shù)。為了記號簡便,在不會混淆的情況下,我們刪掉所有過程和確定性函數(shù)記號中表示依賴于時間變量的t.u1(·)和u2(·)分別是參與者1和參與者2的控制過程。我們總是使用下標1(相應的,下標2)來刻畫與參與者1(相應的,參與者2)相關的控制變量,并使用xu1,u2來表示狀態(tài)依賴于控制變量(u1.u2).令Ft表示t時刻的完全信息,gti(?)Ft是給定的子域流,表示參與者i(i=1,2)在t∈[0.T]時刻可得的信息。如果gti(?)F且gti≠Ft,我們稱參與者i的可得信息是部分信息或不完備信息。若gt1≠gt2,我們稱參與者1和參與者2的可得信息非對稱。我們將研究以下四類非對稱信息下的問題:(i)gt1=Ft1,2和gt2=Ft2,3,即,兩個參與者掌握共同的部分信息Ft2;(ii)gt1=Ft1,2和gt2=Ft2,即,參與者1比參與者2掌握更多的信息;(iii)gt1=Ft和gt2=Ft2,即,參與者1掌握完全信息而參與者2掌握部分信息;(iv)gt1=Ft1,2和gt2=Ft3,即,兩個參與者掌握的信息相互獨立假設每個參與者都希望通過選擇合適的容許控制ui(·)(i=1,2)來最小化他/她自己的代價泛函Ji(u,(·),u2(·)).本章的研究工作中,我們的問題是,在非對稱信息的設置下,找到(v1,(·),v2(·)) ∈v1×v2其被稱為博弈問題的納什均衡點,使得我們稱上述問題為非對稱信息下線性二次非零和微分博弈問題。為了簡便,我們用問題(LQNZSDG)來表示。這一部分的主要結果是如下定理:定理3.1.(u1,u2)是問題(LQNZSDG)的納什均衡點當且僅當(u1,u2)滿足(3.3.8)且(x, (y1,z11,z12,z13),(z2,z21,z22,z23))滿足FBSDE (3.3.9).分別考慮四類非對稱信息下的情形。情形1:gt1=Ft1,2且gt2-Ft2.3.定理3.1可如下重寫為:定理3.2.(u1,u2)是問題(LQNZSDG)的納什均衡點當且僅當(u1,u2)滿足如下形式:其中(x,(y1,z11,z12,z13),(y2,z21,z22,z23))是下列FBSDE的解我們推導出納什均衡點,其被表示成狀態(tài)x的最優(yōu)濾波x,x和x的反饋。定理3.4.在假設(H3.3)下,問題(LQNZSDG)有唯一的納什均衡點,表示為其中x,x和x分別表示為(3.3.32),(3.3.40)和(3.3.45),γi和Ti(i=1,2,3)分別由系統(tǒng)(3.3.37)和(3.3.43)唯一確定。情形2:gt1=Ft1,2,且gt2=Ft2.我們得到下列定理定理3.5.(u1,u2)是問題(LQNZSDG)的納什均衡點當且僅當其中(x, (y1,z11,z12,z13),(y2,z21,z22,z23))是下列FBSDE的解定理3.6.若(H3.3)成立,則問題有唯一的納什均衡點表示為(LQNZSDG)其中x和x分別表示為(3.3.32)和(3.3.40).情形3:gt1=Ft且gt2=Ft2.我們有下列定理定理3.7.(u1,u2)是問題的納什均衡點當且僅當(LQNZSDG)其中是下列FBSDE的解(x,(y1,z11,z12,z13),(y2,z21,z22,z23))定理3.8.在假設(H3.3)下,問題有唯一的納什均衡點表示為其中x和x分別表示為(3.3.32)和(3.3.52).(LQNZSDG)情形4:gt1=Ft1,2且gt2=Ft3.我們有下列定理定理3.9.(u1,u2)是問題的納什均衡點當且僅當(LQNZSDG)其中(x,(y1,z11,z12,z13),(y2,z21,z22,z23))是下列FBSDE的解定理3.11.在假設(H3.3)和(H3.4)下,問題(LQNZSDG)有唯一的納什均衡點表示為其中Ex,x和x分別表示為(3.3.59,),(3.3.61)和(3.3.63),γi和Ti(i=1,2,3)分別由系統(tǒng)(3.3.37)和(3.3.43)唯一確定,其中e(·)被0代替。3.一類正倒向隨機微分方程的分支粒子系統(tǒng)逼近我們考慮下列固定時間區(qū)間[0,T]內(nèi)的正倒向隨機微分方程:其中b:Rd×Rk→Rd,σ:Rd→Rd×l,g:Rd×Rk×Rk×l→Rk及f:Rd→Rk.接下來,我們做出如下假設:假設(H4.1):g滿足如下形式:對z=(z1…,z1),b(x,y),σ(x),g(x,y,z),f(x),C(x,y)和D(x,y)都是有界Lipschitz連續(xù)映射且二階偏導數(shù)有界。借助四步法的思想,我們知道上述FBSDE的解滿足關系Y(t)=u(t,X(t)),Z(t)= (?)xu(t,X(t))σ(X(t))其中u(t,x)是下列PDE的解其中且aij=(σσ*)ij,σ=(σ1,…σl),bi是b的第i個分量。對0≤t≤T,假定v(t,x)=v(T-t,x).可知該非線性拋物型偏微分方程(4.1.2)可以被寫作:我們構建一個無窮粒子系統(tǒng){Xi(t):i∈N)},其在Rd中的位置和隨時間變化的權重{Ai(t):j∈N}滿足下列方程:對0t≤T,i=1,2,其初始值{Xi(0),Ai(0),i∈N}獨立同分布,{Bi(t),i∈N}是獨立的標準布朗運動且對任意φ∈Cb2(Rd).我們得到定理4.2.粒子系統(tǒng)(4.1.4)的解是唯一的,其密度函數(shù)是偏微分方程(4.1.3)的解。下而引入一個有窮粒子系統(tǒng)來得到近似解:對固定的δ0,t∈(0,T],其中i=1,2,……n,給定初始值為定理4.3.un,8(t)到u(t)的收斂被界住。我們注意到上面定理4.3中的KT隨著T增長是指數(shù)增長的,于是,逼近誤差會快速地指數(shù)增長。為了避免數(shù)值格式的這一缺點,我們引入一個分支粒子系統(tǒng)來優(yōu)化粒子在時間分割點處的權重。對固定的δ0,∈=n-2α,0α1,初始存在,u個粒子,每個粒子的初始位置為Xin,δ,ε(0),i=1,2,……,n,其是Rd上獨立同分布的隨機變量,粒子初始的權重為1.假定時間區(qū)間為[0,T]且N*=[T/ε]是不大于Tε的最大整數(shù)。定文ε(t)=jε對j∈≤t(j+1)∈.在時間區(qū)間[j∈,(j+1)∈),j≤N*內(nèi),有mnj個粒子存活且它們的位置和權重如下決定:對i=1,2,……:mjn,其中初始值定義為:Xin,δ,ε(0)=x,Ain,δ,ε(0,0)=1,m0n=n.我們定義非正規(guī)化逼近濾波如下:我們得到定理4.5. 對任意t∈[0,T],δ0,ε=n-2α和0α1/2,存在常數(shù)Kδ使得Eρ12(Vn,δ,ε(t),Vδ(t))≤KTn-(1-2α)+Kδ,Tn-2α.我們定義即Vn,δ,ε(t)的光滑密度,作為u(t,x)的數(shù)值逼近,定義vn,δ,ε(t,x)=vn,δ,ε(T-t,x)作為u(t,x)的數(shù)值逼近。然后,我們有下列推論:推論4.1.對任意存在常數(shù)Kδ,使得我們應用Euler格式來逼近FBSDE(4.1.1)中的X(t).定義數(shù)值解Xn,δ,ε(t)滿足:定理4.6.Xn,δ,ε(t)到X(t)的收斂被Kδ,T,(n-(1-2α)V n-2α)+KTδ界住。根據(jù)四步法的結果,我們定義Yn,δ,ε(t)=vnδ,ε(t,Xtn,δ,ε)作為FBSDE(4.1.1)中Y(t)的數(shù)值解。我們有下列定理:定理4.7.Yn,δ,ε(t)到Y(t)的收斂被界住。4.完全信息和部分信息下正倒向隨機系統(tǒng)的最優(yōu)保費策略4.1.完全信息下最優(yōu)保費問題考慮一個保險公司,其現(xiàn)金余額過程Xtu滿足其決策人的控制策略u在下述意義下是容許的。定義5.1.一個R值保費策略v={vt}0≤t≤T被稱為容許的,如果對每個0≤t≤T,ut是FtW-適應的且E∫0Tut4dt+∞.給狀態(tài)過程Xtv添加一個終端約束滿足EXTv=w0. (5.1.2)考慮遞歸效用或風險度量Ytv滿足:假設代價泛函的形式為其中β是貼現(xiàn)因子,Ut是動態(tài)預設目標,R是遞歸效用的預設目標,Lt,Nt:M和Q是權重因子。完全信息下最優(yōu)保費問題(簡稱OPFI)|凍述如下:問題(OPFI).找到u∈uF使得J[v]=infv∈vF J[v]滿足(5.1.1),(5.1.2)及(5.1.3).該問題的主要結果是如下定理:定理5.1.假設(H5.1)成立。若vt=-Nt-1eβt(pt-Btqt)是問題(OPFI)的最優(yōu)保費策略,則其可以表示為其中(X,Y Z,p,q,k),λt1,λt1,ψt,αt1,αt2和αt3分別是(5.1.10);(511.15),(5.1.16),(5.1.17),(5.1.21),(5.1.22)和(5.1.23)的解。定理5.2.假設(H5.1)成立。則問題(OPFI)的最優(yōu)保費策略為其中Xt滿足(5.1.24),λt1,λt2,ψt,αt1,αt2和αt3分別是(5.1.15),(5.1.16),(5.1.17),(5,1.21),(5.1.22)和(5.1.23)的解。此外,在假設(H5.2)下,最優(yōu)價泛函表示為(5.1.35).4.2.部分信息下最優(yōu)保費問題我們假設決策者只能從股票上獲得信息,考慮系統(tǒng)和其中現(xiàn)金余額過程Xtu是潛在因子,其能夠通過即時波動率為ht的信號(觀測)Stv被部分觀測到。給出一個容許控制的定義。令是R值gt-適應的過程使得:定義5.2.控制u被稱為容許的,如果u∈uad0是gt-適應的。容許控制集記為玩uad.部分信息下最優(yōu)保費問題(簡稱OPPI)陳述如下:問題(IPPI).尋找u∈uad使得J[v]=infv∈vad J[v]滿足(5.2.41),(5.2.42)和(5.1.2).該問題的主要結果是如下定理:定理5.3.假設(H5.1)成立。假定u是問題(OPPI)的最優(yōu)保費策略而(X,YZ)是相應的最優(yōu)狀態(tài)。則FBSDE存在唯一解(p:q,k)∈LFW2(0,T;R)使得其中gt(?)σ{Ss:0≤s≤t}.定理5.4.假設(H5.1)成立。令u∈uad滿足其中(X,Y,Z,p,q,k)是(5.2.48)的解。則u是問題(OPPI)的最優(yōu)保費策略。定理5.5.假設(H5.1)成立。若vt=eβtNt-1(Btqt-pt)是問題(OPPI)的最優(yōu)控制,則其可表示為其中(X,Y,Z),(p,q,k),αt1,αt1,αt3,λt1,λt2和中ψt分別是(5.2.56)當u=u,(5.2.61),(5.1.15),(5.1.16),(5.1,17),(5.1.21),(5,1.22)和(5.1.23)的解。定理5.6.假設(H5.1)和(H5.3)成立。則問題(OPPI)的最優(yōu)保費策略為其中又:滿足(5.2.56),λt1,λt2,ψt,αt1,αt2,和αt3分烈是(5.1.15)1(5.1.16),(5.1.1,7),(5.1.21),(5.1.22)和(5.23)的解。此外,在假設(H5.2)下,最優(yōu)代價泛函由(5.2.66)給出。
【學位單位】:山東大學
【學位級別】:博士
【學位年份】:2015
【中圖分類】:O211.63;F830
【部分圖文】:
始的最優(yōu)保費策略為逡逑叫)全邋u(0)二在(0)邋=邋—1.203正0邋+邋0.化8w0邋+邋0.日88.逡逑圖5.7描述了初始最優(yōu)保費策略UO與初始準備金rco及現(xiàn)金余額終端約束W0邋H者逡逑之間的關系。逡逑當;r0固定,u0與w0呈正線性相關,w0越大,M0越大;當w0固定,ti0與;r0呈負逡逑線性相關,:C0越大,M0越小。逡逑若我們?nèi)≌板澹剿海祪|,w0邋=邋¥1.5億,則U0邋=邋¥0.973億。這意味著如果保險公司.逡逑有初始現(xiàn)金余額¥0.5化且要求終端現(xiàn)金余額的期望達到¥1.5億,它需要收取初始保費逡逑¥0.973邋化。逡逑當0r0,w0)取值位于圖日.7中所示黃色H角區(qū)域,則初始最優(yōu)保費W0邋<邋0.這可W理逡逑解為當初始準備金X0較多而現(xiàn)金余額終端約束W日較小時,保險公司不收取初始保費逡逑反而向投保人分紅W吸引客戶群體。逡逑89逡逑
本文編號:2819398
【學位單位】:山東大學
【學位級別】:博士
【學位年份】:2015
【中圖分類】:O211.63;F830
【部分圖文】:
始的最優(yōu)保費策略為逡逑叫)全邋u(0)二在(0)邋=邋—1.203正0邋+邋0.化8w0邋+邋0.日88.逡逑圖5.7描述了初始最優(yōu)保費策略UO與初始準備金rco及現(xiàn)金余額終端約束W0邋H者逡逑之間的關系。逡逑當;r0固定,u0與w0呈正線性相關,w0越大,M0越大;當w0固定,ti0與;r0呈負逡逑線性相關,:C0越大,M0越小。逡逑若我們?nèi)≌板澹剿海祪|,w0邋=邋¥1.5億,則U0邋=邋¥0.973億。這意味著如果保險公司.逡逑有初始現(xiàn)金余額¥0.5化且要求終端現(xiàn)金余額的期望達到¥1.5億,它需要收取初始保費逡逑¥0.973邋化。逡逑當0r0,w0)取值位于圖日.7中所示黃色H角區(qū)域,則初始最優(yōu)保費W0邋<邋0.這可W理逡逑解為當初始準備金X0較多而現(xiàn)金余額終端約束W日較小時,保險公司不收取初始保費逡逑反而向投保人分紅W吸引客戶群體。逡逑89逡逑
【參考文獻】
相關期刊論文 前3條
1 LIU HuiLi;XIONG Jie;;A branching particle system approximation for nonlinear stochastic filtering[J];Science China(Mathematics);2013年08期
2 ;MAXIMUM PRINCIPLE FOR OPTIMAL CONTROLPROBLEM OF FULLY COUPLEDFORWARD-BACKWARD STOCHASTIC SYSTEMS[J];Systems Science and Mathematical Sciences;1998年03期
3 吳臻,于志勇;LINEAR QUADRATIC NONZERO-SUM DIFFERENTIAL GAMES WITH RANDOM JUMPS[J];Applied Mathematics and Mechanics(English Edition);2005年08期
本文編號:2819398
本文鏈接:http://sikaile.net/jingjilunwen/guojijinrong/2819398.html
最近更新
教材專著