非零和隨機微分博弈及相關(guān)的高維倒向隨機微分方程
本文關(guān)鍵詞:非零和隨機微分博弈及相關(guān)的高維倒向隨機微分方程 出處:《山東大學(xué)》2015年博士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 非零和隨機微分博弈 倒向隨機微分方程 納什均衡點
【摘要】:這篇學(xué)位論文主要研究了馬爾可夫框架下的多人非零和隨機微分博弈理論及其相關(guān)的高維倒向隨機微分方程。論文涵蓋四個主要結(jié)果。首先,我們考慮了一個非零和隨機微分博弈模型,其系統(tǒng)狀態(tài)過程的漂移系數(shù)不有界,而是線性增長的。同時也研究了一些擴散項系數(shù)不有界的例子。在廣義Isaacs條件下,通過證明相關(guān)的高維倒向隨機微分方程解的存在性,我們給出了納什均衡點的存在性。其創(chuàng)新點在于,這個倒向方程的生成元關(guān)于波動過程z是隨機線性增長的。第二個問題研究的是風險敏感的博弈模型,其效用泛函是指數(shù)形式,且?guī)в胁挥薪缦禂?shù)。與其相關(guān)的倒向方程是高維的,生成元為平方增長的。我們給出了納什均衡點的存在性。第三個問題研究的是帶有不連續(xù)哈密爾頓函數(shù)的bang-bang博弈問題。在這種情況下,納什均衡點存在并且是以不連續(xù)的形式呈現(xiàn)。其意義是指,控制過程不連續(xù),會在某些點發(fā)生跳,且只在控制域的邊界取值,取值取決于值函數(shù)的導(dǎo)數(shù)的正負。倒向隨機微分方程在這里是一個耦合的高維系統(tǒng),其生成元關(guān)于波動過程z是不連續(xù)的。最后,我們研究了一個遞歸的隨機微分博弈問題。其意義為瞬時效用泛函不僅與瞬時消費速率有關(guān)而且還與未來的效用有關(guān)。此模型所對應(yīng)的倒向隨機微分方程為高維,且生成元關(guān)于波動過程z隨機線性增長,關(guān)于值過程y有隨機單調(diào)性。在這篇學(xué)術(shù)論文中,主要有四個主要結(jié)果,都是有關(guān)非零和的隨機微分博弈問題。我們在這里簡單地總結(jié)這四個主要結(jié)論,并且給出文章的框架結(jié)構(gòu)。1.帶有非有界系數(shù)的零和隨機微分博弈這篇學(xué)術(shù)論文的第2章是與Hamadene教授合作發(fā)表于雜志Stochastics An Interna-tional Journal of Probability and Stochastic Processes ([64])。第2章,我們研究了一類控制對抗控制的馬爾可夫的非零和隨機微分博弈問題,其中,擴散過程σ不依賴于控制。整體框架與Hamadene et al. [58]類似。更廣泛的多人參與的情況,我們在小節(jié)1.1.3中介紹。現(xiàn)在,為了簡便,我們回憶一下兩人參與的非零和隨機微分博弈(NZSDG)的問題陳述。事實上,本章所有的結(jié)果和技巧都可以很容易的被推廣到多人的情況。一個簡單的NZSDG如下:從下文定理1.3看出,文章[58]只考慮了SDE(0.0.1)的系數(shù)f和σ是有界的情況。而系數(shù)無解的情況沒有被研究過,例如系數(shù)是線性增長的。因此第2章的主要目的為盡可能的放松系數(shù)f和σ的有界性。我們主要把f擴展到了線性增長的情況,σ的不有界性在第2章的最后擴展部分也有一些討論。以下為我們施加的具體的假設(shè)條件:假設(shè)0.1.第2章結(jié)果的創(chuàng)新性在于,給出了這個NZSDG的納什均衡點的存在性,其中漂移系數(shù)f不再是連續(xù)的,而是滿足線性增長條件。問題的陳述與Hamadene, Lepeltier andPeng (1997)[58]是類似的。但在文章[58]中,系數(shù)f是有界的。文中的方法是強烈依賴于Girsanov概率測度變換的,我們需要處理σ-1f的Doleans-Dade指數(shù)。當系數(shù)σ-1和f都是有界的時候,顯然,Doleans-Dade指數(shù)是一個概率密度。然而,當f為關(guān)于x線性增長時,這一結(jié)論就不再是這么顯而易見的了。而且,一些好的相關(guān)的BSDE的性質(zhì)和估計都需要重新證明,這就是這個工作的難點所在。用于克服這一困難的一個非常有效的工具為Haussmann(1986)的結(jié)果(見定理2.1)。定理給出了在f為線性增長的情況下,相應(yīng)的Doleans-Dade指數(shù)的可積性。根據(jù)這一結(jié)論,我們得出σ-1f的Doleans-Dade指數(shù)是在Lp空間里有界的,其中常數(shù)p落在1與2之間。這樣,即使f是線性增長的,有這個可積性結(jié)論,我們也可以順利的使用Girsanov變換。另外,根據(jù)Haussmann的結(jié)論,我們也可以給出原始概率下的期望與新概率下的期望之間的聯(lián)系。這在后文的討論技巧中起了很關(guān)鍵的作用。與[58]一樣,我們采用BSDEs的方法。命題2.1告訴我們,參與者的效用函數(shù)可以被下述的非標準的BSDEs的初始值來刻畫。那么,我們可以證明納什均衡點的存在(見定理2.1)。證明是通過比較BSDE (0.0.2)以及下面的BSDE (0.0.3),后者的生成元為依賴于反饋形式的控制的哈密爾頓函數(shù)。證明使用的是局部化技巧(localization scheme)。一旦我們可以說明BSDE (0.0.3)有解且滿足適當?shù)目煞e性條件,那么我們就有結(jié)論,這個博弈問題的納什均衡點存在,即為隨機過程((v*,v*)(t,xt0,x,Zs1,Zs2))t≤T。因此,這個問題的研究就轉(zhuǎn)化為了研究下面的BSDE:這種特殊的BSDE是高維的,每一維之間通過波動過程耦合在一起。解決這種BSDE的難點在于,生成元含ziσ-1(t, x)f(t, x, (v*, v*)(t, x, z1,z2)), i= 1,2,其中,f不有界而是關(guān)于x線性增長。在馬爾可夫框架下,我們可以看出BSDE (0.0.3)的生成元是關(guān)于波動項隨機線性增長的,或者稱為ω by ω線性增長的,或稱為隨機利普希茨的(見[8])。另外,其生成元為為帶有反饋形式控制的哈密爾頓函數(shù),且關(guān)于(z1,z2)是連續(xù)的。對帶有隨機利普希茨生成元的BSDEs的研究工作還包括Briand[15]。文章研究了含有BMO鞅的不規(guī)則生成元的BSDE。假設(shè)廣義Isaacs條件滿足,并且假設(shè)動力系統(tǒng)的漂移項的分布函數(shù)滿足Lq-domination條件,我們最終可以證明這種特殊類型的BSDE有解,從而給出納什均衡點的存在。我們可以驗證,當系數(shù)σ滿足經(jīng)典的一致橢圓性條件的時候,Lq-domination條件是成立的。我們的方法大致為:(i)構(gòu)造一列具有利普希茨系數(shù)的BSDEs的逼近序列。在馬爾可夫框架下,他們的解過程(Yn,Zn),n≥1可以通過確定性的函數(shù)(ωn,vn),n≥1來刻畫;(ii)給出(Yn,Zn)和(wn,vn)的一致估計。利用Lq-domination條件,我們可以在一個適當空間里的弱收斂結(jié)果里得到一列強收斂的子列(wnk)k≥1。這樣,我們就導(dǎo)出了子列(ynk)k1和(Znk)k1的強收斂;(iii)最終,我們可以驗證收斂列(Ynk,Znk)k≥1的極限就是原BSDE的解。總結(jié)一下,在整個的證明過程中有如下幾點比較重要:(ⅰ)Haussmann的結(jié)果:存在某個p∈(1,2)使得,對任意的容許控制(u,v),都有E[(ζT(σ-1(·,xt,x)f(·,xt,x,v.,v.)))p]∞其中ξT定義為(0.0.1);(ⅱ)Lq-domination性質(zhì)及其變形;(iii)廣義Isaacs條件。在這一章的最后,我們給出了一個示例,并且討論了一些可能的擴展情況。例如,漂移系數(shù)f及擴散系數(shù)σ都不是有界的情況。2.帶有不有界系數(shù)的風險敏感的非零和隨機微分博弈第3章與S.Hamadene教授合作完成,見[63].第3章處理的是風險敏感的NZSDG.如我們在小節(jié)1.1.4中介紹的一樣,這是一類考慮到參與者對于風險的喜好態(tài)度的博弈問題。對于其中三種風險偏好態(tài)度,包括風險厭惡、風險喜好以及風險中性的態(tài)度,我們可以閱讀小章節(jié)1.1.4來了解更多。在本文的第3章中,我們主要采用風險厭惡的模型。另外,為了討論方便,我們只采用有兩個人參與的博弈模型。事實上,這一章節(jié)的所有結(jié)果都可以被自然的推廣到多人參與的博弈問題中去。模型的建立是與標準的NZSDG類似的,見(0.0.1)。我們依然考慮系統(tǒng)的動態(tài)過程為一個擴散過程。然后我們將會建立它的弱表示形式,也就是通過Girsanov變換將原概率測度P轉(zhuǎn)換為新的概率測度Pu,。這個狀態(tài)過程的弱表示形式如下:dxst,x=f(s,xst,x,vs,vs)ds+σ(s,xst,x)dBsv,v,s∈[t,T]且xst,x=x,st.與經(jīng)典情況唯一的區(qū)別為,效用函數(shù)更加的復(fù)雜,是指數(shù)形式的。這種形式的選取在經(jīng)濟領(lǐng)域是很自然并且合適的。對一個風險敏感的NZSDG,其效用函數(shù)陳述如下:對參與者i=1,2和任意的一對容許控制(u,v),效用函數(shù)為Ji(v,v)=Ev,v[e∫0Thi(s,xs0,x,vs,vs)ds+gi(xT0,x)].這個風險敏感的NZSDG的目標為找一個NEP,也就是一對最優(yōu)的容許控制(u*,v*),使得J1(v*,v*)≤J1(v,v*)和J2(v*,v*)≤J2(v*,v)成立。注意在第3章中,所有的假設(shè)條件都與假設(shè)0.1相同:(i)擴散系數(shù)σ一致利普希茨,可逆,有界且其逆也是有界的。由這些條件可知σ滿足一致橢圓條件;(ii)漂移系數(shù)f關(guān)于x線性增長;(iii)瞬時效用hi和終端效用gi都是關(guān)于x多項式增長的,i=1,2;(iv)Isaacs條件成立;(v)帶有反饋控制的哈密爾頓函數(shù)是連續(xù)的。風險敏感的隨機微分博弈問題的研究有很多,包括非零和、零和以及平均場的情況,例如[7,36,43,44,67,95]。其中,通常的解決辦法有兩種,一種是偏微分方程法,例如[7,43,44,67,95]。另一種方法是通過倒向隨機微分方程理論,例如[36]。在第3章中,我們也是通過處理相應(yīng)的BSDE來解決風險敏感的博弈問題,方法類似于E1-Karoui and Hamadene(2003)[36]。然而,[36]只考慮了漂移系數(shù)f是有界的情況。這種限制從某種程度上來講是過于嚴格了。因此,我們的目的是盡量的放松f的有界性。我們?nèi)缯屑僭O(shè)的一樣,(見假設(shè)0.1)函數(shù)f不再是有界的,而是線性增長的。這是這篇文章的主要創(chuàng)新點。這種廣義的風險敏感的NZSDG還未被研究過。在標準NZSDG中,效用泛函是可以被相關(guān)的BSDE的初始值所刻畫。對于風險敏感的情況,也有類似的結(jié)論成立,效用泛函恰好等價于一類特殊的BSDE初始值的指數(shù)。這種等價關(guān)系,我們在第3章中陳述(見命題3.1).因此,尋找NZSDG的NEP等價于尋找如下BSDE解的存在性。這是一個帶有連續(xù)系數(shù)的高維BSDE,其生成元同時含有z的線性項和平方項。解決這類BSDE的困難之處有如下兩個方面:(i)第一個困難就是生成元中所含有的z的平方項。與標準的NZSDG相比,我們需要使用一些技巧來消除掉這個平方項。(ii)第二個困難是:生成元中有兩部分,一個為波動過程的線性部分,也就是帶有反饋控制的哈密爾頓函數(shù)。另一部分為波動過程的平方項。它們的形式為:Hi(s,x,zi,(v*,v*)(t,x,z1,z2))+1/2|zi|2=zif(s,x,z1,z2)+hi(s,x,z1,z2)+1/2|zi|2,i=1,2,其中f是關(guān)于x線性增長的。與摘要中類似,在馬爾可夫框架下,z的線性部分是隨機線性增長的,也就是ωbyω線性增長的。函數(shù)f是有界的情況已經(jīng)在[36]中被研究。我們用來克服這些困難的方法如下:(i)’為了處理z的平房部分,我們采用經(jīng)典的指數(shù)變換(見M.kobylanski et al(2000) [72]):Yi=eYi;Zi=YiZi,i=1,2.這種技巧可以將平方項消除掉。當然,作為代價,生成元中會被額外的引入值過程Yi的部分。(ii)’如經(jīng)典的情況,f的線性增長性所帶來的困難在于Girsanov變換不在是顯而易見的。我們?nèi)匀焕肏aussmann的結(jié)果來克服這一困難。見摘要,存在某個p∈(1,2),使得σ-1-f的Doleans-Dade指數(shù)形式的局部鞅是Lp可積的。這一結(jié)果可以保證我們采用Girsanov變換,從而將波動項從生成元中移出。那么我們將會更方便的得到BSDE解的可積性結(jié)果。在廣義Isaacs假設(shè)以及擴散過程的分布函數(shù)所滿足的domination性質(zhì)下,我們最終證明了,BSDE (0.0.4)有解。同時,也給出了這個風險敏感的NZSDG的納什平衡點。我們總結(jié)此方法的步驟如下:(i)首先進行經(jīng)典的指數(shù)變換從而消除掉波動項的平方部分。那么原始的BSDE將會轉(zhuǎn)換為一種生成元同時含有Y和Z的BSDE。且生成元是關(guān)于這兩個變量ωbyω線性增長的;(ii)然后,我們會使用柔化技巧(mollifier technique)。也就是選取一列帶有平滑系數(shù)的BSDEs來逼近原BSDE。這列逼近方程是有界的,因為其生成元為利普希茨連續(xù)的。另外,在馬爾可夫框架下,它們的解(Yn,Zn),n≥1可以被確定性的函數(shù)(Sn,3n),n≥1來表示。然后我們證明了Sn的指數(shù)增長性質(zhì),從而給出了(Yn,Zn)的一致可積結(jié)果。(iii)我們可以找到一列強收斂的子序列(Snk)k≥1,從而給出了子序列(Ynκ,Znκ)κ≥1的強收斂性;(iv)我們最后驗證了這個子序列(Ynκ,Znκ)κ≥1的收斂極限即為我們變形的BSDE的解。最后,我們再做對數(shù)變換,從而找到原BSDE(0.0.4)的解。3.非零和微分博弈的Bang-Bang形式的納什均衡點第4章是與Hamadene教授合作完成,并且已發(fā)表在雜志Comptes Rendus Mathe-matique中(見[62])。我們先來介紹一下這個工作的出發(fā)點。我們注意到前面有關(guān)NZSDG的工作,例如[58,54,53,76],作者關(guān)心的只是平滑的反饋控制以及哈密爾頓函數(shù)。這篇學(xué)術(shù)論文的第2章和第3章也是這樣。證明過程強烈的依賴于哈密爾頓函數(shù)的連續(xù)性(見假設(shè)0.1)。然而,對于帶有不連續(xù)控制的情況,卻沒有太多的研究工作。不連續(xù)的控制在現(xiàn)實生活中是普遍存在的,尤其是經(jīng)濟和工程領(lǐng)域。因此,本章的主要目的為研究一類馬爾可夫框架下的NZSDG。我們在一些合理的假設(shè)條件下,給出了一類不連續(xù)的納什均衡點,在本文中是以bang-bang的形式呈現(xiàn)。主要運用的工具仍然是BSDEs,在我們的情況下為高維的,且其生成元關(guān)于波動過程z是不連續(xù)的。我們現(xiàn)在簡單介紹一維情況下,兩人參與的博弈模型。更廣泛的高維以及多人參與的情況可以用類似的辦法處理。假設(shè)動力系統(tǒng)的狀態(tài)過程由下面的SDE描述,也就是對任意固定的(t,x)∈[0,T]×R,(?)s≤ T, Xst,x= x+(Ba∨t-Bt). (0.0.5)每個參與者都對系統(tǒng)施加他們自己的控制。我們設(shè)U和V為兩個有界的R上的子集,且,M1(resp.M2)為容許控制的集合。容許控制v=(vt)t≤T(resp.v=(vt)t≤T)是從[0,T]×Ω映射到U(resp.V)的P-可測的過程。記M=M1×M2。令Γ:(t,x,u,v)∈ [0,T]×R×U×V→R為這個博弈問題的動力泛函(作為狀態(tài)過程的漂移系數(shù))。關(guān)于各系數(shù)的具體假設(shè)我們稍后介紹。對任意的容許控制(u.;v.)∈M,令Pu,v為(Ω,F)上的正概率測度,其定義如下:dPt,xu,v=ζT(Γ(.,X.t,x,u.,v.))dP,ζT(θ):=1+∫0tθsζsdBs,t≤T,其中,θ:=(θt)t≤T為任意的Ft-適應(yīng)過程。在r滿足適當假設(shè)條件下,Puv,t,x為(Ω,F)下的概率測度。則,隨機過程Bu,v=(Bs-∫0sΓ(r,Xrt,x,ur,vr)dr)s≤T為(Fs,Pu,v)-布朗運動,并且(Xst,x)s≤T滿足如下的SDE,dXst,x,=Γ(s,Xst,x,us,vs)ds+dBsu,v,(?)s∈[t,T] and Xst,x=x,s∈[0,t]. (0.0.6)我們記gi:x∈R→R,i=1,2為終端效用泛函。對固定的(0,x),我們定義玩家的效用函數(shù)如下,對(u,v)∈M, J1(u,v):=Eu,v[g1(XT0,x)]且J2(u,v):=Eu,v[g2(XT0,x)],其中,對于固定的(0,x),Eu,v為概率Pu,v下的測度。我們考慮納什均衡點的存在性,i.e.一對控制(u*,v*)∈M滿足,對任意的(u,v)∈M,都有J1(u*,v*)≥J1(u,v*)且J2(u*,v*)≥J2(u*,v).我們的假設(shè)為:假設(shè)0.2.(ⅰ)容許控制(u,v)的取值集合為兩個有界的R上的子集,U=[0,1],V=[-1,1];(ⅱ)動力函數(shù)Γ為控制的仿射結(jié)合,有如下結(jié)構(gòu)Γ(t,x,u,v):f(t,x)+u+v。其中,f:(t,x)∈[0,T]×R→R為Borel可測函數(shù)。函數(shù)f是關(guān)于x線性增長的,因此,Γ也是關(guān)于x,(u,v)∈U×V一致線性增長的。(ⅲ)終端函數(shù)gi,i=1,2是關(guān)于x多項式增長的。在這個NZSDG問題的提出中有幾個重要的性質(zhì):(ⅰ)動力函數(shù)Γ并不是有界的,而是關(guān)于x線性增長的。這和之前很多關(guān)于NZSDG的文獻不同(參考[58,54,53,76])。正如摘要中解釋的一樣,由Γ的線性增長性所帶來的困難可以被一個Haussmann的結(jié)果克服(參考引理4.1)。這個結(jié)果是有關(guān)Doleans-Dade指數(shù)的可積性的。事實上,Girsanov變換可以被順利的使用,從而導(dǎo)出弱形式下的狀態(tài)過程(0.0.6)。(ⅱ)容許控制過程的值域U和V是兩個具體的R上的有界子集。.另外,動力函數(shù)Γ也有非常具體的仿射結(jié)構(gòu)。另外,在效用J1和J2中只有終端效用而沒有瞬時效用。因此,納什均衡點,如果存在,應(yīng)該是bang-bang形式的。名詞bang-bang控制來自于經(jīng)典的隨機控制理論。在我們的情況中,當r不依賴于u的時候,這個隨機微分博弈問題就會簡化為一個經(jīng)典的隨機控制問題。bang-bang控制指的是這樣一種不連續(xù)的控制,它會在某一點上有跳,并且取值于其值域的邊界上。其取值會依賴于值函數(shù)的導(dǎo)數(shù)的正負。一個經(jīng)典的形式就是Heaviside函數(shù),正如我們這篇文章中所提到的形式。我們下面來介紹bang-bang形式的納什均衡點。因為動力函數(shù)r是u和u的仿射結(jié)合。因此,我們實際上可以根據(jù)廣義的Isaacs條件來計算出最優(yōu)控制的顯示形式。令H1和H2為這個博弈問題的Hamiltonian函數(shù),也就是如下這樣的不依賴于ω,從[0,T]×R×R×U×V映射到R的函數(shù):H1(t,x,p,u,v):=pΓ(t,x,u,v)=p(f(t,x)+u+v); H2(t,x,q,u,v):=qΓ(t,x,u,v)=q(f(t,x)+u+v).現(xiàn)在,我們可以驗證,下面的控制u和v定義在R×U和R×V上,分別取值于U和V上:(?)p,q∈R,ε∈U,ε∈V,會滿足下面的廣義Isaacs條件:對任意的(t,x,p,q,u,u)∈[0,T]×R×R×U×V和(∈,ε)∈U×V,我們有,H1*(t,x,p,q,ε):=H1(t,x,p,u(p,ε),v(q,ε))≥H1(t,x,p,u,v(q,ε)), H2*(t,x,p,q,ε):=H2(t,x,q,u(p,ε),v(q,ε))≥ H2(t,x,q,u(p,ε),v). (0.0.8)我們需要著重說明的是,函數(shù)H1*(resp.H2*)不依賴于ε(resp.ε),因為,pu(p,ε)=pV0 (resp.qv(q,ε)=|q|)不依賴于ε(resp.ε)。另外,哈密爾頓函數(shù)關(guān)于(p,q)是不連續(xù)的。由(0.0.7),控制對(u,v)是bang-bang形式的。然而,它們不是反饋形式的,因為還依賴于一些常數(shù)。G.J.Olsder[85]也研究過同樣的不平滑的確定性的非零和微分博弈。最近確定性微分博弈相關(guān)的工作還有P Cardaliaguet and S.Plaskacz[24]。而P Cardaliaguet[23]給出了一種反饋形式的納什均衡點的存在唯一性。然而,其效用以一種不穩(wěn)定的形式依賴于終端信息。且我們不太容易將[24]的結(jié)果擴展到高維形式。不平滑的隨機的微分博弈工作還有P Mannucci[80]。這篇文章運用了Hamilton-Jacobi方程體系以及相關(guān)的拋物型PDE技巧。但是在[80]中,狀態(tài)過程是限制在一個有界區(qū)域中,而PDE領(lǐng)域中很多技巧在一個廣義的區(qū)域中不是顯而易見的。第4章的主要創(chuàng)新點在于我們給出了狀態(tài)過程在廣義區(qū)域上的非零和隨機微分博弈問題的bang-bang納什均衡點的存在性。并且結(jié)果可以被推廣到高維的形式。但是,反饋形式的納什均衡點的存在性還是一個未被解決的問題。像[58]一樣,我們采用BSDE的方法。這個問題最終被轉(zhuǎn)化為研究一個高維BSDE的問題。其生成元關(guān)于z不連續(xù)且關(guān)于z隨機線性增長。在廣義Isaacs條件下,我們可以證明相關(guān)的BSDE有界,從而給出了這個問題的bang-bang納什均衡點的存在。我們的主要結(jié)論可以被總結(jié)如下:定理0.1(bang-bang納什均衡點的存在).在假設(shè)0.2及廣義Isaacs條件(0.0.8)下,存在η1,η,(Y1,Z1),(Y2,Z2)和θ,v使得:(i)η1和η2為定義在[0,T]×R到R上的兩個確定性的多項式增長的可測函數(shù);(ii)(Y1,Z1)和(Y2,Z2)為兩個取值于R1+1的兩對P-可測過程;(ⅲ)θ (resp.v)是一個取值于U(resp.V)的一個P-可測過程,且滿足:(a)P-a.s.,(?)s≤T,Ysi=ηi(s,Xs0,x)且Zi(ω):=(Zsi(ω))s≤T為ds-平方可積的;(b)對所有的s≤T,另外,Y0i=Ji(v,v),i=1,2并且控制對(v(Zs1,θs),v(Zs2,vs))s≤T為這個非零和隨機微分博弈問題的bang-bang形式的納什均衡點。NZSDG和BSDEs之間的關(guān)系是用如摘要介紹的經(jīng)典方式取得。這個關(guān)系告訴我們相關(guān)BSDE的初始值恰好為這個博弈問題的效用。另外,一旦我們說明BSDE(0.0.9)有解,并且解滿足一些合適的性質(zhì),那么,NEP就是顯然存在的。這是通過對進行了概率測度變換的BSDEs的解與原方程解之間的比較而取得的,同時利用了(u,司)滿足廣義Isaacs條件(0.0.8)的事實。因此,我們工作的重心應(yīng)為證明BSDE(0.0.9)的可解性。這個方程是高維的,且其生成元關(guān)于波動過程z是不連續(xù)的。很顯然,生成元的不連續(xù)性將會是本工作的一個困難。解決BSDE(0.0.9)的方法如下:(i)我們首先構(gòu)造一列利普希茨連續(xù)的函數(shù)(un,un),n≥1來逼近不連續(xù)的函數(shù)(u,v)。以這列一致利普希茨函數(shù)為生成元的BSDEs列顯然是有解的。另外,其解序列(Yn,zn)可以由確定性的函數(shù)(ηn,ξn)來刻畫。(ii)在合適的空間上,我們給出了這些解的一致估計和函數(shù)ηn所滿足的多項式增長性質(zhì)。(iii)由一個弱收斂的結(jié)果,我們證明了序列ηn為柯西列。從而得到了(Yn,Zn)在適當空間上的強收斂結(jié)果。(iv)我們驗證了這個強收斂序列的極限即為原BSDE的解。也就是證明我們的逼近生成元序列是收斂的。我們最終得到了,當任意的常數(shù)(ε,ε)被某個隨機過程(θ,v)所取代的時候,生成元序列的子列是弱收斂到原Hamiltonian函數(shù)的。哈密爾頓函數(shù)的不連續(xù)性是在弱收斂的討論步驟中被克服的。4.遞歸的馬爾可夫非零和隨機微分博弈第5章是與吳臻教授合作完成。這一章將會在馬爾可夫框架下研究一個遞歸的非零和隨機微分博弈(Recursive NZSDG).我們簡單介紹一下問題的提出。假設(shè)有一個系統(tǒng)描述如下:dxt=δ(t,xt)dBt for t≤T and x0=x. (0.0.10)這個系統(tǒng)被兩個人控制。我們用下面的弱形式的SDE來描述:dxt=f(t,xt,ut,vt)dt+σ(t,xt)dBtv,v for t≤T and x0=x. (0.0.11)過程Bu,v為新的布朗運動,是由B運用Girsanov變換得來的。過程v=(vt)t≤T及v=(vt)t≤T代表著兩人施加在系統(tǒng)上的控制。事實上,這些控制不是免費的,會給兩個人帶來一定的代價。我們討論的遞歸形式的代價泛函,是由下面的BSDE的初始值來定義的:對i=1,2,代價泛函定義為:Ji(v,v)=y0i,v,v對于i=1,2.這個博弈問題的目的為尋找納什均衡點(u*,v*)滿足,J1(v*,v*)≤J1(v,v*)且J2(v*,v*)≤J2(v*,v)對任意的容許控制(u,u)都成立。這實際上是說,兩個人都想要最小化他們的代價,而且沒有人可以通過僅改變自己的控制行為再來削減其代價。遞歸效用的概念已經(jīng)被Duffie and Epstein[35]所考慮過。它擴展了經(jīng)典的效用函數(shù)。遞歸形式的效用所包含的瞬時效用,不僅依賴于瞬時消費速率,而且還依賴于未來的效用。這種利用BSDEs解來描述代價泛函的方式,是受El Karoui et al.[39]的啟發(fā)。遞歸的代價泛函可以被看做一類特殊的BSDE解的初始值。[39]討論了一些遞歸效用的建立以及性質(zhì)。如果函數(shù)hi不依賴于參數(shù)yi,那么代價Ji就簡化為經(jīng)典的結(jié)構(gòu),它為瞬時代價的積累再加上終端代價。一些遞歸的最優(yōu)控制問題被Wang and Wu在[96]中研究過。關(guān)于遞歸博弈問題的研究還包括[97]。文章研究了一個零和的例子。讀者可以閱讀Hamadene的一系列工作來學(xué)習(xí)經(jīng)典的不含遞歸部分的NZSDGs,例如[53,58]等。本章,我們通過BSDE的方法來研究這個遞歸的博弈問題,類似于Wei and Wu[97]。然而,在[97]中,狀態(tài)過程的漂移函數(shù)f是有界的,或者說等價于有界的。當考慮相關(guān)的BSDE時,這種有界性是非常重要的,因為這保證了BSDE生成元關(guān)于z的利普希茨性。然而,這個假設(shè)在某種程度上講太嚴格了。因此,這個工作的目的就是盡可能的放松f的有界性。我們考慮漂移函數(shù)f關(guān)于x是線性增長的情況。這種條件已經(jīng)在經(jīng)典的不含遞歸部分的博弈問題中所考慮,例如[64]及[62]。根據(jù)我們的知識,廣義的含有遞歸部分的模型還沒有被研究過。納什均衡點的存在性等價于相關(guān)的高維BSDE的解的存在性。其生成元關(guān)于z是隨機線性增長的,并且關(guān)于y有隨機單調(diào)性。在廣義Isaacs條件下,我們證明了相關(guān)BSDE的解的存在性,從而給出了這個遞歸的NZSDG問題的納什均衡點的存在。證明BSDE (0.0.12)的解的存在性的思路為:為將區(qū)間[0,T]做一個劃分。、然后首先在小區(qū)間[T-δ,T]上解這個BSDE。然后,倒向擴展到整個區(qū)間。
[Abstract]:......
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:O211.63
【相似文獻】
相關(guān)期刊論文 前10條
1 鄧喜才;左羽;;有限理性與一類多主從博弈問題的良定性[J];經(jīng)濟數(shù)學(xué);2012年03期
2 倪志偉,賈瑞玉,,程慧霞;解決一類博弈問題的神經(jīng)網(wǎng)絡(luò)系統(tǒng)[J];控制與決策;1996年02期
3 曾實松,張優(yōu)智;農(nóng)民市民化進程中農(nóng)民與政府博弈問題初探[J];成都理工大學(xué)學(xué)報(社會科學(xué)版);2004年02期
4 趙汀陽;博弈問題的哲學(xué)分析[J];北京行政學(xué)院學(xué)報;2005年03期
5 晏明智;劉慶菲;;采用競價比選方式租賃資源的博弈問題研究[J];科技廣場;2013年11期
6 王俊玲;;農(nóng)戶對農(nóng)機需求中的博弈問題分析[J];科技信息(科學(xué)教研);2007年19期
7 林厚從;;博弈問題的策略研究[J];軟件導(dǎo)刊;2010年12期
8 王煦陽;;基于合同不完全性導(dǎo)致的信譽博弈問題分析及解決方案——以養(yǎng)生館品牌建立為例[J];中國證券期貨;2013年04期
9 李小三;崔文彩;趙云勝;;企業(yè)安全投資現(xiàn)狀及其利益博弈分析[J];中國公共安全(綜合版);2007年Z1期
10 陳星;;旅游開發(fā)過程中的博弈問題[J];福建論壇(人文社會科學(xué)版);2006年S1期
相關(guān)會議論文 前2條
1 林元慶;陳加良;;關(guān)于博弈學(xué)習(xí)模型的研究[A];2001年中國管理科學(xué)學(xué)術(shù)會議論文集[C];2001年
2 李立清;;從經(jīng)濟學(xué)視角談“綠色考場”制度構(gòu)建問題[A];首屆中國經(jīng)濟論壇論文集[C];2005年
相關(guān)重要報紙文章 前3條
1 李方;汽車引發(fā)和諧思考[N];中國消費者報;2007年
2 楊柯;股市走牛 人才博弈問題顯[N];人才市場報;2007年
3 北京科技大學(xué)教授 趙曉;化解過剩產(chǎn)能不能只依靠行政壓縮[N];中國企業(yè)報;2014年
相關(guān)博士學(xué)位論文 前3條
1 穆蕊;非零和隨機微分博弈及相關(guān)的高維倒向隨機微分方程[D];山東大學(xué);2015年
2 王昭;具有模糊支付的博弈問題及其應(yīng)用研究[D];北京理工大學(xué);2006年
3 譚德慶;多維博弈及應(yīng)用研究[D];西南交通大學(xué);2004年
相關(guān)碩士學(xué)位論文 前10條
1 張芬;基于最優(yōu)控制的微分博弈問題研究[D];云南師范大學(xué);2015年
2 姜小華;偷稅與反偷稅,政府與企業(yè)稅收博弈問題研究[D];浙江大學(xué);2002年
3 范國強;若干排序博弈問題的協(xié)調(diào)機制研究[D];中國海洋大學(xué);2014年
4 熊文耀;非零和隨機微分投資組合博弈問題研究[D];中南大學(xué);2013年
5 張春紅;均值—方差及隨機微分博弈問題研究[D];中南大學(xué);2012年
6 諸栗;易逝品需求不確定的供應(yīng)鏈主從博弈問題[D];天津大學(xué);2007年
7 黃俏玲;零和隨機微分投資組合博弈問題[D];中南大學(xué);2013年
8 劉春麗;我國文獻信息資源共享博弈問題研究[D];東北師范大學(xué);2005年
9 宋鵬;面向承運人與發(fā)貨人的調(diào)度博弈問題研究[D];上海交通大學(xué);2011年
10 李靜;時間一致均值—方差投資組合博弈問題[D];中南大學(xué);2014年
本文編號:1378558
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/1378558.html