帶平均場的線性二次正倒向隨機(jī)對策問題

發(fā)布時(shí)間：2018-02-02 19:41

本文關(guān)鍵詞： 線性二次平均場對策大人口系統(tǒng) 正倒向隨機(jī)微分方程主-從問題部分信息隨機(jī)最大值原理脈沖控制　出處：《山東大學(xué)》2016年博士論文　論文類型：學(xué)位論文

【摘要】：博弈論是一項(xiàng)關(guān)于戰(zhàn)略決策的研究,一般來說,它是來研究聰明理性的決策者之間合作和沖突數(shù)學(xué)模型的,主要應(yīng)用于經(jīng)濟(jì)學(xué)、政治學(xué)、心理學(xué)、邏輯學(xué)、計(jì)算機(jī)科學(xué)、生物學(xué)等。這個(gè)課題首先提出了零和博弈,指的是一個(gè)人的收益恰好等于其他參與者(們)的凈損失。然而今天,博弈論適用于大范圍的行為關(guān)系,并已經(jīng)發(fā)展成為決策科學(xué)邏輯性方面的一個(gè)涵蓋性術(shù)語。在很多社會、經(jīng)濟(jì)和工程模型中,涉及到的個(gè)人或參與者有相互沖突的目標(biāo),因此更適合考慮基于個(gè)人收益或成本的優(yōu)化問題。在此情形下,非合作博弈理論研究方法一定程度上基于經(jīng)濟(jì)學(xué)、社會科學(xué)等的相關(guān)工作產(chǎn)生了。在現(xiàn)存的文獻(xiàn)中,隨機(jī)動(dòng)態(tài)對策和合作問題的研究可以追溯到20世紀(jì)六十年代(請參閱[1,2,3,4])。在最優(yōu)控制背景下弱互聯(lián)系統(tǒng)在[5]中進(jìn)行了研究,并且在兩人非合作非線性動(dòng)態(tài)對策設(shè)定下Nash均衡在[6]中進(jìn)行了分析。近年來,受控的隨機(jī)大人口(也稱作多主體)系統(tǒng)由于其廣泛的出現(xiàn)在政治、經(jīng)濟(jì)、工程等領(lǐng)域而變得非常重要。后來,這類系統(tǒng)的動(dòng)態(tài)優(yōu)化或者控制吸引了研究群體一致的強(qiáng)烈的關(guān)注。受控的大人口系統(tǒng)最大的特點(diǎn)在于考慮可忽略主體的存在性,他們單個(gè)來看是可以被忽略的,但是他們的集體行為將會給所有主體施加某種顯著的影響。這種特點(diǎn)能被個(gè)人動(dòng)態(tài)系統(tǒng)和(或)代價(jià)泛函中的整個(gè)人群的狀態(tài)均值所表示的弱耦合結(jié)構(gòu)表現(xiàn)出來。在這種方式下,所有主體中微觀模式下的個(gè)人行為可以和宏觀模式下的集體行為聯(lián)系起來。這種動(dòng)態(tài)系統(tǒng)和泛函中的弱耦合用來模擬競爭的決策者之間的互動(dòng)影響。特別的,這種動(dòng)態(tài)耦合表明了環(huán)境對個(gè)人決策的影響,并且這種潛在的模型采用的是個(gè)人控制的弱耦合擴(kuò)散形式。值得注意的是由于大人口系統(tǒng)中高度復(fù)雜的耦合結(jié)構(gòu),考慮所有主體的精確狀態(tài)而得到的經(jīng)典策略證明是無效、不可行的。作為一種選擇,研究相關(guān)的只考慮自己個(gè)人狀態(tài)和某個(gè)外生變量的狀態(tài)變的更容易駕馭和有效。對于大人口的帶平均場結(jié)構(gòu)的隨機(jī)動(dòng)態(tài)對策問題,Nash確定性等價(jià)理論最初是由Huang、Caines和Malhame的一系列文章發(fā)展起來的。大規(guī)模的線性控制系統(tǒng)的優(yōu)化問題在[7]中呈現(xiàn)出來,其中許多的主體通過各自的狀態(tài)相互耦合,而代價(jià)泛函是“個(gè)人到集體”的形式。然后一個(gè)明確的非線性McKean-Vlasov馬爾科夫過程模型的一般性表達(dá)在[8,9,10]中有了發(fā)展。本論文主要專注于大人口系統(tǒng)在線性二次情形下的研究,其中狀態(tài)方程對狀態(tài)是線性的并帶有非齊次項(xiàng),代價(jià)泛函是二次的�；仡櫰饋�,線性系統(tǒng)和其相關(guān)的線性二次控制已經(jīng)有了廣泛的研究,這樣的控制問題稱為線性二次最優(yōu)控制問題。關(guān)于一些經(jīng)典的確定性線性二次問題的結(jié)果,讀者可以參閱[11]。對于隨機(jī)情形,這些問題可參閱[12,13]。系統(tǒng)的介紹隨機(jī)線性二次最優(yōu)控制問題可見[14]的相關(guān)段落和其中的文獻(xiàn)。其他相關(guān)的文獻(xiàn)包括[15,16,17]等。由于線性二次非常好的結(jié)構(gòu),所以存在著豐富的線性二次描述的大人口問題的相關(guān)文獻(xiàn)。大人口系統(tǒng)中的線性二次對策問題和ε-Nash均衡性質(zhì)在[18]中有了研究和證明,其中每個(gè)主體的動(dòng)態(tài)系統(tǒng)是不一致的。在[19]中,作者求解Hamilton-Jacobi-Bellman 和 Kolmogorov-Fokker-Plank方程,并且發(fā)現(xiàn)了線性反饋形式顯式的Nash均衡點(diǎn)。[20]旨在研究一類含有N個(gè)決策者的線性二次控制問題,其中基本目標(biāo)是最小化一個(gè)社會成本作為N個(gè)獨(dú)立的帶有平均場結(jié)構(gòu)的泛函之和。后來,[21]提供了一類線性二次框架下一般的平均場對策問題的綜合性研究。關(guān)于線性二次大人口問題更詳盡的結(jié)果,請參閱[22,23,24]等。作為博弈論一個(gè)新的分支,平均場博弈起因于多個(gè)領(lǐng)域,例如,粒子物理學(xué)、經(jīng)濟(jì)學(xué)、生物學(xué)等。在粒子物理學(xué)的很多情形下,通過引入一個(gè)或多個(gè)“平均場”來充當(dāng)描繪粒子間相互作用的媒介,這樣構(gòu)建的逼近方式是非常優(yōu)越的。在這類模型中,通過假設(shè)每個(gè)粒子都是無窮小的來描繪每個(gè)粒子對于構(gòu)建平均場的貢獻(xiàn)和平均場對于每個(gè)粒子的影響,也就是,通過令粒子的數(shù)目N→+∞,采用一類極限過程。在博弈論中,站在數(shù)學(xué)的立場上是涉及了當(dāng)N趨于無窮的時(shí)候,研究一大類N人對策問題。通常的,N人微分對策證明是不易處理的。幸運(yùn)的是,事情可以被簡化,至少當(dāng)參與者數(shù)量增加,就參與者而言,這種對策問題是對稱的。實(shí)際上,個(gè)人與個(gè)人之間的復(fù)雜策略將無法被參與者實(shí)施,因?yàn)楫?dāng)參與者人數(shù)增多的時(shí)候,每個(gè)人會漸漸的在別人的視野中消失。在過去數(shù)十年中,研究平均場博弈及其應(yīng)用的相關(guān)文獻(xiàn)越來越多。對此類對策問題,密切相關(guān)卻獨(dú)立發(fā)展的研究,請參閱[25,26,27]�；谶@些結(jié)果,這條研究路線又吸引了很多注意。一些近期的文獻(xiàn)包括[28,29,30,31],其中涉及了很多平均場博弈論的研究。關(guān)于平均場博弈的一些介紹和例子由[28]給出。[29]主要給出了一類帶平均場相互作用的隨機(jī)微分對策問題的完整的概率分析。[30]主要討論和比較了兩類當(dāng)參與者人數(shù)趨于無窮時(shí)隨機(jī)微分對策的近似方法。另外,[31]處理了一個(gè)銀行間的借入和借出模型,并分析了系統(tǒng)風(fēng)險(xiǎn)。平均場型控制近年來也有了廣泛的研究。[32]得到了平均場倒向隨機(jī)微分方程以及相關(guān)的平均場隨機(jī)微分方程作為一個(gè)高維正倒向隨機(jī)微分方程系統(tǒng)的極限。后來,在[33]中作者深入調(diào)查了帶有一般系數(shù)的此類平均場倒向隨機(jī)微分方程并提出了相關(guān)的偏微分方程�；谶@些研究,[34]和[35]獨(dú)立的研究了平均場型最優(yōu)控制問題,其中控制域是凸的,這也可被[36]中的結(jié)果所涵蓋。此外,[37]提供了平均場型的完全耦合的正倒向隨機(jī)微分方程的解的存在性結(jié)果。更多的關(guān)于平均場型的對策和控制的文獻(xiàn),請參閱[38,39,40,41,42,43,44,45,46,47,48,49,50]等。值得指出的是,平均場型對策和平均場型控制之間有很多區(qū)別。一般來說,像[29,30,31]所引出的那樣,本質(zhì)上平均場型對策和平均場型控制在所采用的方法和得到的均衡上是不同的。準(zhǔn)確的說,平均場型對策的方法是“不同步”—型。它是首先固定或凍結(jié)狀態(tài)平均值xt(N)(線性情形)或者經(jīng)驗(yàn)測度地t(非線性情形)來把初始問題轉(zhuǎn)化成為標(biāo)準(zhǔn)的但是以固定項(xiàng)作為參數(shù)的問題。這個(gè)固定項(xiàng)在這一步仍然是未確定的。下一步,這個(gè)受參數(shù)影響的標(biāo)準(zhǔn)問題可以被求解并且得到最優(yōu)狀態(tài)。這樣的控制稱為分散化控制。然后,這個(gè)固定的狀態(tài)均值或是經(jīng)驗(yàn)測度可以進(jìn)一步由不動(dòng)點(diǎn)分析和最優(yōu)系統(tǒng)相關(guān)的連續(xù)性條件確定出來。在這個(gè)意義下,狀態(tài)均值(或是經(jīng)驗(yàn)測度)和未定的平均場對策將會“不同步”變化。與之相比,在平均場型控制問題中,狀態(tài)均值或者經(jīng)驗(yàn)測度將不再被事先固定或凍結(jié)。實(shí)際上,它們會隨著未定的控制變化而變化。在這種方式下,狀態(tài)均值項(xiàng)和狀態(tài)本身被視為“同步”-型。值得注意的是在上面提到的文獻(xiàn)中,所有的參與者之間相比是微不足道的,也就是說他們不會以單個(gè)的方式影響整個(gè)群體。相對的,他們將會以群體狀態(tài)平均值的統(tǒng)一模式施加影響。在此情形下,所有參與者可以視為同事。一個(gè)實(shí)際的例子是生產(chǎn)同類產(chǎn)品的市場價(jià)格信息。每個(gè)公司產(chǎn)量如此之小使得單個(gè)公司的產(chǎn)量不能影響兄弟公司的行為。然而,所有公司的平均產(chǎn)量將會決定此產(chǎn)品的市場價(jià)格。所有的小公司都采取這個(gè)價(jià)格模式,所以他們進(jìn)一步的相互作用并且通過價(jià)格信息機(jī)制耦合在一起。上面的討論是基于假設(shè)所有的人平等的參與到市場價(jià)格信息中來。然而,在現(xiàn)實(shí)中我們知道參與者地位和角色的不同在現(xiàn)實(shí)狀況中的詮釋有顯著不同。例如,小的單個(gè)個(gè)人的決策總是受某些“領(lǐng)導(dǎo)”群體或者“主導(dǎo)”機(jī)構(gòu)的影響。在我們的價(jià)格信息例子中,這樣的“領(lǐng)導(dǎo)”群體可以被理解為一些壟斷公司,他們有著相當(dāng)大的產(chǎn)量因此會對價(jià)格施加更多顯著的影響。至于那些“主導(dǎo)”機(jī)構(gòu),可以被視為當(dāng)?shù)卣?因?yàn)樗漠a(chǎn)業(yè)政策將會很大程度的影響所有公司的生產(chǎn)行為。相反的,小的公司也會通過市場價(jià)格影響政府的決策。個(gè)重要的影響當(dāng)?shù)卣疇顟B(tài)的因素—生產(chǎn)的稅收,將會依賴于形成的市場價(jià)格。上面的討論暗示了所謂的主-從參與者模型。更確切的,讓我們通過下面的石油開采例子指出來。在原油開采過程中,單個(gè)石油開采公司總是希望開采更多的石油,從而獲得更多的利潤。這此狀態(tài)下,他們的開采計(jì)劃總是傾向于盡量少的考慮宏觀因素,比如石油資源有限、可能出現(xiàn)的環(huán)境代價(jià)和開采過程中的長期受益。另一方面,這些因素更多的是相關(guān)的監(jiān)督部門或當(dāng)?shù)卣紤]的。不像單個(gè)的石油公司,他們更關(guān)心行業(yè)的可持續(xù)發(fā)展和石油部門的綜合效益。因此,他們將作為主要參與者實(shí)施一些宏觀調(diào)控政策。所有小公司(作為從屬參與者)當(dāng)制定生產(chǎn)計(jì)劃時(shí)應(yīng)該遵循這些政策。所以,所有的單個(gè)小生產(chǎn)公司組成了從屬參與者部分,并且依賴他們的集體行為(狀態(tài)平均值)來進(jìn)一步影響當(dāng)?shù)卣?主要參與者)。進(jìn)而主從大人口系統(tǒng)和相關(guān)的平均場對策被廣泛的研究�；仡欀暗墓ぷ�,[51]通過分析一個(gè)無窮集合,并且所有從屬參與者可分為K類討論了主從參與者大人口系統(tǒng)問題。后來,[52]考慮了主從關(guān)系模型的線性二次問題,這里直接把平均場項(xiàng)z作為一個(gè)隨機(jī)過程且系數(shù)是隨機(jī)的。再后來,[53]研究了非線性隨機(jī)動(dòng)態(tài)系統(tǒng)大人口對策問題,其中有一個(gè)主要參與者和N個(gè)從屬參與者,得到ε.N-NaSh均衡性質(zhì),且有εN=O(1/(?)).此外,[54]導(dǎo)出了一個(gè)對策問題,其中收益/消費(fèi)由一個(gè)受控的倒向隨機(jī)微分方程定義,且假設(shè)系數(shù)關(guān)于控制參量滿足嚴(yán)格的凹-凸性。在大多數(shù)控制問題中,我們都假設(shè)信息是可以被完全觀測到的。然后,在現(xiàn)實(shí)中卻未必總是合理的。由于參與者在社會中角色、地位、方法等的不同,所觀測的內(nèi)容也不盡相同。進(jìn)而由于有限的數(shù)據(jù),隱藏的過程或是噪聲觀測等,很多控制問題更適合用部分信息框架來描述。部分信息下的隨機(jī)控制問題在[55]中有了大量的回顧。也有其他的關(guān)于部分可觀測的隨機(jī)控制系統(tǒng)的文獻(xiàn),先前的工作請參閱[56,57,58,59,60,61,62,63],近期的工作請看[64,65,66,67,68,69,70,71,72,73]。對于部分可觀測隨機(jī)微分對策,可參閱[74,75,76]和其中的文獻(xiàn)。值得注意的是,一類帶噪聲觀測的線性二次平均場對策問題也在[77]中進(jìn)行了研究,問題定義在無窮時(shí)間區(qū)間,故而代數(shù)Riccati方程由此引入。另外,在[77]中,由于沒有公共噪聲,所以極限的狀態(tài)均值是確定性的函數(shù),這跟本論文中相關(guān)問題的處理是不一樣的。非常重要的一點(diǎn)是在上述所有的大人口系統(tǒng)問題相關(guān)工作中,所有參與者的狀態(tài)都描述為初始條件給定的(正向)隨機(jī)微分方程。進(jìn)一步的,在此問題中,參與者們的目標(biāo)是最小化他們的目標(biāo)泛函,當(dāng)然其中涉及了終端狀態(tài)。隨著倒向隨機(jī)微分方程廣泛的研究和應(yīng)用,我們很自然的考慮大人口問題在此框架下的動(dòng)態(tài)優(yōu)化問題。實(shí)際上,倒向大人口系統(tǒng)的動(dòng)態(tài)優(yōu)化問題啟發(fā)于很多情形。例如,在動(dòng)態(tài)經(jīng)濟(jì)模型中,參與者有某種遞歸效用或是非線性期望,或者一些生產(chǎn)計(jì)劃需要有些追蹤的終端目標(biāo)卻受平均產(chǎn)量導(dǎo)致的價(jià)格因素影響。另一個(gè)實(shí)例源自于風(fēng)險(xiǎn)管理問題,這時(shí)考慮的是基于整個(gè)部門所有同事平均表現(xiàn)的相關(guān)或相對標(biāo)準(zhǔn)。這就像一個(gè)給定的養(yǎng)老基金通過設(shè)定平均表現(xiàn)(比如,平均套期保值成本,起存金額,盈余)作為一個(gè)基準(zhǔn)來衡量自身的表現(xiàn)。此外,受[78]啟發(fā),帶有終端約束的受控的正向大人口系統(tǒng),可以被重新描述為某個(gè)倒向大人口系統(tǒng)。不同于隨機(jī)微分方程,倒向隨機(jī)微分方程的的終端而不是初始條件事先被明確。作為一個(gè)重要的特點(diǎn),倒向隨機(jī)微分方程的解是個(gè)適應(yīng)對(yt,Zt),其中解的第二部分磊很自然的由鞅表示定理呈現(xiàn)出來,且使得紈滿足適應(yīng)性要求。關(guān)于倒向隨機(jī)微分方程,有著非常豐富的理論和應(yīng)用結(jié)果。線性倒向隨機(jī)微分方程首先是在[79]中考慮的。1990年,Pardoux-Pen g[80]首先引入了非線性倒向隨機(jī)微分方程,建立了倒向方程在標(biāo)準(zhǔn)Lipschitz條件下的解的存在唯一性定理�；谶@一開創(chuàng)性工作,倒向隨機(jī)微分方程理論得以在各個(gè)領(lǐng)域迅速發(fā)展開來,例如,數(shù)理金融、偏微分方程、隨機(jī)控制和微分對策,泛函分析等。獨(dú)立的,[81]提出了隨機(jī)微分遞歸效用,這是標(biāo)準(zhǔn)效用的廣義化,其中瞬時(shí)的效用不僅依賴于瞬時(shí)的消費(fèi)率,而且依賴于將來的效用。像[82]中提到的那樣,效用過程可以被視為一個(gè)特殊倒向隨機(jī)微分方程的解。[82]也從倒向方程的角度給出了遞歸效用的表達(dá)和他們的性質(zhì)。一個(gè)倒向隨機(jī)微分方程和一個(gè)隨機(jī)微分方程耦合在一起,構(gòu)成了一個(gè)正倒向隨機(jī)微分方程。進(jìn)而,在一些實(shí)際背景下,正倒向大人口動(dòng)態(tài)優(yōu)化問題也自然出現(xiàn)了。一個(gè)經(jīng)典的情況是帶終端約束的大人口系統(tǒng)(例如,[83])。在這種情況下,標(biāo)準(zhǔn)的正向隨機(jī)控制問題可以很好的由某個(gè)正倒向控制問題逼近。在過去的幾十年中,正倒向隨機(jī)微分方程已有很多研究成果。關(guān)于解的存在唯一性,有一些著名的結(jié)果。壓縮映射方法首先在[84]中應(yīng)用,后來在[85]中詳細(xì)說明。當(dāng)時(shí)間區(qū)間T充分小時(shí),這個(gè)方法是非常好的。另一個(gè)方法稱為“四步框架”([86]),這是第一個(gè)移除對時(shí)間區(qū)間限制的馬爾科夫正倒向隨機(jī)微分方程的解決辦法。然后是連續(xù)性方法,首先由[87]和[88]提出,后來經(jīng)[89]和[90]發(fā)展,這類方法可以處理任意時(shí)間區(qū)間的非馬氏正倒向方程。關(guān)于這些方法的詳盡內(nèi)容,請參閱[91]這本書。近來,在[92]中,作者找到了一個(gè)統(tǒng)一的框架可以綜合所有存在的方法,并克服了一些非馬氏正倒向方程中長期未解決的困難。關(guān)于正倒向隨機(jī)微分方程更多的理論和應(yīng)用結(jié)果,請參閱以下相關(guān)文獻(xiàn)[93,94,95,96,97,98,99,100,101,102,103,104,105,106]。根據(jù)狀態(tài)相互依賴的特點(diǎn),正倒向隨機(jī)微分方程可以分為兩類：部分耦合和完全耦合正倒向方程。前者指的是倒向狀態(tài)yt(或正向狀態(tài)xt)依賴于正向狀態(tài)xt(或倒向狀態(tài)yt),但是xt(yt)并不依賴yt(xt),這更能來表達(dá)遞歸效用和非線性期望(請參閱,例如[83,68,41])。實(shí)際上,正向狀態(tài)xt通常表示某些未定資產(chǎn)的動(dòng)態(tài)系統(tǒng),倒向狀態(tài)yt代表了決策者的非線性期望或遞歸效用。而遞歸效用依賴于未定資產(chǎn)是很自然和合理的。相反的,未定權(quán)益是不能被采用的遞歸效用所影響的。不僅如此,在數(shù)學(xué)上,描述和研究完全耦合的正倒向隨機(jī)微分方程(正倒向狀態(tài)互相依賴)有很高的理論價(jià)值。與以上正倒向隨機(jī)微分方程驅(qū)動(dòng)的對策問題不同的是,一些受其他機(jī)制影響的隨機(jī)最優(yōu)控制問題,也在實(shí)踐中有著非常廣泛的應(yīng)用,比如脈沖控制、時(shí)間延遲、體制切換系統(tǒng)等。而考察這樣最優(yōu)控制的隨機(jī)最大值原理,在理論研究和實(shí)際應(yīng)用中有著極為重要的作用。最大值原理— 最優(yōu)控制的必要條件,首先由Pontryagin等人的團(tuán)隊(duì)[107]在十世紀(jì)五六十年代提出和研究的。Bismut [79]引入了線性倒向隨機(jī)微分方程作為伴隨方程,這在隨機(jī)控制理論的發(fā)展中起到了里程碑的作用。隨著Pardoux-Peng [80]非線性倒向隨機(jī)微分方程理論的建立,一般的隨機(jī)最大值原理由彭實(shí)戈教授在[108]中通過引入二階伴隨方程得到。隨后,彭教授[109]首先研究了控制域?yàn)橥辜瘯r(shí)正倒向控制系統(tǒng)的隨機(jī)最大值原理。由于倒向隨機(jī)微分方程和正倒向隨機(jī)微分方程在數(shù)理金融、經(jīng)濟(jì)學(xué)等廣泛的應(yīng)用,我們很自然的考慮正倒向隨機(jī)微分方程的最優(yōu)控制問題。在這方面,有豐富的結(jié)果可供查閱,比如[94,110,111,68,112]及其中的文獻(xiàn)。不久前,吳臻教授[106]建立了一般的正倒向隨機(jī)系統(tǒng)的最大值原理,其中控制域是非凸的,且擴(kuò)散項(xiàng)系數(shù)顯式的含有控制變量。這對一般的正倒向隨機(jī)系統(tǒng)最大值原理的發(fā)展做了極大的推動(dòng)。隨著隨機(jī)控制理論的蓬勃發(fā)展,隨機(jī)脈沖控制問題也因?yàn)槠鋸V泛的應(yīng)用而獲得了大量的研究,主要體現(xiàn)在帶交易費(fèi)用的證券投資組合優(yōu)化問題([113,114])和不同幣種間交易率最優(yōu)策略問題([115,116])。Korn [117]也考察了脈沖控制在數(shù)理金融方面的很多應(yīng)用。關(guān)于脈沖控制的綜合研究,可參閱[118]。Wu and Zhang[103]首先研究了帶脈沖控制的正倒向隨機(jī)系統(tǒng)最大值原理,其中假設(shè)正則控制域是凸的,且得到了必要和充分條件。后來,在[119]中作者也考慮了正倒向系統(tǒng)含脈沖控制問題,這里正則控制域未必是凸集,而擴(kuò)散項(xiàng)系數(shù)不含控制。近年來,體制切換模型在金融和隨機(jī)控制中的應(yīng)用獲得了持續(xù)研究。相對于基于擴(kuò)散過程的傳統(tǒng)系統(tǒng)來說,經(jīng)驗(yàn)看來,體制切換模型顯得更有意義。特別的,它可以表征為時(shí)間連續(xù)、狀態(tài)有限的馬爾科夫鏈,其中每個(gè)狀態(tài)表示一個(gè)系統(tǒng)的體制或是一個(gè)經(jīng)濟(jì)指標(biāo)的水平�；谇袚Q模型,在期權(quán)定價(jià)、投資組合管理、風(fēng)險(xiǎn)管理等領(lǐng)域開展了很多工作。在[120]中,Crepey主要研究金融中的定價(jià)方程。Crepey and Matoussi[121]研究了帶馬爾科夫鏈的反射倒向隨機(jī)微分方程。對于帶體制切換模型的控制問題,Donnelly在[122]中調(diào)查了充分最大值原理。利用帶馬爾科夫鏈的倒向隨機(jī)微分方程的結(jié)果[120,121],Tao and W u [123]導(dǎo)出了正倒向體制切換模型的最大值原理。此外,他們也在[124]中研究了體制切換倒向方程的弱收斂。除此之外,延遲的隨機(jī)系統(tǒng)也有很多實(shí)際背景,例如經(jīng)濟(jì)、金融、管理、工程、決策學(xué)等(見Arriojas等[125],Mohammed [126,127])。主要原因是在這些領(lǐng)域的很多現(xiàn)象中,依賴過去是非常普遍的,也就是說他們在t時(shí)刻的行為不僅依賴于t時(shí)刻情形,也依賴于他們的歷史。這樣的模型可被描述為隨機(jī)微分延遲方程。然而,延遲系統(tǒng)由于其延遲效應(yīng)而變得難以處理,不僅是在處理無窮維問題時(shí),而且在于處理軌線延遲部分缺乏It6公式。為了克服這些困難,可以考慮很多特別的系統(tǒng)分類,比如(?)ksendal and Sulem [128]。受以上研究的啟發(fā),論文主要考慮兩類帶脈沖控制的正倒向隨機(jī)最優(yōu)控制問題的最大值原理,一類是帶脈沖的正倒向體制切換系統(tǒng),另一類是帶脈沖的正倒向延遲系統(tǒng)。在第一類中,系統(tǒng)由正倒向隨機(jī)微分方程驅(qū)動(dòng),且所有系數(shù)都含有馬爾科夫鏈。此情況相對于[123]和[103,119]顯得更為復(fù)雜。在第二類中,系統(tǒng)由正倒向隨機(jī)微分延遲方程描述,控制變量包括正則控制和脈沖控制,且都有時(shí)間延遲。我們知道隨機(jī)微分方程和倒向隨機(jī)微分方程之間有很好的對偶關(guān)系。Peng and Yang [129]引入一類新的倒向隨機(jī)微分方程稱為超前倒向隨機(jī)微分方程,且在隨機(jī)微分延遲方程和超前倒向隨機(jī)微分方程之間建立了對偶關(guān)系。利用超前倒向方程的理論和對偶方法,Chen and Wu [130]首先得到了狀態(tài)和控制都含延遲的控制系統(tǒng)最大值原理。后來,Yu[131]研究了含脈沖控制的延遲控制系統(tǒng)最大值原理,其中動(dòng)態(tài)系統(tǒng)由隨機(jī)延遲系統(tǒng)驅(qū)動(dòng),且正則控制是凸的。更多的關(guān)于延遲系統(tǒng)的文獻(xiàn),請參閱[132,133,134]和其中的參考文獻(xiàn)。論文具體組織如下：正倒向框架下大人口動(dòng)態(tài)優(yōu)化問題在第一章中進(jìn)行了闡述,并且研究了部分耦合的正倒向隨機(jī)微分方程驅(qū)動(dòng)的帶平均場的線性二次對策問題。對單個(gè)參與者,我們得到了輔助跟蹤系統(tǒng)的最優(yōu)控制。由于此Hamiltonian系統(tǒng)的二維特性,解耦過程中需要四個(gè)Riccati方程和兩個(gè)常微分方程。進(jìn)一步的,分散化策略可以通過連續(xù)性條件和逼近結(jié)構(gòu)得到。另外,基于一些正倒向微分方程的估計(jì),我們也可證明初始問題的ε-Nash均衡性質(zhì)。我們在第二章里進(jìn)一步考慮了倒向的大人口線性二次對策問題,這里每個(gè)人的狀態(tài)服從倒向隨機(jī)微分方程。由于倒向方程的存在,使得此問題與之前存在的線性二次平均場對策問題很不一樣,因?yàn)榇嬖诘奈墨I(xiàn)中參與者的狀態(tài)服從(正向)隨機(jī)微分方程。這里每個(gè)參與者的動(dòng)態(tài)系統(tǒng)通過狀態(tài)均值弱耦合在一起,并且觀測的信息是完全的。我們得到了極限過程的顯式形式,并且研究了初始問題的ε-Nash均衡性質(zhì)。主-從框架下大人口系統(tǒng)在第三章中有所研究,其中主參與者的動(dòng)態(tài)系統(tǒng)由某個(gè)終端給定的倒向隨機(jī)微分方程描述,而從屬參與者的系統(tǒng)由初始條件給定的隨機(jī)微分方程驅(qū)動(dòng)。在這種情況下,主參與者的目標(biāo)變?yōu)樽钚』蕾嚦跏紶顟B(tài)的代價(jià)泛函,而從屬參與者試圖最小化依賴于終端狀態(tài)的代價(jià)泛函。不僅如此,主參與者也考慮了與從屬參與者的相對表現(xiàn)。相關(guān)的帶平均場的線性二次對策問題獲得了討論且得到了分散化策略。這時(shí)一個(gè)與主參與者狀態(tài)相關(guān)的隨機(jī)過程由此引入作為從屬參與者狀態(tài)均值的逼近。進(jìn)一步得到一個(gè)輔助的平均場隨機(jī)微分方程和一個(gè)3×2正倒向隨機(jī)微分方程系統(tǒng)。這里,3×2正倒向系統(tǒng)是由三個(gè)正向和三個(gè)倒向方程組合而成。在[88]和[104]引入的單調(diào)條件的幫助下,我們得到了這個(gè)正倒向方程解的適定性。最后,初始問題的ε-Nash均衡性質(zhì)得到證明且有ε=O(1/(?))。第四章主要討論了大人口系統(tǒng)在部分信息結(jié)構(gòu)下的動(dòng)態(tài)優(yōu)化問題。這里,單個(gè)參與者只能觀測到各自潛在的布朗運(yùn)動(dòng)生成的信息流。在這樣的設(shè)定下,狀態(tài)均值的極限變?yōu)楣膊祭蔬\(yùn)動(dòng)驅(qū)動(dòng)的某個(gè)隨機(jī)過程。在此框架下,提出了兩類平均場對策問題：一類是由正向動(dòng)態(tài)系統(tǒng)驅(qū)動(dòng)的,另一類是倒向驅(qū)動(dòng)。在正向情形,我們得到與之相關(guān)的平均場對策和某個(gè)Riccati方程系統(tǒng)。在倒向情形,分散化策略的顯式結(jié)構(gòu)和極限過程滿足的倒向隨機(jī)微分方程也可得到。在兩種情形下,我們都可證明ε-Nash均衡性質(zhì)。第五章研究了兩類帶脈沖的正倒向隨機(jī)最優(yōu)控制問題的最大值原理。第一類是關(guān)于帶脈沖的正倒向體制切換系統(tǒng),我們通過利用對正則控制的針狀變分和對脈沖控制的凸變分,得到了隨機(jī)最大值原理。應(yīng)用最大值原理到一個(gè)金融投資-消費(fèi)模型中,我們獲得了最優(yōu)消費(fèi)過程并分析了幾個(gè)經(jīng)濟(jì)因素對消費(fèi)的影響。第二類是關(guān)于帶脈沖的正倒向延遲系統(tǒng),主要的技術(shù)特色是分析了隨機(jī)延遲方程和超前倒向方程的對偶關(guān)系,并證明了超前正倒向隨機(jī)微分延遲方程和相應(yīng)的變分方程的有關(guān)估計(jì)。在一些附加的凸性假設(shè)下,我們也可證明充分的最優(yōu)性條件,這將在金融中的策略選擇問題中有著潛在的應(yīng)用。
[Abstract]:......
【學(xué)位授予單位】：山東大學(xué)
【學(xué)位級別】：博士
【學(xué)位授予年份】：2016
【分類號】：F224.32
，

本文編號：1485317

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/jingjilunwen/qihuoqq/1485317.html

上一篇：高頻農(nóng)產(chǎn)品期貨波動(dòng)率和相關(guān)性預(yù)測——基于Realized Copula-DCC模型的視角
下一篇：基于MRS Copula-GJR-Skewed-t模型的股指期貨套期保值研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

帶平均場的線性二次正倒向隨機(jī)對策問題