天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟(jì)論文 > 期貨論文 >

帶平均場的線性二次正倒向隨機(jī)對策問題

發(fā)布時間:2018-02-02 19:41

  本文關(guān)鍵詞: 線性二次 平均場對策 大人口系統(tǒng) 正倒向隨機(jī)微分方程 主-從問題 部分信息 隨機(jī)最大值原理 脈沖控制 出處:《山東大學(xué)》2016年博士論文 論文類型:學(xué)位論文


【摘要】:博弈論是一項關(guān)于戰(zhàn)略決策的研究,一般來說,它是來研究聰明理性的決策者之間合作和沖突數(shù)學(xué)模型的,主要應(yīng)用于經(jīng)濟(jì)學(xué)、政治學(xué)、心理學(xué)、邏輯學(xué)、計算機(jī)科學(xué)、生物學(xué)等。這個課題首先提出了零和博弈,指的是一個人的收益恰好等于其他參與者(們)的凈損失。然而今天,博弈論適用于大范圍的行為關(guān)系,并已經(jīng)發(fā)展成為決策科學(xué)邏輯性方面的一個涵蓋性術(shù)語。在很多社會、經(jīng)濟(jì)和工程模型中,涉及到的個人或參與者有相互沖突的目標(biāo),因此更適合考慮基于個人收益或成本的優(yōu)化問題。在此情形下,非合作博弈理論研究方法一定程度上基于經(jīng)濟(jì)學(xué)、社會科學(xué)等的相關(guān)工作產(chǎn)生了。在現(xiàn)存的文獻(xiàn)中,隨機(jī)動態(tài)對策和合作問題的研究可以追溯到20世紀(jì)六十年代(請參閱[1,2,3,4])。在最優(yōu)控制背景下弱互聯(lián)系統(tǒng)在[5]中進(jìn)行了研究,并且在兩人非合作非線性動態(tài)對策設(shè)定下Nash均衡在[6]中進(jìn)行了分析。近年來,受控的隨機(jī)大人口(也稱作多主體)系統(tǒng)由于其廣泛的出現(xiàn)在政治、經(jīng)濟(jì)、工程等領(lǐng)域而變得非常重要。后來,這類系統(tǒng)的動態(tài)優(yōu)化或者控制吸引了研究群體一致的強(qiáng)烈的關(guān)注。受控的大人口系統(tǒng)最大的特點在于考慮可忽略主體的存在性,他們單個來看是可以被忽略的,但是他們的集體行為將會給所有主體施加某種顯著的影響。這種特點能被個人動態(tài)系統(tǒng)和(或)代價泛函中的整個人群的狀態(tài)均值所表示的弱耦合結(jié)構(gòu)表現(xiàn)出來。在這種方式下,所有主體中微觀模式下的個人行為可以和宏觀模式下的集體行為聯(lián)系起來。這種動態(tài)系統(tǒng)和泛函中的弱耦合用來模擬競爭的決策者之間的互動影響。特別的,這種動態(tài)耦合表明了環(huán)境對個人決策的影響,并且這種潛在的模型采用的是個人控制的弱耦合擴(kuò)散形式。值得注意的是由于大人口系統(tǒng)中高度復(fù)雜的耦合結(jié)構(gòu),考慮所有主體的精確狀態(tài)而得到的經(jīng)典策略證明是無效、不可行的。作為一種選擇,研究相關(guān)的只考慮自己個人狀態(tài)和某個外生變量的狀態(tài)變的更容易駕馭和有效。對于大人口的帶平均場結(jié)構(gòu)的隨機(jī)動態(tài)對策問題,Nash確定性等價理論最初是由Huang、Caines和Malhame的一系列文章發(fā)展起來的。大規(guī)模的線性控制系統(tǒng)的優(yōu)化問題在[7]中呈現(xiàn)出來,其中許多的主體通過各自的狀態(tài)相互耦合,而代價泛函是“個人到集體”的形式。然后一個明確的非線性McKean-Vlasov馬爾科夫過程模型的一般性表達(dá)在[8,9,10]中有了發(fā)展。本論文主要專注于大人口系統(tǒng)在線性二次情形下的研究,其中狀態(tài)方程對狀態(tài)是線性的并帶有非齊次項,代價泛函是二次的。回顧起來,線性系統(tǒng)和其相關(guān)的線性二次控制已經(jīng)有了廣泛的研究,這樣的控制問題稱為線性二次最優(yōu)控制問題。關(guān)于一些經(jīng)典的確定性線性二次問題的結(jié)果,讀者可以參閱[11]。對于隨機(jī)情形,這些問題可參閱[12,13]。系統(tǒng)的介紹隨機(jī)線性二次最優(yōu)控制問題可見[14]的相關(guān)段落和其中的文獻(xiàn)。其他相關(guān)的文獻(xiàn)包括[15,16,17]等。由于線性二次非常好的結(jié)構(gòu),所以存在著豐富的線性二次描述的大人口問題的相關(guān)文獻(xiàn)。大人口系統(tǒng)中的線性二次對策問題和ε-Nash均衡性質(zhì)在[18]中有了研究和證明,其中每個主體的動態(tài)系統(tǒng)是不一致的。在[19]中,作者求解Hamilton-Jacobi-Bellman 和 Kolmogorov-Fokker-Plank方程,并且發(fā)現(xiàn)了線性反饋形式顯式的Nash均衡點。[20]旨在研究一類含有N個決策者的線性二次控制問題,其中基本目標(biāo)是最小化一個社會成本作為N個獨(dú)立的帶有平均場結(jié)構(gòu)的泛函之和。后來,[21]提供了一類線性二次框架下一般的平均場對策問題的綜合性研究。關(guān)于線性二次大人口問題更詳盡的結(jié)果,請參閱[22,23,24]等。作為博弈論一個新的分支,平均場博弈起因于多個領(lǐng)域,例如,粒子物理學(xué)、經(jīng)濟(jì)學(xué)、生物學(xué)等。在粒子物理學(xué)的很多情形下,通過引入一個或多個“平均場”來充當(dāng)描繪粒子間相互作用的媒介,這樣構(gòu)建的逼近方式是非常優(yōu)越的。在這類模型中,通過假設(shè)每個粒子都是無窮小的來描繪每個粒子對于構(gòu)建平均場的貢獻(xiàn)和平均場對于每個粒子的影響,也就是,通過令粒子的數(shù)目N→+∞,采用一類極限過程。在博弈論中,站在數(shù)學(xué)的立場上是涉及了當(dāng)N趨于無窮的時候,研究一大類N人對策問題。通常的,N人微分對策證明是不易處理的。幸運(yùn)的是,事情可以被簡化,至少當(dāng)參與者數(shù)量增加,就參與者而言,這種對策問題是對稱的。實際上,個人與個人之間的復(fù)雜策略將無法被參與者實施,因為當(dāng)參與者人數(shù)增多的時候,每個人會漸漸的在別人的視野中消失。在過去數(shù)十年中,研究平均場博弈及其應(yīng)用的相關(guān)文獻(xiàn)越來越多。對此類對策問題,密切相關(guān)卻獨(dú)立發(fā)展的研究,請參閱[25,26,27];谶@些結(jié)果,這條研究路線又吸引了很多注意。一些近期的文獻(xiàn)包括[28,29,30,31],其中涉及了很多平均場博弈論的研究。關(guān)于平均場博弈的一些介紹和例子由[28]給出。[29]主要給出了一類帶平均場相互作用的隨機(jī)微分對策問題的完整的概率分析。[30]主要討論和比較了兩類當(dāng)參與者人數(shù)趨于無窮時隨機(jī)微分對策的近似方法。另外,[31]處理了一個銀行間的借入和借出模型,并分析了系統(tǒng)風(fēng)險。平均場型控制近年來也有了廣泛的研究。[32]得到了平均場倒向隨機(jī)微分方程以及相關(guān)的平均場隨機(jī)微分方程作為一個高維正倒向隨機(jī)微分方程系統(tǒng)的極限。后來,在[33]中作者深入調(diào)查了帶有一般系數(shù)的此類平均場倒向隨機(jī)微分方程并提出了相關(guān)的偏微分方程;谶@些研究,[34]和[35]獨(dú)立的研究了平均場型最優(yōu)控制問題,其中控制域是凸的,這也可被[36]中的結(jié)果所涵蓋。此外,[37]提供了平均場型的完全耦合的正倒向隨機(jī)微分方程的解的存在性結(jié)果。更多的關(guān)于平均場型的對策和控制的文獻(xiàn),請參閱[38,39,40,41,42,43,44,45,46,47,48,49,50]等。值得指出的是,平均場型對策和平均場型控制之間有很多區(qū)別。一般來說,像[29,30,31]所引出的那樣,本質(zhì)上平均場型對策和平均場型控制在所采用的方法和得到的均衡上是不同的。準(zhǔn)確的說,平均場型對策的方法是“不同步”—型。它是首先固定或凍結(jié)狀態(tài)平均值xt(N)(線性情形)或者經(jīng)驗測度地t(非線性情形)來把初始問題轉(zhuǎn)化成為標(biāo)準(zhǔn)的但是以固定項作為參數(shù)的問題。這個固定項在這一步仍然是未確定的。下一步,這個受參數(shù)影響的標(biāo)準(zhǔn)問題可以被求解并且得到最優(yōu)狀態(tài)。這樣的控制稱為分散化控制。然后,這個固定的狀態(tài)均值或是經(jīng)驗測度可以進(jìn)一步由不動點分析和最優(yōu)系統(tǒng)相關(guān)的連續(xù)性條件確定出來。在這個意義下,狀態(tài)均值(或是經(jīng)驗測度)和未定的平均場對策將會“不同步”變化。與之相比,在平均場型控制問題中,狀態(tài)均值或者經(jīng)驗測度將不再被事先固定或凍結(jié)。實際上,它們會隨著未定的控制變化而變化。在這種方式下,狀態(tài)均值項和狀態(tài)本身被視為“同步”-型。值得注意的是在上面提到的文獻(xiàn)中,所有的參與者之間相比是微不足道的,也就是說他們不會以單個的方式影響整個群體。相對的,他們將會以群體狀態(tài)平均值的統(tǒng)一模式施加影響。在此情形下,所有參與者可以視為同事。一個實際的例子是生產(chǎn)同類產(chǎn)品的市場價格信息。每個公司產(chǎn)量如此之小使得單個公司的產(chǎn)量不能影響兄弟公司的行為。然而,所有公司的平均產(chǎn)量將會決定此產(chǎn)品的市場價格。所有的小公司都采取這個價格模式,所以他們進(jìn)一步的相互作用并且通過價格信息機(jī)制耦合在一起。上面的討論是基于假設(shè)所有的人平等的參與到市場價格信息中來。然而,在現(xiàn)實中我們知道參與者地位和角色的不同在現(xiàn)實狀況中的詮釋有顯著不同。例如,小的單個個人的決策總是受某些“領(lǐng)導(dǎo)”群體或者“主導(dǎo)”機(jī)構(gòu)的影響。在我們的價格信息例子中,這樣的“領(lǐng)導(dǎo)”群體可以被理解為一些壟斷公司,他們有著相當(dāng)大的產(chǎn)量因此會對價格施加更多顯著的影響。至于那些“主導(dǎo)”機(jī)構(gòu),可以被視為當(dāng)?shù)卣?因為它的產(chǎn)業(yè)政策將會很大程度的影響所有公司的生產(chǎn)行為。相反的,小的公司也會通過市場價格影響政府的決策。個重要的影響當(dāng)?shù)卣疇顟B(tài)的因素—生產(chǎn)的稅收,將會依賴于形成的市場價格。上面的討論暗示了所謂的主-從參與者模型。更確切的,讓我們通過下面的石油開采例子指出來。在原油開采過程中,單個石油開采公司總是希望開采更多的石油,從而獲得更多的利潤。這此狀態(tài)下,他們的開采計劃總是傾向于盡量少的考慮宏觀因素,比如石油資源有限、可能出現(xiàn)的環(huán)境代價和開采過程中的長期受益。另一方面,這些因素更多的是相關(guān)的監(jiān)督部門或當(dāng)?shù)卣紤]的。不像單個的石油公司,他們更關(guān)心行業(yè)的可持續(xù)發(fā)展和石油部門的綜合效益。因此,他們將作為主要參與者實施一些宏觀調(diào)控政策。所有小公司(作為從屬參與者)當(dāng)制定生產(chǎn)計劃時應(yīng)該遵循這些政策。所以,所有的單個小生產(chǎn)公司組成了從屬參與者部分,并且依賴他們的集體行為(狀態(tài)平均值)來進(jìn)一步影響當(dāng)?shù)卣?主要參與者)。進(jìn)而主從大人口系統(tǒng)和相關(guān)的平均場對策被廣泛的研究;仡欀暗墓ぷ,[51]通過分析一個無窮集合,并且所有從屬參與者可分為K類討論了主從參與者大人口系統(tǒng)問題。后來,[52]考慮了主從關(guān)系模型的線性二次問題,這里直接把平均場項z作為一個隨機(jī)過程且系數(shù)是隨機(jī)的。再后來,[53]研究了非線性隨機(jī)動態(tài)系統(tǒng)大人口對策問題,其中有一個主要參與者和N個從屬參與者,得到ε.N-NaSh均衡性質(zhì),且有εN=O(1/(?)).此外,[54]導(dǎo)出了一個對策問題,其中收益/消費(fèi)由一個受控的倒向隨機(jī)微分方程定義,且假設(shè)系數(shù)關(guān)于控制參量滿足嚴(yán)格的凹-凸性。在大多數(shù)控制問題中,我們都假設(shè)信息是可以被完全觀測到的。然后,在現(xiàn)實中卻未必總是合理的。由于參與者在社會中角色、地位、方法等的不同,所觀測的內(nèi)容也不盡相同。進(jìn)而由于有限的數(shù)據(jù),隱藏的過程或是噪聲觀測等,很多控制問題更適合用部分信息框架來描述。部分信息下的隨機(jī)控制問題在[55]中有了大量的回顧。也有其他的關(guān)于部分可觀測的隨機(jī)控制系統(tǒng)的文獻(xiàn),先前的工作請參閱[56,57,58,59,60,61,62,63],近期的工作請看[64,65,66,67,68,69,70,71,72,73]。對于部分可觀測隨機(jī)微分對策,可參閱[74,75,76]和其中的文獻(xiàn)。值得注意的是,一類帶噪聲觀測的線性二次平均場對策問題也在[77]中進(jìn)行了研究,問題定義在無窮時間區(qū)間,故而代數(shù)Riccati方程由此引入。另外,在[77]中,由于沒有公共噪聲,所以極限的狀態(tài)均值是確定性的函數(shù),這跟本論文中相關(guān)問題的處理是不一樣的。非常重要的一點是在上述所有的大人口系統(tǒng)問題相關(guān)工作中,所有參與者的狀態(tài)都描述為初始條件給定的(正向)隨機(jī)微分方程。進(jìn)一步的,在此問題中,參與者們的目標(biāo)是最小化他們的目標(biāo)泛函,當(dāng)然其中涉及了終端狀態(tài)。隨著倒向隨機(jī)微分方程廣泛的研究和應(yīng)用,我們很自然的考慮大人口問題在此框架下的動態(tài)優(yōu)化問題。實際上,倒向大人口系統(tǒng)的動態(tài)優(yōu)化問題啟發(fā)于很多情形。例如,在動態(tài)經(jīng)濟(jì)模型中,參與者有某種遞歸效用或是非線性期望,或者一些生產(chǎn)計劃需要有些追蹤的終端目標(biāo)卻受平均產(chǎn)量導(dǎo)致的價格因素影響。另一個實例源自于風(fēng)險管理問題,這時考慮的是基于整個部門所有同事平均表現(xiàn)的相關(guān)或相對標(biāo)準(zhǔn)。這就像一個給定的養(yǎng)老基金通過設(shè)定平均表現(xiàn)(比如,平均套期保值成本,起存金額,盈余)作為一個基準(zhǔn)來衡量自身的表現(xiàn)。此外,受[78]啟發(fā),帶有終端約束的受控的正向大人口系統(tǒng),可以被重新描述為某個倒向大人口系統(tǒng)。不同于隨機(jī)微分方程,倒向隨機(jī)微分方程的的終端而不是初始條件事先被明確。作為一個重要的特點,倒向隨機(jī)微分方程的解是個適應(yīng)對(yt,Zt),其中解的第二部分磊很自然的由鞅表示定理呈現(xiàn)出來,且使得紈滿足適應(yīng)性要求。關(guān)于倒向隨機(jī)微分方程,有著非常豐富的理論和應(yīng)用結(jié)果。線性倒向隨機(jī)微分方程首先是在[79]中考慮的。1990年,Pardoux-Pen g[80]首先引入了非線性倒向隨機(jī)微分方程,建立了倒向方程在標(biāo)準(zhǔn)Lipschitz條件下的解的存在唯一性定理;谶@一開創(chuàng)性工作,倒向隨機(jī)微分方程理論得以在各個領(lǐng)域迅速發(fā)展開來,例如,數(shù)理金融、偏微分方程、隨機(jī)控制和微分對策,泛函分析等。獨(dú)立的,[81]提出了隨機(jī)微分遞歸效用,這是標(biāo)準(zhǔn)效用的廣義化,其中瞬時的效用不僅依賴于瞬時的消費(fèi)率,而且依賴于將來的效用。像[82]中提到的那樣,效用過程可以被視為一個特殊倒向隨機(jī)微分方程的解。[82]也從倒向方程的角度給出了遞歸效用的表達(dá)和他們的性質(zhì)。一個倒向隨機(jī)微分方程和一個隨機(jī)微分方程耦合在一起,構(gòu)成了一個正倒向隨機(jī)微分方程。進(jìn)而,在一些實際背景下,正倒向大人口動態(tài)優(yōu)化問題也自然出現(xiàn)了。一個經(jīng)典的情況是帶終端約束的大人口系統(tǒng)(例如,[83])。在這種情況下,標(biāo)準(zhǔn)的正向隨機(jī)控制問題可以很好的由某個正倒向控制問題逼近。在過去的幾十年中,正倒向隨機(jī)微分方程已有很多研究成果。關(guān)于解的存在唯一性,有一些著名的結(jié)果。壓縮映射方法首先在[84]中應(yīng)用,后來在[85]中詳細(xì)說明。當(dāng)時間區(qū)間T充分小時,這個方法是非常好的。另一個方法稱為“四步框架”([86]),這是第一個移除對時間區(qū)間限制的馬爾科夫正倒向隨機(jī)微分方程的解決辦法。然后是連續(xù)性方法,首先由[87]和[88]提出,后來經(jīng)[89]和[90]發(fā)展,這類方法可以處理任意時間區(qū)間的非馬氏正倒向方程。關(guān)于這些方法的詳盡內(nèi)容,請參閱[91]這本書。近來,在[92]中,作者找到了一個統(tǒng)一的框架可以綜合所有存在的方法,并克服了一些非馬氏正倒向方程中長期未解決的困難。關(guān)于正倒向隨機(jī)微分方程更多的理論和應(yīng)用結(jié)果,請參閱以下相關(guān)文獻(xiàn)[93,94,95,96,97,98,99,100,101,102,103,104,105,106]。根據(jù)狀態(tài)相互依賴的特點,正倒向隨機(jī)微分方程可以分為兩類:部分耦合和完全耦合正倒向方程。前者指的是倒向狀態(tài)yt(或正向狀態(tài)xt)依賴于正向狀態(tài)xt(或倒向狀態(tài)yt),但是xt(yt)并不依賴yt(xt),這更能來表達(dá)遞歸效用和非線性期望(請參閱,例如[83,68,41])。實際上,正向狀態(tài)xt通常表示某些未定資產(chǎn)的動態(tài)系統(tǒng),倒向狀態(tài)yt代表了決策者的非線性期望或遞歸效用。而遞歸效用依賴于未定資產(chǎn)是很自然和合理的。相反的,未定權(quán)益是不能被采用的遞歸效用所影響的。不僅如此,在數(shù)學(xué)上,描述和研究完全耦合的正倒向隨機(jī)微分方程(正倒向狀態(tài)互相依賴)有很高的理論價值。與以上正倒向隨機(jī)微分方程驅(qū)動的對策問題不同的是,一些受其他機(jī)制影響的隨機(jī)最優(yōu)控制問題,也在實踐中有著非常廣泛的應(yīng)用,比如脈沖控制、時間延遲、體制切換系統(tǒng)等。而考察這樣最優(yōu)控制的隨機(jī)最大值原理,在理論研究和實際應(yīng)用中有著極為重要的作用。最大值原理— 最優(yōu)控制的必要條件,首先由Pontryagin等人的團(tuán)隊[107]在十世紀(jì)五六十年代提出和研究的。Bismut [79]引入了線性倒向隨機(jī)微分方程作為伴隨方程,這在隨機(jī)控制理論的發(fā)展中起到了里程碑的作用。隨著Pardoux-Peng [80]非線性倒向隨機(jī)微分方程理論的建立,一般的隨機(jī)最大值原理由彭實戈教授在[108]中通過引入二階伴隨方程得到。隨后,彭教授[109]首先研究了控制域為凸集時正倒向控制系統(tǒng)的隨機(jī)最大值原理。由于倒向隨機(jī)微分方程和正倒向隨機(jī)微分方程在數(shù)理金融、經(jīng)濟(jì)學(xué)等廣泛的應(yīng)用,我們很自然的考慮正倒向隨機(jī)微分方程的最優(yōu)控制問題。在這方面,有豐富的結(jié)果可供查閱,比如[94,110,111,68,112]及其中的文獻(xiàn)。不久前,吳臻教授[106]建立了一般的正倒向隨機(jī)系統(tǒng)的最大值原理,其中控制域是非凸的,且擴(kuò)散項系數(shù)顯式的含有控制變量。這對一般的正倒向隨機(jī)系統(tǒng)最大值原理的發(fā)展做了極大的推動。隨著隨機(jī)控制理論的蓬勃發(fā)展,隨機(jī)脈沖控制問題也因為其廣泛的應(yīng)用而獲得了大量的研究,主要體現(xiàn)在帶交易費(fèi)用的證券投資組合優(yōu)化問題([113,114])和不同幣種間交易率最優(yōu)策略問題([115,116])。Korn [117]也考察了脈沖控制在數(shù)理金融方面的很多應(yīng)用。關(guān)于脈沖控制的綜合研究,可參閱[118]。Wu and Zhang[103]首先研究了帶脈沖控制的正倒向隨機(jī)系統(tǒng)最大值原理,其中假設(shè)正則控制域是凸的,且得到了必要和充分條件。后來,在[119]中作者也考慮了正倒向系統(tǒng)含脈沖控制問題,這里正則控制域未必是凸集,而擴(kuò)散項系數(shù)不含控制。近年來,體制切換模型在金融和隨機(jī)控制中的應(yīng)用獲得了持續(xù)研究。相對于基于擴(kuò)散過程的傳統(tǒng)系統(tǒng)來說,經(jīng)驗看來,體制切換模型顯得更有意義。特別的,它可以表征為時間連續(xù)、狀態(tài)有限的馬爾科夫鏈,其中每個狀態(tài)表示一個系統(tǒng)的體制或是一個經(jīng)濟(jì)指標(biāo)的水平;谇袚Q模型,在期權(quán)定價、投資組合管理、風(fēng)險管理等領(lǐng)域開展了很多工作。在[120]中,Crepey主要研究金融中的定價方程。Crepey and Matoussi[121]研究了帶馬爾科夫鏈的反射倒向隨機(jī)微分方程。對于帶體制切換模型的控制問題,Donnelly在[122]中調(diào)查了充分最大值原理。利用帶馬爾科夫鏈的倒向隨機(jī)微分方程的結(jié)果[120,121],Tao and W u [123]導(dǎo)出了正倒向體制切換模型的最大值原理。此外,他們也在[124]中研究了體制切換倒向方程的弱收斂。除此之外,延遲的隨機(jī)系統(tǒng)也有很多實際背景,例如經(jīng)濟(jì)、金融、管理、工程、決策學(xué)等(見Arriojas等[125],Mohammed [126,127])。主要原因是在這些領(lǐng)域的很多現(xiàn)象中,依賴過去是非常普遍的,也就是說他們在t時刻的行為不僅依賴于t時刻情形,也依賴于他們的歷史。這樣的模型可被描述為隨機(jī)微分延遲方程。然而,延遲系統(tǒng)由于其延遲效應(yīng)而變得難以處理,不僅是在處理無窮維問題時,而且在于處理軌線延遲部分缺乏It6公式。為了克服這些困難,可以考慮很多特別的系統(tǒng)分類,比如(?)ksendal and Sulem [128]。受以上研究的啟發(fā),論文主要考慮兩類帶脈沖控制的正倒向隨機(jī)最優(yōu)控制問題的最大值原理,一類是帶脈沖的正倒向體制切換系統(tǒng),另一類是帶脈沖的正倒向延遲系統(tǒng)。在第一類中,系統(tǒng)由正倒向隨機(jī)微分方程驅(qū)動,且所有系數(shù)都含有馬爾科夫鏈。此情況相對于[123]和[103,119]顯得更為復(fù)雜。在第二類中,系統(tǒng)由正倒向隨機(jī)微分延遲方程描述,控制變量包括正則控制和脈沖控制,且都有時間延遲。我們知道隨機(jī)微分方程和倒向隨機(jī)微分方程之間有很好的對偶關(guān)系。Peng and Yang [129]引入一類新的倒向隨機(jī)微分方程稱為超前倒向隨機(jī)微分方程,且在隨機(jī)微分延遲方程和超前倒向隨機(jī)微分方程之間建立了對偶關(guān)系。利用超前倒向方程的理論和對偶方法,Chen and Wu [130]首先得到了狀態(tài)和控制都含延遲的控制系統(tǒng)最大值原理。后來,Yu[131]研究了含脈沖控制的延遲控制系統(tǒng)最大值原理,其中動態(tài)系統(tǒng)由隨機(jī)延遲系統(tǒng)驅(qū)動,且正則控制是凸的。更多的關(guān)于延遲系統(tǒng)的文獻(xiàn),請參閱[132,133,134]和其中的參考文獻(xiàn)。論文具體組織如下:正倒向框架下大人口動態(tài)優(yōu)化問題在第一章中進(jìn)行了闡述,并且研究了部分耦合的正倒向隨機(jī)微分方程驅(qū)動的帶平均場的線性二次對策問題。對單個參與者,我們得到了輔助跟蹤系統(tǒng)的最優(yōu)控制。由于此Hamiltonian系統(tǒng)的二維特性,解耦過程中需要四個Riccati方程和兩個常微分方程。進(jìn)一步的,分散化策略可以通過連續(xù)性條件和逼近結(jié)構(gòu)得到。另外,基于一些正倒向微分方程的估計,我們也可證明初始問題的ε-Nash均衡性質(zhì)。我們在第二章里進(jìn)一步考慮了倒向的大人口線性二次對策問題,這里每個人的狀態(tài)服從倒向隨機(jī)微分方程。由于倒向方程的存在,使得此問題與之前存在的線性二次平均場對策問題很不一樣,因為存在的文獻(xiàn)中參與者的狀態(tài)服從(正向)隨機(jī)微分方程。這里每個參與者的動態(tài)系統(tǒng)通過狀態(tài)均值弱耦合在一起,并且觀測的信息是完全的。我們得到了極限過程的顯式形式,并且研究了初始問題的ε-Nash均衡性質(zhì)。主-從框架下大人口系統(tǒng)在第三章中有所研究,其中主參與者的動態(tài)系統(tǒng)由某個終端給定的倒向隨機(jī)微分方程描述,而從屬參與者的系統(tǒng)由初始條件給定的隨機(jī)微分方程驅(qū)動。在這種情況下,主參與者的目標(biāo)變?yōu)樽钚』蕾嚦跏紶顟B(tài)的代價泛函,而從屬參與者試圖最小化依賴于終端狀態(tài)的代價泛函。不僅如此,主參與者也考慮了與從屬參與者的相對表現(xiàn)。相關(guān)的帶平均場的線性二次對策問題獲得了討論且得到了分散化策略。這時一個與主參與者狀態(tài)相關(guān)的隨機(jī)過程由此引入作為從屬參與者狀態(tài)均值的逼近。進(jìn)一步得到一個輔助的平均場隨機(jī)微分方程和一個3×2正倒向隨機(jī)微分方程系統(tǒng)。這里,3×2正倒向系統(tǒng)是由三個正向和三個倒向方程組合而成。在[88]和[104]引入的單調(diào)條件的幫助下,我們得到了這個正倒向方程解的適定性。最后,初始問題的ε-Nash均衡性質(zhì)得到證明且有ε=O(1/(?))。第四章主要討論了大人口系統(tǒng)在部分信息結(jié)構(gòu)下的動態(tài)優(yōu)化問題。這里,單個參與者只能觀測到各自潛在的布朗運(yùn)動生成的信息流。在這樣的設(shè)定下,狀態(tài)均值的極限變?yōu)楣膊祭蔬\(yùn)動驅(qū)動的某個隨機(jī)過程。在此框架下,提出了兩類平均場對策問題:一類是由正向動態(tài)系統(tǒng)驅(qū)動的,另一類是倒向驅(qū)動。在正向情形,我們得到與之相關(guān)的平均場對策和某個Riccati方程系統(tǒng)。在倒向情形,分散化策略的顯式結(jié)構(gòu)和極限過程滿足的倒向隨機(jī)微分方程也可得到。在兩種情形下,我們都可證明ε-Nash均衡性質(zhì)。第五章研究了兩類帶脈沖的正倒向隨機(jī)最優(yōu)控制問題的最大值原理。第一類是關(guān)于帶脈沖的正倒向體制切換系統(tǒng),我們通過利用對正則控制的針狀變分和對脈沖控制的凸變分,得到了隨機(jī)最大值原理。應(yīng)用最大值原理到一個金融投資-消費(fèi)模型中,我們獲得了最優(yōu)消費(fèi)過程并分析了幾個經(jīng)濟(jì)因素對消費(fèi)的影響。第二類是關(guān)于帶脈沖的正倒向延遲系統(tǒng),主要的技術(shù)特色是分析了隨機(jī)延遲方程和超前倒向方程的對偶關(guān)系,并證明了超前正倒向隨機(jī)微分延遲方程和相應(yīng)的變分方程的有關(guān)估計。在一些附加的凸性假設(shè)下,我們也可證明充分的最優(yōu)性條件,這將在金融中的策略選擇問題中有著潛在的應(yīng)用。
[Abstract]:......
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:F224.32


本文編號:1485317

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/qihuoqq/1485317.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5b87c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
免费在线播放不卡视频| 青青操日老女人的穴穴| 国产麻豆一线二线三线| 99亚洲综合精品成人网色播| 99一级特黄色性生活片| 最近最新中文字幕免费| 国产精品久久精品国产| 国产又色又粗又黄又爽| 日本91在线观看视频| 亚洲欧美日韩在线看片| 少妇高潮呻吟浪语91| 精品推荐久久久国产av| 99久久精品免费精品国产| 91亚洲国产日韩在线| 中文字幕精品人妻一区| 激情内射日本一区二区三区| 激情爱爱一区二区三区| 人妻少妇久久中文字幕久久| 免费观看在线午夜视频| 国产熟女一区二区三区四区| 亚洲综合天堂一二三区| 麻豆亚州无矿码专区视频| 日本熟妇熟女久久综合| 人妻偷人精品一区二区三区不卡 | 国产三级视频不卡在线观看| 日韩美成人免费在线视频| 国产成人精品一区二区三区| 欧美国产日韩在线综合| 亚洲精品国产主播一区| 国产精品刮毛视频不卡| 亚洲最大的中文字幕在线视频| 欧美日本亚欧在线观看| 日本高清不卡一二三区| 99国产高清不卡视频| 日韩专区欧美中文字幕| 成人你懂的在线免费视频| 日本欧美在线一区二区三区| 亚洲一区二区精品免费视频| 国产一区二区三区午夜精品| 国产精品一区日韩欧美| 最近最新中文字幕免费|