天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

風(fēng)險(xiǎn)敏感性馬爾科夫控制過(guò)程的最優(yōu)解

發(fā)布時(shí)間:2020-03-18 16:18
【摘要】:最優(yōu)控制問(wèn)題指在一個(gè)動(dòng)態(tài)系統(tǒng)中通過(guò)確定一個(gè)控制策略使性能標(biāo)準(zhǔn)達(dá)到最優(yōu)(最大或最小).馬爾科夫控制過(guò)程是隨機(jī)動(dòng)態(tài)系統(tǒng)中的一類.在最近五十年對(duì)隨機(jī)動(dòng)態(tài)最優(yōu)控制問(wèn)題的大量研究中,風(fēng)險(xiǎn)敏感性平均準(zhǔn)則尤為受到關(guān)注.傳統(tǒng)的馬爾科夫控制過(guò)程研究方法有兩種:(1)收縮映射法;(2)消失折現(xiàn)法.Cavazos-Cadena(2009)提出了另外一種分析證明方法,其主要結(jié)果利用基本的概率與分析準(zhǔn)則通過(guò)相對(duì)獨(dú)立的參數(shù)獲得.通過(guò)引入相對(duì)值函數(shù)和分析被賦予風(fēng)險(xiǎn)敏感性總費(fèi)用準(zhǔn)則的停時(shí)問(wèn)題驗(yàn)證了最優(yōu)方程有界解的存在性和唯一性.本文在概述了馬爾科夫控制過(guò)程的研究歷史后,詳細(xì)重點(diǎn)介紹了 Cavazos-Cadena的方法并運(yùn)用此方法對(duì)最大化平均收益準(zhǔn)則下最優(yōu)方程的解進(jìn)行了探索性研究.針對(duì)可數(shù)狀態(tài)空間和緊致行動(dòng)集合上的馬爾科夫控制過(guò)程的最優(yōu)解問(wèn)題,本文控制策略的表現(xiàn)優(yōu)劣由風(fēng)險(xiǎn)敏感性平均費(fèi)用準(zhǔn)則度量.為保證風(fēng)險(xiǎn)敏感性馬爾科夫控制過(guò)程的最優(yōu)方程的解存在,兩條基本假設(shè)條件的成立是必要的:(ⅰ)同步Doeblin條件(SDC)成立;(ⅱ)馬爾科夫控制過(guò)程{Xt}是平穩(wěn)確定性策略下的馬爾科夫鏈.在此框架下對(duì)于具有緊支撐的非負(fù)費(fèi)用函數(shù),最優(yōu)平均費(fèi)用函數(shù)是一常數(shù).最優(yōu)方程與最優(yōu)平均費(fèi)用函數(shù)的聯(lián)系為:最優(yōu)方程的解即是平均費(fèi)用函數(shù)的最小值,且使最優(yōu)方程成立的策略是最優(yōu)平穩(wěn)確定性策略.從而尋求最小平均費(fèi)用的問(wèn)題轉(zhuǎn)變成求解最優(yōu)方程.
【學(xué)位授予單位】:武漢大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:F224

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 Shan-shan PAN;Wei-qiu ZHU;Rong-chun HU;Rong-hua HUAN;;隨機(jī)激勵(lì)下連續(xù)時(shí)間馬爾科夫跳變非線性系統(tǒng)的平穩(wěn)響應(yīng)研究(英文)[J];Journal of Zhejiang University-Science A(Applied Physics & Engineering);2017年02期

2 黃麒元;王致杰;王東偉;杜彬;;馬爾科夫理論及其在預(yù)測(cè)中的應(yīng)用綜述[J];技術(shù)與市場(chǎng);2015年09期

3 翟波;;基于灰色-馬爾科夫理論的煤礦瓦斯?jié)舛阮A(yù)測(cè)[J];城市地理;2017年10期

4 王雙成;劉喜華;唐海燕;;基于依賴分析的馬爾科夫網(wǎng)絡(luò)分類器學(xué)習(xí)與優(yōu)化[J];模式識(shí)別與人工智能;2006年04期

5 高山珍,王永亮;7維廣義馬爾科夫方程的幾個(gè)性質(zhì)[J];石家莊鐵道學(xué)院學(xué)報(bào);2003年02期

6 高山珍,高靜偉;廣義馬爾科夫方程解的存在性[J];河北職業(yè)技術(shù)師范學(xué)院學(xué)報(bào);2003年03期

7 曹昌祺;原子自發(fā)輻射的非馬爾科夫理論[J];量子光學(xué)學(xué)報(bào);2002年S1期

8 吳盧榮,林運(yùn)國(guó);學(xué)生成績(jī)預(yù)測(cè)的時(shí)齊馬爾科夫法[J];聊城師院學(xué)報(bào)(自然科學(xué)版);2002年02期

9 李錦江,萬(wàn)新敏,劉德權(quán);線性模型的最小二乘估計(jì)與馬爾科夫估計(jì)[J];空軍雷達(dá)學(xué)院學(xué)報(bào);2000年04期

10 高山珍,李俊紅,解建軍;7維廣義馬爾科夫方程的解[J];貴州教育學(xué)院學(xué)報(bào)(自然科學(xué));2000年02期

相關(guān)會(huì)議論文 前10條

1 周玲;張聞釗;李遜;;非馬爾科夫環(huán)境下光力系統(tǒng)的糾纏與制冷[A];第十七屆全國(guó)量子光學(xué)學(xué)術(shù)會(huì)議報(bào)告摘要集[C];2016年

2 倪中新;邱華;;基于馬爾科夫機(jī)制轉(zhuǎn)換模型的期現(xiàn)對(duì)沖研究[A];第十屆(2015)中國(guó)管理學(xué)年會(huì)論文集[C];2015年

3 曹昌祺;;原子自發(fā)輻射的非馬爾科夫理論[A];第十屆全國(guó)量子光學(xué)學(xué)術(shù)報(bào)告會(huì)論文論文集[C];2002年

4 雷延軍;李向陽(yáng);;基于兩級(jí)雙渠道供應(yīng)鏈的馬爾科夫庫(kù)存優(yōu)化模型研究[A];第九屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2007年

5 田德源;陸治釗;;新馬爾科夫法[A];第8屆全國(guó)核電子學(xué)與核探測(cè)技術(shù)學(xué)術(shù)年會(huì)論文集(二)[C];1996年

6 李立陽(yáng);劉海天;付建蘇;王會(huì)龍;張民強(qiáng);;基于馬爾科夫隨機(jī)場(chǎng)的圖像去噪[A];第六屆中國(guó)指揮控制大會(huì)論文集(上冊(cè))[C];2018年

7 呂驥;曲澤星;高加力;;利用分子動(dòng)力學(xué)和馬爾科夫態(tài)模型研究真菌光感受器vivid的光致二聚化過(guò)程[A];中國(guó)化學(xué)會(huì)第30屆學(xué)術(shù)年會(huì)摘要集-第十九分會(huì):化學(xué)中的量子與經(jīng)典動(dòng)力學(xué)[C];2016年

8 陳其安;廖小紅;王丹;陳抒妤;;中國(guó)大陸貨幣政策對(duì)香港股票市場(chǎng)的溢出效應(yīng):基于馬爾科夫轉(zhuǎn)換模型的實(shí)證研究[A];第十九屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2017年

9 王紡翔;陳巍;李亞平;何德勇;王超;韓云光;王雙;銀振強(qiáng);韓正甫;;單光子探測(cè)器后脈沖效應(yīng)的費(fèi)馬爾科夫性質(zhì)(英文)[A];第十七屆全國(guó)量子光學(xué)學(xué)術(shù)會(huì)議報(bào)告摘要集[C];2016年

10 梁加馳;沈競(jìng);;基于R語(yǔ)言的MCMC方法研究[A];第十屆中國(guó)不確定系統(tǒng)年會(huì)、第十四屆中國(guó)青年信息與管理學(xué)者大會(huì)論文集[C];2012年

相關(guān)重要報(bào)紙文章 前10條

1 記者 吳長(zhǎng)鋒;時(shí)而馬爾科夫 時(shí)而非馬爾科夫[N];科技日?qǐng)?bào);2011年

2 記者 張力;張德江會(huì)見俄羅斯聯(lián)邦總統(tǒng)助理馬爾科夫[N];中國(guó)人事報(bào);2009年

3 記者 呂華;董軍會(huì)見俄羅斯圣彼得堡市副市長(zhǎng)馬爾科夫[N];西安日?qǐng)?bào);2015年

4 謝思佳 符信;探討深化合作模式[N];廣州日?qǐng)?bào);2012年

5 本報(bào)記者 范昕;機(jī)器人無(wú)法勝任創(chuàng)造性工作[N];文匯報(bào);2016年

6 記者 吳溫;第四屆中國(guó)(石家莊)皮博會(huì)開幕[N];石家莊日?qǐng)?bào);2012年

7 本報(bào)駐俄羅斯記者  馬劍;“漂在石油上”的城市[N];人民日?qǐng)?bào);2006年

8 王蔚 肖丹 陶健;“中俄旅游年”上海全力開拓滬俄旅游市場(chǎng)[N];中國(guó)旅游報(bào);2012年

9 蔣涌;文化的半徑有多大?[N];自貢日?qǐng)?bào);2012年

10 王旭;泰和尼科:將在中國(guó)市場(chǎng)推進(jìn)系統(tǒng)應(yīng)用[N];中國(guó)建材報(bào);2013年

相關(guān)博士學(xué)位論文 前10條

1 王軍義;具有時(shí)變時(shí)滯的馬爾科夫復(fù)雜神經(jīng)網(wǎng)絡(luò)的同步問(wèn)題研究[D];東北大學(xué);2016年

2 王繼民;非線性廣義半馬爾科夫跳變系統(tǒng)的分析與綜合[D];山東大學(xué);2018年

3 李繁飆;半馬爾科夫跳變系統(tǒng)的分析和綜合[D];哈爾濱工業(yè)大學(xué);2015年

4 龍少華;奇異時(shí)滯馬爾科夫系統(tǒng)的容許性問(wèn)題研究[D];電子科技大學(xué);2013年

5 陶杰;馬爾科夫跳變系統(tǒng)的耗散性分析與綜合[D];浙江大學(xué);2018年

6 張興遠(yuǎn);非馬爾科夫演化及對(duì)量子熱機(jī)性能的影響[D];大連理工大學(xué);2016年

7 肖興;開放量子系統(tǒng)的非馬爾科夫動(dòng)力學(xué)和弱測(cè)量反饋控制[D];湖南師范大學(xué);2012年

8 杜元花;幾類隨機(jī)微分方程的穩(wěn)定性分析[D];電子科技大學(xué);2016年

9 范子龍;高維開放量子系統(tǒng)的非馬爾科夫動(dòng)力學(xué)研究[D];湖南師范大學(xué);2016年

10 鄒紅梅;非馬爾科夫環(huán)境下量子系統(tǒng)的非經(jīng)典效應(yīng)[D];湖南師范大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 于娜;風(fēng)險(xiǎn)敏感性馬爾科夫控制過(guò)程的最優(yōu)解[D];武漢大學(xué);2018年

2 孫錫林;基于馬爾科夫邏輯網(wǎng)的公安盜竊犯罪案件推理研究[D];華中科技大學(xué);2018年

3 付曉閱;廣義馬爾科夫跳變系統(tǒng)的正解及穩(wěn)定性研究[D];東北大學(xué);2015年

4 王明晗;馬爾科夫體制轉(zhuǎn)換模型下達(dá)到遺贈(zèng)目標(biāo)的最優(yōu)投資與再保險(xiǎn)[D];安徽師范大學(xué);2018年

5 胡程科;馬爾科夫巖性預(yù)測(cè)及基于信息熵的觀測(cè)點(diǎn)位置和數(shù)量?jī)?yōu)化[D];清華大學(xué);2017年

6 吳佩;基于混合馬爾科夫樹模型的ICS異常檢測(cè)方法研究[D];合肥工業(yè)大學(xué);2018年

7 蔡蕊;一類帶馬爾科夫切換的非線性時(shí)滯利率模型及其數(shù)值方法的收斂性[D];東華大學(xué);2012年

8 郭一木;基于張量鏈的并行和增量系統(tǒng)實(shí)現(xiàn)與應(yīng)用[D];華中科技大學(xué);2017年

9 陳微;馬爾科夫跳躍線性系統(tǒng)模態(tài)反饋控制問(wèn)題研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2018年

10 丁琴;具有可控MTPM的離散馬爾科夫跳躍系統(tǒng)控制問(wèn)題研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2017年

,

本文編號(hào):2588919

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/2588919.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶99d18***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com