半Markov決策過程折扣模型與平均模型之間的關(guān)系
[Abstract]:Firstly, a class of semi-M arkov decision problems is discussed under the discounted cost and average cost performance criteria, respectively. Based on the performance potential method, the optimality equation satisfied by the optimal stationary strategy is derived. Then the relationship between the two models is discussed and the results of the average model can be obtained by taking the discount factor to the limit of 00:00 for the corresponding conclusions of the discount model.
【作者單位】: 中國(guó)科學(xué)技術(shù)大學(xué)自動(dòng)化系 中國(guó)科學(xué)技術(shù)大學(xué)自動(dòng)化系 合肥工業(yè)大學(xué)計(jì)算機(jī)系 中國(guó)科學(xué)技術(shù)大學(xué)自動(dòng)化系 中國(guó)科學(xué)技術(shù)大學(xué)自動(dòng)化系
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(60274012,60574065) 安徽省自然科學(xué)基金資助項(xiàng)目(050420301)
【分類號(hào)】:C934
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 宋京生;轉(zhuǎn)移速率族非一致有界的連續(xù)時(shí)間馬氏決策規(guī)劃[J];中國(guó)科學(xué)(A輯 數(shù)學(xué) 物理學(xué) 天文學(xué) 技術(shù)科學(xué));1987年12期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 朱承軍;周建中;;電力市場(chǎng)中梯級(jí)水電站組合交易策略研究[J];華東電力;2006年07期
2 段楠楠;;電子商務(wù)企業(yè)客戶關(guān)系的預(yù)測(cè)與動(dòng)態(tài)管理[J];華東交通大學(xué)學(xué)報(bào);2010年01期
3 黃力平;Q過程的馬氏控制及其最優(yōu)控制[J];湖北大學(xué)學(xué)報(bào)(自然科學(xué)版);1991年03期
4 滕海文;霍達(dá);李悅;;設(shè)計(jì)基準(zhǔn)期內(nèi)抗震結(jié)構(gòu)維修策略優(yōu)化[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2006年02期
5 柴雪霞;馬學(xué)森;周雷;唐昊;;基于SMDP模型的Web服務(wù)組合優(yōu)化方法[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年10期
6 劉虹;;基于MDP自適應(yīng)決策的庫(kù)存控制[J];河北建筑科技學(xué)院學(xué)報(bào);2006年03期
7 李薇;林干;;多任務(wù)條件下地空導(dǎo)彈武器裝備視情維修策略[J];火力與指揮控制;2011年04期
8 劉發(fā)貴;麥偉鵬;黃凱耀;;動(dòng)態(tài)電源管理隨機(jī)模型算法的設(shè)計(jì)與實(shí)現(xiàn)[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年09期
9 郭先平;Q(f)-過程非唯一時(shí)連續(xù)時(shí)間折扣目標(biāo)MDP[J];湖南師范大學(xué)自然科學(xué)學(xué)報(bào);1996年03期
10 劉仲英,吳冰,張新武;企業(yè)知識(shí)管理戰(zhàn)略變化的分析模型[J];管理科學(xué);2004年04期
相關(guān)會(huì)議論文 前2條
1 劉翱;劉克;劉廣;崔珊珊;;基于馬爾可夫決策過程的調(diào)度問題建模[A];第九屆中國(guó)不確定系統(tǒng)年會(huì)、第五屆中國(guó)智能計(jì)算大會(huì)、第十三屆中國(guó)青年信息與管理學(xué)者大會(huì)論文集[C];2011年
2 李金林;徐麗萍;;超訂下艙位控制的R-MDP模型與穩(wěn)健策略[A];第三屆(2008)中國(guó)管理學(xué)年會(huì)論文集[C];2008年
相關(guān)博士學(xué)位論文 前10條
1 曹曉剛;原材料價(jià)格波動(dòng)下的生產(chǎn)—庫(kù)存管理研究[D];武漢大學(xué);2009年
2 馮奇;POMDP近似解法研究及在中醫(yī)診療方案優(yōu)化中的應(yīng)用[D];北京交通大學(xué);2011年
3 楊潔;開放量子系統(tǒng)的建模及其控制[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
4 趙浩;感知無線電系統(tǒng)中機(jī)會(huì)頻譜接入技術(shù)的研究[D];北京郵電大學(xué);2010年
5 牛建軍;無線傳感器網(wǎng)絡(luò)分布式調(diào)度方法研究[D];清華大學(xué);2010年
6 毛李帆;電網(wǎng)規(guī)劃中長(zhǎng)期負(fù)荷預(yù)測(cè)技術(shù)的研究[D];湖南大學(xué);2011年
7 張秀斌;視情維修決策模型及應(yīng)用研究[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2003年
8 范領(lǐng)進(jìn);知識(shí)價(jià)值理論研究[D];吉林大學(xué);2004年
9 魏軼華;隨機(jī)環(huán)境下的若干定價(jià)問題研究[D];西安電子科技大學(xué);2004年
10 杜黎;網(wǎng)上拍賣與無形資產(chǎn)定價(jià)研究[D];西安電子科技大學(xué);2004年
相關(guān)碩士學(xué)位論文 前10條
1 夏青青;道路交通安全事故成因及預(yù)測(cè)模型研究[D];長(zhǎng)沙理工大學(xué);2010年
2 李波;中醫(yī)臨床數(shù)據(jù)挖掘系統(tǒng)的研究與實(shí)現(xiàn)[D];北京交通大學(xué);2011年
3 柴雪霞;基于強(qiáng)化學(xué)習(xí)的Web服務(wù)組合優(yōu)化研究[D];合肥工業(yè)大學(xué);2011年
4 任玲;無線傳感器網(wǎng)絡(luò)能量高效的傳輸策略研究[D];合肥工業(yè)大學(xué);2011年
5 毛沙;無線傳感器網(wǎng)絡(luò)節(jié)能優(yōu)化策略研究[D];合肥工業(yè)大學(xué);2011年
6 袁野;基于強(qiáng)化學(xué)習(xí)算法的互聯(lián)電網(wǎng)AGC隨機(jī)最優(yōu)控制[D];華南理工大學(xué);2011年
7 胡細(xì)兵;基于強(qiáng)化學(xué)習(xí)算法的最優(yōu)潮流研究[D];華南理工大學(xué);2011年
8 吳燕如;基于馬爾科夫模型的風(fēng)電機(jī)組優(yōu)化檢修[D];華北電力大學(xué);2011年
9 呂志科;基于隨機(jī)供應(yīng)的聯(lián)合定價(jià)與庫(kù)存控制研究[D];湘潭大學(xué);2011年
10 梅牡丹;基于灰色理論的建筑施工事故的預(yù)測(cè)研究[D];安徽理工大學(xué);2011年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 董澤清;;馬爾可夫決策規(guī)劃綜述[J];經(jīng)濟(jì)數(shù)學(xué);1984年00期
2 蔣翔;張麗君;龍偉忠;;企業(yè)存貯優(yōu)化的經(jīng)濟(jì)訂貨批量折扣模型研究[J];商場(chǎng)現(xiàn)代化;2007年26期
3 周永務(wù);;隨機(jī)需求下兩層供應(yīng)鏈協(xié)調(diào)的一個(gè)批量折扣模型[J];系統(tǒng)工程理論與實(shí)踐;2006年07期
4 王勇,唐浩陽,秦鵬;一維運(yùn)輸折扣模型及算法[J];重慶大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年10期
5 牛志勇;黃沛;高維和;;基于最優(yōu)反應(yīng)均衡的渠道數(shù)量折扣模型及實(shí)驗(yàn)分析[J];管理科學(xué);2010年02期
6 鮑忠奎;;基于銷售商費(fèi)用信息不對(duì)稱下供應(yīng)鏈協(xié)調(diào)的量折扣模型[J];南開大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期
7 張文明;徐寅峰;蘇兵;;顧客需求量不確定時(shí)生產(chǎn)商的在線數(shù)量折扣策略[J];運(yùn)籌與管理;2011年02期
8 岳萬勇;趙正佳;荊鹿;;跨國(guó)供應(yīng)鏈數(shù)量折扣模型[J];華東經(jīng)濟(jì)管理;2011年09期
9 蔣金鳳;不等間隔的一階多項(xiàng)式模型及貝葉斯預(yù)測(cè)[J];統(tǒng)計(jì)與決策;2004年03期
10 王殿奎;朱翼雋;劉棟;;精益生產(chǎn)環(huán)境下生產(chǎn)線排隊(duì)模型的性能優(yōu)化分析[J];統(tǒng)計(jì)與決策;2006年23期
相關(guān)會(huì)議論文 前10條
1 沈淼森;康婉瑩;錢照明;;新型正激單級(jí)功率因數(shù)校正電路的仿真平均模型[A];2001系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2001年
2 李衍杰;殷保群;奚宏生;周亞平;;一類半Markov過程的靈敏度分析和性能優(yōu)化[A];第二十二屆中國(guó)控制會(huì)議論文集(下)[C];2003年
3 鄭勇;謝祖軍;汪榮江;倪四道;熊熊;葛粲;;地殼結(jié)構(gòu)對(duì)汶川余震定位及震源機(jī)制反演的影響[A];中國(guó)地球物理·2009[C];2009年
4 王瑩;盛四清;;基于自回歸動(dòng)平均模型和神經(jīng)網(wǎng)絡(luò)算法的加權(quán)組合的電力系統(tǒng)的負(fù)荷預(yù)測(cè)[A];中國(guó)高等學(xué)校電力系統(tǒng)及其自動(dòng)化專業(yè)第二十四屆學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2008年
5 徐華中;王江;王先來;;AC-DC變換器自適應(yīng)控制器設(shè)計(jì)[A];1999中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];1999年
6 陳虬;雷震宇;;板殼結(jié)構(gòu)的隨機(jī)有限元分析[A];第七屆全國(guó)結(jié)構(gòu)工程學(xué)術(shù)會(huì)議論文集(第Ⅰ卷)[C];1998年
7 雷震宇;陳虬;;板殼結(jié)構(gòu)動(dòng)力響應(yīng)的隨機(jī)有限元分析[A];第八屆全國(guó)結(jié)構(gòu)工程學(xué)術(shù)會(huì)議論文集(第Ⅲ卷)[C];1999年
8 曹靖;李紅濤;京華;徐繼寧;;一種基于功率補(bǔ)償器的多電平逆變器直流電壓平衡的控制方法[A];2008中國(guó)電工技術(shù)學(xué)會(huì)電力電子學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文摘要集[C];2008年
9 王建華;張方華;龔春英;楊寧;;開關(guān)變換器兩端口網(wǎng)絡(luò)建模、分析及設(shè)計(jì)[A];2009安捷倫科技節(jié)論文集[C];2009年
10 曹裕;陳曉紅;李喜華;;基于企業(yè)生命周期的智力資本與企業(yè)績(jī)效關(guān)系研究[A];第四屆(2009)中國(guó)管理學(xué)年會(huì)——管理科學(xué)與工程分會(huì)場(chǎng)論文集[C];2009年
相關(guān)重要報(bào)紙文章 前1條
1 孫彥 中國(guó)科學(xué)院心理研究所;風(fēng)險(xiǎn)讓人們更加“只顧眼前”[N];中國(guó)社會(huì)科學(xué)報(bào);2010年
相關(guān)博士學(xué)位論文 前8條
1 Khalil Ibrahem Othman;沖積河流水力及河床形態(tài)的數(shù)值模擬究[D];河海大學(xué);2004年
2 李衍杰;擴(kuò)展Markov決策過程的性能靈敏度分析與優(yōu)化[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年
3 孔梅梅;人眼光學(xué)數(shù)字化模型及其光學(xué)參數(shù)干涉測(cè)試方法的研究[D];南京理工大學(xué);2009年
4 尹晶;海岸沙壩運(yùn)動(dòng)的實(shí)驗(yàn)與數(shù)值模擬研究[D];大連理工大學(xué);2012年
5 歐陽長(zhǎng)蓮;DC-DC開關(guān)變換器的建模分析與研究[D];南京航空航天大學(xué);2005年
6 牛全民;基于PSM模式的DC-DC功率變換器非線性建模及集成化設(shè)計(jì)[D];電子科技大學(xué);2009年
7 葛焰明;考慮轉(zhuǎn)移因素的航空收益管理[D];復(fù)旦大學(xué);2011年
8 杜彥良;河流中污染物垂向紊動(dòng)混合規(guī)律及其應(yīng)用研究[D];河海大學(xué);2001年
相關(guān)碩士學(xué)位論文 前10條
1 唐浩陽;物流網(wǎng)絡(luò)中的運(yùn)輸分派模型及其算法研究[D];重慶大學(xué);2002年
2 吳玉華;SMDP基于性能勢(shì)的異步優(yōu)化算法[D];合肥工業(yè)大學(xué);2006年
3 陳棟;SMDP基于性能勢(shì)的NDP優(yōu)化方法及應(yīng)用研究[D];合肥工業(yè)大學(xué);2006年
4 周雷;折扣和平均準(zhǔn)則下SMDP基于性能勢(shì)的統(tǒng)一強(qiáng)化學(xué)習(xí)算法[D];合肥工業(yè)大學(xué);2006年
5 岳萬勇;跨國(guó)供應(yīng)鏈數(shù)量折扣模型的研究[D];西南交通大學(xué);2011年
6 程燕;不確定SMDP基于性能勢(shì)的魯棒控制研究[D];合肥工業(yè)大學(xué);2007年
7 王蓓蓓;多維模糊最優(yōu)控制及其在最優(yōu)停時(shí)中的應(yīng)用[D];南京理工大學(xué);2009年
8 吳慧;CSPS模型基于學(xué)習(xí)的Look-ahead控制研究[D];合肥工業(yè)大學(xué);2007年
9 朱軍衛(wèi);級(jí)聯(lián)型相移載波SPWM逆變器的研究[D];南京航空航天大學(xué);2004年
10 周衛(wèi)東;中國(guó)荷斯坦奶牛泌乳曲線的數(shù)學(xué)模型及其遺傳特性研究[D];浙江大學(xué);2001年
,本文編號(hào):2299502
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2299502.html