基于馬氏決策過(guò)程的易逝品聯(lián)合策略
本文選題:易逝品 + 馬氏決策過(guò)程; 參考:《計(jì)算機(jī)集成制造系統(tǒng)》2017年01期
【摘要】:為了有效解決零售商在銷售易逝品時(shí)的訂貨、舊產(chǎn)品處理及定價(jià)的聯(lián)合決策問(wèn)題,提出運(yùn)用馬氏決策過(guò)程建立模型及使用Q學(xué)習(xí)算法求得最優(yōu)策略。最優(yōu)策略包括各個(gè)狀態(tài)下選擇的決策動(dòng)作,它能使從現(xiàn)在起及后續(xù)無(wú)限期的貼現(xiàn)總值為最大。算法中的迭代公式通過(guò)不斷與環(huán)境進(jìn)行互動(dòng)并得到反饋,時(shí)刻更新最優(yōu)策略。基于有限的狀態(tài)集和動(dòng)作集,在狀態(tài)轉(zhuǎn)移概率及當(dāng)期期望收益未知的情況下,算法經(jīng)過(guò)長(zhǎng)時(shí)間學(xué)習(xí)后能夠得到穩(wěn)定的最優(yōu)策略。研究發(fā)現(xiàn),各參數(shù)(變化)對(duì)聯(lián)合策略中各策略的特征有不同的影響,該結(jié)論為啟發(fā)式策略的相關(guān)研究提供了一定的理論支持和解決思路。
[Abstract]:In order to effectively solve the joint decision problem of ordering, dealing with old products and pricing when retailers sell perishable products, the Markov decision process is used to establish the model and the Q learning algorithm is used to obtain the optimal strategy. The optimal strategy includes the decision actions selected under each state, which can maximize the total discounted value from now on and the following indefinite period. The iterative formula in the algorithm updates the optimal strategy by constantly interacting with the environment and getting feedback. Based on the finite state set and action set, the algorithm can obtain a stable optimal strategy after long learning under the condition of unknown state transition probability and expected income in the current period. It is found that each parameter (variation) has different effects on the characteristics of each strategy in the joint strategy. This conclusion provides some theoretical support and solution for the research of heuristic strategy.
【作者單位】: 暨南大學(xué)管理學(xué)院;
【基金】:廣東省自然科學(xué)基金資助項(xiàng)目(2016Z00052)~~
【分類號(hào)】:F274;F724.2
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 官振中;任建標(biāo);;價(jià)格和庫(kù)存驅(qū)動(dòng)替代的兩產(chǎn)品動(dòng)態(tài)定價(jià)策略[J];系統(tǒng)管理學(xué)報(bào);2013年02期
2 陳旭;考慮需求信息更新的易逝品的訂貨策略[J];計(jì)算機(jī)集成制造系統(tǒng)-CIMS;2003年11期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 鄭江波;程福陽(yáng);楊柳;;基于馬氏決策過(guò)程的易逝品聯(lián)合策略[J];計(jì)算機(jī)集成制造系統(tǒng);2017年01期
2 胡玉生;李金林;冉倫;徐德英;;基于顧客分類的多等級(jí)產(chǎn)品動(dòng)態(tài)定價(jià)[J];系統(tǒng)管理學(xué)報(bào);2016年05期
3 劉芬;;兩階段不確定需求下可替代產(chǎn)品訂貨決策研究[J];經(jīng)營(yíng)管理者;2016年03期
4 元鵬鵬;郝楊楊;李恒;;客戶選擇網(wǎng)絡(luò)零售配送時(shí)隙動(dòng)態(tài)規(guī)劃模型[J];遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年11期
5 李祥祥;郭進(jìn)利;;需求信息更新的制造商兩階段批發(fā)策略[J];系統(tǒng)工程;2015年10期
6 凌有聲;陳淮莉;;缺貨情形下基于消費(fèi)者選擇行為的收益管理研究[J];物流技術(shù);2015年05期
7 何燕;徐和;陳鵬宇;;基于網(wǎng)絡(luò)直銷可替代隨機(jī)需求的供應(yīng)鏈研究[J];管理科學(xué);2015年01期
8 秦詩(shī)月;;考慮需求替代的部分短缺量拖后訂貨模型[J];遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年11期
9 劉盈含;吳龍生;;需求信息更新下缺貨成本共擔(dān)的易逝品供應(yīng)鏈協(xié)調(diào)研究[J];工業(yè)工程;2014年05期
10 施國(guó)洪;郭志霞;;考慮庫(kù)存和運(yùn)輸成本的易逝品零售商訂貨策略[J];物流技術(shù);2014年11期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 官振中;史本山;;易逝性高科技產(chǎn)品收益管理定價(jià)策略[J];管理科學(xué)學(xué)報(bào);2008年05期
2 陳劍;肖勇波;劉曉玲;陳友華;;基于乘客選擇行為的航空機(jī)票控制模型研究[J];系統(tǒng)工程理論與實(shí)踐;2006年01期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 高斌;;基于電子易逝品的回收再利用研究[J];物流工程與管理;2013年05期
2 馬慶國(guó);孟麗君;;存在退貨的易逝品庫(kù)存系統(tǒng)仿真研究[J];西安電子科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2009年01期
3 蔣維;李君靈;楊曉恝;;供應(yīng)不確定下易逝品定價(jià)和訂貨聯(lián)合決策模型[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年03期
4 葛澤慧;王素娟;桂宏;;易逝品最優(yōu)訂貨模型與數(shù)值分析[J];上海理工大學(xué)學(xué)報(bào);2011年01期
5 饒文婷;;易逝品庫(kù)存風(fēng)險(xiǎn)管理淺議[J];商場(chǎng)現(xiàn)代化;2008年13期
6 范琛;姚儉;;易逝品供應(yīng)鏈季末庫(kù)存價(jià)值實(shí)現(xiàn)問(wèn)題的比較研究[J];上海理工大學(xué)學(xué)報(bào);2009年03期
7 王鶯;;供應(yīng)鏈競(jìng)爭(zhēng)零售商的易逝品定價(jià)問(wèn)題研究[J];統(tǒng)計(jì)與決策;2009年15期
8 劉小艷;王鶯;;替代性易逝品降價(jià)時(shí)點(diǎn)設(shè)定問(wèn)題的博弈分析[J];開發(fā)研究;2011年02期
9 王鶯;張治國(guó);劉成華;;時(shí)變條件下易逝品運(yùn)輸?shù)穆窂竭x擇[J];統(tǒng)計(jì)與決策;2009年10期
10 徐輝;李成嚴(yán);周力波;;基于蟻群算法的易逝品訂貨問(wèn)題研究[J];哈爾濱理工大學(xué)學(xué)報(bào);2010年03期
相關(guān)會(huì)議論文 前1條
1 徐永鋒;戴岱;羅迎;劉陽(yáng);;基于信用支付的易逝品集中訂貨決策模型[A];第六屆(2011)中國(guó)管理學(xué)年會(huì)——管理科學(xué)與工程分會(huì)場(chǎng)論文集[C];2011年
相關(guān)博士學(xué)位論文 前7條
1 馮琳;易逝品庫(kù)存控制及收益管理研究[D];天津大學(xué);2014年
2 陳娟;基于再制造的高殘值易逝品供應(yīng)鏈研究[D];上海交通大學(xué);2010年
3 陽(yáng)成虎;隨機(jī)環(huán)境下若干易逝品定價(jià)模型研究[D];西南交通大學(xué);2008年
4 曹細(xì)玉;基于多變量決策的易逝品供應(yīng)鏈協(xié)調(diào)研究[D];南京航空航天大學(xué);2007年
5 汪峻萍;易逝品供應(yīng)鏈優(yōu)化與協(xié)調(diào)問(wèn)題研究[D];合肥工業(yè)大學(xué);2014年
6 謝小良;易逝品庫(kù)存運(yùn)輸整合優(yōu)化[D];中南大學(xué);2010年
7 孟麗君;易逝品逆向物流的庫(kù)存控制及車輛路徑問(wèn)題的優(yōu)化研究[D];浙江大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 方欽榕;考慮消費(fèi)者策略行為的易逝品供應(yīng)鏈定價(jià)與協(xié)調(diào)機(jī)制研究[D];東北大學(xué);2014年
2 劉錚;考慮顧客行為的易逝品定價(jià)策略研究[D];東北大學(xué);2013年
3 盧梅金;易逝品生產(chǎn)—分銷網(wǎng)絡(luò)優(yōu)化策略研究[D];福州大學(xué);2014年
4 馮琳;供應(yīng)鏈環(huán)境下易逝品的最優(yōu)庫(kù)存控制[D];天津大學(xué);2011年
5 馬國(guó)柱;易逝品的種類選擇及訂購(gòu)定價(jià)策略研究[D];華中科技大學(xué);2010年
6 于運(yùn)平;基于信用支付的易逝品三階段經(jīng)濟(jì)訂貨策略[D];青島大學(xué);2010年
7 張之偉;零售企業(yè)配送中心的易逝品庫(kù)存控制與門店配送研究[D];北京交通大學(xué);2013年
8 徐如乾;易逝品庫(kù)存策略研究[D];青島大學(xué);2011年
9 石忠城;基于企業(yè)社會(huì)責(zé)任的易逝品供應(yīng)鏈整合及網(wǎng)絡(luò)均衡分析[D];東北大學(xué);2009年
10 李晨;易逝品供應(yīng)鏈線性返利合作模型與延遲交貨策略研究[D];重慶大學(xué);2008年
,本文編號(hào):2006368
本文鏈接:http://sikaile.net/jingjilunwen/xmjj/2006368.html