供應(yīng)鏈聯(lián)合補(bǔ)充問(wèn)題的強(qiáng)化學(xué)習(xí)算法
本文關(guān)鍵詞:供應(yīng)鏈聯(lián)合補(bǔ)充問(wèn)題的強(qiáng)化學(xué)習(xí)算法
更多相關(guān)文章: 供應(yīng)鏈 聯(lián)合補(bǔ)充問(wèn)題 強(qiáng)化學(xué)習(xí) 進(jìn)銷(xiāo)存系統(tǒng)
【摘要】:聯(lián)合補(bǔ)充問(wèn)題(The joint replenishment problem ERP),是指在同一供應(yīng)商處采購(gòu)多種貨物,對(duì)不同周期的不同貨物進(jìn)行調(diào)度的策略問(wèn)題,好的采購(gòu)策略能提高庫(kù)存管理效果和節(jié)約成本。在實(shí)現(xiàn)生活中,企業(yè)受到外界各種因素的影響,在聯(lián)合補(bǔ)充的過(guò)程中需求量或者采購(gòu)周期往往會(huì)產(chǎn)生波動(dòng),為了降低企業(yè)的額外無(wú)用消耗,模糊聯(lián)合問(wèn)題就因運(yùn)而生,,問(wèn)題的解決也變得迫在眉睫。隨著生產(chǎn)生活的需要,企業(yè)需要面對(duì)各種各樣的聯(lián)合補(bǔ)充問(wèn)題,機(jī)器學(xué)習(xí)和ERP相結(jié)合,解決了專(zhuān)家算法中供應(yīng)鏈中的知識(shí)獲取問(wèn)題。強(qiáng)化學(xué)習(xí)是人工智能的重要算法之一,它是通過(guò)不斷與環(huán)境交互從而改進(jìn)本身的策略。 首先,研究單一供應(yīng)商條件下需求為模糊變量的聯(lián)合補(bǔ)充問(wèn)題,需求量為模糊變量,列出其隸屬函數(shù),通過(guò)梯形模糊數(shù)求解目標(biāo)函數(shù),通過(guò)模糊隸屬度求出目標(biāo)函數(shù),即各產(chǎn)品的補(bǔ)充周期;通過(guò)各個(gè)產(chǎn)品的最佳補(bǔ)充周期確定對(duì)應(yīng)的基本補(bǔ)充周期長(zhǎng)度。通過(guò)對(duì)需求模糊的聯(lián)合補(bǔ)充問(wèn)題研究,得到一個(gè)每次行動(dòng)后系統(tǒng)獲得的回報(bào)函數(shù)并通過(guò)學(xué)習(xí)算法對(duì)數(shù)學(xué)模型進(jìn)行處理,最終求解出的函數(shù)為最小化訂貨成本。 其次,研究聯(lián)合補(bǔ)充問(wèn)題的強(qiáng)化學(xué)習(xí)算法。通過(guò)強(qiáng)化學(xué)習(xí)對(duì)離散問(wèn)題的研究,從而解決無(wú)模型情況下的聯(lián)合補(bǔ)充問(wèn)題。將聯(lián)合補(bǔ)充問(wèn)題轉(zhuǎn)變?yōu)闆Q策問(wèn)題,進(jìn)而使用強(qiáng)化學(xué)習(xí)解決策略問(wèn)題。依據(jù)半馬爾可夫理論,采用強(qiáng)化學(xué)習(xí)算法,對(duì)供應(yīng)鏈中聯(lián)合補(bǔ)充問(wèn)題進(jìn)行無(wú)導(dǎo)師學(xué)習(xí),每種貨物的基本周期作為初始狀態(tài),由馬爾可夫決策鏈,通過(guò)行為和轉(zhuǎn)移概率計(jì)算出聯(lián)合補(bǔ)充的Q值,參數(shù)選取原則與結(jié)束條件,最后通過(guò)實(shí)例的驗(yàn)證證明算法的有效性與實(shí)用性。 最后,將本文研究的學(xué)習(xí)算法應(yīng)用于一套進(jìn)銷(xiāo)存系統(tǒng)中,系統(tǒng)使用SSH框架,使用Java開(kāi)發(fā),數(shù)據(jù)庫(kù)采用Mysql。經(jīng)銷(xiāo)存系統(tǒng)中包括商品管理、采購(gòu)管理、商品運(yùn)輸、倉(cāng)庫(kù)管理、基礎(chǔ)維護(hù)這五大模塊。通過(guò)測(cè)試驗(yàn)證,證明了本文模型算法在實(shí)際中的實(shí)用性。
【學(xué)位授予單位】:哈爾濱理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:F274;TP18
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 李春貴,劉永信,陳波;多步截?cái)嘈袆?dòng)—評(píng)價(jià)強(qiáng)化學(xué)習(xí)算法[J];內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年02期
2 鄭宇;羅四維;呂子昂;;基于模型的層次化強(qiáng)化學(xué)習(xí)算法[J];北京交通大學(xué)學(xué)報(bào);2006年05期
3 周如益;高陽(yáng);;一種基于性能勢(shì)的無(wú)折扣強(qiáng)化學(xué)習(xí)算法[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年04期
4 高陽(yáng);周如益;王皓;曹志新;;平均獎(jiǎng)賞強(qiáng)化學(xué)習(xí)算法研究[J];計(jì)算機(jī)學(xué)報(bào);2007年08期
5 何源;張文生;;基于核方法的強(qiáng)化學(xué)習(xí)算法[J];微計(jì)算機(jī)信息;2008年04期
6 楊旭東;劉全;李瑾;;一種基于資格跡的并行強(qiáng)化學(xué)習(xí)算法[J];蘇州大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年01期
7 劉夢(mèng)婷;牟永敏;趙剛;歐陽(yáng)騰飛;;基于強(qiáng)化學(xué)習(xí)算法的供應(yīng)鏈管理訂單策略研究[J];數(shù)據(jù)通信;2013年01期
8 王學(xué)寧,賀漢根,徐昕;求解部分可觀(guān)測(cè)馬氏決策過(guò)程的強(qiáng)化學(xué)習(xí)算法[J];控制與決策;2004年11期
9 李春貴;劉永信;王萌;;集成規(guī)劃的行動(dòng)-自適應(yīng)評(píng)價(jià)強(qiáng)化學(xué)習(xí)算法[J];內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年03期
10 蘇浩銘;王浩;;一種基于模型的強(qiáng)化學(xué)習(xí)算法[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年09期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 陳宗海;段家慶;任皴;羅楊宇;李成榮;;針對(duì)機(jī)器人覓食任務(wù)的強(qiáng)化學(xué)習(xí)算法及其仿真研究[A];'2008系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2008年
2 孟祥萍;苑全德;皮玉珍;;基于量子理論的多Agent系統(tǒng)強(qiáng)化學(xué)習(xí)研究[A];'2006系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2006年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 陳興國(guó);基于值函數(shù)估計(jì)的強(qiáng)化學(xué)習(xí)算法研究[D];南京大學(xué);2013年
2 鄭宇;分層強(qiáng)化學(xué)習(xí)算法及其應(yīng)用研究[D];北京交通大學(xué);2009年
3 李?yuàn)?基于視覺(jué)聽(tīng)覺(jué)語(yǔ)義相干性的強(qiáng)化學(xué)習(xí)系統(tǒng)的研究[D];太原理工大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 張曉艷;連續(xù)時(shí)間分層強(qiáng)化學(xué)習(xí)算法[D];合肥工業(yè)大學(xué);2010年
2 蘇浩銘;基于模型知識(shí)的大空間強(qiáng)化學(xué)習(xí)算法的研究與實(shí)現(xiàn)[D];合肥工業(yè)大學(xué);2008年
3 楊宛璐;基于性能勢(shì)的改進(jìn)平均獎(jiǎng)賞強(qiáng)化學(xué)習(xí)算法研究[D];廣東工業(yè)大學(xué);2014年
4 宋超峰;基于平均型強(qiáng)化學(xué)習(xí)算法的動(dòng)態(tài)調(diào)度方法的研究[D];天津大學(xué);2006年
5 袁姣紅;基于模型的動(dòng)態(tài)分層強(qiáng)化學(xué)習(xí)算法研究[D];中南大學(xué);2011年
6 褚建華;Q-learning強(qiáng)化學(xué)習(xí)算法改進(jìn)及其應(yīng)用研究[D];北京化工大學(xué);2009年
7 周雷;折扣和平均準(zhǔn)則下SMDP基于性能勢(shì)的統(tǒng)一強(qiáng)化學(xué)習(xí)算法[D];合肥工業(yè)大學(xué);2006年
8 黃付亮;聯(lián)合博弈框架下的多Agent強(qiáng)化學(xué)習(xí)算法研究[D];太原科技大學(xué);2011年
9 趙紹航;供應(yīng)鏈聯(lián)合補(bǔ)充問(wèn)題的強(qiáng)化學(xué)習(xí)算法[D];哈爾濱理工大學(xué);2015年
10 楊旭東;并行強(qiáng)化學(xué)習(xí)研究[D];蘇州大學(xué);2012年
本文編號(hào):1172565
本文鏈接:http://sikaile.net/guanlilunwen/gongyinglianguanli/1172565.html