供應(yīng)鏈聯(lián)合補(bǔ)充問題的強(qiáng)化學(xué)習(xí)算法
本文關(guān)鍵詞:供應(yīng)鏈聯(lián)合補(bǔ)充問題的強(qiáng)化學(xué)習(xí)算法
更多相關(guān)文章: 供應(yīng)鏈 聯(lián)合補(bǔ)充問題 強(qiáng)化學(xué)習(xí) 進(jìn)銷存系統(tǒng)
【摘要】:聯(lián)合補(bǔ)充問題(The joint replenishment problem ERP),是指在同一供應(yīng)商處采購多種貨物,對不同周期的不同貨物進(jìn)行調(diào)度的策略問題,好的采購策略能提高庫存管理效果和節(jié)約成本。在實(shí)現(xiàn)生活中,企業(yè)受到外界各種因素的影響,在聯(lián)合補(bǔ)充的過程中需求量或者采購周期往往會產(chǎn)生波動,為了降低企業(yè)的額外無用消耗,模糊聯(lián)合問題就因運(yùn)而生,,問題的解決也變得迫在眉睫。隨著生產(chǎn)生活的需要,企業(yè)需要面對各種各樣的聯(lián)合補(bǔ)充問題,機(jī)器學(xué)習(xí)和ERP相結(jié)合,解決了專家算法中供應(yīng)鏈中的知識獲取問題。強(qiáng)化學(xué)習(xí)是人工智能的重要算法之一,它是通過不斷與環(huán)境交互從而改進(jìn)本身的策略。 首先,研究單一供應(yīng)商條件下需求為模糊變量的聯(lián)合補(bǔ)充問題,需求量為模糊變量,列出其隸屬函數(shù),通過梯形模糊數(shù)求解目標(biāo)函數(shù),通過模糊隸屬度求出目標(biāo)函數(shù),即各產(chǎn)品的補(bǔ)充周期;通過各個產(chǎn)品的最佳補(bǔ)充周期確定對應(yīng)的基本補(bǔ)充周期長度。通過對需求模糊的聯(lián)合補(bǔ)充問題研究,得到一個每次行動后系統(tǒng)獲得的回報函數(shù)并通過學(xué)習(xí)算法對數(shù)學(xué)模型進(jìn)行處理,最終求解出的函數(shù)為最小化訂貨成本。 其次,研究聯(lián)合補(bǔ)充問題的強(qiáng)化學(xué)習(xí)算法。通過強(qiáng)化學(xué)習(xí)對離散問題的研究,從而解決無模型情況下的聯(lián)合補(bǔ)充問題。將聯(lián)合補(bǔ)充問題轉(zhuǎn)變?yōu)闆Q策問題,進(jìn)而使用強(qiáng)化學(xué)習(xí)解決策略問題。依據(jù)半馬爾可夫理論,采用強(qiáng)化學(xué)習(xí)算法,對供應(yīng)鏈中聯(lián)合補(bǔ)充問題進(jìn)行無導(dǎo)師學(xué)習(xí),每種貨物的基本周期作為初始狀態(tài),由馬爾可夫決策鏈,通過行為和轉(zhuǎn)移概率計算出聯(lián)合補(bǔ)充的Q值,參數(shù)選取原則與結(jié)束條件,最后通過實(shí)例的驗(yàn)證證明算法的有效性與實(shí)用性。 最后,將本文研究的學(xué)習(xí)算法應(yīng)用于一套進(jìn)銷存系統(tǒng)中,系統(tǒng)使用SSH框架,使用Java開發(fā),數(shù)據(jù)庫采用Mysql。經(jīng)銷存系統(tǒng)中包括商品管理、采購管理、商品運(yùn)輸、倉庫管理、基礎(chǔ)維護(hù)這五大模塊。通過測試驗(yàn)證,證明了本文模型算法在實(shí)際中的實(shí)用性。
【學(xué)位授予單位】:哈爾濱理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:F274;TP18
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李春貴,劉永信,陳波;多步截斷行動—評價強(qiáng)化學(xué)習(xí)算法[J];內(nèi)蒙古大學(xué)學(xué)報(自然科學(xué)版);2005年02期
2 鄭宇;羅四維;呂子昂;;基于模型的層次化強(qiáng)化學(xué)習(xí)算法[J];北京交通大學(xué)學(xué)報;2006年05期
3 周如益;高陽;;一種基于性能勢的無折扣強(qiáng)化學(xué)習(xí)算法[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2006年04期
4 高陽;周如益;王皓;曹志新;;平均獎賞強(qiáng)化學(xué)習(xí)算法研究[J];計算機(jī)學(xué)報;2007年08期
5 何源;張文生;;基于核方法的強(qiáng)化學(xué)習(xí)算法[J];微計算機(jī)信息;2008年04期
6 楊旭東;劉全;李瑾;;一種基于資格跡的并行強(qiáng)化學(xué)習(xí)算法[J];蘇州大學(xué)學(xué)報(自然科學(xué)版);2012年01期
7 劉夢婷;牟永敏;趙剛;歐陽騰飛;;基于強(qiáng)化學(xué)習(xí)算法的供應(yīng)鏈管理訂單策略研究[J];數(shù)據(jù)通信;2013年01期
8 王學(xué)寧,賀漢根,徐昕;求解部分可觀測馬氏決策過程的強(qiáng)化學(xué)習(xí)算法[J];控制與決策;2004年11期
9 李春貴;劉永信;王萌;;集成規(guī)劃的行動-自適應(yīng)評價強(qiáng)化學(xué)習(xí)算法[J];內(nèi)蒙古大學(xué)學(xué)報(自然科學(xué)版);2008年03期
10 蘇浩銘;王浩;;一種基于模型的強(qiáng)化學(xué)習(xí)算法[J];合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2008年09期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 陳宗海;段家慶;任皴;羅楊宇;李成榮;;針對機(jī)器人覓食任務(wù)的強(qiáng)化學(xué)習(xí)算法及其仿真研究[A];'2008系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會議論文集[C];2008年
2 孟祥萍;苑全德;皮玉珍;;基于量子理論的多Agent系統(tǒng)強(qiáng)化學(xué)習(xí)研究[A];'2006系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會論文集[C];2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 陳興國;基于值函數(shù)估計的強(qiáng)化學(xué)習(xí)算法研究[D];南京大學(xué);2013年
2 鄭宇;分層強(qiáng)化學(xué)習(xí)算法及其應(yīng)用研究[D];北京交通大學(xué);2009年
3 李妼;基于視覺聽覺語義相干性的強(qiáng)化學(xué)習(xí)系統(tǒng)的研究[D];太原理工大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張曉艷;連續(xù)時間分層強(qiáng)化學(xué)習(xí)算法[D];合肥工業(yè)大學(xué);2010年
2 蘇浩銘;基于模型知識的大空間強(qiáng)化學(xué)習(xí)算法的研究與實(shí)現(xiàn)[D];合肥工業(yè)大學(xué);2008年
3 楊宛璐;基于性能勢的改進(jìn)平均獎賞強(qiáng)化學(xué)習(xí)算法研究[D];廣東工業(yè)大學(xué);2014年
4 宋超峰;基于平均型強(qiáng)化學(xué)習(xí)算法的動態(tài)調(diào)度方法的研究[D];天津大學(xué);2006年
5 袁姣紅;基于模型的動態(tài)分層強(qiáng)化學(xué)習(xí)算法研究[D];中南大學(xué);2011年
6 褚建華;Q-learning強(qiáng)化學(xué)習(xí)算法改進(jìn)及其應(yīng)用研究[D];北京化工大學(xué);2009年
7 周雷;折扣和平均準(zhǔn)則下SMDP基于性能勢的統(tǒng)一強(qiáng)化學(xué)習(xí)算法[D];合肥工業(yè)大學(xué);2006年
8 黃付亮;聯(lián)合博弈框架下的多Agent強(qiáng)化學(xué)習(xí)算法研究[D];太原科技大學(xué);2011年
9 趙紹航;供應(yīng)鏈聯(lián)合補(bǔ)充問題的強(qiáng)化學(xué)習(xí)算法[D];哈爾濱理工大學(xué);2015年
10 楊旭東;并行強(qiáng)化學(xué)習(xí)研究[D];蘇州大學(xué);2012年
本文編號:1172565
本文鏈接:http://sikaile.net/guanlilunwen/gongyinglianguanli/1172565.html