天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 管理論文 > 供應(yīng)鏈論文 >

基于RBF神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)算法的供應(yīng)鏈產(chǎn)銷(xiāo)協(xié)同計(jì)劃沖突消解研究

發(fā)布時(shí)間:2017-08-10 06:35

  本文關(guān)鍵詞:基于RBF神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)算法的供應(yīng)鏈產(chǎn)銷(xiāo)協(xié)同計(jì)劃沖突消解研究


  更多相關(guān)文章: 多agent 自學(xué)習(xí) RBF神經(jīng)網(wǎng)絡(luò) Q-強(qiáng)化學(xué)習(xí) 沖突消解


【摘要】:為提高傳統(tǒng)協(xié)商自學(xué)習(xí)能力,利用多agent智能技術(shù),建立基于黑板模型的協(xié)商框架,構(gòu)建五元組協(xié)商模型,采取Q-強(qiáng)化學(xué)習(xí)算法,給出一種協(xié)商策略;使用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)一步優(yōu)化協(xié)商策略,預(yù)測(cè)對(duì)手信息并調(diào)整讓步幅度。通過(guò)算例驗(yàn)證該方法的可行性和有效性,通過(guò)與未改進(jìn)的Q-強(qiáng)化學(xué)習(xí)算法對(duì)比,該方法可增強(qiáng)協(xié)商agent的自學(xué)習(xí)能力,縮短協(xié)商時(shí)間,提高沖突消解效率。
【作者單位】: 北京工業(yè)大學(xué)經(jīng)濟(jì)管理學(xué)院;
【關(guān)鍵詞】多agent 自學(xué)習(xí) RBF神經(jīng)網(wǎng)絡(luò) Q-強(qiáng)化學(xué)習(xí) 沖突消解
【基金】:國(guó)家自然科學(xué)基金面上資助項(xiàng)目(71371018) 北京市社科規(guī)劃項(xiàng)目(13JDJGB037)
【分類(lèi)號(hào)】:F274;TP183
【正文快照】: 0引言為快速及時(shí)地滿(mǎn)足動(dòng)態(tài)變化的市場(chǎng)需求,供應(yīng)鏈上的銷(xiāo)售商往往與制造商提早建立合同,制定商品采購(gòu)計(jì)劃。目前計(jì)劃的制定已從過(guò)去簡(jiǎn)單的物品買(mǎi)賣(mài),轉(zhuǎn)變?yōu)榭紤]全局利益的產(chǎn)銷(xiāo)協(xié)同計(jì)劃。然而由于供應(yīng)鏈企業(yè)之間的目標(biāo)往往是對(duì)立的,協(xié)同計(jì)劃時(shí)不免針對(duì)價(jià)格、交貨期等產(chǎn)生分歧,出

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條

1 隋新;蔡國(guó)永;史磊;;基于Q-強(qiáng)化學(xué)習(xí)的多Agent協(xié)商策略及算法[J];計(jì)算機(jī)工程;2010年17期

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 張冬梅;劉強(qiáng);;一種基于強(qiáng)化學(xué)習(xí)的傳感器網(wǎng)絡(luò)應(yīng)用重構(gòu)決策方法[J];北京交通大學(xué)學(xué)報(bào);2010年03期

2 楊萍;畢義明;孫淑玲;;具有自主決策能力的機(jī)動(dòng)單元智能體研究[J];兵工學(xué)報(bào);2007年11期

3 趙曉華;李振龍;于泉;張杰;;基于切換模型的兩交叉口信號(hào)燈Q學(xué)習(xí)協(xié)調(diào)控制[J];北京工業(yè)大學(xué)學(xué)報(bào);2007年11期

4 孫若瑩;李忱;趙剛;;基于強(qiáng)化學(xué)習(xí)的牛鞭效應(yīng)對(duì)策模型[J];北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期

5 王華;崔曉婷;劉向東;張宇河;;基于Q-學(xué)習(xí)的衛(wèi)星姿態(tài)在線模糊神經(jīng)網(wǎng)絡(luò)控制[J];北京理工大學(xué)學(xué)報(bào);2006年03期

6 畢金波,吳滄浦;有效的自適應(yīng)λ即時(shí)差異學(xué)習(xí)(英文)[J];Journal of Beijing Institute of Technology(English Edition);1999年03期

7 童亮;陸際聯(lián);;Multi-Agent Reinforcement Learning Algorithm Based on Action Prediction[J];Journal of Beijing Institute of Technology(English Edition);2006年02期

8 吳洪巖;劉淑華;張崳;;基于RBFNN的強(qiáng)化學(xué)習(xí)在機(jī)器人導(dǎo)航中的應(yīng)用[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2009年02期

9 楊銀賢;Multi-agent reinforcement learning using modular neural network Q-learning algorithms[J];Journal of Chongqing University;2005年01期

10 楊東,殷萇茗,陳煥文,吳柏森;基于Q-學(xué)習(xí)的非線性控制[J];長(zhǎng)沙電力學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年01期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 王作為;具有認(rèn)知能力的智能機(jī)器人行為學(xué)習(xí)方法研究[D];哈爾濱工程大學(xué);2010年

2 高延增;超小型水下機(jī)器人關(guān)鍵性能提升技術(shù)研究[D];華南理工大學(xué);2010年

3 黃正行;臨床過(guò)程分析與優(yōu)化技術(shù)研究[D];浙江大學(xué);2010年

4 林龍信;仿生水下機(jī)器人的增強(qiáng)學(xué)習(xí)控制方法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

5 馮奇;POMDP近似解法研究及在中醫(yī)診療方案優(yōu)化中的應(yīng)用[D];北京交通大學(xué);2011年

6 孫祥;大學(xué)生就業(yè)區(qū)域流向及引導(dǎo)策略研究[D];合肥工業(yè)大學(xué);2011年

7 陳學(xué)松;強(qiáng)化學(xué)習(xí)及其在機(jī)器人系統(tǒng)中的應(yīng)用研究[D];廣東工業(yè)大學(xué);2011年

8 李s,

本文編號(hào):649315


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/gongyinglianguanli/649315.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)68b1b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com