基于中介Agent的強(qiáng)化學(xué)習(xí)優(yōu)化協(xié)商模型
本文關(guān)鍵詞:基于中介Agent的強(qiáng)化學(xué)習(xí)優(yōu)化協(xié)商模型 出處:《計(jì)算機(jī)科學(xué)》2017年01期 論文類型:期刊論文
更多相關(guān)文章: 多Agent 強(qiáng)化學(xué)習(xí) 自適應(yīng)學(xué)習(xí) 中介Agent
【摘要】:提出了一種基于強(qiáng)化學(xué)習(xí)的雙邊優(yōu)化協(xié)商模型。引入了一個(gè)中介Agent。在強(qiáng)化學(xué)習(xí)策略中使用不同的參數(shù)產(chǎn)生提議,進(jìn)而選出最好的參數(shù)進(jìn)行協(xié)商。為了進(jìn)一步提高協(xié)商的性能,還提出了基于中介Agent自適應(yīng)的學(xué)習(xí)能力。仿真實(shí)驗(yàn)結(jié)果證明了所提協(xié)商方法的有效性,且該方法提高了協(xié)商的性能。
[Abstract]:A bilateral optimal negotiation model based on reinforcement learning is proposed. An agent agent is introduced. Different parameters are used to generate proposals in reinforcement learning strategies. Then the best parameters are selected for negotiation. In order to further improve the performance of the negotiation, an adaptive learning ability based on intermediary Agent is proposed. The simulation results show the effectiveness of the proposed negotiation method. The method improves the performance of negotiation.
【作者單位】: 哈爾濱工程大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(61472095,61272186) 智能教育與信息工程黑龍江省高校重點(diǎn)實(shí)驗(yàn)室資助
【分類號(hào)】:TP18
【正文快照】: 1引言 協(xié)商是實(shí)現(xiàn)網(wǎng)上電子商務(wù)的重要手段,也是設(shè)計(jì)軟件Agent的重要目標(biāo)。如何提高Agent自主協(xié)商的能力一直是多Agent系統(tǒng)迫切需要解決的問題。 已經(jīng)存在很多關(guān)于自主Agent協(xié)商的研究方法。比如:張化祥等人[4]把強(qiáng)化學(xué)習(xí)運(yùn)用到談判過程中,引入了價(jià)格信念、時(shí)間信念和時(shí)間貼
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 孫天昊;陳飛;朱慶生;曹峰;;基于貝葉斯分類的增強(qiáng)學(xué)習(xí)協(xié)商策略[J];計(jì)算機(jī)科學(xué);2011年09期
2 隋新;蔡國(guó)永;史磊;;基于Q-強(qiáng)化學(xué)習(xí)的多Agent協(xié)商策略及算法[J];計(jì)算機(jī)工程;2010年17期
3 張化祥,黃上騰;基于增強(qiáng)學(xué)習(xí)的代理談判模型[J];計(jì)算機(jī)工程;2004年10期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張京敏;董紅斌;;基于中介Agent的強(qiáng)化學(xué)習(xí)優(yōu)化協(xié)商模型[J];計(jì)算機(jī)科學(xué);2017年01期
2 檀何鳳;劉政怡;;模式分類方法比較研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2015年02期
3 武玉英;李豪;蔣國(guó)瑞;;基于RBF神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)算法的供應(yīng)鏈產(chǎn)銷協(xié)同計(jì)劃沖突消解研究[J];計(jì)算機(jī)應(yīng)用研究;2015年05期
4 鄧佳賓;廉佐政;王海珍;李耀成;韓江;;基于記憶模型學(xué)習(xí)的商務(wù)Agent協(xié)商設(shè)計(jì)[J];齊齊哈爾大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年06期
5 張科;羅軍;鄧俊昆;;基于改進(jìn)增強(qiáng)學(xué)習(xí)算法的雙邊多協(xié)議協(xié)商策略[J];計(jì)算機(jī)科學(xué);2014年01期
6 游正陸;張剛;;基于貝葉斯的多維數(shù)據(jù)分類模型[J];改革與開放;2013年06期
7 姚淑君;張永亮;;廣義Maxwell流體分?jǐn)?shù)階微分方程的數(shù)值解法[J];計(jì)算機(jī)工程與應(yīng)用;2013年12期
8 蔣國(guó)瑞;胡應(yīng)蘭;;基于D-S證據(jù)理論的多Agent辯論談判策略研究[J];計(jì)算機(jī)工程與應(yīng)用;2013年12期
9 孫天昊;鄧俊昆;陳飛;朱慶生;;基于增強(qiáng)學(xué)習(xí)協(xié)商策略的研究及優(yōu)化[J];計(jì)算機(jī)工程與應(yīng)用;2012年23期
10 張步良;;基于分類概率加權(quán)的樸素貝葉斯分類方法[J];重慶理工大學(xué)學(xué)報(bào)(自然科學(xué));2012年07期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 程昱;高濟(jì);古華茂;傅朝陽(yáng);;基于機(jī)器學(xué)習(xí)的自動(dòng)協(xié)商決策模型[J];軟件學(xué)報(bào);2009年08期
2 李劍;牛少彰;;一種基于混合遺傳算法的雙邊多議題協(xié)商[J];北京郵電大學(xué)學(xué)報(bào);2009年02期
3 孫天昊;朱慶生;李雙慶;周明強(qiáng);;一種優(yōu)化的基于增強(qiáng)學(xué)習(xí)協(xié)商策略[J];計(jì)算機(jī)工程與應(yīng)用;2008年30期
4 程昱;高濟(jì);古華茂;傅朝陽(yáng);;基于對(duì)手態(tài)度學(xué)習(xí)的協(xié)商決策模型[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2008年10期
5 張化祥,黃上騰;基于增強(qiáng)學(xué)習(xí)的代理談判模型[J];計(jì)算機(jī)工程;2004年10期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張宇晴,佟振聲,胡旦華,武雪芳;Agent技術(shù)在廠級(jí)監(jiān)控信息系統(tǒng)中的應(yīng)用[J];上海電力學(xué)院學(xué)報(bào);2004年01期
2 林菁,孟波;群體決策支持系統(tǒng)中的管理和協(xié)調(diào)Agent及其應(yīng)用研究[J];計(jì)算機(jī)應(yīng)用與軟件;2004年12期
3 羅朝春,涂光瑜,羅毅,盛戈f,
本文編號(hào):1439311
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1439311.html