基于演化博弈的多智能體任務(wù)轉(zhuǎn)發(fā)的研究
本文關(guān)鍵詞:基于演化博弈的多智能體任務(wù)轉(zhuǎn)發(fā)的研究
更多相關(guān)文章: 多智能體 演化博弈 轉(zhuǎn)發(fā)任務(wù) 獎(jiǎng)勵(lì)機(jī)制
【摘要】:隨著多智能體在任務(wù)分配方面的發(fā)展,如何優(yōu)化任務(wù)分配的問(wèn)題越來(lái)越受到研究者的關(guān)注。由于智能體通常執(zhí)行任務(wù)時(shí)所處的通信環(huán)境相對(duì)惡劣,因而智能體之間是否能夠有效協(xié)作,完成任務(wù),該問(wèn)題至關(guān)重要。 針對(duì)智能體轉(zhuǎn)發(fā)任務(wù)決策影響其他智能體獲取任務(wù)的問(wèn)題,通常在多智能體的群體中每個(gè)智能體都盡可能多地轉(zhuǎn)發(fā)自己獲取的任務(wù),以達(dá)到資源共享的目的。但是考慮到智能體在轉(zhuǎn)發(fā)任務(wù)時(shí),由于受到通訊環(huán)境的限制,發(fā)送的任務(wù)一直丟失,,未能準(zhǔn)確地將任務(wù)送達(dá)到其鄰近的智能體,將導(dǎo)致智能體不再愿意繼續(xù)消耗能量轉(zhuǎn)發(fā)其他智能體的任務(wù)。 本文以演化博弈的動(dòng)力學(xué)為基礎(chǔ)進(jìn)行分析,推導(dǎo)出使得多智能體系統(tǒng)轉(zhuǎn)發(fā)任務(wù)演化穩(wěn)定的條件以及一段時(shí)間內(nèi)各智能體的收益總和最大的條件,并通過(guò)實(shí)驗(yàn)驗(yàn)證了推導(dǎo)的結(jié)論,得出了激勵(lì)制度和通訊等干擾因素對(duì)演化穩(wěn)定狀態(tài)以及多智能體收益的影響。 文章主要研究?jī)?nèi)容如下: 1.考慮智能體受到通訊環(huán)境的影響,結(jié)合博弈論對(duì)于智能體是否轉(zhuǎn)發(fā)其他智能體的矛盾點(diǎn)進(jìn)行了闡述; 2.構(gòu)建智能體任務(wù)轉(zhuǎn)發(fā)演化模型,使得演化過(guò)程中體現(xiàn)出智能體個(gè)體策略的調(diào)整,最終達(dá)到轉(zhuǎn)發(fā)任務(wù)或者不轉(zhuǎn)發(fā)任務(wù)的穩(wěn)定狀態(tài),并得出激勵(lì)制度和通訊等干擾因素對(duì)演化穩(wěn)定狀態(tài)以及多智能體收益的結(jié)論; 3.通過(guò)仿真實(shí)驗(yàn)得出結(jié)論,并分析實(shí)驗(yàn)結(jié)果。
【關(guān)鍵詞】:多智能體 演化博弈 轉(zhuǎn)發(fā)任務(wù) 獎(jiǎng)勵(lì)機(jī)制
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP18;O225
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 1 緒論10-16
- 1.1 課題研究背景10-11
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-13
- 1.3 課題意義13
- 1.4 課題目標(biāo)13-14
- 1.5 論文組織結(jié)構(gòu)14-16
- 2 智能體與演化博弈16-34
- 2.1 智能體16-19
- 2.1.1 智能體的概念16-17
- 2.1.2 多智能體的體系結(jié)構(gòu)17
- 2.1.3 多智能體的通信17-18
- 2.1.4 多智能體的協(xié)作與協(xié)調(diào)18
- 2.1.5 多智能體技術(shù)18-19
- 2.1.6 多智能體的技術(shù)應(yīng)用領(lǐng)域19
- 2.2 博弈論19-30
- 2.2.1 博弈論的基本要素20-21
- 2.2.2 納什均衡21-23
- 2.2.3 博弈的類型23-25
- 2.2.4 博弈論研究的問(wèn)題25
- 2.2.5 演化博弈論25-26
- 2.2.6 演化博弈的理論起源26
- 2.2.7 演化博弈的基本特征26-27
- 2.2.8 演化博弈的建立27-28
- 2.2.9 演化博弈的應(yīng)用優(yōu)勢(shì)28-30
- 2.3 復(fù)制子動(dòng)態(tài)30-32
- 2.3.1 復(fù)制子動(dòng)態(tài)的概述30
- 2.3.2 一般的兩人對(duì)稱博弈復(fù)制子動(dòng)態(tài)30-31
- 2.3.3 一般兩人對(duì)稱博弈復(fù)制子動(dòng)態(tài)和 ESS31-32
- 2.3.4 標(biāo)準(zhǔn)的 N 總體復(fù)制子動(dòng)態(tài)32
- 2.4 本章總結(jié)32-34
- 3 基于演化博弈的多智能體任務(wù)轉(zhuǎn)發(fā)模型34-45
- 3.1 博弈模型34-37
- 3.1.1 智能體雙方都選擇轉(zhuǎn)發(fā)策略35
- 3.1.2 智能體雙方只有一方選擇轉(zhuǎn)發(fā)策略35-36
- 3.1.3 智能體雙方都選擇不轉(zhuǎn)發(fā)策略36-37
- 3.2 反思機(jī)制37-38
- 3.3 演化動(dòng)力學(xué)分析38-40
- 3.4 轉(zhuǎn)發(fā)模型分析40-42
- 3.5 智能體達(dá)到穩(wěn)定狀態(tài)時(shí)的總收益分析42
- 3.6 智能體整個(gè)博弈過(guò)程中的總收益分析42-43
- 3.7 引入反思機(jī)制前后的對(duì)比43-44
- 3.8 本章總結(jié)44-45
- 4 實(shí)驗(yàn)驗(yàn)證45-54
- 4.1 智能體趨向于任務(wù)轉(zhuǎn)發(fā)與趨向于不轉(zhuǎn)發(fā)的條件驗(yàn)證45-50
- 4.2 智能體趨向于任務(wù)轉(zhuǎn)發(fā)時(shí)收益最大的條件的驗(yàn)證50-51
- 4.3 基于反思機(jī)制的復(fù)制子動(dòng)態(tài)與隨機(jī)博弈收益對(duì)比的驗(yàn)證51-52
- 4.4 基于反思機(jī)制的復(fù)制子動(dòng)態(tài)與復(fù)制子動(dòng)態(tài)收斂速度對(duì)比的驗(yàn)證52-54
- 5 總結(jié)與展望54-56
- 5.1 工作總結(jié)54
- 5.2 展望54-56
- 參考文獻(xiàn)56-60
- 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文60-61
- 致謝61
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前9條
1 王占杰;劉晶晶;;基于多Agent的分布式多目標(biāo)任務(wù)調(diào)度機(jī)制研究[J];大連理工大學(xué)學(xué)報(bào);2011年05期
2 耿霆;胡建武;張志良;單小軍;;基于復(fù)雜網(wǎng)絡(luò)與Agent的作戰(zhàn)系統(tǒng)建模[J];艦船電子工程;2010年09期
3 方齊云;郭炳發(fā);;演化博弈理論發(fā)展動(dòng)態(tài)[J];經(jīng)濟(jì)學(xué)動(dòng)態(tài);2005年02期
4 劉金琨,爾聯(lián)潔;多智能體技術(shù)應(yīng)用綜述[J];控制與決策;2001年02期
5 沈士根;馬絢;蔣華;李瑋;曹奇英;;基于演化博弈論的WSNs信任決策模型與動(dòng)力學(xué)分析[J];控制與決策;2012年08期
6 王蕊;周光輝;;基于非合作博弈批量調(diào)度優(yōu)化[J];制造業(yè)自動(dòng)化;2013年14期
7 肖正;張世永;;基于后悔值的多Agent沖突博弈強(qiáng)化學(xué)習(xí)模型[J];軟件學(xué)報(bào);2008年11期
8 徐楊;李響;常宏;王月星;;復(fù)雜網(wǎng)絡(luò)特性對(duì)大規(guī)模多智能體協(xié)同控制的影響[J];軟件學(xué)報(bào);2012年11期
9 劉躍峰;張安;;有人機(jī)/無(wú)人機(jī)編隊(duì)協(xié)同任務(wù)分配方法[J];系統(tǒng)工程與電子技術(shù);2010年03期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 金元日;不確定通信下多智能體系統(tǒng)的一致性[D];浙江大學(xué);2013年
本文編號(hào):1064001
本文鏈接:http://sikaile.net/kejilunwen/yysx/1064001.html