基于協(xié)作機制的多Agent追捕研究

發(fā)布時間：2018-03-12 14:20

本文選題：多智能體系統(tǒng)　切入點：追逃　出處：《哈爾濱工業(yè)大學》2017年博士論文　論文類型：學位論文

【摘要】：基于agent的模型(ABMs)在人工智能及虛擬現實等領域一直都是在試圖模仿人類的行為,在一個人工環(huán)境中,為了產生許多社會科學家可以理解的可能現象,agent的決策模塊要互相影響并進行交互。這個定義對于那些不是在分布式人工智能(DAI)的專家來說并不是特別清楚,但是如果考慮到那些反映了特殊類型的ABM鼎鼎大名的視頻游戲,它確實提供了一個明確的意義。事實上,視頻游戲將虛擬世界的玩家和一些互動的人物整合了起來,例如:怪物,追兵,逃跑者、宇航員、士兵等。這些agent中的每一個在特定的情況下都在進行一種特定的并且規(guī)則的行為(一種行為算法),最重要的是,agent可以與其他agent進行交互。然而,游戲也有很大的概率隨機產生許多不同的結果,電子游戲基于每個agent的交互性而可以產生大量不確定的事件。在基于agent的不同領域,如任務協(xié)調和路徑規(guī)劃等,移動agent在未知環(huán)境下的追捕成為一個最有趣的挑戰(zhàn),該論文的總體目標是提出基于組織框架和博弈論的理論多agent系統(tǒng)的協(xié)作機制,以檢查和解決一些涉及多智能體的追捕及逃脫的問題。該聯(lián)盟機制將允許agent合作和自己協(xié)調自身任務,及時和有效地實現全局目標。在路徑規(guī)劃方面,提出了一種基于隨機馬爾可夫運動策略決策過程的方法(MDP)。此外,還開發(fā)了一種避障算法,允許agent在遇到的障礙時可以采取一些有效的方法。仿真實驗的目標是展示這些不同的機制在追捕的過程中如何影響的捕獲時間和內在學習的過程。本文共分為五章:第1章介紹了工作的主要目標以及對一些相關工作的原理及結果的介紹。該章節(jié)專注于探索適用于多Agent系統(tǒng)不同的任務和路徑規(guī)劃方法。此外,考慮到這些機制在關系到追捕和逃避問題的應用。這些章節(jié)的最后是關于論文工作的一些規(guī)范的介紹。第2章提出了一種基于Agent-組-角色(AGR)模型的聯(lián)盟形成算法。該算法的應用為了衡量對不同的捕獲者追捕群組的影響的形成及其面不同追捕者的穩(wěn)定性。在這個模型中,多個agent通過提出獲得群組中的角色來形成群組。在聯(lián)盟形成過程中,agent必須在群組創(chuàng)建的過程中執(zhí)行一組特定的任務,以實現固定的目標。為了控制agent的運動策略,利用基于馬爾可夫的決策過程(MDP)的方法,允許在合作的多agent系統(tǒng)中通過使用獎勵和轉移函數來決策問題。第3章簡述了其他兩個基于組織原則的任務協(xié)調機制。以定義一個抓捕群組組訪問機制為目標,提出了一個YAMAM模型任務協(xié)調機制(Yet Another Multi-Agent Model)。確定了一些agent,角色,任務和技能等概念來形成這個抓捕逃脫問題的框架,并優(yōu)化的不同追逐群組組之間的任務共享機制。開發(fā)了一個靈活的基于模糊邏輯理論的AGR模型。該模型的目的是讓不同群組互動、組織和動態(tài)重組。在追逃問題上,提取出了不同程度的靈活性的組織模型的分組算法,突出了對逃跑者的捕獲時間以及對動態(tài)重組的發(fā)展在任務執(zhí)行過程中的積極作用。在4章中,提出了一種迭代剔除劣勢策略分散的聯(lián)盟形成算法(IED)。這種博弈論決策過程是常見的解決問題的方法,該過程需要反復挑選出的占主導地位的戰(zhàn)略,以確定通過這種方法達到平衡。第5章重點研究了在追求目標的過程中所遇到的復雜的障礙如U和H的處理,提出了基于bug算法和通過MDP的應用來生成獎勵的方法來實現避障。這個新的過程稱為獎勵錯誤算法(RBA),提高了agent上傳感器返回的環(huán)境數據的使用效率,證明了(RBA)是如何提高追捕者的目標轉向正確率以及他們在障礙物躲避上的決策的效率。
[Abstract]:......
【學位授予單位】：哈爾濱工業(yè)大學
【學位級別】：博士
【學位授予年份】：2017
【分類號】：TP18

【相似文獻】

相關期刊論文前10條

1 ;Approach to Weighted Geometric Evaluation Based on Projection Pursuit[J];Engineering Sciences;2006年01期

2 ;A New Optimization Neural Network for High Resolution Time-Frequency Analysis[J];電路與系統(tǒng)學報;1997年01期

3 Jun Li;Wen-Long Song;Yu-Rong He;;Research of Multiagent Coordination and Cooperation Algorithm[J];Journal of Harbin Institute of Technology;2013年03期

4 ;COMPRESSED SPEECH SIGNAL SENSING BASED ON THE STRUCTURED BLOCK SPARSITY WITH PARTIAL KNOWLEDGE OF SUPPORT[J];Journal of Electronics(China);2012年Z1期

5 ;A NEW APPROACH FOR UNSUPERVISED RESTORING IMAGES BASED ON WAVELET-DOMAIN PROJECTION PURSUIT LEARNING NETWORK[J];Journal of Electronics(China);2003年05期

6 Nguyen ThanhSon;Guo Shuxu;Chen Haipeng;;EFFECT OF MULTIPATH CHANNEL MODELS TO THE RECOVERY ALGORITHMS ON COMPRESSED SENSING IN UWB CHANNEL ESTIMATION[J];Journal of Electronics(China);2013年03期

7 趙治棟;楊雷;陳甸甸;;基于FFT-Matching Pursuit的心電身份識別算法研究[J];傳感技術學報;2013年03期

8 ;Coordination of multiple mobile robots with limited communication range in pursuit of single mobile target in cluttered environment[J];Journal of Control Theory and Applications;2010年04期

9 ;NEW BOOKS[J];China's Tibet;2009年02期

10 ;A DISTRIBUTED COMPRESSED SENSING APPROACH FOR SPEECH SIGNAL DENOISING[J];Journal of Electronics(China);2011年Z1期

相關會議論文前10條

1 Maha Chakri Sirindhorn;;The Pursuit of Knowledge as a Form of Promoting Social Progress[A];文明的和諧與共同繁榮——北京論壇（2004）論文選集[C];2004年

2 嚴德志;于鳳芹;;基于Matching Pursuit的音像信號的分析[A];第十二屆全國信號處理學術年會（CCSP-2005）論文集[C];2005年

3 ;Study on a Solution of Pursuit-evasion Differential Game Based on Artificial Fish School Algorithm[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年

4 ;A PSO Solution for Pursuit-evasion Problem of Randomly Mobile Agents[A];2009中國控制與決策會議論文集（3）[C];2009年

5 ;Time-Lag Effect on the Capture Capability of Pursuit-Control[A];第二十六屆中國控制會議論文集[C];2007年

6 ;Fuzzy Logical Guidance Based on Particle Swarm Optimized Parameters[A];第二十七屆中國控制會議論文集[C];2008年

7 ;A New Multiple Attribute Decision Making Method Based on Preference and Projection Pursuit Clustering Model[A];中國自動化學會控制理論專業(yè)委員會D卷[C];2011年

8 ;In the Pursuit of Vyakarana-elements in Chinese Translations[A];文明的和諧與共同繁榮：人類文明的多元發(fā)展模式——北京論壇（2007）論文選集[C];2007年

9 楊熙;王金枝;;多智能體系統(tǒng)一致性的魯棒性分析[A];第五屆全國復雜網絡學術會議論文（摘要）匯集[C];2009年

10 張亞;田玉平;;離散時間多智能體系統(tǒng)一致的權重條件[A];中國自動化學會控制理論專業(yè)委員會B卷[C];2011年

相關重要報紙文章前2條

1 記者田蓓蕾;全市二○○六年反腐敗重點任務協(xié)調組工作會議召開[N];遼源日報;2006年

2 記者胡加齊;墨西哥發(fā)明盲人電子避障裝置[N];新華每日電訊;2000年

相關博士學位論文前10條

1 蘇迪（Mohammed El Habib Souidi）;基于協(xié)作機制的多Agent追捕研究[D];哈爾濱工業(yè)大學;2017年

2 王振華;具有通信時滯的線性多智能體系統(tǒng)的趨同[D];山東大學;2015年

3 鄭寶杰;多智能體系統(tǒng)若干包含控制問題研究[D];鄭州大學;2015年

4 張方方;多智能體系統(tǒng)分布式優(yōu)化控制[D];山東大學;2015年

5 龍曉軍;多智能體系統(tǒng)的有限時間一致性跟蹤[D];大連海事大學;2015年

6 楊新榮;廣義多智能體系統(tǒng)的一致性問題研究[D];哈爾濱工業(yè)大學;2015年

7 夏紅;多智能體系統(tǒng)群一致性與編隊控制研究[D];電子科技大學;2014年

8 李金沙;多智能體系統(tǒng)一致性學習協(xié)議的設計與分析[D];西安電子科技大學;2015年

9 黃捷;高階非線性多智能體系統(tǒng)一致性控制研究[D];北京理工大學;2015年

10 楊大鵬;多智能體系統(tǒng)的事件驅動一致性控制與多Lagrangian系統(tǒng)的分布式協(xié)同[D];北京理工大學;2015年

相關碩士學位論文前10條

1 李沛;翻譯報告：感性文化與理性文化-摘自 The Pursuit of Glory: Europe 1648-1815[D];云南大學;2014年

2 孟亞偉;一類具有時滯和領導者的二階多智能體系統(tǒng)的一致性[D];重慶師范大學;2013年

3 劉孝琪;多智能體系統(tǒng)一致性及其在蜂擁控制中的應用研究[D];電子科技大學;2013年

4 王琛陽;帶領導者的多智能體系統(tǒng)一致性問題研究[D];河北大學;2015年

5 陳小龍;基于量化信息的多智能體系統(tǒng)狀態(tài)估計[D];西南交通大學;2015年

6 王航飛;基于事件驅動的多智能體系統(tǒng)的環(huán)形編隊控制研究[D];華北電力大學;2015年

7 陳文秀;離散時間廣義多智能體系統(tǒng)的容許一致性[D];溫州大學;2015年

8 張文濤;多智能體系統(tǒng)分布式協(xié)調控制的相關問題研究[D];浙江師范大學;2015年

9 曹偉俊;帶有擾動的多智能體系統(tǒng)的一致性研究[D];北京化工大學;2015年

10 成照萌;多智能體系統(tǒng)的模型預測控制[D];華中科技大學;2015年

，

本文編號：1601936

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1601936.html

上一篇：基于卷積神經網絡的水稻蟲害識別
下一篇：基于相似性的無線傳感網定位算法研究

論文發(fā)表

·知網|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于協(xié)作機制的多Agent追捕研究