基于BDI的管制員Agent建模技術
發(fā)布時間:2017-08-03 23:23
本文關鍵詞:基于BDI的管制員Agent建模技術
更多相關文章: BDI Agent 強化學習 Jadex 管制員建模 多Agent系統
【摘要】:人工智能自20世紀50年代誕生起就受到廣泛關注,到目前為止國內外許多著名高校均成立了專門研究人工智能學科的研究機構。多門學科的技術在人工智能有所應用,因此,對人工智能的研究具有一定的挑戰(zhàn)性。伴隨著計算機技術的發(fā)展和全球信息化大潮的推動,人工智能的研究課題和應用領域也在不斷擴展。Agent(智能體)作為人工智能理論的一種相對較新的軟件模式,將人工智能理論引入到分布式系統的主流領域。國內已經有人運用Agent技術構建了空中交通運行仿真系統,但側重于構建Agent之間的通信協作關系,并沒有從邏輯層面對Agent進行深入建模。針對空中交通仿真系統中的管制員Agent建模問題,本文分析了管制操作行為特點,采用最流行的Agent模型——BDI模型,建立了基于決策樹模型的管制規(guī)則知識庫,設計了慎思型管制員Agent;贘adex平臺,構建了管制員Agent模型,將由JADE平臺建立的航空器Agent和模擬空管自動化系統Agent與Jadex平臺建立的管制員Agent進行通信與協調,通過仿真系統構建仿真場景并驗證管制員Agent的BDI推理過程,實現了對管制員的日常指揮行為的模擬。同時,考慮到在某些情況下,Agent的先驗知識并不完善,需要學習功能對其進行補充,因此,本文提出了管制員Agent的學習行為,并運用Q學習算法對其進行編程實現并對學習效果進行分析。實驗結果表明,本文所構建的管制員Agent模型可以順利進行BDI推理過程和學習行為并對飛行沖突進行探測與解脫,證明了本文構建的BDI模型和學習行為的有效性與合理性。
【關鍵詞】:BDI Agent 強化學習 Jadex 管制員建模 多Agent系統
【學位授予單位】:南京航空航天大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP18;V355.1
【目錄】:
- 摘要4-5
- ABSTRACT5-13
- 縮略詞13-14
- 第一章 緒論14-19
- 1.1 研究背景14-15
- 1.2 國內外研究現狀15-17
- 1.2.1 BDI Agent系統研究方面15
- 1.2.2 空中交通運行仿真方面15-17
- 1.3 本文的主要研究工作17
- 1.4 本文的內容安排17-19
- 第二章 基于BDI模型的Agent理論研究19-32
- 2.1 Agent定義及體系結構19-21
- 2.1.1 Agent定義19-20
- 2.1.2 Agent體系結構20-21
- 2.2 BDI Agent技術核心21-24
- 2.2.1 BDI Agent基本結構22-23
- 2.2.2 BDI Agent行為產生原理23-24
- 2.3 Jadex BDI Agent平臺研究24-31
- 2.3.1 Jadex架構25-26
- 2.3.2 Jadex中的BDI模型26-29
- 2.3.2.1 信念(Belief)26-27
- 2.3.2.2 目標(Goal)27-28
- 2.3.2.3 規(guī)劃(Plan)28-29
- 2.3.2.4 能力(Capability)29
- 2.3.3 Jadex中的Agent規(guī)范29-31
- 2.4 本章小結31-32
- 第三章 管制員Agent模型的實現32-48
- 3.1 管制員Agent的基本BDI模型32-33
- 3.2 管制操作特征分析33-36
- 3.2.1 管制員的行為33-34
- 3.2.2 管制操作流程34-35
- 3.2.3 基于BDI模型的管制員Agent推理過程35-36
- 3.3 管制員Agent的BDI模型設計與實現36-47
- 3.3.1 通信模塊39-40
- 3.3.2 感知模塊40
- 3.3.3 決策模塊40-47
- 3.3.3.1 知識庫40-45
- 3.3.3.2 信念庫45-46
- 3.3.3.3 推理行為與愿望庫46-47
- 3.3.3.4 決策行為與意圖庫47
- 3.4 本章小結47-48
- 第四章 管制員Agent的學習行為模型48-60
- 4.1 Agent學習行為48-50
- 4.1.1 監(jiān)督學習48-49
- 4.1.2 無監(jiān)督學習49
- 4.1.3 強化學習49-50
- 4.2 強化學習算法理論研究50-54
- 4.2.1 強化學習原理與模型50-51
- 4.2.2 強化學習要素51-52
- 4.2.3 學習任務52-53
- 4.2.4 Q學習53-54
- 4.3 管制員Agent的學習行為實現54-59
- 4.3.1 航空器Agent狀態(tài)信息描述54-56
- 4.3.1.1 航空器Agent高度離散化55-56
- 4.3.1.2 航空器Agent速度離散化56
- 4.3.2 管制員Agent動作描述56-57
- 4.3.3 Q表57-58
- 4.3.4 回報的確定58
- 4.3.5 具體學習行為實現方案58-59
- 4.4 本章小結59-60
- 第五章 管制員Agent模型驗證60-79
- 5.1 仿真環(huán)境構建60-63
- 5.1.1 開發(fā)環(huán)境選擇60
- 5.1.2 數據庫構建60-62
- 5.1.3 仿真空域環(huán)境62-63
- 5.1.4 沖突場景構建63
- 5.2 模型驗證63-78
- 5.2.1 平臺集成63-64
- 5.2.2 通信模塊驗證64-65
- 5.2.3 感知模塊驗證65-66
- 5.2.4 決策模塊驗證66-75
- 5.2.4.1 同航跡沖突解脫66-69
- 5.2.4.2 逆向航跡沖突解脫69-73
- 5.2.4.3 交叉航跡沖突解脫73-75
- 5.2.5 學習行為驗證75-78
- 5.3 本章小結78-79
- 第六章 總結與展望79-80
- 6.1 本文總結79
- 6.2 工作展望79-80
- 參考文獻80-83
- 致謝83-84
- 在學期間的研究成果及發(fā)表的學術論文84-85
- 附錄85-91
- 附錄1 管制員Agent ADF定義文件代碼85-91
- 附錄2 沖突飛行計劃91
【參考文獻】
中國期刊全文數據庫 前3條
1 張鈞翔;胡明華;;基于多Agent的多機場終端區(qū)空中交通智能仿真系統設計[J];交通運輸工程與信息學報;2009年02期
2 王超;徐肖豪;;基于Agent的空中交通系統建模與仿真研究[J];計算機工程與應用;2008年31期
3 呂小平;;中國民航新一代空中交通管理系統發(fā)展總體框架[J];中國民用航空;2007年08期
中國博士學位論文全文數據庫 前1條
1 張洪海;機場終端區(qū)協同流量管理關鍵技術研究[D];南京航空航天大學;2009年
中國碩士學位論文全文數據庫 前1條
1 許亞;基于強化學習的移動機器人路徑規(guī)劃研究[D];山東大學;2013年
,本文編號:616810
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/616810.html