多智能體情感決策學(xué)習(xí)方法及其在Flow智能交通中的應(yīng)用
發(fā)布時間:2022-07-12 14:17
傳統(tǒng)的計算機技術(shù)已經(jīng)滿足不了人工智能的發(fā)展需求,人們迫切需求更加智能的決策學(xué)習(xí)方法來解決各種復(fù)雜問題。分布式技術(shù)使得智能體(Agent)之間可以相互協(xié)作和學(xué)習(xí),處理復(fù)雜決策問題的能力大大提升,已成為智能控制領(lǐng)域的研究熱點。然而,多智能體(Multi-Agent)在完成需要頻繁交互的決策任務(wù)時,普遍存在學(xué)習(xí)能力差、偏好評估和群體一致性較低等問題。近年來,情感計算以其可以量化展示群體智慧的涌現(xiàn)過程和決策一致性的收斂過程的優(yōu)勢,為解決這類復(fù)雜決策問題提供了一種新方法。目前針對情感計算的研究主要集中在情感識別和表達,鮮有探討如何利用情感機制來進行更好的決策。此外,智能體的發(fā)展局限于邏輯推理能力的改進,很少涉及個體情感變化和群體情感交互。值得一提的是,面向大規(guī)模多智能體的系統(tǒng)建模問題時,情感機制的反饋會有助于更好地評估當前的環(huán)境并幫助智能體做出有利的決策,使得系統(tǒng)更加智能,決策更加高效。為此,本文提出了一種情感交互機制下的多智能體決策學(xué)習(xí)方法,構(gòu)造了融合決策偏好的多層情感計算模型,給出了智能體情感變化和行為偏好之間的映射關(guān)系;然后,定義了一種新型的決策一致性指數(shù)和方案決策熵,以此體現(xiàn)決策的收斂過...
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號說明
第一章 緒論
1.1 課題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展動態(tài)
1.2.1 情感計算與智能決策
1.2.2 多智能體強化學(xué)習(xí)
1.2.3 智能交通系統(tǒng)
1.3 論文內(nèi)容簡介
第二章 融合決策偏好的情感模型
2.1 引言
2.2 多層情感計算模型
2.3 決策偏好情感模型
2.4 群體一致性分析
2.4.1 衡量群體一致性方法
2.4.2 情感在所提方法中的重要性分析
2.5 本章小結(jié)
第三章 基于多智能體的情感交互
3.1 引言
3.2 多智能體決策系統(tǒng)
3.3 群體情感交互與決策流程
3.3.1 多智能體協(xié)商和交互系統(tǒng)
3.3.2 多智能體的情感交互式?jīng)Q策
3.4 實例分析
3.5 本章小結(jié)
第四章 基于情感驅(qū)動強化學(xué)習(xí)的智能交通系統(tǒng)
4.1 引言
4.2 Ray分布式計算框架
4.2.1 Ray分布式系統(tǒng)架構(gòu)
4.2.2 可拓展的強化學(xué)習(xí)庫Rllib
4.3 Flow智能交通系統(tǒng)
4.3.1 基于SUMO的交通路網(wǎng)與車輛建模
4.3.2 Flow混合自主交通強化學(xué)習(xí)框架
4.4 情感驅(qū)動的多智能體強化學(xué)習(xí)方法
4.4.1 情感與駕駛行為偏好
4.4.2 獎勵函數(shù)設(shè)計
4.5 實例研究
4.5.1 仿真分析
4.5.2 方法對比
4.6 本章小結(jié)
第五章 結(jié)論與展望
5.1 結(jié)論
5.2 展望
參考文獻
附錄一: 傳統(tǒng)多屬性群決策問題決策流程
附錄二: 智能交通實驗相關(guān)參數(shù)設(shè)置
致謝
研究成果及發(fā)表的學(xué)術(shù)論文
作者和導(dǎo)師介紹
附件
【參考文獻】:
期刊論文
[1]智能公路發(fā)展現(xiàn)狀與關(guān)鍵技術(shù)[J]. 徐志剛,李金龍,趙祥模,李立,王忠仁,童星,田彬,侯俊,汪貴平,張騫. 中國公路學(xué)報. 2019(08)
[2]基于深度強化學(xué)習(xí)的車輛跟馳控制[J]. 朱冰,蔣淵德,趙健,陳虹,鄧偉文. 中國公路學(xué)報. 2019(06)
[3]國際智能交通系統(tǒng)研發(fā)熱點[J]. 王笑京,張紀升,宋向輝,汪林. 科技導(dǎo)報. 2019(06)
[4]情緒對駕駛行為影響研究[J]. 張殿業(yè),程靜,張藝. 中國安全科學(xué)學(xué)報. 2018(10)
[5]深度學(xué)習(xí)在無人駕駛汽車領(lǐng)域應(yīng)用的研究進展[J]. 王科俊,趙彥東,邢向磊. 智能系統(tǒng)學(xué)報. 2018(01)
[6]面向未來智能社會的智能交通系統(tǒng)發(fā)展策略[J]. 武雯婧. 環(huán)球市場信息導(dǎo)報. 2017(01)
[7]城市智能交通系統(tǒng)技術(shù)發(fā)展現(xiàn)狀及趨勢[J]. 劉小明,何忠賀. 自動化博覽. 2015(01)
[8]性格、心情和情感的多層情感建模方法[J]. 李海芳,何海鵬,陳俊杰. 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2011(04)
[9]對中國大城市交通擁堵問題的認識[J]. 郭繼孚,劉瑩,余柳. 城市交通. 2011(02)
[10]完全智能控制 Google無人駕駛汽車路試[J]. 蘇鑫. 道路交通與安全. 2010(04)
博士論文
[1]情感交互式?jīng)Q策方法及其在過程控制中的應(yīng)用[D]. 宿翀.北京化工大學(xué) 2012
碩士論文
[1]基于深度強化學(xué)習(xí)的自動駕駛決策仿真[D]. 夏偉.中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進技術(shù)研究院) 2017
[2]基于多智能體強化學(xué)習(xí)的足球機器人決策策略研究[D]. 丁明剛.合肥工業(yè)大學(xué) 2017
[3]智能公交信息的采集處理及應(yīng)用研究[D]. 鄧捷.重慶交通大學(xué) 2014
[4]腦電、眼動技術(shù)融合的情感測量方法研究[D]. 莊曉旭.東北大學(xué) 2013
[5]基于多智能體強化學(xué)習(xí)的決策支持系統(tǒng)的研究[D]. 李東華.南京航空航天大學(xué) 2009
本文編號:3659280
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
符號說明
第一章 緒論
1.1 課題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展動態(tài)
1.2.1 情感計算與智能決策
1.2.2 多智能體強化學(xué)習(xí)
1.2.3 智能交通系統(tǒng)
1.3 論文內(nèi)容簡介
第二章 融合決策偏好的情感模型
2.1 引言
2.2 多層情感計算模型
2.3 決策偏好情感模型
2.4 群體一致性分析
2.4.1 衡量群體一致性方法
2.4.2 情感在所提方法中的重要性分析
2.5 本章小結(jié)
第三章 基于多智能體的情感交互
3.1 引言
3.2 多智能體決策系統(tǒng)
3.3 群體情感交互與決策流程
3.3.1 多智能體協(xié)商和交互系統(tǒng)
3.3.2 多智能體的情感交互式?jīng)Q策
3.4 實例分析
3.5 本章小結(jié)
第四章 基于情感驅(qū)動強化學(xué)習(xí)的智能交通系統(tǒng)
4.1 引言
4.2 Ray分布式計算框架
4.2.1 Ray分布式系統(tǒng)架構(gòu)
4.2.2 可拓展的強化學(xué)習(xí)庫Rllib
4.3 Flow智能交通系統(tǒng)
4.3.1 基于SUMO的交通路網(wǎng)與車輛建模
4.3.2 Flow混合自主交通強化學(xué)習(xí)框架
4.4 情感驅(qū)動的多智能體強化學(xué)習(xí)方法
4.4.1 情感與駕駛行為偏好
4.4.2 獎勵函數(shù)設(shè)計
4.5 實例研究
4.5.1 仿真分析
4.5.2 方法對比
4.6 本章小結(jié)
第五章 結(jié)論與展望
5.1 結(jié)論
5.2 展望
參考文獻
附錄一: 傳統(tǒng)多屬性群決策問題決策流程
附錄二: 智能交通實驗相關(guān)參數(shù)設(shè)置
致謝
研究成果及發(fā)表的學(xué)術(shù)論文
作者和導(dǎo)師介紹
附件
【參考文獻】:
期刊論文
[1]智能公路發(fā)展現(xiàn)狀與關(guān)鍵技術(shù)[J]. 徐志剛,李金龍,趙祥模,李立,王忠仁,童星,田彬,侯俊,汪貴平,張騫. 中國公路學(xué)報. 2019(08)
[2]基于深度強化學(xué)習(xí)的車輛跟馳控制[J]. 朱冰,蔣淵德,趙健,陳虹,鄧偉文. 中國公路學(xué)報. 2019(06)
[3]國際智能交通系統(tǒng)研發(fā)熱點[J]. 王笑京,張紀升,宋向輝,汪林. 科技導(dǎo)報. 2019(06)
[4]情緒對駕駛行為影響研究[J]. 張殿業(yè),程靜,張藝. 中國安全科學(xué)學(xué)報. 2018(10)
[5]深度學(xué)習(xí)在無人駕駛汽車領(lǐng)域應(yīng)用的研究進展[J]. 王科俊,趙彥東,邢向磊. 智能系統(tǒng)學(xué)報. 2018(01)
[6]面向未來智能社會的智能交通系統(tǒng)發(fā)展策略[J]. 武雯婧. 環(huán)球市場信息導(dǎo)報. 2017(01)
[7]城市智能交通系統(tǒng)技術(shù)發(fā)展現(xiàn)狀及趨勢[J]. 劉小明,何忠賀. 自動化博覽. 2015(01)
[8]性格、心情和情感的多層情感建模方法[J]. 李海芳,何海鵬,陳俊杰. 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2011(04)
[9]對中國大城市交通擁堵問題的認識[J]. 郭繼孚,劉瑩,余柳. 城市交通. 2011(02)
[10]完全智能控制 Google無人駕駛汽車路試[J]. 蘇鑫. 道路交通與安全. 2010(04)
博士論文
[1]情感交互式?jīng)Q策方法及其在過程控制中的應(yīng)用[D]. 宿翀.北京化工大學(xué) 2012
碩士論文
[1]基于深度強化學(xué)習(xí)的自動駕駛決策仿真[D]. 夏偉.中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進技術(shù)研究院) 2017
[2]基于多智能體強化學(xué)習(xí)的足球機器人決策策略研究[D]. 丁明剛.合肥工業(yè)大學(xué) 2017
[3]智能公交信息的采集處理及應(yīng)用研究[D]. 鄧捷.重慶交通大學(xué) 2014
[4]腦電、眼動技術(shù)融合的情感測量方法研究[D]. 莊曉旭.東北大學(xué) 2013
[5]基于多智能體強化學(xué)習(xí)的決策支持系統(tǒng)的研究[D]. 李東華.南京航空航天大學(xué) 2009
本文編號:3659280
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3659280.html
最近更新
教材專著