基于代數(shù)狀態(tài)空間方法的有限博弈的分析與設(shè)計
發(fā)布時間:2021-04-26 20:22
隨著博弈與控制交叉學(xué)科的興起,博弈論受到了控制領(lǐng)域的廣泛關(guān)注。基于博弈方法的控制論在多智能體的協(xié)同控制、武器分配、電力系統(tǒng)的經(jīng)濟調(diào)度等方面得到了廣泛應(yīng)用。然而,利用博弈理論解決控制問題的前提是對博弈系統(tǒng)性質(zhì)的深入了解,因此對有限博弈的結(jié)構(gòu)性質(zhì)與演化動態(tài)的分析是很有必要的。本文主要以矩陣的半張量積為工具,基于代數(shù)狀態(tài)空間方法,研究有限博弈正交分解、博弈設(shè)計、演化動態(tài)以及在武器-目標(biāo)分配問題上的應(yīng)用。首先,研究了調(diào)和博弈的動態(tài)等價性及有限博弈的正交分解。通過推導(dǎo)得到了與基底純調(diào)和博弈動態(tài)等價的純調(diào)和博弈的充要條件;針對有限博弈的向量空間結(jié)構(gòu),分別從對稱博弈、零和博弈以及正規(guī)化博弈的角度出發(fā),提出了基于對稱博弈、基于零和博弈以及基于正規(guī)化博弈的三種有限博弈的正交分解方法,并分別推導(dǎo)出了不同博弈子空間的基底;比較分析了向量內(nèi)積在不同博弈正交分解中的作用,證明了只有當(dāng)相容性條件滿足時,不同的正交分解均可在標(biāo)準內(nèi)積下實現(xiàn)。其次,研究了三種不同類型勢博弈的檢驗與設(shè)計問題。針對網(wǎng)絡(luò)上的分布式博弈問題,提出了基于局部信息的勢博弈設(shè)計方法,給出了設(shè)計只依賴于局部信息收益函數(shù)的充要條件;針對網(wǎng)絡(luò)上具有競爭性...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:185 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
ABSTRACT
符號說明
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀及分析
1.2.1 博弈的正交分解
1.2.2 勢博弈設(shè)計方法
1.2.3 演化博弈學(xué)習(xí)規(guī)則
1.2.4 超網(wǎng)絡(luò)演化博弈
1.2.5 武器-目標(biāo)分配問題
1.2.6 存在的主要問題
1.3 論文研究內(nèi)容及章節(jié)安排
第2章 有限博弈的代數(shù)狀態(tài)空間表示
2.1 引言
2.2 矩陣半張量積與邏輯系統(tǒng)的狀態(tài)空間表示
2.2.1 矩陣半張量積的定義
2.2.2 矩陣半張量積的性質(zhì)
2.2.3 邏輯動態(tài)系統(tǒng)的狀態(tài)空間表示
2.3 有限博弈的向量空間結(jié)構(gòu)
2.4 演化博弈的狀態(tài)空間模型
2.5 本章小結(jié)
第3章 有限博弈的正交分解及性質(zhì)研究
3.1 引言
3.2 純調(diào)和博弈的納什均衡與動態(tài)等價性
3.2.1 基于勢博弈的正交分解與調(diào)和博弈
3.2.2 純調(diào)和博弈的納什均衡
3.2.3 純調(diào)和博弈的動態(tài)等價性
3.3 基于對稱博弈的正交分解
3.3.1 對稱博弈的向量空間結(jié)構(gòu)
3.3.2 對稱博弈正交補空間的向量空間結(jié)構(gòu)
3.3.3 二人對稱博弈和反對稱博弈關(guān)于勢博弈的分解
3.3.4 二人對稱/反對稱博弈的性質(zhì)
3.4 基于零和博弈與正規(guī)化博弈的正交分解
3.4.1 基于零和博弈的正交分解
3.4.2 基于正規(guī)化博弈的正交分解
3.4.3 內(nèi)積與正交分解
3.5 本章小結(jié)
第4章 有限勢博弈的檢驗與設(shè)計方法
4.1 引言
4.2 有限勢博弈的檢驗與設(shè)計
4.2.1 有限勢博弈的檢驗
4.2.2 基于局部信息的勢博弈設(shè)計
4.3 零和勢博弈的檢驗與設(shè)計
4.3.1 零和勢博弈的檢驗
4.3.2 基于局部信息的零和勢博弈的設(shè)計
4.4 群勢博弈的檢驗與設(shè)計
4.4.1 群勢博弈及其性質(zhì)
4.4.2 群集勢博弈的檢驗
4.4.3 群集勢博弈的設(shè)計
4.5 本章小結(jié)
第5章 有限狀態(tài)演化博弈學(xué)習(xí)規(guī)則設(shè)計方法
5.1 引言
5.2 狀態(tài)演化博弈
5.2.1 狀態(tài)演化博弈的模型
5.2.2 狀態(tài)勢博弈
5.2.3 狀態(tài)演化博弈中的學(xué)習(xí)規(guī)則
5.3 基于兩步記憶的較優(yōu)響應(yīng)學(xué)習(xí)規(guī)則設(shè)計方法
5.3.1 個體獲得的信息
5.3.2 基于兩步記憶的較優(yōu)響應(yīng)學(xué)習(xí)規(guī)則
5.3.3 較優(yōu)響應(yīng)學(xué)習(xí)規(guī)則收斂性分析
5.3.4 通用時間高效學(xué)習(xí)規(guī)則的存在性分析
5.4 狀態(tài)演化博弈的應(yīng)用
5.4.1 有限博弈純納什均衡求解仿真算例
5.4.2 時變通信結(jié)構(gòu)下多智能體系統(tǒng)協(xié)同控制仿真算例
5.5 本章小結(jié)
第6章 超圖演化勢博弈的檢驗與動態(tài)特性
6.1 引言
6.2 網(wǎng)絡(luò)演化博弈與超圖網(wǎng)絡(luò)演化博弈模型
6.2.1 網(wǎng)絡(luò)演化博弈的模型
6.2.2 超圖網(wǎng)絡(luò)演化博弈的模型
6.3 超圖群勢博弈的檢驗與動態(tài)特性
6.3.1 超網(wǎng)絡(luò)群勢博弈的檢驗
6.3.2 超網(wǎng)絡(luò)演化群勢博弈的動態(tài)分析
6.4 超圖策略區(qū)分博弈的檢驗與動態(tài)分析
6.4.1 策略區(qū)分博弈的模型
6.4.2 策略區(qū)分勢博弈的性質(zhì)與動態(tài)分析
6.4.3 超網(wǎng)絡(luò)演化策略區(qū)分勢博弈的檢驗與動態(tài)分析
6.5 本章小結(jié)
第7章 武器-目標(biāo)分配問題的博弈方法
7.1 引言
7.2 武器-目標(biāo)分配問題的博弈模型
7.2.1 武器-目標(biāo)分配問題描述
7.2.2 武器-目標(biāo)分配問題的博弈建模
7.2.3 基于博弈方法的武器-目標(biāo)分配問題求解流程
7.3 基于勢博弈設(shè)計的武器-目標(biāo)分配問題求解
7.3.1 武器-目標(biāo)分配問題算例描述
7.3.2 基于局部信息的武器收益函數(shù)計算
7.3.3 仿真分析
7.4 基于群勢博弈設(shè)計的武器-目標(biāo)分配問題求解
7.4.1 問題設(shè)定及群博弈建模
7.4.2 基于局部信息的群收益函數(shù)設(shè)計
7.4.3 仿真分析
7.5 基于狀態(tài)演化博弈的武器-目標(biāo)分配問題求解
7.5.1 問題設(shè)定
7.5.2 依賴于狀態(tài)的收益函數(shù)設(shè)計
7.5.3 狀態(tài)演化學(xué)習(xí)規(guī)則下的仿真分析
7.6 本章小結(jié)
結(jié)論
參考文獻
附錄A 帶擾動的馬爾科夫鏈
A.1 馬爾科夫鏈
A.2 狀態(tài)分類與平穩(wěn)分布
A.3 正則攝動馬爾科夫鏈
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個人簡歷
【參考文獻】:
期刊論文
[1]武器-目標(biāo)分配問題研究[J]. 楊進帥,李進,王毅. 火力與指揮控制. 2019(05)
[2]博弈控制論簡述[J]. 程代展,付世華. 控制理論與應(yīng)用. 2018(05)
[3]矩陣半張量積及換位矩陣的幾點注解[J]. 王元華,劉挺,程代展. 系統(tǒng)科學(xué)與數(shù)學(xué). 2016(09)
[4]博弈論在電力系統(tǒng)中典型應(yīng)用及若干展望[J]. 盧強,陳來軍,梅生偉. 中國電機工程學(xué)報. 2014(29)
[5]分布式優(yōu)化:算法設(shè)計和收斂性分析[J]. 洪奕光,張艷瓊. 控制理論與應(yīng)用. 2014(07)
[6]關(guān)于控制理論發(fā)展的某些思考[J]. 郭雷. 系統(tǒng)科學(xué)與數(shù)學(xué). 2011(09)
[7]網(wǎng)絡(luò)戰(zhàn)中艦艇編隊協(xié)同目標(biāo)最優(yōu)分配研究[J]. 董奎義,楊根源,王子明. 戰(zhàn)術(shù)導(dǎo)彈技術(shù). 2011(04)
[8]一種求解武器-目標(biāo)分配問題的啟發(fā)式方法[J]. 王正元,李朋飛,汪民樂. 指揮控制與仿真. 2011(02)
[9]演化博弈與自組織合作[J]. 王龍,伏鋒,陳小杰,楚天廣,謝廣明. 系統(tǒng)科學(xué)與數(shù)學(xué). 2007(03)
本文編號:3162059
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:185 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
ABSTRACT
符號說明
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀及分析
1.2.1 博弈的正交分解
1.2.2 勢博弈設(shè)計方法
1.2.3 演化博弈學(xué)習(xí)規(guī)則
1.2.4 超網(wǎng)絡(luò)演化博弈
1.2.5 武器-目標(biāo)分配問題
1.2.6 存在的主要問題
1.3 論文研究內(nèi)容及章節(jié)安排
第2章 有限博弈的代數(shù)狀態(tài)空間表示
2.1 引言
2.2 矩陣半張量積與邏輯系統(tǒng)的狀態(tài)空間表示
2.2.1 矩陣半張量積的定義
2.2.2 矩陣半張量積的性質(zhì)
2.2.3 邏輯動態(tài)系統(tǒng)的狀態(tài)空間表示
2.3 有限博弈的向量空間結(jié)構(gòu)
2.4 演化博弈的狀態(tài)空間模型
2.5 本章小結(jié)
第3章 有限博弈的正交分解及性質(zhì)研究
3.1 引言
3.2 純調(diào)和博弈的納什均衡與動態(tài)等價性
3.2.1 基于勢博弈的正交分解與調(diào)和博弈
3.2.2 純調(diào)和博弈的納什均衡
3.2.3 純調(diào)和博弈的動態(tài)等價性
3.3 基于對稱博弈的正交分解
3.3.1 對稱博弈的向量空間結(jié)構(gòu)
3.3.2 對稱博弈正交補空間的向量空間結(jié)構(gòu)
3.3.3 二人對稱博弈和反對稱博弈關(guān)于勢博弈的分解
3.3.4 二人對稱/反對稱博弈的性質(zhì)
3.4 基于零和博弈與正規(guī)化博弈的正交分解
3.4.1 基于零和博弈的正交分解
3.4.2 基于正規(guī)化博弈的正交分解
3.4.3 內(nèi)積與正交分解
3.5 本章小結(jié)
第4章 有限勢博弈的檢驗與設(shè)計方法
4.1 引言
4.2 有限勢博弈的檢驗與設(shè)計
4.2.1 有限勢博弈的檢驗
4.2.2 基于局部信息的勢博弈設(shè)計
4.3 零和勢博弈的檢驗與設(shè)計
4.3.1 零和勢博弈的檢驗
4.3.2 基于局部信息的零和勢博弈的設(shè)計
4.4 群勢博弈的檢驗與設(shè)計
4.4.1 群勢博弈及其性質(zhì)
4.4.2 群集勢博弈的檢驗
4.4.3 群集勢博弈的設(shè)計
4.5 本章小結(jié)
第5章 有限狀態(tài)演化博弈學(xué)習(xí)規(guī)則設(shè)計方法
5.1 引言
5.2 狀態(tài)演化博弈
5.2.1 狀態(tài)演化博弈的模型
5.2.2 狀態(tài)勢博弈
5.2.3 狀態(tài)演化博弈中的學(xué)習(xí)規(guī)則
5.3 基于兩步記憶的較優(yōu)響應(yīng)學(xué)習(xí)規(guī)則設(shè)計方法
5.3.1 個體獲得的信息
5.3.2 基于兩步記憶的較優(yōu)響應(yīng)學(xué)習(xí)規(guī)則
5.3.3 較優(yōu)響應(yīng)學(xué)習(xí)規(guī)則收斂性分析
5.3.4 通用時間高效學(xué)習(xí)規(guī)則的存在性分析
5.4 狀態(tài)演化博弈的應(yīng)用
5.4.1 有限博弈純納什均衡求解仿真算例
5.4.2 時變通信結(jié)構(gòu)下多智能體系統(tǒng)協(xié)同控制仿真算例
5.5 本章小結(jié)
第6章 超圖演化勢博弈的檢驗與動態(tài)特性
6.1 引言
6.2 網(wǎng)絡(luò)演化博弈與超圖網(wǎng)絡(luò)演化博弈模型
6.2.1 網(wǎng)絡(luò)演化博弈的模型
6.2.2 超圖網(wǎng)絡(luò)演化博弈的模型
6.3 超圖群勢博弈的檢驗與動態(tài)特性
6.3.1 超網(wǎng)絡(luò)群勢博弈的檢驗
6.3.2 超網(wǎng)絡(luò)演化群勢博弈的動態(tài)分析
6.4 超圖策略區(qū)分博弈的檢驗與動態(tài)分析
6.4.1 策略區(qū)分博弈的模型
6.4.2 策略區(qū)分勢博弈的性質(zhì)與動態(tài)分析
6.4.3 超網(wǎng)絡(luò)演化策略區(qū)分勢博弈的檢驗與動態(tài)分析
6.5 本章小結(jié)
第7章 武器-目標(biāo)分配問題的博弈方法
7.1 引言
7.2 武器-目標(biāo)分配問題的博弈模型
7.2.1 武器-目標(biāo)分配問題描述
7.2.2 武器-目標(biāo)分配問題的博弈建模
7.2.3 基于博弈方法的武器-目標(biāo)分配問題求解流程
7.3 基于勢博弈設(shè)計的武器-目標(biāo)分配問題求解
7.3.1 武器-目標(biāo)分配問題算例描述
7.3.2 基于局部信息的武器收益函數(shù)計算
7.3.3 仿真分析
7.4 基于群勢博弈設(shè)計的武器-目標(biāo)分配問題求解
7.4.1 問題設(shè)定及群博弈建模
7.4.2 基于局部信息的群收益函數(shù)設(shè)計
7.4.3 仿真分析
7.5 基于狀態(tài)演化博弈的武器-目標(biāo)分配問題求解
7.5.1 問題設(shè)定
7.5.2 依賴于狀態(tài)的收益函數(shù)設(shè)計
7.5.3 狀態(tài)演化學(xué)習(xí)規(guī)則下的仿真分析
7.6 本章小結(jié)
結(jié)論
參考文獻
附錄A 帶擾動的馬爾科夫鏈
A.1 馬爾科夫鏈
A.2 狀態(tài)分類與平穩(wěn)分布
A.3 正則攝動馬爾科夫鏈
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個人簡歷
【參考文獻】:
期刊論文
[1]武器-目標(biāo)分配問題研究[J]. 楊進帥,李進,王毅. 火力與指揮控制. 2019(05)
[2]博弈控制論簡述[J]. 程代展,付世華. 控制理論與應(yīng)用. 2018(05)
[3]矩陣半張量積及換位矩陣的幾點注解[J]. 王元華,劉挺,程代展. 系統(tǒng)科學(xué)與數(shù)學(xué). 2016(09)
[4]博弈論在電力系統(tǒng)中典型應(yīng)用及若干展望[J]. 盧強,陳來軍,梅生偉. 中國電機工程學(xué)報. 2014(29)
[5]分布式優(yōu)化:算法設(shè)計和收斂性分析[J]. 洪奕光,張艷瓊. 控制理論與應(yīng)用. 2014(07)
[6]關(guān)于控制理論發(fā)展的某些思考[J]. 郭雷. 系統(tǒng)科學(xué)與數(shù)學(xué). 2011(09)
[7]網(wǎng)絡(luò)戰(zhàn)中艦艇編隊協(xié)同目標(biāo)最優(yōu)分配研究[J]. 董奎義,楊根源,王子明. 戰(zhàn)術(shù)導(dǎo)彈技術(shù). 2011(04)
[8]一種求解武器-目標(biāo)分配問題的啟發(fā)式方法[J]. 王正元,李朋飛,汪民樂. 指揮控制與仿真. 2011(02)
[9]演化博弈與自組織合作[J]. 王龍,伏鋒,陳小杰,楚天廣,謝廣明. 系統(tǒng)科學(xué)與數(shù)學(xué). 2007(03)
本文編號:3162059
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3162059.html
最近更新
教材專著