天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

博弈學(xué)習(xí)理論中若干問(wèn)題的研究

發(fā)布時(shí)間:2020-12-25 21:14
  自二十世紀(jì)初,博弈論的理論體系建立以后,它獲得了巨大的發(fā)展。并且,博弈論被廣泛應(yīng)用到了軍事,經(jīng)濟(jì),政治科學(xué)等領(lǐng)域。Nash均衡點(diǎn)是博弈論中一個(gè)非常重要的概念。Nash均衡點(diǎn)意味著,在收益最大化的假設(shè)下,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)。博弈學(xué)習(xí)理論為Nash均衡點(diǎn)的產(chǎn)生或選擇提供了一種較為符合實(shí)際的解釋。詳細(xì)地講,Nash均衡點(diǎn)是有限理性的參與者為了達(dá)到最優(yōu),后悔最小或滿意等目標(biāo),隨著時(shí)間的逐步推移,利用自己所收集的信息進(jìn)行策略或動(dòng)作調(diào)整的長(zhǎng)期結(jié)果。本文將對(duì)博弈學(xué)習(xí)理論中的若干問(wèn)題進(jìn)行討論。第一章給出了關(guān)于博弈論,Nash均衡點(diǎn),以及博弈學(xué)習(xí)理論的必要知識(shí),并介紹了本文研究所涉及的主要問(wèn)題。齊次噪音下的自適應(yīng)學(xué)習(xí)過(guò)程可從數(shù)學(xué)上抽象為由隨機(jī)擾動(dòng)生成的不可約Markov鏈。第二章應(yīng)用大偏差理論來(lái)分析,當(dāng)隨機(jī)擾動(dòng)趨于零時(shí),帶隨機(jī)擾動(dòng)的Markov鏈的次極限行為或中期行為。通過(guò)將相應(yīng)無(wú)擾動(dòng)Markov鏈的極限點(diǎn)集迭代劃分為不同階的圈,本章研究了,當(dāng)隨機(jī)噪音趨于消失時(shí),帶隨機(jī)擾動(dòng)的Markov鏈在各個(gè)極限點(diǎn)之間進(jìn)行遍歷的最可能的次序,以及隨機(jī)穩(wěn)定均衡點(diǎn)的選擇問(wèn)題。第三章考慮了,一個(gè)對(duì)... 

【文章來(lái)源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:98 頁(yè)

【學(xué)位級(jí)別】:博士

【文章目錄】:
致謝
摘要
Abstract
目錄
第一章 緒論
    1.1 博弈論簡(jiǎn)介
    1.2 Nash均衡點(diǎn)
    1.3 有限理性與博弈學(xué)習(xí)理論
    1.4 本文有關(guān)的問(wèn)題模型
        1.4.1 隨機(jī)穩(wěn)定性
        1.4.2 多重位置的自適應(yīng)學(xué)習(xí)過(guò)程
第二章 逃逸動(dòng)力學(xué)及隨機(jī)穩(wěn)定性
    2.1 引言
    2.2 正常返類吸收域的逃逸動(dòng)力學(xué)
        2.2.1 基本符號(hào)與定義
        2.2.2 逃逸位置與時(shí)間
        2.2.3 逃逸路徑
    2.3 迭代圈劃分
        2.3.1 圈劃分
        2.3.2 k-圈(k≥1)吸收域的逃逸動(dòng)力學(xué)
    2.4 隨機(jī)穩(wěn)定性
        2.4.1 隨機(jī)穩(wěn)定均衡點(diǎn)的選擇
        2.4.2 到達(dá)隨機(jī)穩(wěn)定均衡點(diǎn)的等待時(shí)間
    2.5 應(yīng)用
第三章 觀察和互相聯(lián)系的有效性
    3.1 引言
    3.2 基本模型
    3.3 局部參考結(jié)構(gòu)的分析
        3.3.1 完美的參考結(jié)構(gòu)
        3.3.2 一般的參考結(jié)構(gòu)
    3.4 收斂性
        3.4.1 完美參考結(jié)構(gòu)的情形
        3.4.2 一般參考結(jié)構(gòu)的情形
    3.5 隨機(jī)穩(wěn)定性
    3.6 應(yīng)用—囚徒困境
        3.6.1 啟發(fā)性的例子
        3.6.2 一般結(jié)果
第四章 結(jié)論
    4.1 本文主要結(jié)果
    4.2 進(jìn)一步研究的展望
附錄A 關(guān)于大偏差理論的一些結(jié)果
    A.1 引言
    A.2 帶隨機(jī)擾動(dòng)Markov鏈抽樣路徑的大偏差性質(zhì)
    A.3 隨機(jī)變量序列生成的函數(shù)序列的估計(jì)
參考文獻(xiàn)
簡(jiǎn)歷
發(fā)表和錄用的文章目錄



本文編號(hào):2938399

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjifazhanlunwen/2938399.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bcdf6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com