天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于實時啟發(fā)式搜索的非完備信息博弈策略研究

發(fā)布時間:2023-04-01 21:27
  機器博弈是人工智能領域的重要研究方向。非完備信息博弈是機器博弈的子領域。非完備信息博弈中存在隱藏信息和信息不對稱的特點,和完備信息博弈相比,非完備信息博弈更加貼近現(xiàn)實生活中。例如,競標、拍賣、股票交易等現(xiàn)實問題中都存在隱藏信息和信息不對稱。因此,研究非完備信息博弈問題更有現(xiàn)實意義。德州撲克博弈包含了隱藏信息、信息不對稱和隨機事件等重要特性,它是典型的非完備信息博弈。求解德州撲克博弈的傳統(tǒng)方法是基于抽象的求解方法,該方法結(jié)合狀態(tài)空間抽象和虛擬遺憾值最小化算法(Counterfactual Regret Minimi-zation,CFR)離線求解撲克博弈策略,無法進行博弈策略的實時求解。本文以德州撲克為研究對象,結(jié)合殘局策略求解方法和啟發(fā)式博弈樹搜索方法來研究二人非限制性德州撲克博弈策略的實時求解算法。針對撲克博弈的局部策略求解問題,研究博弈問題的分解方法和博弈殘局的求解方法。借鑒完備信息博弈問題的分解思路,把非完備信息博弈問題的博弈樹分解為主干和一系列游戲殘局,同時把完備信息博弈中的殘局概念推廣到非完備信息博弈中。針對非完備信息博弈問題的博弈殘局,研究殘局構造算法,使得博弈殘局符合擴展...

【文章頁數(shù)】:63 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 課題研究背景
    1.2 研究目的和意義
    1.3 國內(nèi)外研究現(xiàn)狀
        1.3.1 國外研究現(xiàn)狀
        1.3.2 國內(nèi)研究現(xiàn)狀
    1.4 論文主要研究內(nèi)容與組織結(jié)構
        1.4.1 主要研究內(nèi)容
        1.4.2 組織結(jié)構
第2章 非完備信息博弈
    2.1 擴展式博弈
        2.1.1 全局視角的博弈樹
        2.1.2 參與者視角的博弈樹
        2.1.3 旁觀視角的博弈樹
    2.2 策略
        2.2.1 平均策略
        2.2.2 最佳應對策略
        2.2.3 納什均衡策略
    2.3 遺憾值
        2.3.1 虛擬遺憾值最小化
        2.3.2 CFR算法
    2.4 本章小結(jié)
第3章 基于非完備信息博弈問題分解的求解算法
    3.1 非完備信息博弈問題分解
    3.2 博弈策略求解
        3.2.1 固定殘局的策略求解
        3.2.2 主干部分的策略求解
        3.2.3 可變殘局的策略求解
    3.3 本章小結(jié)
第4章 基于啟發(fā)式博弈樹搜索的策略實時求解算法
    4.1 實時策略求解框架
        4.1.1 限制搜索深度
        4.1.2 限制搜索廣度
        4.1.3 局部博弈樹搜索
        4.1.4 改進的resolving算法
    4.2 撲克博弈殘局估值
        4.2.1 撲克殘局生成與求解
        4.2.2 訓練數(shù)據(jù)構造
        4.2.3 估值網(wǎng)絡
    4.3 本章小結(jié)
第5章 德州撲克智能體的實現(xiàn)與實驗分析
    5.1 智能體的實現(xiàn)
        5.1.1 智能體通信協(xié)議
        5.1.2 人機撲克博弈系統(tǒng)
    5.2 實驗與分析
        5.2.1 估值網(wǎng)絡實驗
        5.2.2 啟發(fā)式博弈樹搜索實驗
        5.2.3 撲克對局實驗
    5.3 本章小結(jié)
結(jié)論
參考文獻
致謝



本文編號:3777895

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3777895.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶cdef2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com