軍棋機(jī)器人UCT算法及計算機(jī)博弈行為研究
發(fā)布時間:2023-02-21 11:06
機(jī)器人技術(shù)是當(dāng)今世界備受關(guān)注的前沿課題,伴隨著近年來人工智能技術(shù)不斷的發(fā)展,機(jī)器人技術(shù)也成為了一個令人浮想聯(lián)翩的技術(shù)領(lǐng)域。本文以大家喜聞樂見的中國傳統(tǒng)的非完備信息二人軍棋計算機(jī)博弈作為研究對象,軍棋博弈的每方擁有25個棋子、12種類型棋子,每個棋子的級別、靈活性、價值都不相同,且雙方都對彼此的策略一無所知,只能靠推理猜測決定走步,博弈過程中既要學(xué)會預(yù)防對方的欺騙又要學(xué)會蒙騙對手,加入機(jī)器人技術(shù)的情感識別能夠幫助計算機(jī)博弈算法更好的識別對方策略,減少因?qū)κ制垓_而造成的損失,進(jìn)而提升計算機(jī)博弈程序的戰(zhàn)斗力。論文創(chuàng)新工作體現(xiàn)在如下幾點(diǎn):1)利用歷史啟發(fā)表來指導(dǎo)蒙特卡羅算法對敵方棋子隸屬度進(jìn)行模擬,極大的節(jié)省了模擬時間,并在我方棋子估值上針對軍棋棋子種類多,估值缺乏適時性等問題上提出一種基于探索與收益均衡思想的Q-learning學(xué)習(xí)算法,完善了博弈過程中的動態(tài)估值系統(tǒng),提高了估值的時效性。2)提出基于UCT搜索策略的高價值棋子篩選方法,形成一種多棋子協(xié)同博弈方法,實(shí)現(xiàn)了多棋子協(xié)同對弈,提升了軍棋計算機(jī)博弈系統(tǒng)中棋子的團(tuán)體協(xié)同性、溝通性、欺騙性、引誘性等高級對抗能力。3)結(jié)合博弈機(jī)器人意圖情感...
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景
1.1.1 機(jī)器人學(xué)
1.1.2 計算機(jī)博弈
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 本課題研究意義
1.4 本文主要工作
1.4.1 具體研究內(nèi)容
1.4.2 本文組織結(jié)構(gòu)
第2章 計算機(jī)博弈關(guān)鍵技術(shù)分析
2.1 博弈基本原理
2.2 博弈相關(guān)研究方法
2.2.1 博弈搜索樹
2.2.2 搜索復(fù)雜度分析
2.2.3 開局庫與殘局庫分析
2.3 經(jīng)典博弈算法介紹
2.3.1 極大極小值算法
2.3.2 alpha-beta剪枝算法
2.3.3 蒙特卡羅算法
2.3.4 UCT算法
2.3.5 強(qiáng)化學(xué)習(xí)算法
2.4 本章小結(jié)
第3章 軍棋計算機(jī)博弈模型構(gòu)建
3.1 博弈分類及軍棋博弈簡介
3.2 軍棋非完備信息博弈分析
3.2.1 非完備信息棋局處理
3.2.2 啟發(fā)式棋子隸屬度估計
3.3 動態(tài)估值策略實(shí)現(xiàn)
3.3.1 棋子四大要素介紹及初始化
3.3.2 棋子動態(tài)估值及實(shí)現(xiàn)
3.4 動態(tài)估值參數(shù)優(yōu)化及性能對比
3.5 本章小結(jié)
第4章 基于UCT的協(xié)同搜索策略
4.1 多棋子協(xié)同定義
4.2 Q學(xué)習(xí)算法應(yīng)用
4.3 UCT算法進(jìn)行高價值棋子的發(fā)現(xiàn)
4.4 改進(jìn)性能對比
4.5 本章小結(jié)
第5章 意圖博弈機(jī)器人行為規(guī)劃
5.1 博弈機(jī)器人行為規(guī)劃模型
5.2 對手意圖的識別與行為預(yù)測
5.2.1 對手行為序列預(yù)估
5.2.2 引入意圖對手行為序列
5.2.3 行為序列集
5.3 系統(tǒng)設(shè)計及效果展示
5.3.1 意圖博弈機(jī)器人系統(tǒng)設(shè)計
5.3.2 實(shí)驗(yàn)結(jié)果分析
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 本文的主要工作及創(chuàng)新點(diǎn)
6.2 未來工作與展望
致謝
參考文獻(xiàn)
個人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文及取得的研究成果
本文編號:3747600
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景
1.1.1 機(jī)器人學(xué)
1.1.2 計算機(jī)博弈
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 本課題研究意義
1.4 本文主要工作
1.4.1 具體研究內(nèi)容
1.4.2 本文組織結(jié)構(gòu)
第2章 計算機(jī)博弈關(guān)鍵技術(shù)分析
2.1 博弈基本原理
2.2 博弈相關(guān)研究方法
2.2.1 博弈搜索樹
2.2.2 搜索復(fù)雜度分析
2.2.3 開局庫與殘局庫分析
2.3 經(jīng)典博弈算法介紹
2.3.1 極大極小值算法
2.3.2 alpha-beta剪枝算法
2.3.3 蒙特卡羅算法
2.3.4 UCT算法
2.3.5 強(qiáng)化學(xué)習(xí)算法
2.4 本章小結(jié)
第3章 軍棋計算機(jī)博弈模型構(gòu)建
3.1 博弈分類及軍棋博弈簡介
3.2 軍棋非完備信息博弈分析
3.2.1 非完備信息棋局處理
3.2.2 啟發(fā)式棋子隸屬度估計
3.3 動態(tài)估值策略實(shí)現(xiàn)
3.3.1 棋子四大要素介紹及初始化
3.3.2 棋子動態(tài)估值及實(shí)現(xiàn)
3.4 動態(tài)估值參數(shù)優(yōu)化及性能對比
3.5 本章小結(jié)
第4章 基于UCT的協(xié)同搜索策略
4.1 多棋子協(xié)同定義
4.2 Q學(xué)習(xí)算法應(yīng)用
4.3 UCT算法進(jìn)行高價值棋子的發(fā)現(xiàn)
4.4 改進(jìn)性能對比
4.5 本章小結(jié)
第5章 意圖博弈機(jī)器人行為規(guī)劃
5.1 博弈機(jī)器人行為規(guī)劃模型
5.2 對手意圖的識別與行為預(yù)測
5.2.1 對手行為序列預(yù)估
5.2.2 引入意圖對手行為序列
5.2.3 行為序列集
5.3 系統(tǒng)設(shè)計及效果展示
5.3.1 意圖博弈機(jī)器人系統(tǒng)設(shè)計
5.3.2 實(shí)驗(yàn)結(jié)果分析
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 本文的主要工作及創(chuàng)新點(diǎn)
6.2 未來工作與展望
致謝
參考文獻(xiàn)
個人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文及取得的研究成果
本文編號:3747600
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3747600.html
最近更新
教材專著