天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于CNN和MCTS的非完備信息機器博弈研究

發(fā)布時間:2020-04-18 18:28
【摘要】:自從提出人工智能概念以來,機器博弈一直是最具挑戰(zhàn)性的研究方向之一。機器博弈分為完備信息機器博弈和不完備信息機器博弈。不完備信息機器博弈的特點是玩家在博弈過程中無法獲得所有的信息,F(xiàn)實世界中的許多決策問題都可以抽象為不完備信息博弈問題,例如機場規(guī)劃,網(wǎng)絡(luò)安全,財務(wù)和能源問題。因此,研究不完備信息機器博弈具有重要的現(xiàn)實意義。解決不完備信息機器博弈問題的傳統(tǒng)方法是局部可觀察的馬爾可夫決策過程模型和強化學(xué)習(xí)算法。但是,強化學(xué)習(xí)不能在信息不完整和高維狀態(tài)空間的情況下收斂。僅通過有限的數(shù)據(jù)和重復(fù)的測試就不可能遍歷所有狀態(tài)。本文提出了一種深度學(xué)習(xí)網(wǎng)絡(luò)模型來解決一些不完備信息機器博弈問題中的大狀態(tài)空間問題。由于引入了人類經(jīng)驗,因此基于神經(jīng)網(wǎng)絡(luò)的模型可以模擬博弈中的人類合作。本文提出了一種基于蒙特卡洛樹搜索和簡單風(fēng)險模型的不完全信息博弈方法。本文使用深度學(xué)習(xí)網(wǎng)絡(luò)代替強化學(xué)習(xí)中的狀態(tài)作用值函數(shù),解決了強化學(xué)習(xí)無法在高維狀態(tài)空間中收斂的問題。本文將深度神經(jīng)網(wǎng)絡(luò)和改進的深度強化學(xué)習(xí)算法應(yīng)用于信息不完全的機器博弈中,實現(xiàn)了二打一的機器博弈系統(tǒng)。與傳統(tǒng)的學(xué)習(xí)算法相比,從感知到行動到端到端的學(xué)習(xí)策略達到了更高的博弈水平。改進的深度強化學(xué)習(xí)為大規(guī)模機器博弈系統(tǒng)的實現(xiàn)提供了一種可行的方法,也為將其擴展到現(xiàn)實生活提供了可能性。
【圖文】:

蒙特卡洛,算法流程,機制選擇


33圖 4.2 蒙特卡洛博弈樹搜索算法流程然后從新擴展的葉節(jié)點 tl進行仿真,以產(chǎn)生獎勵值 ,,然后將該獎勵值 反向傳播至為此迭代選擇的節(jié)點序列,以更新節(jié)點統(tǒng)計信息;每個節(jié)點的訪問次數(shù)都會增加,其平均獎勵或 Q 值會根據(jù) 更新。對于較簡單的域,獎勵值Δ可以是離散的(獲勝/平局/虧損)結(jié)果,也可以是連續(xù)的獎勵值,對于更復(fù)雜的多玩家域,獎勵值可以是相對于每個玩家 p 的獎勵值向量。一旦搜索中斷或達到計算預(yù)算,搜索就會終止,并通過某種機制選擇根節(jié)點 t0的
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP18

【相似文獻】

相關(guān)期刊論文 前10條

1 郭琴琴;李淑琴;包華;;亞馬遜棋機器博弈系統(tǒng)中評估函數(shù)的研究[J];計算機工程與應(yīng)用;2012年34期

2 ;2007全國機器博弈學(xué)術(shù)研討會征稿[J];重慶工學(xué)院學(xué)報(自然科學(xué)版);2007年02期

3 張加佳;王軒;;機器博弈風(fēng)險分析及其估算方法的研究[J];高技術(shù)通訊;2013年09期

4 張振;龐海;;機器博弈及其搜索算法的研究[J];軟件導(dǎo)刊;2008年07期

5 張振;顧治華;;機器博弈及其搜索算法的研究[J];電腦知識與技術(shù);2008年24期

6 ;“第二屆中國機器博弈錦標(biāo)賽暨2007中國機器博弈學(xué)術(shù)研討會”于2007年10月在重慶工學(xué)院隆重舉行[J];重慶工學(xué)院學(xué)報(自然科學(xué)版);2007年12期

7 ;棋訊[J];棋藝(象棋);2010年12期

8 何軒;洪迎偉;王開譯;彭耶萍;;機器博弈中搜索策略和估值函數(shù)的設(shè)計——以六子棋為例[J];電腦知識與技術(shù);2019年34期

9 劉成;李飛;孫玉霞;尹航;邱虹坤;王亞杰;;貫穿式案例教學(xué)法在機器博弈課程中的實踐[J];計算機教育;2019年08期

10 ;中國人工智能學(xué)會機器博弈專業(yè)委員會[J];智能系統(tǒng)學(xué)報;2013年01期

相關(guān)會議論文 前4條

1 王玨;程然;王驕;;人工神經(jīng)元網(wǎng)絡(luò)結(jié)合TD(λ)算法在中國象棋機器博弈中的應(yīng)用[A];2009中國控制與決策會議論文集(2)[C];2009年

2 朱峰;張雪峰;徐心和;;關(guān)于機器博弈中的逐步展開型對策的一點討論[A];2007中國控制與決策學(xué)術(shù)年會論文集[C];2007年

3 徐心和;王浩;孔凡禹;;事件對策理論及在棋類游戲中的應(yīng)用[A];2007年中國智能自動化會議論文集[C];2007年

4 王洪巖;朱峰;張雪峰;李玉倩;安爽;徐心和;;一種基于粗神經(jīng)網(wǎng)絡(luò)的中國象棋機器博弈評估實現(xiàn)[A];2007中國控制與決策學(xué)術(shù)年會論文集[C];2007年

相關(guān)重要報紙文章 前3條

1 蔣佑銘;電腦圍棋對弈技術(shù)的發(fā)展趨勢[N];圍棋報;2009年

2 本報記者 朱芙蓉;人機博弈:機器“終結(jié)”西洋跳棋[N];科技日報;2008年

3 記者 何鑫 通訊員 張燕霖;高交會“中國象棋人機大戰(zhàn)”今開戰(zhàn)[N];深圳商報;2009年

相關(guān)博士學(xué)位論文 前4條

1 張加佳;非完備信息機器博弈中風(fēng)險及對手模型的研究[D];哈爾濱工業(yè)大學(xué);2015年

2 徐長明;基于連珠模式的六子棋機器博弈關(guān)鍵技術(shù)研究[D];東北大學(xué);2010年

3 南海;單回合的回合制戰(zhàn)棋博弈模型搜索算法研究[D];重慶大學(xué);2016年

4 譚科;基于博弈實驗的電力市場綜合模擬與分析[D];華南理工大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 羅俊逸;基于Alpha-Beta剪枝與啟發(fā)式演算的簡單吃墩博弈方法[D];重慶郵電大學(xué);2019年

2 劉偉;基于CNN和MCTS的非完備信息機器博弈研究[D];西安電子科技大學(xué);2019年

3 吳天棟;非完備信息機器博弈算法及對手模型的研究[D];武漢理工大學(xué);2018年

4 李羽戈;橋牌叫牌機器博弈模型及算法研究[D];北京郵電大學(xué);2019年

5 胡開亮;基于狀態(tài)抽象和殘局解算的二人非限制性德州撲克策略的研究[D];哈爾濱工業(yè)大學(xué);2017年

6 朱航宇;基于深度強化學(xué)習(xí)的3D游戲的非完備信息機器博弈研究[D];哈爾濱工業(yè)大學(xué);2018年

7 王鵬程;基于深度強化學(xué)習(xí)的非完備信息機器博弈研究[D];哈爾濱工業(yè)大學(xué);2017年

8 代佳寧;基于虛擬遺憾最小化算法的非完備信息機器博弈研究[D];哈爾濱工業(yè)大學(xué);2017年

9 李昌;基于Q學(xué)習(xí)算法的非完備信息機器博弈的研究[D];哈爾濱工業(yè)大學(xué);2015年

10 唐艷;圍棋博弈機器學(xué)習(xí)算法的研究及應(yīng)用[D];重慶理工大學(xué);2012年



本文編號:2632395

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2632395.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e40bf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
少妇熟女精品一区二区三区| 国产女优视频一区二区| 99热中文字幕在线精品| 国产在线成人免费高清观看av| 亚洲综合香蕉在线视频| 国产麻豆一线二线三线| 国产av大片一区二区三区| 国产又大又硬又粗又湿| 国产av精品高清一区二区三区| 亚洲国产一级片在线观看| 国产一区二区三区不卡| 久久99青青精品免费| 熟女乱一区二区三区四区| 精品少妇人妻av免费看| 亚洲精品中文字幕在线视频| 日本丰满大奶熟女一区二区| 日本午夜免费观看视频| 午夜久久精品福利视频| 在线视频三区日本精品| 91在线国内在线中文字幕| 黑鬼糟蹋少妇资源在线观看| 国产传媒免费观看视频| 国产一级内片内射免费看| 色婷婷中文字幕在线视频| 极品熟女一区二区三区| 亚洲天堂精品1024| 99久热只有精品视频最新| 亚洲淫片一区二区三区| 成人亚洲国产精品一区不卡| 国产日韩久久精品一区| 日韩欧美综合中文字幕 | 日韩性生活片免费观看| 大香蕉网国产在线观看av| 黄色片一区二区在线观看| 丝袜美女诱惑在线观看| 国产一区在线免费国产一区| 高清不卡一卡二卡区在线| 一区二区三区在线不卡免费| 日本加勒比中文在线观看| a久久天堂国产毛片精品| 大尺度激情福利视频在线观看|