應(yīng)用于感知決策任務(wù)的策略算法研究
【文章頁(yè)數(shù)】:102 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-2決策任務(wù)^??Figure?1-2.?Decision-making?task??
支持非理性決策的理論除了匹配律之外,還有概率匹配[56]。其中,概率學(xué)習(xí)??任務(wù)常用于檢測(cè)人類的非理性行為。例如,2017年,SilvatM根據(jù)概率學(xué)習(xí)任務(wù)設(shè)??計(jì)了一個(gè)實(shí)驗(yàn)(如圖1-2所示),要求被試童復(fù)地在黑色球會(huì)出現(xiàn)在左側(cè)(按L鍵)??還是右側(cè)(按R鍵)的框內(nèi)做出選擇,并且....
圖1一論文組織結(jié)構(gòu)圖
鷹用予感知決策住務(wù)的策略算法研.究??H章,提出了一個(gè)受獎(jiǎng)勵(lì)調(diào)制的策略參數(shù)算法。該箅法從目標(biāo)函數(shù)導(dǎo)得到,策略參數(shù)包括獎(jiǎng)勵(lì)和經(jīng)驗(yàn)兩個(gè)組成部分。利用該算法證明單階段決策任務(wù)時(shí),獎(jiǎng)勵(lì)會(huì)通過(guò)提取不同的經(jīng)驗(yàn)值來(lái)形成決策。按的決策結(jié)果即可是獲得最佳收益的理性決策,也可是獲得次優(yōu)的非四章,提出....
圖2一時(shí)間差分預(yù)測(cè)誤差與多巴胺能神經(jīng)元發(fā)放的比較[l4州
浙江工業(yè)大學(xué)碩士學(xué)位論文得獎(jiǎng)勵(lì)后,這種多巴胺神經(jīng)元的激活就停止了。類似地,囡為提示本勵(lì),所以在訓(xùn)練之前不應(yīng)該導(dǎo)致預(yù)測(cè)誤差。低是在訓(xùn)練之后,—且它值(即F(cwe)>0),這種意外出現(xiàn)的提示就應(yīng)該會(huì)產(chǎn)生預(yù)測(cè)誤差(?fF(cwe)?-?F(?ocwe)?=?fF(cwe)?>?0),....
圖3-2單階段決策任務(wù)的用例圖??Figure?3-2.?Use?case?of?single-stage?decision-making?tasks??
化鍵?數(shù)數(shù)??圖3-1單階段決策任務(wù)的功能設(shè)計(jì)圖??Figure?3-1.?Functional?design?diagram?of?single-stage?decision-making?tasks??根據(jù)上述的功能設(shè)計(jì),以下將用用例圖與活動(dòng)圖對(duì)該決策任務(wù)的主要功能進(jìn)??行詳....
本文編號(hào):3947834
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3947834.html