天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于直接強(qiáng)化學(xué)習(xí)的面向目標(biāo)的仿生導(dǎo)航模型

發(fā)布時(shí)間:2020-02-17 19:08
【摘要】:針對連續(xù)動(dòng)作和狀態(tài)空間中面向目標(biāo)的導(dǎo)航問題,依據(jù)海馬結(jié)構(gòu)中位置細(xì)胞相關(guān)特性和相關(guān)信息傳遞通路,構(gòu)建海馬位置細(xì)胞到前額葉皮層假設(shè)的動(dòng)作細(xì)胞的脈沖神經(jīng)網(wǎng)絡(luò)模型.連續(xù)的狀態(tài)空間和動(dòng)作空間分別由位置細(xì)胞和動(dòng)作細(xì)胞進(jìn)行表征,模型采用直接強(qiáng)化學(xué)習(xí)與脈沖響應(yīng)模型相結(jié)合的算法進(jìn)行面向目標(biāo)的自主導(dǎo)航.在Morris水迷宮環(huán)境中的仿真實(shí)驗(yàn)結(jié)果表明,該模型能夠解決連續(xù)狀態(tài)空間中面向目標(biāo)導(dǎo)航問題,所采用算法在性能上優(yōu)于傳統(tǒng)的時(shí)間差分學(xué)習(xí)算法.調(diào)整網(wǎng)絡(luò)中動(dòng)作細(xì)胞的數(shù)量,模型的收斂性能不變,在改變狀態(tài)空間和目標(biāo)位置時(shí),也可以實(shí)現(xiàn)面向目標(biāo)的導(dǎo)航.
【圖文】:

示意圖,細(xì)胞突,示意圖


I邐Delayed邋and邋weighted.邐i逡逑|邐postsynaptic邋potential^邋\邐|逡逑;/邋?邋■邋^邋^逡逑i邋/邐\邋Total邋potential邋Postsynaptic邋potentials逡逑Presynaptie/邐/邋\一邋|\邐A逡逑\邋i邐i邋/邐Stochastic邋threshold邋model逡逑:xs-?——^邐_逡逑Place邋cellj邐Delayed邋synaptic邐|邐Action邋cell逡逑圖2位置細(xì)胞到動(dòng)作細(xì)胞突觸連接示意圖逡逑Figure邋2邋The邋sketch邋map邋of邋synaptic邋from邋place邋cells邋to邋action邋cells逡逑中為最大放龜設(shè)定為100邋Hz,邋(m,?)是當(dāng)前位置、,a表示位置野的寬度.由(1)式可}當(dāng)前逡逑位置可由位置細(xì)胞群聯(lián)合編碼,通過這種密集編碼方式,位置細(xì)胞對整個(gè)環(huán)境進(jìn)行了表征.位置細(xì)胞逡逑被建模為Poisson神經(jīng)元,所以,瞬時(shí)放電率為巧的位置細(xì)胞在:無窮小的持續(xù)時(shí)間(At)產(chǎn)生脈沖的逡逑可能性為b6(spike)邋=邋e邋r邋(^At)邋?悐p._}0)大寧一個(gè)到1之_.均句分布的隨機(jī)懫樣逡逑值時(shí),位置細(xì)胞產(chǎn)生一個(gè)脈沖.逡逑模型假設(shè)前額葉皮層中存在著代表動(dòng)物運(yùn)動(dòng)方向的動(dòng)作細(xì)胞丨action邋cells),將動(dòng)作細(xì)胞構(gòu)建成環(huán)逡逑狀模型,不同于文獻(xiàn)[12,13,27],動(dòng)作細(xì)胞之間不存在著橫向突觸連接.動(dòng)作細(xì)胞被建模成脈沖響應(yīng)模逡逑M邋(spikeiesponse:皿idel,SRM)邋_,位置細(xì)胞到動(dòng)作細(xì)胞的突..觸信息傳遞示?Yj圖如畫2所示,動(dòng)作細(xì)逡逑胞i的膜電位為逡

動(dòng)作空間,標(biāo)位,連續(xù)狀態(tài),細(xì)胞的


、、、、、逡逑14-邋-邋'邋一一、■逡逑12-邋:;;;:■邐/邋l^vw-逡逑s./Z/Z/H邋t邋t邋t\邋^邋H逡逑/邋/邋M邋/邐f邋f邋\邋\邋\逡逑\邐/邋M邋\邋\邋.逡逑/邋/邋#邐邐邐//f邋令、、逡逑4_.邋,/#邋令\\邋\邐爹邋\\\.逡逑//邋/邋/邋\\邋\^-邐\邋v\逡逑2.,、、--,,,方丨、?邐*■逡逑\邐\邐<邐\邐\邋V邋?邋V邋t邐\邋I逡逑0l邐'邐'邐'邐逡逑0邐5邐10邐15邐20逡逑圖10有障礙物環(huán)境中的導(dǎo)航地圖逡逑Figure邋10邋Navigation邋map邋with邋obstacle邋environment逡逑5結(jié)論逡逑本文根據(jù)海馬體到前額葉皮晨的生理學(xué)研究,,構(gòu)建位置細(xì)胞到假設(shè)動(dòng)作細(xì)胞的脈沖神經(jīng)網(wǎng)絡(luò)模逡逑型,在無先驗(yàn)知識的條件下,在連續(xù)的狀態(tài)和動(dòng)作空間中進(jìn)行面向g標(biāo)位置的導(dǎo)航,其中,狀態(tài)空間由逡逑位置野構(gòu)成,動(dòng)作空間由動(dòng)作細(xì)胞所代表的運(yùn)動(dòng)方向表示.本文使用基于脈沖響應(yīng)模型的宣接強(qiáng)化學(xué)逡逑習(xí),調(diào)節(jié)位置細(xì)胞到動(dòng)作細(xì)胞的突觸連接權(quán)構(gòu)成整個(gè)狀態(tài)空間的導(dǎo)航地圖.仿真實(shí)驗(yàn)結(jié)果表明,該逡逑模型能夠有效的學(xué)習(xí)到連續(xù)狀態(tài)和動(dòng)作空間面向S標(biāo)位置的導(dǎo)航策略,所采用的方法在收斂性上優(yōu)于逡逑傳統(tǒng)的強(qiáng)化學(xué)習(xí)方法,在改變模型中位置細(xì)胞和動(dòng)作細(xì)胞的數(shù)量、_目標(biāo)位置以及在環(huán)境中加入障礙物逡逑后,模型也能夠有穩(wěn)定的表現(xiàn),能夠?qū)崿F(xiàn)在連續(xù)狀態(tài)和動(dòng)作空_中的有效的學(xué)習(xí)和導(dǎo)航活動(dòng).逡逑模型采用脈沖神經(jīng)網(wǎng)絡(luò),更加切合生物學(xué)事實(shí),但也使得整個(gè)模型的計(jì)算鷥有所增加.仿真實(shí)驗(yàn)逡逑中,初始位置和目標(biāo)位置是隨機(jī)給定的二維坐標(biāo),使得模型輸入信息不是智能體完全自主探測所得.


本文編號:2580486

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2580486.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶67f79***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com