基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的電子鼻系統(tǒng)

發(fā)布時(shí)間：2024-05-20 01:47

　　電子鼻技術(shù)發(fā)展至今已有幾十年的歷史,在環(huán)境監(jiān)測(cè)、食品安全、醫(yī)療診斷等方面得到了廣泛的應(yīng)用。嗅覺和其他人類知覺類似,是一種主動(dòng)感知(Active Perception)過程,可以用馬爾可夫決策過程(MDP)來描述,強(qiáng)化學(xué)習(xí)是解決MDP問題的重要的方法。近年來,結(jié)合了深度學(xué)習(xí)的強(qiáng)化學(xué)習(xí)算法(如DQN、A3C等)取得了很大的突破,受到了越來越多的重視。傳統(tǒng)的強(qiáng)化學(xué)習(xí)算法依賴外部獎(jiǎng)勵(lì)信號(hào),但在外部獎(jiǎng)勵(lì)稀疏或者缺乏時(shí)強(qiáng)化學(xué)習(xí)算法便無法適用。而生物體可以在只有稀疏外部獎(jiǎng)勵(lì)信號(hào)或者沒有外部獎(jiǎng)勵(lì)信號(hào)的情況下進(jìn)行學(xué)習(xí)。本文在生物學(xué)習(xí)的仿生基礎(chǔ)上提出了一種基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的強(qiáng)化學(xué)習(xí)框架,模擬生物在學(xué)習(xí)過程中產(chǎn)生內(nèi)部獎(jiǎng)勵(lì)信號(hào)(如好奇心和賦能),通過內(nèi)部獎(jiǎng)勵(lì)信號(hào)和外部獎(jiǎng)勵(lì)信號(hào)共同作用,以彌補(bǔ)強(qiáng)化學(xué)習(xí)的缺陷。針對(duì)目前電子鼻存在的不足,本文應(yīng)用基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的強(qiáng)化學(xué)習(xí)框架來提高電子鼻性能。主要進(jìn)行了以下研究:(1)硬件傳感器由于其電子特性、數(shù)量等原因決定了電子鼻無法與生物嗅覺相媲美,本文嘗試在改善進(jìn)氣氣道設(shè)計(jì)、傳感器布置以及動(dòng)態(tài)調(diào)制采樣速度基礎(chǔ)上,將傳統(tǒng)的靜態(tài)分類算法,轉(zhuǎn)換為動(dòng)態(tài)馬爾可夫決策過程,以充分...

【文章頁數(shù)】：67 頁

【學(xué)位級(jí)別】：碩士

【部分圖文】：

圖１－１機(jī)器學(xué)習(xí)分類結(jié)構(gòu)圖??監(jiān)督學(xué)習(xí)在分類時(shí)存在很多問題，例如泛化問題、正確學(xué)習(xí)數(shù)據(jù)的選擇和處??

獎(jiǎng)勵(lì)信號(hào)才能得以持續(xù)工作。在許多場(chǎng)景下，比物嗅覺機(jī)制一樣，生物進(jìn)行嗅探行為并不是或者了獎(jiǎng)勵(lì)信號(hào)刺激，而是生物內(nèi)在自發(fā)的根據(jù)自身在少數(shù)，而是廣泛存在于各種現(xiàn)實(shí)場(chǎng)景，在外部，傳統(tǒng)的強(qiáng)化學(xué)習(xí)算法將不再適用。因此，如何術(shù)領(lǐng)域的重要研究方向。??可獲取和計(jì)算機(jī)算力的快速提升，圖形圖像識(shí)別得....

圖１－２論文章節(jié)結(jié)構(gòu)圖??以下是圖丨－２中論文的具體結(jié)構(gòu)：??

著更高的準(zhǔn)確性。??１．５．２?本文的主要貢獻(xiàn)??（１）提出了一種基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的強(qiáng)化學(xué)習(xí)框架；??（２）在框架中使用兩種方式組成內(nèi)在激勵(lì)信號(hào)；??（３）實(shí)驗(yàn)研究了不同氣體（黃酒、ＶＯＣ氣體）的進(jìn)氣流速與傳感器響應(yīng)的??關(guān)系，并將本文的框架與現(xiàn)有分類算法進(jìn)行對(duì)比。??１．５....

圖2-s外部激勵(lì)行為和內(nèi)部激勵(lì)行為流程對(duì)比圖

?基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的電子鼻系統(tǒng)???動(dòng)？他們從事各種各樣的活動(dòng)，出于好奇或樂趣，沒有得到回報(bào)。這種行為在成??人和動(dòng)物身上也能觀察到，這種行為現(xiàn)象被稱為內(nèi)在動(dòng)機(jī)。心理學(xué)家依據(jù)動(dòng)機(jī)的??來源區(qū)分內(nèi)在動(dòng)機(jī)和外在動(dòng)機(jī)。當(dāng)獎(jiǎng)勵(lì)來自環(huán)境時(shí)，它被稱為外部動(dòng)機(jī)。??大腦會(huì)同時(shí)受外部環(huán)境和內(nèi)....

圖３－１現(xiàn)有強(qiáng)化學(xué)習(xí)框架??

現(xiàn)有強(qiáng)化學(xué)習(xí)框架是Ａｇｅｎｔ在已有動(dòng)作序列中選擇一個(gè)動(dòng)作對(duì)環(huán)境產(chǎn)生影??響，環(huán)境把觀測(cè)值和外部獎(jiǎng)勵(lì)反饋給Ａｇｅｎｔ，然后Ａｇｅｎｔ據(jù)此使用算法對(duì)下一個(gè)??動(dòng)作序列進(jìn)行動(dòng)作選取。如圖３－１：??ａｔｕ動(dòng)作???觀測(cè)值〇，?ｔ??環(huán)境?Ａｇｅｎｔ?一???＾?ＤＱＮ，Ａ３Ｃ算法??外....

本文編號(hào)：3978773

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/yiqiyibiao/3978773.html

上一篇：JJG548-2018《測(cè)汞儀檢定規(guī)程》解讀和應(yīng)用
下一篇：基于STM32的體脂測(cè)量器

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于內(nèi)在激勵(lì)學(xué)習(xí)機(jī)制的電子鼻系統(tǒng)