天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于編解碼框架的圖像語義描述研究

發(fā)布時(shí)間:2021-11-27 01:45
  近年來,圖像語義描述作為人工智能領(lǐng)域一項(xiàng)基本的研究任務(wù),受到越來越多的關(guān)注。它作為橋梁連接了計(jì)算機(jī)視覺中的圖像處理技術(shù)和自然語言處理中的序列語句生成技術(shù)。圖像語義描述在實(shí)際生活中有著很多的應(yīng)用,例如,它可以幫助視覺障礙者理解圖像,也可以通過挖掘圖像的語義內(nèi)容來提高圖像檢索的質(zhì)量。圖像語義描述任務(wù)也取得了很大的進(jìn)展,尤其是基于編解碼網(wǎng)絡(luò)框架的模型在這個(gè)任務(wù)上取得了優(yōu)異的性能表現(xiàn)。在本文中,我們提出了一種叫做自動(dòng)重構(gòu)網(wǎng)絡(luò)(Auto-Reconstructor Network,ARNet)的網(wǎng)絡(luò)結(jié)構(gòu),該網(wǎng)絡(luò)嵌入于編解碼網(wǎng)絡(luò)模型之中,并且能夠端到端的為圖像生成描述語句。在我們的自動(dòng)重構(gòu)網(wǎng)絡(luò)中,使用當(dāng)前時(shí)刻循環(huán)神經(jīng)網(wǎng)絡(luò)產(chǎn)生的隱狀態(tài)去重構(gòu)前一刻時(shí)刻的隱狀態(tài),以此起到在不同時(shí)刻的隱狀態(tài)之間進(jìn)行信息遷移變換的作用。因此,通過自動(dòng)重構(gòu)網(wǎng)絡(luò),可以鼓勵(lì)當(dāng)前時(shí)刻的隱狀態(tài)去從前一個(gè)時(shí)刻的隱狀態(tài)中吸收更多有用的信息,并且能夠挖掘相鄰兩個(gè)隱狀態(tài)之間更深的語義關(guān)系,從而對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)中隱狀態(tài)中信息的動(dòng)態(tài)變換起到正則化的效果。我們通過一系列的實(shí)驗(yàn)說明自動(dòng)重構(gòu)網(wǎng)絡(luò)能夠提升現(xiàn)有編解碼網(wǎng)絡(luò)模型的圖像語義描述性能。同時(shí),我們定... 

【文章來源】:武漢大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:67 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于編解碼框架的圖像語義描述研究


圖1-2圖像語義描述技術(shù)在Google、Microsoft以及騰訊AI?Lab中的應(yīng)用實(shí)例??

基于編解碼框架的圖像語義描述研究


vinya】5110]等人提出的基于編解碼框架的圖像語義描述模型(NIC)示意圖

基于編解碼框架的圖像語義描述研究


圖1_4?等人提出的帶有注意力機(jī)制的圖像語義描述模型示意圖??【17]


本文編號(hào):3521348

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3521348.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5ae86***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com