多主題的圖像摘要生成方法研究

發(fā)布時間：2021-01-14 23:15

　　圖像描述生成任務（Image Caption）是一個融合了計算機視覺（CV）和自然語言處理（NLP）的綜合類問題,可以簡單的理解為將輸入的圖像翻譯成關于圖像內(nèi)容的描述的過程。實現(xiàn)該任務對于機器來說具有一定的挑戰(zhàn)性,需要將這一大問題劃分為以下幾個子任務:（1）識別圖中目標對象;（2）找到目標對象之間的聯(lián)系;（3）用自然語言陳述圖像表達內(nèi)容。其中理解目標對象之間的聯(lián)系,并且用自然語言描述出來是實現(xiàn)圖像描述生成任務中的重難點。該任務的應用場景非常廣泛,一般是給照片匹配文字,即用戶拍了一張照片,利用圖像描述生成技術(shù)可以匹配到合適的文字,對于用戶來說既方便檢索,又省去了用戶手動配文字的時間。又或者應用在幫助視覺障礙者理解圖像內(nèi)容等等。迄今為止,常見的圖像描述生成方法大致可以分為三大類,其中基于神經(jīng)網(wǎng)絡的是最準確,研究價值最高的圖像描述生成方法�；谏窠�(jīng)網(wǎng)絡的圖像描述生成方法一般采用編碼解碼結(jié)構(gòu),當利用解碼器Decoder對中間編碼生成詞序列時,通常僅考慮訓練文本的詞分布,假定了在任何主題下的詞分布都是一致的,并沒有考慮主題對詞分布的影響,導致解碼器擬合了一般意義上的詞分布。事實上,不同主題下的詞...

【文章來源】：遼寧大學遼寧省 211工程院校

【文章頁數(shù)】：70 頁

【學位級別】：碩士

【部分圖文】：

多主題的圖像摘要生成方法研究

CNN結(jié)構(gòu)

多主題的圖像摘要生成方法研究

LSTM結(jié)構(gòu)

多主題的圖像摘要生成方法研究

GoogleNIC結(jié)構(gòu)

本文編號：2977737

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/shengwushengchang/2977737.html

上一篇：基于膠囊內(nèi)窺鏡影像的小腸疾病檢測算法研究
下一篇：基于高級語義的通用型文本生成遷移學習

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

多主題的圖像摘要生成方法研究