天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于協(xié)同注意力機制的視覺問答系統(tǒng)研究與實現(xiàn)

發(fā)布時間:2024-05-10 03:07
  視覺問答(VQA)系統(tǒng)是將圖片和問題作為輸入,計算機結(jié)合輸入的圖像和文字信息,產(chǎn)生一條人類語言作為輸出的任務,它運用了計算機視覺和自然語言處理兩個領域方面的知識。在視覺問答中,計算機視覺(CV)技術(shù)用來理解輸入圖像,自然語言處理(NLP)技術(shù)用來理解輸入的問題以及生成答案。VQA的關鍵解決方案主要在于如何融合從輸入圖像和問題中提取的視覺和語言特征。近年來,許多基于CNN+LSTM的網(wǎng)絡能夠表現(xiàn)出很好的效果,最近許多網(wǎng)絡將attention應用到VQA中。盡管如此,VQA回答問題的準確率仍然并不理想,特別是在關系推理以及計數(shù)方面。為了解決這個問題,本研究中選擇采用協(xié)同注意機制的訓練方法來訓練網(wǎng)絡,其中協(xié)同注意力機制的作用是生成圖像-問題對的雙相關特征,并使用推理模塊來推理圖片中對象的關系以及圖片中對象與問題的關系,幫助模型預測答案。本文重點研究了基于協(xié)同注意力機制的視覺問答系統(tǒng),其主要研究內(nèi)容包括:1)深入研究了協(xié)同注意力機制,構(gòu)建一個有效的協(xié)同注意力機制,通過co-attention協(xié)同注意力生成圖像-問題對的雙相關特征,讓網(wǎng)絡可以自主學習雙相關特征,通過實驗驗證,使得視覺問答的準確率...

【文章頁數(shù)】:60 頁

【學位級別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 本文研究內(nèi)容
    1.4 本文組織及結(jié)構(gòu)
第二章 相關算法及分析
    2.1 LSTM網(wǎng)絡
    2.2 殘差網(wǎng)絡Res Net
        2.2.1 殘差模塊
        2.2.2 殘差網(wǎng)絡
    2.3 視覺問答系統(tǒng)
        2.3.1 傳統(tǒng)分類方法
        2.3.2 聯(lián)合嵌入
        2.3.3 單注意機制
        2.3.4 聯(lián)合注意力機制
        2.3.5 視覺問答系統(tǒng)訓練流程
    2.4 推理網(wǎng)絡RN
        2.4.1 RN網(wǎng)絡
        2.4.2 RN網(wǎng)絡算法
        2.4.3 RN網(wǎng)絡訓練
    2.5 本章小結(jié)
第三章 基于協(xié)同注意力機制的視覺問答系統(tǒng)
    3.1 基于協(xié)同注意力機制的視覺問答系統(tǒng)框架
    3.2 特征提取
        3.2.1 問題和答案表示
        3.2.2 圖像表示
    3.3 改進的推理網(wǎng)絡RN
    3.4 協(xié)同注意力層
        3.4.1 架構(gòu)概述
        3.4.2 注意力創(chuàng)造的基本方法
        3.4.3 融合圖像和問題表示
        3.4.4 答案預測
    3.5 本章小結(jié)
第四章 實驗與結(jié)果分析
    4.1 實驗工具及數(shù)據(jù)集概述
        4.1.1 使用工具
        4.1.2 實驗數(shù)據(jù)集
    4.2 實驗設置及實驗方法
    4.3 基于協(xié)同注意力機制的視覺問答系統(tǒng)結(jié)果分析
        4.3.1 協(xié)同注意力機制結(jié)果分析
        4.3.2 數(shù)據(jù)對比分析
        4.3.3 改進的RN網(wǎng)絡結(jié)果分析
    4.4 本章小結(jié)
第五章 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
參考文獻
發(fā)表論文和參加科研情況說明
致謝



本文編號:3968650

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3968650.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9a539***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com