基于Attention自動編碼機制的圖像自動評論方法研究
發(fā)布時間:2022-01-03 14:43
隨著電子商務(wù)的普及,在線旅游、在線購物等也隨之蓬勃發(fā)展。越來越多的消費者依據(jù)自己的消費經(jīng)驗通過網(wǎng)絡(luò)對產(chǎn)品或服務(wù)發(fā)表評論。對于在線旅游或者在線購物網(wǎng)站,網(wǎng)站上的圖像至關(guān)重要。商家需要通過學(xué)習(xí)用戶發(fā)表的評論來推測用戶的喜好和購物心理,在此基礎(chǔ)上設(shè)計宣傳圖像。此背景下,本文做了學(xué)術(shù)性探究,嘗試對圖像進(jìn)行自動評論,首次提出圖像自動評論模型。在現(xiàn)實場景中,用戶對圖像的判斷主觀性很強,難以形成統(tǒng)一的評價標(biāo)準(zhǔn)。因此本文使用深度學(xué)習(xí)方法,去挖掘影響用戶判斷的圖像屬性,以及如何有效融合這些屬性對圖像進(jìn)行評價。本文擬實現(xiàn)的圖像自動評論算法是計算機視覺、自然語言處理與機器學(xué)習(xí)的交叉研究方向。本文的模型可以模擬用戶對拍攝的圖像自動生成簡短評論,以便于商家根據(jù)用戶的喜好對圖像進(jìn)行調(diào)整。本文的主要工作有:1、借鑒圖像描述的方法和模型,本文首次提出圖像簡短評論模型,參考編碼器-解碼器模型算法,同時加入Attention自動編碼機制來構(gòu)建本文的圖像自動評論模型。使用本文制作的圖像評論數(shù)據(jù)集對模型進(jìn)行訓(xùn)練調(diào)參,對拍攝的照片自動生成簡短的評論。同時,基于BLEU、CIDEr等評價指標(biāo)對模型進(jìn)行調(diào)整以達(dá)到最佳效果。2、本文...
【文章來源】:江西師范大學(xué)江西省
【文章頁數(shù)】:49 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖像描述實例圖
學(xué)習(xí)概述器學(xué)習(xí)年中,機器學(xué)習(xí)為我們提供了自動駕駛汽車,實以及對人類基因組的大大改進(jìn)。機器學(xué)習(xí)如今已經(jīng)個學(xué)科其中包括計算機學(xué)科、工程技術(shù)和統(tǒng)計學(xué)序設(shè)計當(dāng)中,人們輸入到系統(tǒng)中的是程序也可以說理數(shù)據(jù),系統(tǒng)輸出的是對應(yīng)的答案。但是機器學(xué)習(xí)們預(yù)期得到的答案,系統(tǒng)根據(jù)這些輸出其規(guī)則。這據(jù)上,從而達(dá)到計算機去自主生成答案的目標(biāo)。機出來的,而不是用明確的程序編寫出來的。把很多機器學(xué)習(xí)系統(tǒng)中,它會在這些輸入的例子當(dāng)中找到的規(guī)則,實現(xiàn)任務(wù)自動化。
機器學(xué)習(xí)為我們提供了自動駕駛汽車,實以及對人類基因組的大大改進(jìn)。機器學(xué)習(xí)如今已經(jīng)個學(xué)科其中包括計算機學(xué)科、工程技術(shù)和統(tǒng)計學(xué)序設(shè)計當(dāng)中,人們輸入到系統(tǒng)中的是程序也可以說理數(shù)據(jù),系統(tǒng)輸出的是對應(yīng)的答案。但是機器學(xué)習(xí)們預(yù)期得到的答案,系統(tǒng)根據(jù)這些輸出其規(guī)則。這據(jù)上,從而達(dá)到計算機去自主生成答案的目標(biāo)。機出來的,而不是用明確的程序編寫出來的。把很多機器學(xué)習(xí)系統(tǒng)中,它會在這些輸入的例子當(dāng)中找到的規(guī)則,實現(xiàn)任務(wù)自動化。圖 2-1 傳統(tǒng)方式
【參考文獻(xiàn)】:
期刊論文
[1]MFSR: Maximum Feature Score Region-based Captions Locating in News Video Images[J]. Zhi-Heng Wang,Chao Guo,Hong-Min Liu,Zhan-Qiang Huo. International Journal of Automation and Computing. 2018(04)
[2]基于概念器的深度神經(jīng)網(wǎng)絡(luò)模型[J]. 錢光武,張蕾,王炎. 中國科學(xué):信息科學(xué). 2018(05)
[3]基于CNN-RNN深度學(xué)習(xí)的圖片描述方法與優(yōu)化[J]. 陳虹君,羅福強,趙力衡,張杰,李瑤. 湘潭大學(xué)自然科學(xué)學(xué)報. 2018(02)
[4]基于深度學(xué)習(xí)的圖像描述研究[J]. 楊楠,南琳,張丁一,庫濤. 紅外與激光工程. 2018(02)
[5]基于連續(xù)Skip-gram及深度學(xué)習(xí)的圖像描述方法[J]. 曹劉彬,張麗紅. 測試技術(shù)學(xué)報. 2017(05)
[6]基于注意機制編碼解碼模型的答案選擇方法(英文)[J]. Yuan-ping NIE,Yi HAN,Jiu-ming HUANG,Bo JIAO,Ai-ping LI. Frontiers of Information Technology & Electronic Engineering. 2017(04)
[7]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動化學(xué)報. 2016(09)
[8]基于詞向量特征的循環(huán)神經(jīng)網(wǎng)絡(luò)語言模型[J]. 張劍,屈丹,李真. 模式識別與人工智能. 2015(04)
[9]基于概念級語義的圖像描述與識別[J]. 任越美,程顯毅,李小燕,謝玉宇. 計算機科學(xué). 2008(07)
[10]一種基于變異灰度直方圖的視頻字幕檢測定位方法[J]. 張佑生,彭青松,汪榮貴. 電子學(xué)報. 2004(02)
本文編號:3566454
【文章來源】:江西師范大學(xué)江西省
【文章頁數(shù)】:49 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖像描述實例圖
學(xué)習(xí)概述器學(xué)習(xí)年中,機器學(xué)習(xí)為我們提供了自動駕駛汽車,實以及對人類基因組的大大改進(jìn)。機器學(xué)習(xí)如今已經(jīng)個學(xué)科其中包括計算機學(xué)科、工程技術(shù)和統(tǒng)計學(xué)序設(shè)計當(dāng)中,人們輸入到系統(tǒng)中的是程序也可以說理數(shù)據(jù),系統(tǒng)輸出的是對應(yīng)的答案。但是機器學(xué)習(xí)們預(yù)期得到的答案,系統(tǒng)根據(jù)這些輸出其規(guī)則。這據(jù)上,從而達(dá)到計算機去自主生成答案的目標(biāo)。機出來的,而不是用明確的程序編寫出來的。把很多機器學(xué)習(xí)系統(tǒng)中,它會在這些輸入的例子當(dāng)中找到的規(guī)則,實現(xiàn)任務(wù)自動化。
機器學(xué)習(xí)為我們提供了自動駕駛汽車,實以及對人類基因組的大大改進(jìn)。機器學(xué)習(xí)如今已經(jīng)個學(xué)科其中包括計算機學(xué)科、工程技術(shù)和統(tǒng)計學(xué)序設(shè)計當(dāng)中,人們輸入到系統(tǒng)中的是程序也可以說理數(shù)據(jù),系統(tǒng)輸出的是對應(yīng)的答案。但是機器學(xué)習(xí)們預(yù)期得到的答案,系統(tǒng)根據(jù)這些輸出其規(guī)則。這據(jù)上,從而達(dá)到計算機去自主生成答案的目標(biāo)。機出來的,而不是用明確的程序編寫出來的。把很多機器學(xué)習(xí)系統(tǒng)中,它會在這些輸入的例子當(dāng)中找到的規(guī)則,實現(xiàn)任務(wù)自動化。圖 2-1 傳統(tǒng)方式
【參考文獻(xiàn)】:
期刊論文
[1]MFSR: Maximum Feature Score Region-based Captions Locating in News Video Images[J]. Zhi-Heng Wang,Chao Guo,Hong-Min Liu,Zhan-Qiang Huo. International Journal of Automation and Computing. 2018(04)
[2]基于概念器的深度神經(jīng)網(wǎng)絡(luò)模型[J]. 錢光武,張蕾,王炎. 中國科學(xué):信息科學(xué). 2018(05)
[3]基于CNN-RNN深度學(xué)習(xí)的圖片描述方法與優(yōu)化[J]. 陳虹君,羅福強,趙力衡,張杰,李瑤. 湘潭大學(xué)自然科學(xué)學(xué)報. 2018(02)
[4]基于深度學(xué)習(xí)的圖像描述研究[J]. 楊楠,南琳,張丁一,庫濤. 紅外與激光工程. 2018(02)
[5]基于連續(xù)Skip-gram及深度學(xué)習(xí)的圖像描述方法[J]. 曹劉彬,張麗紅. 測試技術(shù)學(xué)報. 2017(05)
[6]基于注意機制編碼解碼模型的答案選擇方法(英文)[J]. Yuan-ping NIE,Yi HAN,Jiu-ming HUANG,Bo JIAO,Ai-ping LI. Frontiers of Information Technology & Electronic Engineering. 2017(04)
[7]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動化學(xué)報. 2016(09)
[8]基于詞向量特征的循環(huán)神經(jīng)網(wǎng)絡(luò)語言模型[J]. 張劍,屈丹,李真. 模式識別與人工智能. 2015(04)
[9]基于概念級語義的圖像描述與識別[J]. 任越美,程顯毅,李小燕,謝玉宇. 計算機科學(xué). 2008(07)
[10]一種基于變異灰度直方圖的視頻字幕檢測定位方法[J]. 張佑生,彭青松,汪榮貴. 電子學(xué)報. 2004(02)
本文編號:3566454
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3566454.html
最近更新
教材專著