當(dāng)前位置：主頁 > 科技論文 > 計(jì)算機(jī)應(yīng)用論文 >

基于視覺特征的二維圖像文本描述生成關(guān)鍵算法研究

發(fā)布時(shí)間：2024-02-19 16:09

　　二維圖像文本描述生成是人工智能領(lǐng)域的一個(gè)熱門研究,是指利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法和技術(shù),生成能夠描述圖像視覺內(nèi)容的文本語言,涉及了計(jì)算機(jī)視覺和自然語言處理。基于視覺特征的二維圖像文本描述生成關(guān)鍵算法研究旨在通過特征提取、特征融合、語言生成等算法和技術(shù),生成完整的、符合語法結(jié)構(gòu)的文本句子,準(zhǔn)確地描述出二維圖像的視覺內(nèi)容。二維圖像文本描述生成對(duì)于場景理解具有重要意義,人類的交流過程大多依賴于自然語言,使計(jì)算機(jī)能夠描述我們的視覺世界將會(huì)導(dǎo)致大量可能的應(yīng)用,如圖像檢索、語義視覺搜索;人機(jī)交互中的視障輔助;智能監(jiān)控中的道路監(jiān)控等。近年來,雖然該領(lǐng)域的研究取得了長足的進(jìn)步;但是仍然存在著一些亟待解決的問題,表現(xiàn)在以下幾個(gè)方面:(1)已有研究中僅考慮使用圖像層次的特征或粗粒度的屬性特征,造成重要判別信息的損失。在基于注意力機(jī)制的二維圖像文本描述生成方法中,注意力機(jī)制作為特征融合算法能夠充分發(fā)揮作用的前提是已提取足夠的視覺特征;而在基于屬性的圖像文本描述生成方法中使用的通常是粗粒度的屬性特征。忽略了目標(biāo)特征和細(xì)粒度屬性信息的互補(bǔ)性。(2)已有研究中未考慮以粗粒度到細(xì)粒度的方式理解二維圖像的視覺內(nèi)容,...

【文章頁數(shù)】：131 頁

【學(xué)位級(jí)別】：博士

【部分圖文】：

圖１．３基于檢索的圖像文本描述生成方法示意圖ｔ１６］??Ｆｉｇ．?１．３?Ｄｉａｇｒａｍ?ｏｆ?Ｒｅｔｒｉｅｖｅ－ｂａｓｅｄ?Ｍｅｔｈｏｄ?ｆｏｒ?Ｉｍａｇｅ?Ｄｅｓｃｒｉｐｔｉｏｎ?Ｇｅｎｅｒａｔｉｏ?

圖１．７稠密文本描述生成示意圖Ｗ??Ｆｉｇ．?１．７?Ｄｉａｇｒａｍ?ｏｆ?Ｄｅｎｓｅ?Ｄｅｓｃｒｉｐｔｉｏｎｓ?Ｇｅｎｅｒａｔｉｏｎ??

圖1.8基于注意力的圖像文本描述生成示意圖[63]

圖１．１０語義概念示意圖［８９】??Ｆｉｇ．?１．１０?Ｄｉａｇｒａｍ?ｏｆ?Ｓｅｍａｎｔｉｃ?Ｃｏｎｃｅｐｔｓ??

本文編號(hào)：3902969

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/shengwushengchang/3902969.html

上一篇：基于知識(shí)圖譜的社會(huì)媒體中少數(shù)民族主題數(shù)據(jù)抽取方法
下一篇：基于近紅外光譜分析技術(shù)的紡織物纖維成分檢測(cè)方法研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于視覺特征的二維圖像文本描述生成關(guān)鍵算法研究