基于卷積神經(jīng)網(wǎng)絡(luò)的圖像標注算法研究
發(fā)布時間:2021-08-06 01:25
在大數(shù)據(jù)時代,每天都有海量的圖片上傳到互聯(lián)網(wǎng),為了對如此大規(guī)模圖像數(shù)據(jù)進行有效的管理和檢索,圖像的高效自動標注顯得越來越重要。圖像自動標注就是利用算法使得計算機能自動為圖像賦上與圖像語義內(nèi)容相關(guān)的關(guān)鍵詞匯,其本質(zhì)是在圖像的高層語義信息和底層特征之間建立一種映射關(guān)系。傳統(tǒng)的圖像標注算法需要手動提取特征,不適應(yīng)大規(guī)模的數(shù)據(jù)集,而基于深度學(xué)習(xí)的圖像標注算法大多忽視了圖像的多標簽性,且這些算法沒有考慮圖像標簽間的關(guān)聯(lián)性,以致提取的特征不夠高效;诖,本文對基于卷積神經(jīng)網(wǎng)絡(luò)的圖像自動標注的理論和方法進行了深入的探究,針對現(xiàn)有方法存在的問題提出了改進算法和模型。本文的主要工作內(nèi)容如下:(1)提出基于Sigmoid損失函數(shù)的卷積神經(jīng)網(wǎng)絡(luò)圖像標注算法。針對圖像標注任務(wù)的多標簽性,將卷積神經(jīng)網(wǎng)絡(luò)常用的Softmax損失函數(shù)改為Sigmoid損失函數(shù),更好地適應(yīng)多標簽學(xué)習(xí),提出了一個適用于多標簽圖像的卷積神經(jīng)網(wǎng)絡(luò)模型;并使用256位編碼特征來表示圖像從而進行圖像標注,獲得了方便存儲和圖像快速比較的特征,最后通過實驗驗證所提出模型的有效性。(2)提出基于多標簽加權(quán)三元組損失函數(shù)的卷積神經(jīng)網(wǎng)絡(luò)圖像標注算法。...
【文章來源】:蘇州大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:89 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1?“語義鴻溝”示例??
leNet|?=輸入??j?第皁:棰十Sigmoid損失函數(shù)的CNN圖像標ill法?j??卜i?|?!??,一,aS?〇?V?:?;?£,?£,?4?.?.?SE??!?r^J^L卜丨了卜;??一^?;丨??lnCr"|-^:-^?j?!?’?T?—???CCA-KNN?;??|?丨!?I??I?I?I?I??*網(wǎng)t:坫于加權(quán).SSlfiiX函數(shù)的OWIS?Wil_?ii?I?|?第Ti申:S十SSE特征的CNNIH悚坫itB.L).?I??!?J?!?^??圖1-2本文的主要研究內(nèi)容??本文主要從兩個角度對基于卷積神經(jīng)網(wǎng)絡(luò)的圖像自動標注算法進行改進。一??是對卷積神經(jīng)網(wǎng)絡(luò)的損失函數(shù)進行優(yōu)化,二是對模型的網(wǎng)絡(luò)結(jié)構(gòu)進行改進。對于??激活函數(shù),本文先從圖像的多標簽性出發(fā),將卷積神經(jīng)M絡(luò)常用的Softmax函數(shù)改??為Sigmoid函數(shù),提取全面高效的多標簽圖像特征,以適用于多標簽圖像標注的任務(wù);??后又從標簽間的聯(lián)系和相似圖像間的差異性出發(fā),對損失函數(shù)進行創(chuàng)新,提出了基??于加權(quán)多標簽三元組損失函數(shù),該損失確數(shù)考慮丫標簽間的信息,同時增加了網(wǎng)絡(luò)??模型的內(nèi)聚性,改善了圖像的標注效果。對于網(wǎng)絡(luò)結(jié)構(gòu),本文在卷積神經(jīng)網(wǎng)絡(luò)中引??入SE模塊,學(xué)習(xí)到卷積層各通道信息不同的重要程度,提高卷積層輸出的表征能力,??同時從特征的空間像素點出發(fā),考慮各像素之間重要性,提出了SSE特征提取方法,??從而獲得了兼顧通道和空間信息的卷積層特征。??1.5本文內(nèi)容安排??本文主要探宄基f卷積神經(jīng)網(wǎng)絡(luò)的圖像標注算法,章節(jié)內(nèi)容及結(jié)構(gòu)安排如卜:??第一章為緒論,簡耍介紹/圖像D動標注的研究背景和意義,并對卷積祌經(jīng)網(wǎng)??7??
基于卷積神經(jīng)網(wǎng)絡(luò)的圖像標注算法研宄?第二章相關(guān)T:作??第二章相關(guān)工作??本章將從三個方面介紹本文的相關(guān)技術(shù)背景。首先,概述分析圖像自動標注算??法的基本框架;然后,介紹卷積神經(jīng)網(wǎng)絡(luò)的工作原理;最后,回顧幾種典型的圖像??自動標注算法。??2.1圖像自動標注的基本框架??圖像自動標注利用算法使得計算機能自動為圖像賦上與圖像語義內(nèi)容相關(guān)的關(guān)??鍵詞匯,如圖2-1所示。它是一種多標簽學(xué)習(xí)問題,它通過對多標簽圖像數(shù)據(jù)集的訓(xùn)??練,學(xué)習(xí)到圖像視覺特征和語義標簽的關(guān)系模型,構(gòu)建低層視覺特征和卨層語義的??映射關(guān)系,這種關(guān)系在一定程度上可以解決“語義鴻溝”問題。??courtyard?building?%?man?man??jd?building?columns?kitchen?woman??|?纛羞*?arches?丨lowers?Wa!,?waI1??9?columns?yard?■?^?women?caps??flowers?trees?■,、skirts?bag??trees?house?■?hats??tourists?tourists?tourists?person??癱?square?reed?creek?bridge??'?rec^?square?g?bridge?rails??^3.?house?camera?rails?trees??mountain?grass?vegetation?creek??圖2-1圖像標注示例??圖像自動標注的基本框架如圖2-2所示。主要步驟分為圖像預(yù)處理、圖像特征提??娶模型訓(xùn)練、算法優(yōu)化、標簽預(yù)測。??圖像預(yù)處理:在圖像標注中,
本文編號:3324796
【文章來源】:蘇州大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:89 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1?“語義鴻溝”示例??
leNet|?=輸入??j?第皁:棰十Sigmoid損失函數(shù)的CNN圖像標ill法?j??卜i?|?!??,一,aS?〇?V?:?;?£,?£,?4?.?.?SE??!?r^J^L卜丨了卜;??一^?;丨??lnCr"|-^:-^?j?!?’?T?—???CCA-KNN?;??|?丨!?I??I?I?I?I??*網(wǎng)t:坫于加權(quán).SSlfiiX函數(shù)的OWIS?Wil_?ii?I?|?第Ti申:S十SSE特征的CNNIH悚坫itB.L).?I??!?J?!?^??圖1-2本文的主要研究內(nèi)容??本文主要從兩個角度對基于卷積神經(jīng)網(wǎng)絡(luò)的圖像自動標注算法進行改進。一??是對卷積神經(jīng)網(wǎng)絡(luò)的損失函數(shù)進行優(yōu)化,二是對模型的網(wǎng)絡(luò)結(jié)構(gòu)進行改進。對于??激活函數(shù),本文先從圖像的多標簽性出發(fā),將卷積神經(jīng)M絡(luò)常用的Softmax函數(shù)改??為Sigmoid函數(shù),提取全面高效的多標簽圖像特征,以適用于多標簽圖像標注的任務(wù);??后又從標簽間的聯(lián)系和相似圖像間的差異性出發(fā),對損失函數(shù)進行創(chuàng)新,提出了基??于加權(quán)多標簽三元組損失函數(shù),該損失確數(shù)考慮丫標簽間的信息,同時增加了網(wǎng)絡(luò)??模型的內(nèi)聚性,改善了圖像的標注效果。對于網(wǎng)絡(luò)結(jié)構(gòu),本文在卷積神經(jīng)網(wǎng)絡(luò)中引??入SE模塊,學(xué)習(xí)到卷積層各通道信息不同的重要程度,提高卷積層輸出的表征能力,??同時從特征的空間像素點出發(fā),考慮各像素之間重要性,提出了SSE特征提取方法,??從而獲得了兼顧通道和空間信息的卷積層特征。??1.5本文內(nèi)容安排??本文主要探宄基f卷積神經(jīng)網(wǎng)絡(luò)的圖像標注算法,章節(jié)內(nèi)容及結(jié)構(gòu)安排如卜:??第一章為緒論,簡耍介紹/圖像D動標注的研究背景和意義,并對卷積祌經(jīng)網(wǎng)??7??
基于卷積神經(jīng)網(wǎng)絡(luò)的圖像標注算法研宄?第二章相關(guān)T:作??第二章相關(guān)工作??本章將從三個方面介紹本文的相關(guān)技術(shù)背景。首先,概述分析圖像自動標注算??法的基本框架;然后,介紹卷積神經(jīng)網(wǎng)絡(luò)的工作原理;最后,回顧幾種典型的圖像??自動標注算法。??2.1圖像自動標注的基本框架??圖像自動標注利用算法使得計算機能自動為圖像賦上與圖像語義內(nèi)容相關(guān)的關(guān)??鍵詞匯,如圖2-1所示。它是一種多標簽學(xué)習(xí)問題,它通過對多標簽圖像數(shù)據(jù)集的訓(xùn)??練,學(xué)習(xí)到圖像視覺特征和語義標簽的關(guān)系模型,構(gòu)建低層視覺特征和卨層語義的??映射關(guān)系,這種關(guān)系在一定程度上可以解決“語義鴻溝”問題。??courtyard?building?%?man?man??jd?building?columns?kitchen?woman??|?纛羞*?arches?丨lowers?Wa!,?waI1??9?columns?yard?■?^?women?caps??flowers?trees?■,、skirts?bag??trees?house?■?hats??tourists?tourists?tourists?person??癱?square?reed?creek?bridge??'?rec^?square?g?bridge?rails??^3.?house?camera?rails?trees??mountain?grass?vegetation?creek??圖2-1圖像標注示例??圖像自動標注的基本框架如圖2-2所示。主要步驟分為圖像預(yù)處理、圖像特征提??娶模型訓(xùn)練、算法優(yōu)化、標簽預(yù)測。??圖像預(yù)處理:在圖像標注中,
本文編號:3324796
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3324796.html
最近更新
教材專著