基于結(jié)構(gòu)化主題模型的圖像分類方法研究
發(fā)布時(shí)間:2021-08-29 14:57
圖像分類是計(jì)算機(jī)視覺研究領(lǐng)域的重要問題之一,其準(zhǔn)確性直接影響著人們對(duì)圖像資源的有效利用。人工智能算法在分類速度和準(zhǔn)確性等方面都有效地提高了圖像分類的效果,但圖像的底層特征表達(dá)與上層語(yǔ)義之間存在的“語(yǔ)義鴻溝”,仍然是嚴(yán)重影響圖像分類準(zhǔn)確率的一個(gè)重要因素。主題模型的主題是視覺詞匯與上層語(yǔ)義之間的媒介,是克服“語(yǔ)義鴻溝”的有效方法之一。以圖像分類問題為研究背景,本文針對(duì)隱狄利克雷分配(latent Dirichlet allocation,LDA)模型忽略視覺詞匯之間空間位置關(guān)系的不足開展研究,從不同方面研究和探索具有空間信息的結(jié)構(gòu)化主題模型的構(gòu)建方法。結(jié)合圖像數(shù)據(jù)特點(diǎn),所提出的模型增強(qiáng)了對(duì)圖像的表達(dá)能力,進(jìn)而提高了圖像分類的準(zhǔn)確率;同時(shí)結(jié)合當(dāng)前流行的深度學(xué)習(xí)方法,在主題模型中引入了卷積神經(jīng)網(wǎng)絡(luò)的特征表示,增強(qiáng)了主題模型的表達(dá)能力。本文研究的主要內(nèi)容和貢獻(xiàn)包括以下幾方面:(1)提出融合圖像內(nèi)相鄰主題結(jié)構(gòu)關(guān)系的主題模型。LDA模型忽略了視覺詞匯的空間位置關(guān)系,影響了其對(duì)圖像表達(dá)的準(zhǔn)確性。作為生成式模型,主題可以理解為視覺對(duì)象的組成部件,因此,相鄰視覺詞匯由同一主題產(chǎn)生的概率較高。據(jù)此,本文提出...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:125 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
詞袋模型的處理過程[18]
NN)[43]算法基于區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(regions CNN, R-CNN)[經(jīng)網(wǎng)絡(luò)(fast regions CNN, Fast-RCNN)[45],將特征提取、區(qū)行整合,有效地提高了模型的速度和準(zhǔn)確性。Wang 等人[46]將神經(jīng)網(wǎng)絡(luò)(recurrent neural networks, RNN)相結(jié)合,在圖像標(biāo)義標(biāo)簽依賴關(guān)系和圖像標(biāo)簽相關(guān)性,有效地提高多標(biāo)簽圖像[47]
PLSI 模型生成文檔的過程擇一篇文檔 dm;得到一個(gè)主題 zk;生成一個(gè)詞 wn。篇文檔由多個(gè)主題以一定概率混合組Fig. 1-3 Graphical model of PLSI
【參考文獻(xiàn)】:
期刊論文
[1]共詞網(wǎng)絡(luò)LDA模型的中文短文本主題分析[J]. 蔡永明,長(zhǎng)青. 情報(bào)學(xué)報(bào). 2018(03)
[2]ZenLDA: Large-Scale Topic Model Training on Distributed Data-Parallel Platform[J]. Bo Zhao,Hucheng Zhou,Guoqiang Li,Yihua Huang. Big Data Mining and Analytics. 2018(01)
[3]圖像物體分類與檢測(cè)算法綜述[J]. 黃凱奇,任偉強(qiáng),譚鐵牛. 計(jì)算機(jī)學(xué)報(bào). 2014(06)
[4]局部特征與多示例學(xué)習(xí)結(jié)合的超聲圖像分類方法[J]. 丁建睿,黃劍華,劉家鋒,張英濤. 自動(dòng)化學(xué)報(bào). 2013(06)
[5]一種新的目標(biāo)檢測(cè)方法:Latent Dirichlet classification[J]. 丁軼,郭喬進(jìn),李寧. 南京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(02)
[6]一種自適應(yīng)的Web圖像語(yǔ)義自動(dòng)標(biāo)注方法[J]. 許紅濤,周向東,向宇,施伯樂. 軟件學(xué)報(bào). 2010(09)
[7]建模連續(xù)視覺特征的圖像語(yǔ)義標(biāo)注方法[J]. 李志欣,施智平,劉曦,史忠植. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2010(08)
[8]一種基于類主題空間的圖像場(chǎng)景分類方法[J]. 唐穎軍,須德,解文杰,薄一航. 中國(guó)圖象圖形學(xué)報(bào). 2010(07)
[9]圖像-文本相關(guān)性挖掘的Web圖像聚類方法[J]. 吳飛,韓亞洪,莊越挺,邵健. 軟件學(xué)報(bào). 2010(07)
本文編號(hào):3370862
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:125 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
詞袋模型的處理過程[18]
NN)[43]算法基于區(qū)域卷積神經(jīng)網(wǎng)絡(luò)(regions CNN, R-CNN)[經(jīng)網(wǎng)絡(luò)(fast regions CNN, Fast-RCNN)[45],將特征提取、區(qū)行整合,有效地提高了模型的速度和準(zhǔn)確性。Wang 等人[46]將神經(jīng)網(wǎng)絡(luò)(recurrent neural networks, RNN)相結(jié)合,在圖像標(biāo)義標(biāo)簽依賴關(guān)系和圖像標(biāo)簽相關(guān)性,有效地提高多標(biāo)簽圖像[47]
PLSI 模型生成文檔的過程擇一篇文檔 dm;得到一個(gè)主題 zk;生成一個(gè)詞 wn。篇文檔由多個(gè)主題以一定概率混合組Fig. 1-3 Graphical model of PLSI
【參考文獻(xiàn)】:
期刊論文
[1]共詞網(wǎng)絡(luò)LDA模型的中文短文本主題分析[J]. 蔡永明,長(zhǎng)青. 情報(bào)學(xué)報(bào). 2018(03)
[2]ZenLDA: Large-Scale Topic Model Training on Distributed Data-Parallel Platform[J]. Bo Zhao,Hucheng Zhou,Guoqiang Li,Yihua Huang. Big Data Mining and Analytics. 2018(01)
[3]圖像物體分類與檢測(cè)算法綜述[J]. 黃凱奇,任偉強(qiáng),譚鐵牛. 計(jì)算機(jī)學(xué)報(bào). 2014(06)
[4]局部特征與多示例學(xué)習(xí)結(jié)合的超聲圖像分類方法[J]. 丁建睿,黃劍華,劉家鋒,張英濤. 自動(dòng)化學(xué)報(bào). 2013(06)
[5]一種新的目標(biāo)檢測(cè)方法:Latent Dirichlet classification[J]. 丁軼,郭喬進(jìn),李寧. 南京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(02)
[6]一種自適應(yīng)的Web圖像語(yǔ)義自動(dòng)標(biāo)注方法[J]. 許紅濤,周向東,向宇,施伯樂. 軟件學(xué)報(bào). 2010(09)
[7]建模連續(xù)視覺特征的圖像語(yǔ)義標(biāo)注方法[J]. 李志欣,施智平,劉曦,史忠植. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2010(08)
[8]一種基于類主題空間的圖像場(chǎng)景分類方法[J]. 唐穎軍,須德,解文杰,薄一航. 中國(guó)圖象圖形學(xué)報(bào). 2010(07)
[9]圖像-文本相關(guān)性挖掘的Web圖像聚類方法[J]. 吳飛,韓亞洪,莊越挺,邵健. 軟件學(xué)報(bào). 2010(07)
本文編號(hào):3370862
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3370862.html
最近更新
教材專著