主題模型與眼動(dòng)分析在場景分類中的研究及應(yīng)用
發(fā)布時(shí)間:2017-11-11 00:01
本文關(guān)鍵詞:主題模型與眼動(dòng)分析在場景分類中的研究及應(yīng)用
更多相關(guān)文章: 場景分類 特征提取 多尺度 眼動(dòng) 顯著性
【摘要】:場景分類是場景理解中的一個(gè)基本問題,它主要用于自動(dòng)標(biāo)注圖像所屬的場景類別。為了實(shí)現(xiàn)場景分類,通常需要完成兩部分工作:圖像特征的提取和表示;選擇合適的算法和分類器。本文的研究工作主要集中在第一部分。使用單尺度的方法對圖像進(jìn)行局部特征提取時(shí),如果尺度過大,則會包含一些冗余信息;而如果尺度過小,則會丟失圖像鄰域之間固有的空間結(jié)構(gòu)信息。為此,本文提出一種基于多尺度的方法,即對圖像不同位置的子區(qū)域采用不同的尺度來進(jìn)行特征提取。此外,我們還提出使用分類別多次聚類的方法來優(yōu)化特征詞典的構(gòu)建。使用LDA主題模型來進(jìn)行的實(shí)驗(yàn)證明了本文提出的方法是有效的。在場景分類時(shí),通常都需要對圖像的全部區(qū)域進(jìn)行特征提取。但過多的數(shù)據(jù)會導(dǎo)致分類方法效率較低,也會帶來一些噪聲。我們知道,人的視覺注意力很容易被場景中的顯著區(qū)域所吸引,因此人的視覺注視區(qū)域與顯著性存在一定的相關(guān)性。而這種高級的認(rèn)知行為可以通過眼動(dòng)信息反映出來。因此本文又提出將眼動(dòng)信息引入圖像的特征提取階段,從而得到每幅圖像的顯著區(qū)域,并對其進(jìn)行分類。使用空間金字塔匹配模型和支持向量機(jī)來進(jìn)行的分類實(shí)驗(yàn)結(jié)果顯示,我們的模型在一些場景中取得了比較好的分類效果;而且整個(gè)模型在參數(shù)學(xué)習(xí)和測試這兩個(gè)部分的效率有了明顯提升。在模型部分引入眼動(dòng)信息并且取得一定提升的基礎(chǔ)上,我們嘗試從自頂向下的視角,利用眼動(dòng)分析來探討人類對場景的認(rèn)知機(jī)理,為此我們進(jìn)行了兩個(gè)眼動(dòng)實(shí)驗(yàn)。在實(shí)驗(yàn)數(shù)據(jù)的基礎(chǔ)上,我們從視覺注視區(qū)域的位置分布及圖像熵、視覺注視點(diǎn)的停留時(shí)間、眼動(dòng)路徑等方面分析了人眼的視覺注視機(jī)制。分析表明,眼動(dòng)的關(guān)注區(qū)域不僅具有極大的信息量,而且與場景類別特征存在很大的相關(guān)性,這就為進(jìn)一步建立符合人類視覺認(rèn)知機(jī)理的場景分類模型提供了論證依據(jù)。
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.41
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前8條
1 蘇煜;山世光;陳熙霖;高文;;基于全局和局部特征集成的人臉識別[J];軟件學(xué)報(bào);2010年08期
2 曹健;王武軍;韓飛;劉玉樹;;基于局部特征的目標(biāo)識別技術(shù)研究[J];計(jì)算機(jī)工程;2010年10期
3 王愛平;張功營;劉方;;EM算法研究與應(yīng)用[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年09期
4 王福興;田宏杰;申繼亮;;場景知覺及其研究范式[J];心理科學(xué)進(jìn)展;2009年02期
5 王強(qiáng);陳歡歡;王s,
本文編號:1168900
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1168900.html
最近更新
教材專著