基于語(yǔ)義的圖像檢索技術(shù)研究
發(fā)布時(shí)間:2020-06-20 17:28
【摘要】: 隨著多媒體技術(shù)的發(fā)展和互聯(lián)網(wǎng)的不斷普及,數(shù)字圖像已得到了越來(lái)越廣泛的應(yīng)用。20世紀(jì)90年代以來(lái),為了有效地組織和檢索海量圖像數(shù)據(jù),滿足人們?nèi)找嬖鲩L(zhǎng)的圖像檢索需求,出現(xiàn)了基于內(nèi)容的圖像檢索技術(shù),并逐漸成為了圖像檢索技術(shù)發(fā)展的主流方向。 現(xiàn)有基于內(nèi)容的圖像檢索技術(shù)在描述圖像內(nèi)容時(shí)大多直接采用了顏色、紋理、形狀等低層圖像特征,這些傳統(tǒng)的特征描述方式一般直接以統(tǒng)計(jì)數(shù)據(jù)的形式出現(xiàn)。而事實(shí)上,這些統(tǒng)計(jì)數(shù)據(jù)與人對(duì)圖像內(nèi)容的理解存在很大的差異。人對(duì)圖像內(nèi)容的理解并不建立在統(tǒng)計(jì)的基礎(chǔ)之上,并且圖像內(nèi)容具有“模糊”特性,無(wú)法簡(jiǎn)單的用特征向量進(jìn)行表示。這就造成了現(xiàn)有系統(tǒng)中必然會(huì)存在圖像表示與人的理解偏差的問(wèn)題,即語(yǔ)義鴻溝問(wèn)題。很多情況下,僅僅使用圖像的低層特征作為檢索依據(jù),其結(jié)果不盡人意。 因此,如何描述圖像,使其盡可能的符合人對(duì)圖像的理解,成為提高檢索精確度的關(guān)鍵。從人對(duì)事物認(rèn)知的角度看,人對(duì)圖像內(nèi)容的理解和描述主要在語(yǔ)義層次上進(jìn)行。如何縮小“語(yǔ)義鴻溝”,如何準(zhǔn)確表達(dá)圖像的內(nèi)容語(yǔ)義和用戶的檢索意圖,成為了圖像檢索技術(shù)研究的重點(diǎn)和關(guān)鍵。 本文在圖像特征索引的基礎(chǔ)上,引入了模糊語(yǔ)義分類方法和相關(guān)反饋方法,著眼于圖像特征與語(yǔ)義概念間的映射,初步探索了特定場(chǎng)景下低層特征與高層語(yǔ)義間的映射方法,主要的工作有: 1.運(yùn)用物理特征提取算法,提取圖像顏色、紋理和形狀特征,用于后續(xù)的語(yǔ)義映射。圖像的物理特征是計(jì)算機(jī)理解圖像內(nèi)容的基礎(chǔ),良好的特征提取算法,能夠提高后續(xù)語(yǔ)義映射的準(zhǔn)確程度,進(jìn)而最終改善系統(tǒng)檢索的效果。 2.運(yùn)用模糊分類方法,建立低層特征與高層語(yǔ)義間的映射。 要進(jìn)行基于語(yǔ)義的圖像檢索,首先需要提取出圖像語(yǔ)義概念。在現(xiàn)在的計(jì)算機(jī)及模式識(shí)別技術(shù)條件下,對(duì)圖像語(yǔ)義概念的提取,應(yīng)該建立在對(duì)圖像目標(biāo)識(shí)別的基礎(chǔ)上。通過(guò)模式識(shí)別的方法,識(shí)別出圖像中的目標(biāo)并與語(yǔ)義概念進(jìn)行連接,這樣,就可以使低層物理特征映射到高層語(yǔ)義特征,實(shí)現(xiàn)對(duì)高層語(yǔ)義的檢索。本文引入了模糊分類的方法,通過(guò)選擇最佳訓(xùn)練樣本,實(shí)現(xiàn)物理特征向語(yǔ)義的映射。同時(shí),模糊集合的使用,使使同一幅圖像可以同時(shí)隸屬于不同的語(yǔ)義類別,這也更加符合人對(duì)事物的認(rèn)知方式。 3.運(yùn)用基于語(yǔ)義分類的相關(guān)反饋方法,引入用戶對(duì)語(yǔ)義概念的理解。 用戶可以通過(guò)判斷系統(tǒng)檢索結(jié)果與自己檢索預(yù)期之間的差異,分別選擇能夠準(zhǔn)確表達(dá)檢索意圖和不能表達(dá)檢索意圖的圖像,進(jìn)行相關(guān)反饋,對(duì)圖像對(duì)應(yīng)語(yǔ)義進(jìn)行修正,更好地表達(dá)用戶對(duì)概念的理解,減小樣本選擇者的主觀性。同時(shí)通過(guò)用戶的反饋,可以降低物理特征相似但語(yǔ)義無(wú)關(guān)圖像對(duì)語(yǔ)義概念的隸屬度,使檢索結(jié)果更加準(zhǔn)確。
【學(xué)位授予單位】:四川大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2007
【分類號(hào)】:G354
【圖文】:
N(3為上式中i代表圖像的特征取值,L是特征的可取值的個(gè)數(shù),n‘是圖像中具有特征值為i的象素個(gè)數(shù),N是圖像象素的總數(shù)。如圖3一3。圖3一3頗色統(tǒng)計(jì)直方圖示例對(duì)于彩色圖像,可以對(duì)其3個(gè)分量分別做直方圖,可以使用不同的顏色分量進(jìn)行匹配。如圖3一4,其中(a)為原圖像,(b)為圖像紅色分量的直方圖,(c)為圖像綠色分量的直方圖,(d)為圖像藍(lán)色分量的直方圖。
四川大學(xué)碩士學(xué)位論文圖3一4各顏色分t統(tǒng)計(jì)直方圖當(dāng)圖像中的顏色特征不能取遍所有可能的值時(shí),統(tǒng)計(jì)直方圖會(huì)出現(xiàn)零值。這些零值會(huì)給直方圖的相似度度量產(chǎn)生很大的影響,從而使計(jì)算出來(lái)的匹配值不能正確的反應(yīng)兩圖之間的顏色差別。在某種程度上而言,我們可以通過(guò)增加圖像特征間取值的間隔,減少特征值數(shù)量的方式來(lái)克服這個(gè)問(wèn)題。但這卻出現(xiàn)了一個(gè)問(wèn)題,例如在飽和度和亮度相同的情況下,色調(diào)的微小變化無(wú)法被人所察覺(jué)。那么,在量化特征的時(shí)候,相距很近的,人眼并不能區(qū)分的兩個(gè)色調(diào)值,可能被分到一個(gè)量化級(jí)別上,也可能被量化到相鄰的兩個(gè)級(jí)別上。也就是說(shuō),兩個(gè)相似的特征值
本文編號(hào):2722733
【學(xué)位授予單位】:四川大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2007
【分類號(hào)】:G354
【圖文】:
N(3為上式中i代表圖像的特征取值,L是特征的可取值的個(gè)數(shù),n‘是圖像中具有特征值為i的象素個(gè)數(shù),N是圖像象素的總數(shù)。如圖3一3。圖3一3頗色統(tǒng)計(jì)直方圖示例對(duì)于彩色圖像,可以對(duì)其3個(gè)分量分別做直方圖,可以使用不同的顏色分量進(jìn)行匹配。如圖3一4,其中(a)為原圖像,(b)為圖像紅色分量的直方圖,(c)為圖像綠色分量的直方圖,(d)為圖像藍(lán)色分量的直方圖。
四川大學(xué)碩士學(xué)位論文圖3一4各顏色分t統(tǒng)計(jì)直方圖當(dāng)圖像中的顏色特征不能取遍所有可能的值時(shí),統(tǒng)計(jì)直方圖會(huì)出現(xiàn)零值。這些零值會(huì)給直方圖的相似度度量產(chǎn)生很大的影響,從而使計(jì)算出來(lái)的匹配值不能正確的反應(yīng)兩圖之間的顏色差別。在某種程度上而言,我們可以通過(guò)增加圖像特征間取值的間隔,減少特征值數(shù)量的方式來(lái)克服這個(gè)問(wèn)題。但這卻出現(xiàn)了一個(gè)問(wèn)題,例如在飽和度和亮度相同的情況下,色調(diào)的微小變化無(wú)法被人所察覺(jué)。那么,在量化特征的時(shí)候,相距很近的,人眼并不能區(qū)分的兩個(gè)色調(diào)值,可能被分到一個(gè)量化級(jí)別上,也可能被量化到相鄰的兩個(gè)級(jí)別上。也就是說(shuō),兩個(gè)相似的特征值
【引證文獻(xiàn)】
相關(guān)期刊論文 前1條
1 孫亮;任小康;;基于本體的圖像語(yǔ)義檢索模型[J];重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版);2009年01期
相關(guān)碩士學(xué)位論文 前3條
1 袁本剛;基于語(yǔ)義的圖像檢索相關(guān)問(wèn)題研究[D];西北大學(xué);2009年
2 孫亮;基于本體的圖像語(yǔ)義檢索技術(shù)研究[D];西北師范大學(xué);2009年
3 賀雙雙;基于語(yǔ)義模型的外觀專利圖像檢索技術(shù)研究[D];廣東工業(yè)大學(xué);2013年
本文編號(hào):2722733
本文鏈接:http://sikaile.net/tushudanganlunwen/2722733.html
最近更新
教材專著