圖像檢索中的標(biāo)注與排序方法研究
本文關(guān)鍵詞: 圖像檢索 圖像分類 多示例學(xué)習(xí) 圖像排序 隨機(jī)游走 集成學(xué)習(xí) 出處:《山東大學(xué)》2012年碩士論文 論文類型:學(xué)位論文
【摘要】:由于文本檢索的巨大成功,目前主流的圖像搜索引擎如Google、百度等對(duì)圖像檢索采用的還是基于文本關(guān)鍵詞的方式,即根據(jù)圖像周圍的文本來(lái)判斷一幅圖像與查詢的相關(guān)性。由于文本描述與圖像內(nèi)容之間可能存在的不匹配現(xiàn)象,圖像檢索結(jié)果往往不盡人意。改善圖像搜索結(jié)果的方式一般有兩種:一是檢索前對(duì)圖像進(jìn)行語(yǔ)義標(biāo)注,改善圖像關(guān)鍵字的準(zhǔn)確度,利用圖像的語(yǔ)義進(jìn)行檢索;二是圖像檢索結(jié)果重新排序,就是對(duì)搜索結(jié)果利用圖像和文本本身的特征,對(duì)搜索結(jié)果進(jìn)行重新排序,試圖將相關(guān)圖像排在前面,以提高檢索結(jié)果滿意度。 現(xiàn)實(shí)中圖像內(nèi)容往往具有多義性,傳統(tǒng)的圖像標(biāo)注算法會(huì)導(dǎo)致準(zhǔn)確率的下降。多示例學(xué)習(xí)是近年來(lái)才出現(xiàn)的一種新的學(xué)習(xí)框架,并以其對(duì)多義性對(duì)象的出色表示能力而被成功地運(yùn)用在圖像分類標(biāo)注任務(wù)中。多示例學(xué)習(xí)中多示例包的生成方式是影響多示例學(xué)習(xí)效果的一個(gè)重要因素。本文將重點(diǎn)分析多示例圖像分類標(biāo)注,提出一個(gè)全新的圖像多示例包生成方式。同時(shí),為了提高分類的泛化能力,本文對(duì)集成學(xué)習(xí)也進(jìn)行了相關(guān)研究。另一方面,圖像本身又是一個(gè)多模態(tài)的對(duì)象,比如圖像內(nèi)容,圖像相關(guān)文本,都是圖像的不同模態(tài)。現(xiàn)在圖像排序的研究對(duì)圖像多模態(tài)特征之間的相互作用利用并不充分,本文通過(guò)分析現(xiàn)有的圖像排序算法,全面的考慮圖像多模態(tài)之間的相互關(guān)系,將提出一個(gè)將圖像多模態(tài)統(tǒng)一起來(lái)進(jìn)行排序的方法。 本文主要做了三方面的研究:1)綜合分析現(xiàn)有的基于多示例學(xué)習(xí)的圖像標(biāo)注算法,提出一個(gè)新的基于多示例學(xué)習(xí)的標(biāo)注方法。方法中圖像被建模成一個(gè)高斯混合模型,每個(gè)高斯模型作為多示例包中的一個(gè)示例。這樣每個(gè)示例就是一個(gè)概率的表示,而非傳統(tǒng)的向量形式,能更多的表示圖像信息、。2)系統(tǒng)分析集成學(xué)習(xí)的現(xiàn)有研究成果,提出了一個(gè)基于多重集的新的選擇性集成方法。方法是一個(gè)離散空間的優(yōu)化問(wèn)題,因此速度可以保證,同時(shí),算法中分類器有各自的置信度。3)分析現(xiàn)有的圖像排序算法的不足,提出一個(gè)新的圖像排序算法,算法將更加全面的利用圖像的多模態(tài)特征。算法將圖像搜索結(jié)果集抽象成一個(gè)多重圖。圖的每個(gè)頂點(diǎn)是一副多模態(tài)圖像,圖像之間的多重邊表示圖像模態(tài)之間的相似度。最后利用隨機(jī)游走模型來(lái)進(jìn)行圖像排序。為了驗(yàn)證所提算法的有效性,本文在Corel數(shù)據(jù)集、LCI數(shù)據(jù)集合Web Queries數(shù)據(jù)集上分別對(duì)三個(gè)算法進(jìn)行了驗(yàn)證。實(shí)驗(yàn)結(jié)果證明,本文所提出的算法有效的改善了分類精度和排序效果。
[Abstract]:Because of the great success of text retrieval, the current mainstream image search engines such as Google, Baidu and so on still adopt the method based on text keywords. That is, judging the correlation between an image and the query based on the text around the image. Because of the possible mismatch between the text description and the image content, Image retrieval results are often unsatisfactory. There are generally two ways to improve image search results: one is to annotate the image before retrieval, improve the accuracy of image keywords, and use the image semantics to retrieve; The second is the reordering of image retrieval results, which is to reorder the search results by using the features of the image and the text itself, and try to rank the related images in the front, in order to improve the satisfaction of the retrieval results. In reality, image content is often ambiguous, and traditional image tagging algorithm will lead to the decline of accuracy. Multi-example learning is a new learning framework that has emerged in recent years. It has been successfully used in image classification and tagging tasks because of its excellent representation ability to polysemous objects. The generation of multi-sample packets in multi-example learning is an important factor affecting the effectiveness of multi-sample learning. Focus on the analysis of multi-example image classification tagging, In order to improve the generalization ability of classification, integration learning is also studied in this paper. On the other hand, the image itself is a multi-modal object, such as image content. Image related texts are all different modes of image. Now the research of image sorting is not enough to utilize the interaction between image multi-modal features. This paper analyzes the existing image sorting algorithm. Considering the interrelation of image multimodal, a method of image multi-modal sorting is proposed. This paper mainly focuses on three aspects: (1) Comprehensive analysis of the existing image tagging algorithm based on multi-example learning, and a new annotation method based on multi-example learning, in which the image is modeled as a Gao Si mixed model. Each Gao Si model is used as an example in multiple sample packages. Thus, each example is a representation of probability, rather than a traditional vector form, which can represent more of the existing research results of system analysis integration learning. A new selective ensemble method based on multiple sets is proposed. The method is an optimization problem in discrete space, so the speed can be guaranteed. At the same time, the classifier in the algorithm has its own confidence degree. 3) the shortcomings of the existing image sorting algorithms are analyzed. A new image sorting algorithm is proposed, which makes full use of the multimodal features of the image. The algorithm abstracts the image search result set into a multiplex graph. Each vertex of the graph is a multimodal image. The multiple edges between images represent the similarity between the image modes. Finally, the random walk model is used to sort the images. In order to verify the effectiveness of the proposed algorithm, In this paper, three algorithms are validated on the Web Queries dataset of Corel data set. The experimental results show that the proposed algorithm improves the classification accuracy and sorting effect effectively.
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP391.41
【共引文獻(xiàn)】
相關(guān)期刊論文 前7條
1 潘強(qiáng);;結(jié)合包光滑性的半監(jiān)督多示例核學(xué)習(xí)方法[J];自動(dòng)化與信息工程;2013年05期
2 陳綿書(shū);楊樹(shù)媛;趙志杰;付平;孫元;李曉妮;孫言;齊小隱;;多點(diǎn)多樣性密度算法及其在圖像檢索中的應(yīng)用[J];吉林大學(xué)學(xué)報(bào)(工學(xué)版);2011年05期
3 張良;蔡躍明;;基于多示例學(xué)習(xí)的圖像檢索算法研究[J];軍事通信技術(shù);2009年02期
4 潘強(qiáng);張鋼;王春茹;;結(jié)合示例空間概念權(quán)重的多示例核學(xué)習(xí)方法[J];科學(xué)技術(shù)與工程;2012年30期
5 丁建睿;黃劍華;劉家鋒;張英濤;;局部特征與多示例學(xué)習(xí)結(jié)合的超聲圖像分類方法[J];自動(dòng)化學(xué)報(bào);2013年06期
6 王紅軍;李志蜀;成樝;周鵬;周維;;基于隱含變量的聚類集成模型[J];軟件學(xué)報(bào);2009年04期
7 王剛;許信順;;一種新的基于多示例學(xué)習(xí)的場(chǎng)景分類方法[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2010年07期
相關(guān)博士學(xué)位論文 前6條
1 傅強(qiáng);選擇性神經(jīng)網(wǎng)絡(luò)集成算法研究[D];浙江大學(xué);2007年
2 黃鵬;基于廣義半監(jiān)督學(xué)習(xí)方法的軟件質(zhì)量預(yù)測(cè)研究[D];上海交通大學(xué);2010年
3 段震;基于構(gòu)造性學(xué)習(xí)的覆蓋算法的發(fā)展及應(yīng)用[D];安徽大學(xué);2010年
4 宋相法;基于稀疏表示和集成學(xué)習(xí)的若干分類問(wèn)題研究[D];西安電子科技大學(xué);2013年
5 丁建睿;基于多示例學(xué)習(xí)的淺表器官超聲圖像分類方法研究[D];哈爾濱工業(yè)大學(xué);2012年
6 陳濤;多示例學(xué)習(xí)算法及其應(yīng)用研究[D];華南理工大學(xué);2013年
相關(guān)碩士學(xué)位論文 前3條
1 楊樹(shù)媛;多點(diǎn)多樣性密度算法及其在圖像檢索中的應(yīng)用[D];吉林大學(xué);2011年
2 胡聰;基于多示例學(xué)習(xí)的超聲乳腺腫瘤良惡性分類[D];哈爾濱工業(yè)大學(xué);2011年
3 席曉聰;圖像分類方法研究[D];山東大學(xué);2013年
,本文編號(hào):1550585
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1550585.html