基于哈希學習的跨模態(tài)檢索技術研究
發(fā)布時間:2022-01-20 06:53
人工智能技術的發(fā)展已經越來越成熟,許多基于人工智能技術的高科技公司如雨后春筍般涌現(xiàn),甚至有不少企業(yè)已經生產出了能夠改變我們日常生活的人工智能產品。而人工智能技術可以取得如此令人印象深刻的成果,卻并非一蹴而就。自1956年人工智能技術誕生至今,已經經歷了多次的爆發(fā)期與寒冬期,而這次人工智能技術的爆發(fā)更加來勢洶洶,因為其與之前幾次的爆發(fā)期相比,具有一個鮮明的特點——以大數(shù)據(jù)為基礎。大數(shù)據(jù)不僅僅是因其數(shù)據(jù)量大,更重要的是其數(shù)據(jù)種類具有多樣性,且數(shù)據(jù)的價值密度較低。我們每天都會產生和接收各種信息,而這些信息都會被記錄下來,然后通過各種人工智能技術來分析我們的日常行為、生活習性,以便為我們的生活提供各種便利性的服務。在海量的多媒體數(shù)據(jù)之中,有些數(shù)據(jù)并不是相互獨立的,它們很可能是對同一事物的不同表現(xiàn)方式,在語義上具有一定的相似性。如何從這些不同類型的數(shù)據(jù)中檢索到需要的數(shù)據(jù)逐漸已經成為人們的迫切需求,也得到了學術界的廣泛關注,這就是跨模態(tài)檢索。跨模態(tài)檢索的根本目的是尋找不同模態(tài)間具有相似性的樣本,是以一種模態(tài)的數(shù)據(jù)作為輸入,在數(shù)據(jù)庫中檢索出在語義上具有相似性的另一種模態(tài)的數(shù)據(jù)的方法。而哈希方法因為其...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
單模態(tài)檢索示意圖
哈爾濱工業(yè)大學工學碩士學位論文除了文本檢索外,最具用的就是基于圖像的單模態(tài)檢索,即圖像檢索。早在 20世紀 70 年代末期,就已經有學者開始從事圖像檢索的相關研究工作,經過多年的技術發(fā)展,目前的圖像檢索技術主要可以分為兩種[57]:(1)基于文本的圖像檢索[25]方法。該方法首先應用于圖像檢索研究,其主要思想是將文本檢索中取得一定成果的技術移植到圖像檢索中。首先由人工的方式對大量的圖片進行類別標注,形成一個圖像數(shù)據(jù)庫,而這些圖像數(shù)據(jù)庫是以人工標注的類別作為索引的。檢索時通過輸入的文本與索引進行對比,可以迅速找到相同類別的圖像。該方法實質是將圖片通過人工標注的方式轉換為類別標簽,再通過類別標簽進行文本查詢,簡單快捷。但是,該方法顯然存在先天的不足。因為該方法的本質是一個勞動力密集形工作,因為每個勞動力每天的工作量是有上限的,隨著圖片數(shù)量的不斷增長,只能通過增加勞動力的方式來完成工作。而且,圖片類別標注的好壞會受到標注者的主觀意愿的影響,不存在一個可以量化的標準,如圖 1-2所示,兩張圖片都可能被標注為“高樓”、“天空”,但其側重點顯然不同,注定了無法對每張圖片都進行準確的標注[4],會對最后的搜索結果產生巨大的影響。
哈爾濱工業(yè)大學工學碩士學位論文1.2.2 跨模態(tài)檢索跨模態(tài)檢索的適用范圍比單模態(tài)檢索要廣,其以任一種模態(tài)的數(shù)據(jù)作為被查詢的示例,從海量的多媒體數(shù)據(jù)庫中查詢與之具有語義相關性的其他模態(tài)的數(shù)據(jù),其示意圖如圖 1-3 所示?缒B(tài)檢索本質是跨越多種模態(tài)信息間描述方式上的鴻溝,通過子空間學習(Subspace Learning),將它們映射到同一維度空間上進行度量,以此把語義表達上具有相似性的不同模態(tài)間的數(shù)據(jù)聯(lián)系起來,達到可以只用一種模態(tài)的數(shù)據(jù)就檢索出其他模態(tài)數(shù)據(jù)的目的。
【參考文獻】:
期刊論文
[1]基于改進的局部敏感哈希算法實現(xiàn)圖像型垃圾郵件過濾[J]. 曹玉東,劉艷洋,賈旭,王冬霞. 計算機應用研究. 2016(06)
[2]大數(shù)據(jù)哈希學習:現(xiàn)狀與趨勢[J]. 李武軍,周志華. 科學通報. 2015(Z1)
[3]綜合紋理統(tǒng)計模型與全局主顏色的圖像檢索方法[J]. 陳慧婷,覃團發(fā),唐振華,常侃. 北京郵電大學學報. 2011(S1)
博士論文
[1]基于圖像哈希的大規(guī)模圖像檢索方法研究[D]. 付海燕.大連理工大學 2014
碩士論文
[1]基于P-穩(wěn)態(tài)分布和空間球面網格的位置敏感哈希算法[D]. 陳翔.哈爾濱工業(yè)大學 2015
本文編號:3598370
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
單模態(tài)檢索示意圖
哈爾濱工業(yè)大學工學碩士學位論文除了文本檢索外,最具用的就是基于圖像的單模態(tài)檢索,即圖像檢索。早在 20世紀 70 年代末期,就已經有學者開始從事圖像檢索的相關研究工作,經過多年的技術發(fā)展,目前的圖像檢索技術主要可以分為兩種[57]:(1)基于文本的圖像檢索[25]方法。該方法首先應用于圖像檢索研究,其主要思想是將文本檢索中取得一定成果的技術移植到圖像檢索中。首先由人工的方式對大量的圖片進行類別標注,形成一個圖像數(shù)據(jù)庫,而這些圖像數(shù)據(jù)庫是以人工標注的類別作為索引的。檢索時通過輸入的文本與索引進行對比,可以迅速找到相同類別的圖像。該方法實質是將圖片通過人工標注的方式轉換為類別標簽,再通過類別標簽進行文本查詢,簡單快捷。但是,該方法顯然存在先天的不足。因為該方法的本質是一個勞動力密集形工作,因為每個勞動力每天的工作量是有上限的,隨著圖片數(shù)量的不斷增長,只能通過增加勞動力的方式來完成工作。而且,圖片類別標注的好壞會受到標注者的主觀意愿的影響,不存在一個可以量化的標準,如圖 1-2所示,兩張圖片都可能被標注為“高樓”、“天空”,但其側重點顯然不同,注定了無法對每張圖片都進行準確的標注[4],會對最后的搜索結果產生巨大的影響。
哈爾濱工業(yè)大學工學碩士學位論文1.2.2 跨模態(tài)檢索跨模態(tài)檢索的適用范圍比單模態(tài)檢索要廣,其以任一種模態(tài)的數(shù)據(jù)作為被查詢的示例,從海量的多媒體數(shù)據(jù)庫中查詢與之具有語義相關性的其他模態(tài)的數(shù)據(jù),其示意圖如圖 1-3 所示?缒B(tài)檢索本質是跨越多種模態(tài)信息間描述方式上的鴻溝,通過子空間學習(Subspace Learning),將它們映射到同一維度空間上進行度量,以此把語義表達上具有相似性的不同模態(tài)間的數(shù)據(jù)聯(lián)系起來,達到可以只用一種模態(tài)的數(shù)據(jù)就檢索出其他模態(tài)數(shù)據(jù)的目的。
【參考文獻】:
期刊論文
[1]基于改進的局部敏感哈希算法實現(xiàn)圖像型垃圾郵件過濾[J]. 曹玉東,劉艷洋,賈旭,王冬霞. 計算機應用研究. 2016(06)
[2]大數(shù)據(jù)哈希學習:現(xiàn)狀與趨勢[J]. 李武軍,周志華. 科學通報. 2015(Z1)
[3]綜合紋理統(tǒng)計模型與全局主顏色的圖像檢索方法[J]. 陳慧婷,覃團發(fā),唐振華,常侃. 北京郵電大學學報. 2011(S1)
博士論文
[1]基于圖像哈希的大規(guī)模圖像檢索方法研究[D]. 付海燕.大連理工大學 2014
碩士論文
[1]基于P-穩(wěn)態(tài)分布和空間球面網格的位置敏感哈希算法[D]. 陳翔.哈爾濱工業(yè)大學 2015
本文編號:3598370
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3598370.html
最近更新
教材專著