基于深度學(xué)習(xí)的服裝圖像檢索算法研究
發(fā)布時(shí)間:2022-01-06 04:52
最近幾年,服裝領(lǐng)域電子商務(wù)蓬勃發(fā)展,互聯(lián)網(wǎng)上的服裝圖像數(shù)據(jù)量與日俱增。為了處理海量的服裝圖像數(shù)據(jù),有效的基于內(nèi)容的服裝圖像檢索變得異常重要。散列方法,即以二進(jìn)制碼表示圖像,并使用漢明距離來(lái)判斷相似性,因其在存儲(chǔ)和搜索速度方面的優(yōu)勢(shì)而被廣泛接受。受卷積神經(jīng)網(wǎng)絡(luò)(CNN)最新進(jìn)展的鼓舞,本文提出了一種有效的深度學(xué)習(xí)框架,快速生成用于服裝圖像檢索的二進(jìn)制哈希碼。本文提出了一種新的監(jiān)督深度哈希方法,用于學(xué)習(xí)緊湊哈希碼以執(zhí)行基于內(nèi)容的圖像檢索,該目標(biāo)哈希碼用于描述不同圖像內(nèi)容之間的關(guān)系。然后,目標(biāo)哈希碼被饋送到深度網(wǎng)絡(luò)進(jìn)行訓(xùn)練。針對(duì)大規(guī)模的服裝圖像數(shù)據(jù)庫(kù),提出了基于深度網(wǎng)絡(luò)的服裝檢索模型。經(jīng)過(guò)訓(xùn)練,我們的深度網(wǎng)絡(luò)可以為不同內(nèi)容的圖像生成具有較大漢明距離的哈希碼。在本文服裝圖像數(shù)據(jù)庫(kù)上進(jìn)行的實(shí)驗(yàn)表明,我們的方法優(yōu)于其他最新方法,包括無(wú)監(jiān)督,有監(jiān)督和深度哈希方法。本文主要完成了以下工作:首先是構(gòu)建了一套服裝數(shù)據(jù)集。該服裝數(shù)據(jù)集共有102000張服裝圖像,其中該數(shù)據(jù)集要包含服裝的類別信息,服裝邊界框位置信息和服裝掩膜信息,其中實(shí)驗(yàn)結(jié)果顯示位置關(guān)鍵點(diǎn)信息可以克服服裝光照,變形,有遮擋造成的影響,掩膜信息...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
劃分區(qū)域
第二章相關(guān)理論研究11圖2-1劃分區(qū)域圖2-2統(tǒng)計(jì)區(qū)域內(nèi)直方圖4)生成HOG特征圖像梯度強(qiáng)度的會(huì)受到圖像部分區(qū)域的光照的影響而變化,也會(huì)受到目標(biāo)區(qū)域的前景-背景對(duì)比度的影響而變化,所以梯度強(qiáng)度極不穩(wěn)定。為了解決這個(gè)不穩(wěn)定的問(wèn)題,有必要對(duì)梯度強(qiáng)度進(jìn)行歸一化操作。規(guī)范化進(jìn)一步壓縮了照明,陰影和邊緣。將每個(gè)單元?jiǎng)澐譃榇蟮模臻g連接的塊。以此方式,塊中所有單元的特征向量被串聯(lián)連接以獲得塊的HOG特征。假設(shè)輸入圖片為128×128,則該單元將具有16×16=256,并且該塊將具有(16-2+1)×(16-2+1)=225,并且每個(gè)塊具有36維矢量,總共225×36=8100維向量,該向量是與該圖片相對(duì)應(yīng)的HOG特征向量。然后,利用SVM將提取的特征向量作為人體的紋理特征輸入到其中,并且進(jìn)行分類和訓(xùn)練,最后利用訓(xùn)練好的模型,可以檢測(cè)出圖像中的人體位置區(qū)域。2.2.2Sift特征Sift特征是圖像的局部特征,具有旋轉(zhuǎn)不變性,尺度不變性和亮度不變性。它對(duì)于視角,光線反射和噪聲的變化也具有一定的穩(wěn)定性。SIFT算法的本質(zhì)是在不同比例空間上找到特征點(diǎn)并計(jì)算特征點(diǎn)的方向。這些特征點(diǎn)非常突出,不會(huì)受到諸
電子科技大學(xué)碩士學(xué)位論文14圖2-3高斯圖像金字塔和高斯差分圖像金字塔圖2-4不同高斯核處理后的圖像(2)特征點(diǎn)定位與過(guò)濾由于離散空間不是連續(xù)的,兩個(gè)離散點(diǎn)之間會(huì)有一定的距離,導(dǎo)致真正的極值點(diǎn)往往不在離散的點(diǎn)上,下圖2-5顯示了二維函數(shù)離散空間得到的極值點(diǎn)與連續(xù)空間極值點(diǎn)的差別。將已知的離散空間點(diǎn)進(jìn)行某種插值計(jì)算,然后得到的連續(xù)空間極值點(diǎn)的方法叫做子像素插值法。
【參考文獻(xiàn)】:
期刊論文
[1]一種基于Local Jet 結(jié)構(gòu)的全局圖像特征構(gòu)造方法(英文)[J]. 謝錦,蔡自興. 自動(dòng)化學(xué)報(bào). 2014(06)
[2]全局圖像特征分析與實(shí)時(shí)層次化消失點(diǎn)檢測(cè)[J]. 孫愿,盧鴻波,張志敏. 中國(guó)圖象圖形學(xué)報(bào). 2013(07)
[3]基于局部和全局特征融合的圖像檢索[J]. 汪華章,何小海,宰文姣. 光學(xué)精密工程. 2008(06)
本文編號(hào):3571771
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
劃分區(qū)域
第二章相關(guān)理論研究11圖2-1劃分區(qū)域圖2-2統(tǒng)計(jì)區(qū)域內(nèi)直方圖4)生成HOG特征圖像梯度強(qiáng)度的會(huì)受到圖像部分區(qū)域的光照的影響而變化,也會(huì)受到目標(biāo)區(qū)域的前景-背景對(duì)比度的影響而變化,所以梯度強(qiáng)度極不穩(wěn)定。為了解決這個(gè)不穩(wěn)定的問(wèn)題,有必要對(duì)梯度強(qiáng)度進(jìn)行歸一化操作。規(guī)范化進(jìn)一步壓縮了照明,陰影和邊緣。將每個(gè)單元?jiǎng)澐譃榇蟮模臻g連接的塊。以此方式,塊中所有單元的特征向量被串聯(lián)連接以獲得塊的HOG特征。假設(shè)輸入圖片為128×128,則該單元將具有16×16=256,并且該塊將具有(16-2+1)×(16-2+1)=225,并且每個(gè)塊具有36維矢量,總共225×36=8100維向量,該向量是與該圖片相對(duì)應(yīng)的HOG特征向量。然后,利用SVM將提取的特征向量作為人體的紋理特征輸入到其中,并且進(jìn)行分類和訓(xùn)練,最后利用訓(xùn)練好的模型,可以檢測(cè)出圖像中的人體位置區(qū)域。2.2.2Sift特征Sift特征是圖像的局部特征,具有旋轉(zhuǎn)不變性,尺度不變性和亮度不變性。它對(duì)于視角,光線反射和噪聲的變化也具有一定的穩(wěn)定性。SIFT算法的本質(zhì)是在不同比例空間上找到特征點(diǎn)并計(jì)算特征點(diǎn)的方向。這些特征點(diǎn)非常突出,不會(huì)受到諸
電子科技大學(xué)碩士學(xué)位論文14圖2-3高斯圖像金字塔和高斯差分圖像金字塔圖2-4不同高斯核處理后的圖像(2)特征點(diǎn)定位與過(guò)濾由于離散空間不是連續(xù)的,兩個(gè)離散點(diǎn)之間會(huì)有一定的距離,導(dǎo)致真正的極值點(diǎn)往往不在離散的點(diǎn)上,下圖2-5顯示了二維函數(shù)離散空間得到的極值點(diǎn)與連續(xù)空間極值點(diǎn)的差別。將已知的離散空間點(diǎn)進(jìn)行某種插值計(jì)算,然后得到的連續(xù)空間極值點(diǎn)的方法叫做子像素插值法。
【參考文獻(xiàn)】:
期刊論文
[1]一種基于Local Jet 結(jié)構(gòu)的全局圖像特征構(gòu)造方法(英文)[J]. 謝錦,蔡自興. 自動(dòng)化學(xué)報(bào). 2014(06)
[2]全局圖像特征分析與實(shí)時(shí)層次化消失點(diǎn)檢測(cè)[J]. 孫愿,盧鴻波,張志敏. 中國(guó)圖象圖形學(xué)報(bào). 2013(07)
[3]基于局部和全局特征融合的圖像檢索[J]. 汪華章,何小海,宰文姣. 光學(xué)精密工程. 2008(06)
本文編號(hào):3571771
本文鏈接:http://sikaile.net/projectlw/qgylw/3571771.html
最近更新
教材專著