偏標記學習算法及其在圖像分類中的應用研究
發(fā)布時間:2020-11-20 04:43
傳統(tǒng)的監(jiān)督學習需要明確的監(jiān)督信息,而為示例標注明確的監(jiān)督信息需要耗費大量的人力和物力,甚至有的標注需要專門的人才才能完成。弱監(jiān)督學習不僅不需要強監(jiān)督信息,并且弱監(jiān)督學習框架更加符合現(xiàn)實生活中的場景,因此弱監(jiān)督學習框架在機器學習領域受到了廣泛關注。偏標記學習是弱監(jiān)督學習中的一種。在偏標記學習中,每個示例對象都有一個候選集合,該集合帶有多個標簽信息,其中真正的標簽只有一個。偏標記學習的難點主要在以下三個方面,第一是訓練示例對應的標簽信息是一個集合,而不是明確地指出其對應的真正標簽。第二是候選集合中的標簽存在相似性。第三是示例與標簽之間的聯(lián)系很難充分利用;谝陨戏治,本文提出了兩個基于偏標記學習的算法。為了充分利用示例空間與標簽空間之間的相似性,本文提出了一個基于低秩和標簽傳播的偏標記圖像分類算法。該算法的創(chuàng)新點有三個,首先基于流行假設充分利用了示例空間和標簽空間之間的相似性。流行假設的思想是在示例空間中相似的示例在標簽空間中也具有同樣的相似性,因此基于流行假設能夠將示例空間與標簽空間聯(lián)系起來。其次基于低秩表示矩陣構建示例之間的相似性。相對于基于距離度量的相似性構建方式,該算法采用的低秩表示方式能夠構建全局空間并且對高維數(shù)據(jù)有更好的效果。在構建低秩表示矩陣時加入了稀疏約束,減少示例不平衡對低秩表示矩陣的影響。最后并沒有以最大概率值作為對應示例的真正標簽,而是將其轉換成了一個多輸出回歸問題。由于矩陣中可能會存在消歧效果不明顯的標簽,所以候選標簽集合中的概率值可能存在平均概率的情況。不以最大概率值做為對應示例的真正標簽,減少偽正例對預測模型的影響。大量實驗證明了使用低秩表示矩陣表示示例與示例之間的相關性,并且將這種相關性延伸到標簽空間對分類性能有很大作用。為了突顯出真正的標簽,本文提出了一個基于標簽最大置信度的偏標記圖像分類算法。該算法主要有兩個創(chuàng)新點,第一是在模型的損失項中增加每個示例置信度的無窮范數(shù),突出候選標簽集合中的真正示例。平均消歧策略有一個很大的弊端即消歧后的置信度矩陣中存在消歧效果不明顯的示例。該算法改善平均消歧策略劣勢,突出候選標簽中的真正標簽。第二是基于圖拉普拉斯約束項充分利用示例之間的相似性。圖拉普拉斯項使目標函數(shù)中的相似示例會有相似輸出,使得突出的標簽接近真正的標簽。大量的實驗結果表明,基于標簽最大置信度的方法在圖像分類問題上有著很好的性能。
【學位單位】:北京交通大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TP181;TP391.41
【部分圖文】:
2.1偏標記學習理論綜述??2.1.1偏標記學習框架定義??通過新聞報到以及社交媒體能夠獲得大量圖片和對應的標簽信息。由圖2-1??所示,通過人臉檢測算法和人名抽取算法,能夠獲取一下圖像,并且為這些圖片??標注大致的信息范圍。經(jīng)過對現(xiàn)有的弱監(jiān)督學習框架進行分析和比較,發(fā)現(xiàn)沒有??滿足上述條件的學習框架,為了方便構建學習模型,研宄學者提出了偏標記學習??的概念。由于每個人的理解不同,所以偏標記學習在一些英文文獻中出現(xiàn)了不同??的命名,偏標記學習最常用的命名是partial?label?learning?[13_15,2G’21]。在文獻[5,7,12,22]??稱之為?ambiguous?label?learning,文獻[8]稱之為?superset?label?learning,文獻[23]稱??之為?learning?from?candidate?labeling?sets。??Z1?0?II?Tiinr—?L2??標記如練樣本^???ESBBHPiniBESHB?偏標記訓練?fif?本?2??11月10日,美國總統(tǒng)S巴馬人名油^?11月10日,美國I?R-rm??(右〉在華盛頓白宮會見當?shù)偨y(tǒng)右瘡華齙鉑莒會見當?shù)偨y(tǒng)?3^p>?;納一.特朗過;??屋納德?特朗窖。(照片來源:新?^唐5攏刻乩室簦輳牐ㄕ掌?矗保盒??一?'?B?:??華網(wǎng)/麵)??圖2-1自動采集偏標記訓練示例的圖例??Figure?2-1?Example?for?collecting?partial?label?learning?instances??在偏標記學習中
圖2-2四種弱監(jiān)督學習框架??Figure?2-2?Four?types?of?weakly?supervised?learning?framework??圖2-2以圖例的形式展示了在這四種弱監(jiān)督學習框架中示例和標簽之間的關??系。這四種框架都是根據(jù)不同的弱監(jiān)督信息提出來的框架,下面將偏標記與其它??三種弱監(jiān)督框架進行比較,表述內容如下:??(1)
Figure?2-3?The?flow?diagram?of?image?classification??偏標記學習是一種示例標簽信息帶噪聲的弱監(jiān)督學習框架,處理的是示例的??標簽信息唯一并且在候選集合中這一類問題。圖2-3表示的是在強監(jiān)督學習框架下??構建分類器,然而真實生活中強監(jiān)督信息比較難獲取,并且需要耗費大量人力和??物力,所以基于弱監(jiān)督學習的圖像分類更加受到學者的關注。在實際應用中我們??可以通過圖片和文本識別算法,提取到圖像和相應的候選集合,在此條件下,基??于偏標記學習框架構建的圖像分類模型更加符合需求。通常獲取到圖像和相應的??候選集合,通過特征提取之后,接下來的步驟就是基于偏標記學習框架構建分類??模型,其流程圖如圖2-4所示:??Monicas?Rachels?Phoebe??一Monica、Rachel、Phoebe??隨遍Monicas?RacheK?Phoebe?,??r?一??圖片預處理以及特征提取??t.??^?u??』??"u?r??構建基于偏標記學習框架的分類器??L.?■?■?.j??r-?_?丨Ilflr????丨丨 ̄"??預鍘標簽??l?....?-d??圖2-4基于偏標記學習框架的圖像分類??Figure?2-4?The?image?classifica
【參考文獻】
本文編號:2890967
【學位單位】:北京交通大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TP181;TP391.41
【部分圖文】:
2.1偏標記學習理論綜述??2.1.1偏標記學習框架定義??通過新聞報到以及社交媒體能夠獲得大量圖片和對應的標簽信息。由圖2-1??所示,通過人臉檢測算法和人名抽取算法,能夠獲取一下圖像,并且為這些圖片??標注大致的信息范圍。經(jīng)過對現(xiàn)有的弱監(jiān)督學習框架進行分析和比較,發(fā)現(xiàn)沒有??滿足上述條件的學習框架,為了方便構建學習模型,研宄學者提出了偏標記學習??的概念。由于每個人的理解不同,所以偏標記學習在一些英文文獻中出現(xiàn)了不同??的命名,偏標記學習最常用的命名是partial?label?learning?[13_15,2G’21]。在文獻[5,7,12,22]??稱之為?ambiguous?label?learning,文獻[8]稱之為?superset?label?learning,文獻[23]稱??之為?learning?from?candidate?labeling?sets。??Z1?0?II?Tiinr—?L2??標記如練樣本^???ESBBHPiniBESHB?偏標記訓練?fif?本?2??11月10日,美國總統(tǒng)S巴馬人名油^?11月10日,美國I?R-rm??(右〉在華盛頓白宮會見當?shù)偨y(tǒng)右瘡華齙鉑莒會見當?shù)偨y(tǒng)?3^p>?;納一.特朗過;??屋納德?特朗窖。(照片來源:新?^唐5攏刻乩室簦輳牐ㄕ掌?矗保盒??一?'?B?:??華網(wǎng)/麵)??圖2-1自動采集偏標記訓練示例的圖例??Figure?2-1?Example?for?collecting?partial?label?learning?instances??在偏標記學習中
圖2-2四種弱監(jiān)督學習框架??Figure?2-2?Four?types?of?weakly?supervised?learning?framework??圖2-2以圖例的形式展示了在這四種弱監(jiān)督學習框架中示例和標簽之間的關??系。這四種框架都是根據(jù)不同的弱監(jiān)督信息提出來的框架,下面將偏標記與其它??三種弱監(jiān)督框架進行比較,表述內容如下:??(1)
Figure?2-3?The?flow?diagram?of?image?classification??偏標記學習是一種示例標簽信息帶噪聲的弱監(jiān)督學習框架,處理的是示例的??標簽信息唯一并且在候選集合中這一類問題。圖2-3表示的是在強監(jiān)督學習框架下??構建分類器,然而真實生活中強監(jiān)督信息比較難獲取,并且需要耗費大量人力和??物力,所以基于弱監(jiān)督學習的圖像分類更加受到學者的關注。在實際應用中我們??可以通過圖片和文本識別算法,提取到圖像和相應的候選集合,在此條件下,基??于偏標記學習框架構建的圖像分類模型更加符合需求。通常獲取到圖像和相應的??候選集合,通過特征提取之后,接下來的步驟就是基于偏標記學習框架構建分類??模型,其流程圖如圖2-4所示:??Monicas?Rachels?Phoebe??一Monica、Rachel、Phoebe??隨遍Monicas?RacheK?Phoebe?,??r?一??圖片預處理以及特征提取??t.??^?u??』??"u?r??構建基于偏標記學習框架的分類器??L.?■?■?.j??r-?_?丨Ilflr????丨丨 ̄"??預鍘標簽??l?....?-d??圖2-4基于偏標記學習框架的圖像分類??Figure?2-4?The?image?classifica
【參考文獻】
相關博士學位論文 前1條
1 吳麗娜;基于詞袋模型的圖像分類算法研究[D];北京交通大學;2013年
本文編號:2890967
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2890967.html
最近更新
教材專著