天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于模糊規(guī)則的圖像深度特征學習

發(fā)布時間:2021-01-25 21:57
  圖像特征學習是計算機視覺和機器學習領(lǐng)域的重要研究內(nèi)容,計算機視覺中的很多任務(wù)如圖像分類、目標檢測、圖像分割等,首先會利用圖像特征學習方法抽取原始圖像的特征,然后再根據(jù)具體的任務(wù)實現(xiàn)相應(yīng)的目標。根據(jù)目前的研究,當前流行的圖像特征學習方法是子空間學習和深度神經(jīng)網(wǎng)絡(luò),這些方法無需人工參與即可自動地通過端到端的訓(xùn)練提取高效的特征來用于分類識別等任務(wù)。然而,子空間學習方法在核方法的選擇上存在一些不足。深度神經(jīng)網(wǎng)絡(luò)圖像特征抽取方法目前也面臨著諸多挑戰(zhàn),其有效性嚴重依賴大規(guī)模的數(shù)據(jù),且通常被視為黑盒模型,解釋性較差。針對上述問題,本文在圖像特征學習領(lǐng)域展開研究,如下為本文的三個主要工作:1)第一個工作是以TSK模糊系統(tǒng)為基礎(chǔ),提出了一種基于模糊規(guī)則的圖像特征學習的模型,使得模型具備模糊系統(tǒng)強大的學習能力和較好的可解釋性。不同于經(jīng)典的模糊系統(tǒng)通常用于分類和回歸任務(wù),本文把TSK模糊系統(tǒng)視為一個特征抽取模型用于圖像特征的抽取。本文把TSK模糊系統(tǒng)的前件部分視為將圖像數(shù)據(jù)從原始空間映射到高維空間的一種非線性轉(zhuǎn)換,模型的后件部分可以根據(jù)需求選擇不同的特征學習目標準則,避免了核函數(shù)選擇的同時也使得模型具有了非... 

【文章來源】:江南大學江蘇省 211工程院校 教育部直屬院校

【文章頁數(shù)】:60 頁

【學位級別】:碩士

【部分圖文】:

基于模糊規(guī)則的圖像深度特征學習


深度學習結(jié)構(gòu)圖

示意圖,卷積,示意圖


τ玫慕峁梗?還惴旱撓τ糜諭枷翊?砹煊頡S肴??擁納窬??緗峁共煌?珻NN通過引入局部感知野、權(quán)值共享及池化等思想,有效地減少模型參數(shù)的數(shù)量,降低了網(wǎng)絡(luò)的復(fù)雜度。CNN主要由卷積層、池化層和全連接層這三部分組成。卷積層是CNN的核心,CNN成功的關(guān)鍵就是使用了卷積結(jié)構(gòu)[96,97],它起到了局部感知野和權(quán)重共享的作用。在圖像處理領(lǐng)域中經(jīng)常使用卷積操作來抽取圖像潛在的特征,例如傳統(tǒng)圖像處理中,Sobel算子可以提取圖像的邊緣特征。CNN通過訓(xùn)練,可以自動生成卷積核中的權(quán)重,從而逐層地提取出圖像從低級到復(fù)雜的特征。圖2-2展示了卷積操作的基本過程。卷積操作之后,卷積層會將計算的結(jié)果輸入到非線性激活函數(shù)中,讓模型從簡單的線性抽取結(jié)構(gòu)拓展到非線性特征抽取,極大地增強了模型的表達能力。早期的激活函數(shù)有tanh函數(shù)和sigmoid函數(shù),近年來廣泛使用的是ReLu函數(shù)及其變種形式。圖2-2卷積操作示意圖池化層也是CNN中的一大特色,又被稱作為下采樣層,是對卷積層輸出的特征圖進行降維壓縮。一般常用的池化操作有最大值池化、平均值池化和L2范數(shù)池化,圖2-3

示意圖,示意圖,卷積,全連接


第二章經(jīng)典模糊系統(tǒng)及卷積神經(jīng)網(wǎng)絡(luò)概述11展示了最大值池化的流程。通過池化操作,可以壓縮圖像和參數(shù),并且引入了一定平移與旋轉(zhuǎn)不變性,這使得模型更具魯棒性。圖2-3最大值池化操作示意圖全連接層在CNN的最后幾層,在整個CNN中充當了分類器的角色。全連接層旨在把卷積層網(wǎng)絡(luò)學習到的特征映射到樣本的標記空間中,將經(jīng)過卷積層提取到的二維特征圖轉(zhuǎn)化成一維向量。但是全連接層的參數(shù)往往占據(jù)了模型參數(shù)的絕大部分,在一些卷積神經(jīng)網(wǎng)絡(luò)中,研究者通過使用全局均值池化或是SVM來代替?zhèn)鹘y(tǒng)的全連接層。目前卷積神經(jīng)網(wǎng)絡(luò)的框架很多,例如早期LeCun提出了LeNet-5[98],它是第一個成功應(yīng)用于數(shù)字識別問題的卷積神經(jīng)網(wǎng)絡(luò),LeNet-5模型的整體架構(gòu)如圖2-4所示。LeNet-5模型一共有7層,分別由兩層卷積層、兩層平均池化層和三層全連接層組成。Krizhevsky等提出了AlexNet[53],通過增加網(wǎng)絡(luò)中卷積層的數(shù)目,進一步提升模型的表征能力,采用dropout技術(shù)丟棄一些神經(jīng)元防止模型過擬合的同時也提升了模型的訓(xùn)練速度。Szegedy等提出了GooLeNet[99],該模型的深度超過20層,使得CNN的結(jié)構(gòu)進一步加深。在GooLeNet結(jié)構(gòu)中采用了多個不同尺寸的卷積核來增加學習的多樣性,通過采用inception結(jié)構(gòu)提升了計算資源的利用率。Simonyan等人提出了VGG[100]模型,VGG將傳統(tǒng)CNN中單個尺寸較大的卷積核替換成多個尺寸較小的卷積核,這種替換卷積核的思想使得模型可以學到更為豐富特征的同時還減少參數(shù)的數(shù)量。但是由于VGG的深度較深,網(wǎng)絡(luò)結(jié)構(gòu)比較復(fù)雜,會耗費大量的計算資源。圖2-4LeNet-5整體結(jié)構(gòu)雖然針對不同的視覺任務(wù)提出了許多不同的深度卷積網(wǎng)絡(luò)變體,但此類神經(jīng)網(wǎng)絡(luò)通常被視為是一個黑盒模型,解釋性比較差,這也限制了其在解釋性要求較高領(lǐng)域的應(yīng)用。

【參考文獻】:
期刊論文
[1]深度卷積神經(jīng)網(wǎng)絡(luò)在計算機視覺中的應(yīng)用研究綜述[J]. 盧宏濤,張秦川.  數(shù)據(jù)采集與處理. 2016(01)
[2]基于模糊子空間聚類的〇階L2型TSK模糊系統(tǒng)[J]. 鄧趙紅,張江濱,蔣亦樟,史熒中,王士同.  電子與信息學報. 2015(09)
[3]針對大樣本集的融合模糊系統(tǒng)[J]. 徐華,張庭,戴陽陽.  計算機應(yīng)用研究. 2015(08)
[4]基于監(jiān)督學習的Takagi Sugeno Kang模糊系統(tǒng)圖像融合方法研究[J]. 李奕,吳小俊.  電子與信息學報. 2014(05)
[5]基于正負模糊規(guī)則的相結(jié)合的圖像分類[J]. 吳軍,王士同.  計算機應(yīng)用. 2011(01)
[6]基于灰度共生矩陣的紋理特征提取[J]. 高程程,惠曉威.  計算機系統(tǒng)應(yīng)用. 2010(06)
[7]模糊規(guī)則自適應(yīng)學習的彈性圖像配準[J]. 王士同,鄧趙紅.  江南大學學報(自然科學版). 2007(06)
[8]基于SVM的模糊推理在圖像降噪中的建模與仿真[J]. 孫紅星,趙楠楠,徐心和.  系統(tǒng)仿真學報. 2006(11)
[9]基于模糊邏輯的圖像檢索研究[J]. 王小玲,謝康林.  控制與決策. 2005(12)
[10]基于進化策略生成可解釋性模糊系統(tǒng)[J]. 閻嶺,鄭洪濤,蔣靜坪.  電子學報. 2005(01)

碩士論文
[1]基于詞袋模型的圖像分類系統(tǒng)[D]. 劉爽.大連海事大學 2015



本文編號:2999963

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2999963.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶103e1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com