天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機應(yīng)用論文 >

基于自編碼器和生成對抗網(wǎng)絡(luò)的圖像識別方法研究

發(fā)布時間:2021-06-26 10:29
  圖像識別的核心是如何學(xué)習(xí)到判別性強,魯棒的圖像特征。性能優(yōu)良的特征有助于圖像識別與分析。但因圖像內(nèi)容非常復(fù)雜,易受遮擋、光照、尺寸、形變等因素的影響,獲得判別能力強的特征非常困難。如何能夠有效地提取圖像特征,目前仍然是人工智能,模式識別和計算機視覺等領(lǐng)域研究的重點內(nèi)容之一,本文以自編碼器和生成對抗網(wǎng)絡(luò)兩種模型為基礎(chǔ)框架,研究了深度學(xué)習(xí)方法在圖像特征提取及其在圖像識別中的應(yīng)用。深度學(xué)習(xí)具有強大的,從一般抽象到高度抽象的多層次數(shù)據(jù)表征能力,它持續(xù)吸引著眾多的研究人員和資金投入其中。雖然深度學(xué)習(xí)已經(jīng)在圖像,語音和信號處理等多個領(lǐng)域都取得較好的成績,但是仍然存在一些問題和需要改進的地方,比如如何將鑒別信息有效地嵌入到特征學(xué)習(xí)中,如何將大量的無標記數(shù)據(jù)融入到有標記數(shù)據(jù)中統(tǒng)一地進行學(xué)習(xí),如何提取到可解釋的數(shù)據(jù)表示等問題,本文主要針對以上問題,提出幾種基于自編碼器和生成對抗網(wǎng)絡(luò)的深度學(xué)習(xí)方法來提高模型的泛化能力。本文主要工作包含以下幾個方面:(1)提出了一種標簽一致性約束的稀疏自編碼器模型。自編碼器是一種具有快速推理結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型,如稀疏自編碼器,非負約束自編碼器等,但是這些自編碼器都忽略了數(shù)據(jù)... 

【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校

【文章頁數(shù)】:107 頁

【學(xué)位級別】:博士

【部分圖文】:

基于自編碼器和生成對抗網(wǎng)絡(luò)的圖像識別方法研究


圖1.2:深度學(xué)習(xí)發(fā)展史??Fig.?1.2:?History?of?deep?learning.???

流程圖,圖像識別,流程圖


?江南大學(xué)博士學(xué)位論文???圖像采集——圖像預(yù)處理——特征提取——圖像識別??圖1.3:圖像識別流程圖??Fig.?1.3:?Pipeline?of?image?recognition.??提齲目前,特征仍然沒有非常嚴格的定義,特征的精確定義往往與所面對的問題或任??務(wù)有關(guān)。在圖像識別中,良好的特征具有魯棒性好、判別性強,能使后續(xù)識別任務(wù)變得簡??單等特點%。眾多的研究致力于提取判別性強的魯棒特征表示,圖像特征提取的發(fā)展主??要經(jīng)歷了三個階段:人工設(shè)計特征,淺層學(xué)習(xí)特征和深度學(xué)習(xí)特征I27]。??人工設(shè)計的特征通常是指通過對不同種類的圖像觀察分析后,人為設(shè)計的圖像特征。??包括圖像顏色特征,紋理特征和局部特征等。顏色矩_?(Color?Moments)是一種有效的??顏色特征表示方法,由于顏色信息主要分布于低階矩中,所以常用一階矩均值,二階矩??方差和三階矩斜度來表示。顏色直方圖[29:也是一種顏色特征表示方法,它通過計算各??種色彩在整幅圖中所占的比例來對圖像進行描述。描述圖像的紋理特征主要包括局部二??值模式丨31丨(Local?Binary?Patterns,?LBP)和方向梯度直方圖丨30丨(Histogram?of?Oriented??Gradient,?HOG)等方法。LBP是非常強大的紋理運算符,由于其計算簡單、辨別力強??且對光照變化魯棒,所以這種方法己成功應(yīng)用于指紋識別,車牌識別和人臉識別等領(lǐng)??域。H〇G特征是另外一種經(jīng)典的圖像紋理特征方法,其主要思想是:在一副圖像中,局??部目標的表象和形狀能夠被梯度或邊緣的方向密度分布很好地描述。這種方法最早是應(yīng)??用于靜態(tài)圖像的行人檢測上,后來應(yīng)用于

示意圖,多層感知機,示意圖,卷積


?江南大學(xué)博士學(xué)位論文???隱含層??a??(——、'??圖2.1:多層感知機結(jié)構(gòu)示意圖??Fig.?2.1:?The?architecure?of?Multilayer?perception.??J{9)?-?argminE^p^Jly?-?/(a:;0)||i.?(2.1.3)??u??前向傳播過程?■??輸入:訓(xùn)練數(shù)據(jù)與標簽{x,y}.??輸出:代價函數(shù)J.??1:?:r經(jīng)由輸入層得到/I⑶=_r.??2:前向傳播:??for?k?=?\?I?do??a(k)?=?h(k)?+?W(k)h(k-i)??"⑷=/(a⑷)??end?for??3:計算模型輸出p??4:計算損失函數(shù)J?=?L(仏y).??前向傳播與反向傳播當(dāng)使用MLP接收輸入;r,信息通過網(wǎng)絡(luò)向前流動,輸入x經(jīng)由??隱藏單兀最終到達輸出層產(chǎn)生設(shè),這是前向傳播(Forward?Propagation)的過程。前向傳??播會產(chǎn)生一標量代價函數(shù)J(6>)?=?其中0包含所有參數(shù)權(quán)重和偏置6。反向傳??播(Back?Propagation)算法又將代價函數(shù)的信息經(jīng)由MLP向后傳播,以計算梯度。以深度??為Z的MLP為例,單個樣本(jt.W前向傳播和反向傳播的算法如算法1和2所示。??2.1.2?卷積神經(jīng)網(wǎng)絡(luò)??本小節(jié)將介紹卷積祌經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)(Convolutional?Neural?Xetwork,CXX),??也常被簡稱為卷積網(wǎng)絡(luò)(Convolutional?Network),是一種專門用來處理具有類似網(wǎng)格結(jié)??10??

【參考文獻】:
期刊論文
[1]Visual interpretability for deep learning:a survey[J]. Quan-shi ZHANG,Song-chun ZHU.  Frontiers of Information Technology & Electronic Engineering. 2018(01)
[2]改進的投影孿生支持向量機[J]. 陳素根,吳小俊.  電子學(xué)報. 2017(02)
[3]拉普拉斯多層極速學(xué)習(xí)機[J]. 丁世飛,張楠,史忠植.  軟件學(xué)報. 2017(10)

博士論文
[1]機器學(xué)習(xí)在計算機視覺和癌癥生物信息學(xué)中的若干關(guān)鍵問題研究[D]. 于祥春.吉林大學(xué) 2019
[2]解糾纏表示學(xué)習(xí)與概念空間構(gòu)建[D]. 李澤健.浙江大學(xué) 2019
[3]基于深度學(xué)習(xí)的圖像分類方法研究[D]. 孟丹.華東師范大學(xué) 2017



本文編號:3251173

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3251173.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶764ec***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com