天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學(xué)習(xí)的實(shí)時(shí)四邊形目標(biāo)檢測算法研究

發(fā)布時(shí)間:2021-11-25 23:51
  現(xiàn)實(shí)生活中,很多四邊形目標(biāo)如屏幕、幻燈片、文檔、白板等通常都是包含信息量豐富的信息載體。這些目標(biāo)作為一種人造圖形目標(biāo)在生活、辦公中被廣泛應(yīng)用。近年來,由于手機(jī)等移動設(shè)備得到了普及,用戶通常使用手機(jī)對四邊形目標(biāo)進(jìn)行拍照以保存目標(biāo)中的內(nèi)容,移動設(shè)備拍攝得到的圖片能夠便利的分享信息、整理保存。四邊形目標(biāo)檢測的具體任務(wù)是將手機(jī)圖片中四邊形目標(biāo)的四個(gè)角點(diǎn)檢測出來,利用獲取的四個(gè)角點(diǎn)的坐標(biāo),可將四邊形目標(biāo)截取出來得到比例合理的矩形圖像。目前為止,針對四邊形目標(biāo)檢測的問題,眾多研究者提出了不同的算法方案。通常,這些算法都存在一定的局限性,如只能針對特定的四邊形目標(biāo)進(jìn)行檢測,或?qū)Ρ尘暗膹?fù)雜度有限制。針對已有文獻(xiàn)的這些問題,本文通過引入深度學(xué)習(xí)理論與方法,對實(shí)時(shí)四邊形目標(biāo)檢測算法進(jìn)行系統(tǒng)且深入的研究。本論文主要貢獻(xiàn)如下:(1)針對四邊形目標(biāo)檢測受四邊形檢測算法的影響這一現(xiàn)象,受高精度目標(biāo)檢測算法Faster RCNN的啟發(fā),設(shè)計(jì)一種二階網(wǎng)絡(luò)框架,其中算法框架的第一個(gè)階段為使用深度學(xué)習(xí)算法生成輪廓圖像,進(jìn)而在輪廓圖像中使用四邊形檢測算法檢索出可能是目標(biāo)的四邊形,即四邊形推薦,第二階段將四邊形推薦中的四邊形... 

【文章來源】:深圳大學(xué)廣東省

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的實(shí)時(shí)四邊形目標(biāo)檢測算法研究


神經(jīng)元模型èq

神經(jīng)網(wǎng)絡(luò)模型,輸入層,隱含層,神經(jīng)網(wǎng)絡(luò)


基于深度學(xué)習(xí)的實(shí)時(shí)四邊形目標(biāo)檢測算法研究12()1iipiNpiee==p(2-11)與均方誤差函數(shù)相比,雖然交叉熵函數(shù)無法應(yīng)用于回歸任務(wù)中,但是它在分類任務(wù)中的表現(xiàn)比均方誤差函數(shù)更加優(yōu)秀,因此也被廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)的分類任務(wù)中。2.1.4神經(jīng)網(wǎng)絡(luò)整體結(jié)構(gòu)一般的,多個(gè)神經(jīng)元組成一個(gè)神經(jīng)網(wǎng)絡(luò)層,往往,一個(gè)神經(jīng)網(wǎng)絡(luò)包含三種層:“輸入層”、“隱含層”和“輸出層”,其中輸入層神經(jīng)元對應(yīng)的輸入只有一個(gè)并且沒有權(quán)重和偏置。一個(gè)典型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下:圖2-3神經(jīng)網(wǎng)絡(luò)模型圖2-3描述了一個(gè)簡單的神經(jīng)網(wǎng)絡(luò),它由一個(gè)輸入層、一個(gè)隱含層、一個(gè)輸出層所組成,每個(gè)層都有兩個(gè)節(jié)點(diǎn),網(wǎng)絡(luò)接收長度為2的數(shù)組作為輸入,輸出也是一個(gè)長度為2的數(shù)組,在網(wǎng)絡(luò)進(jìn)行預(yù)測時(shí),執(zhí)行一個(gè)稱作“前向傳播”的過程,而在網(wǎng)絡(luò)訓(xùn)練時(shí),執(zhí)行“反向傳播”的過程,接下來,就這兩個(gè)過程進(jìn)行解釋。前向傳播,即網(wǎng)絡(luò)輸入層12inin接收數(shù)據(jù)12datadata,進(jìn)行運(yùn)算并輸出結(jié)果向量12outout,這個(gè)結(jié)果向量既可以表示分類的結(jié)果,也可以表示回歸預(yù)測中的數(shù)值。式(2-12)描述了一個(gè)全連接中由輸入層到隱含層的前向傳播的過程:111,11,211121211122,12,2wwnetnetfininbbww=+(2-12)式(2-12)中,輸入層中的每一個(gè)值分別與每一個(gè)隱含層中的神經(jīng)元相連,與連接該神經(jīng)元上的權(quán)重1w相乘相加,加上偏置1b后經(jīng)過激活函數(shù)即得到中間隱含層。該過程可以

特征圖,卷積,尺寸,卷積核


基于深度學(xué)習(xí)的實(shí)時(shí)四邊形目標(biāo)檢測算法研究14對單個(gè)卷積核的卷積操作來說,卷積的數(shù)學(xué)形式如下:i,ji+k,j+lk,lk,lg=fh(2-14)式(2-14)中,i,jf=f為卷積的輸入單通道圖像(矩陣),i,jg=g為卷積輸出,k,lh=h為卷積核,k和l分別是卷積核的長和寬,i和j分別是卷積核移動在卷積圖像上的橫向和縱向的位置。由式(2-14)可以看出,卷積操作通過加權(quán)求和方式將一個(gè)區(qū)域的像素信息在特征圖的一個(gè)對應(yīng)位置上進(jìn)行表示,下面以一個(gè)單通道卷積例子來說明一下這種操作的具體過程:圖2-4卷積操作另外,卷積后的輸出相比輸入圖像,尺寸在一定程度上被縮小了,這主要是由于卷積核的尺寸不允許卷積操作從輸入圖像的邊緣開始,這種操作也稱為“無填充”卷積,當(dāng)我們需要卷積后的輸出與卷積前尺寸相同時(shí),通常的做法是提前將卷積的輸入的四周補(bǔ)上若干行列的0值,如此卷積后的圖像就能與卷積前的輸入尺寸相統(tǒng)一,這種操作被稱為“填充”卷積。另一方面,卷積中的“步長”,即卷積核每次移動時(shí)跨過的元素個(gè)數(shù),也能夠影響到卷積輸出的尺寸。圖2-4中展示的是無填充,步長為[1,1]的卷積方式。卷積操作可以起到收集圖像特征的作用,下面將以一個(gè)單通道卷積核進(jìn)行卷積操作的直觀例子來討論這種作用:

【參考文獻(xiàn)】:
期刊論文
[1]動態(tài)規(guī)劃算法在手機(jī)拍照文檔圖像中的應(yīng)用[J]. 王茂森,牛少彰.  北京郵電大學(xué)學(xué)報(bào). 2017(04)
[2]基于Harris角點(diǎn)的矩形檢測[J]. 張從鵬,魏學(xué)光.  光學(xué)精密工程. 2014(08)



本文編號:3519027

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3519027.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b64b3***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com