天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學(xué)習(xí)的場景蒙古文字檢測與識別研究

發(fā)布時間:2021-06-29 21:17
  文字作為人類高層語義信息中最直接的表示形式,在圖像理解中扮演著不可或缺的重要角色。近年來,研究人員針對場景圖像中英文、漢字等文字的檢測和識別方法已經(jīng)進(jìn)行了深入研究,并取得了豐碩成果,但針對復(fù)雜場景圖像中的蒙古文字檢測和識別方法研究還處于起步階段。在此背景下,本文主要研究內(nèi)容如下:1.本文研究了一種基于深度學(xué)習(xí)和最大穩(wěn)定極值區(qū)域(MSER)的場景蒙古文字檢測算法。目前,由于缺少大規(guī)模場景蒙古文字檢測數(shù)據(jù)集資源,無法訓(xùn)練得到魯棒的深度檢測網(wǎng)絡(luò)模型,但基于MSER的方法不需要大量訓(xùn)練樣本,且對視角、字符大小、光照變化具有魯棒性。在MSER方法基礎(chǔ)上,只需要相對較少的訓(xùn)練樣本就可以訓(xùn)練出高效穩(wěn)定的卷積神經(jīng)網(wǎng)絡(luò)(CNN)分類器,用來判斷候選連通區(qū)域是否是蒙古文字區(qū)域。實驗結(jié)果表明,所提方法能夠良好地完成場景圖像中的蒙古文字檢測任務(wù)。2.本文研究了一種虛擬場景蒙古文字樣本生成方法。在蒙古語言文字信息化的快速發(fā)展過程中,關(guān)于印刷體蒙古文檔圖像分析和文字識別方面已經(jīng)開展了大量工作,但針對場景中的蒙古文字識別研究開展的較少。一方面關(guān)于蒙古語言文字的研究開展的較晚,另一方面由于缺乏大量的訓(xùn)練樣本,導(dǎo)致無法... 

【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁數(shù)】:56 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的場景蒙古文字檢測與識別研究


生成的候選區(qū)域Figure3.2Generatedcandidateregions

矩形圖,矩形,連通區(qū)域,邊緣密度


螄嘟岷希?源?砑觳獾降拇?量非文字區(qū)域。1.非極大值抑制(Non-MaximumSuppression,NMS)可以表述為“局部最大搜索”,其中局部最大,表示大于其它所有領(lǐng)域,但是不包括其自身。NMS是計算機(jī)視覺中應(yīng)用最廣泛的后處理算法。NMS的原理是使用最大濾波器對檢測到的所有目標(biāo)矩形框進(jìn)行概率排序,然后將概率最大的目標(biāo)矩形框與其余的目標(biāo)矩形框相比,如果他們的重疊度(IntersectionOverUnion,IOU)大于預(yù)先設(shè)定的閾值,則將其余的目標(biāo)矩形框丟掉,保留原始的目標(biāo)矩形框。然后一直重復(fù)這個過程,一直到找到所有滿足條件的目標(biāo)矩形框。圖3.3顯示了目標(biāo)檢測中矩形框的重疊形式,計算圖中overlap的面積即可求得它們的IOU。圖3.3矩形交叉圖Figure3.3RectanglecrossdiagramIOU的計算公式如公式(3.1)所示,其中A為矩形1的面積,B為矩形2的面積。IOU=∩∪(3.1)2.本文事先設(shè)定的一些啟發(fā)式規(guī)則如下:a)計算邊緣密度。通過計算候選連通區(qū)域的邊緣密度,來對候選連通區(qū)域進(jìn)行篩眩因為文字區(qū)域的邊緣密度大于非文字區(qū)域的邊緣密度,所以可以去除小于設(shè)定的閾值的候選連通區(qū)域。候選連通區(qū)域邊緣密度的計算公式如(3.5)所示:=∑∑(,)(3.2)其中,(,)表示邊緣圖像,和分別表示候選區(qū)域的寬度和高度。在本文中,閾值設(shè)定為0.2,如果候選連通區(qū)域的邊緣密度小于0.2,則將它們視為非文字連通區(qū)域,并去除掉。b)計算候選連通區(qū)域的寬高比。刪除掉高度和寬度之比在[0.1,10]之外的候選文字連通區(qū)域。c)計算候選連通區(qū)域的面積。刪除掉極值區(qū)域面積大于1300的候選連通區(qū)域和面積小于150的候選連通區(qū)域。overlapAB

區(qū)域圖,字符,區(qū)域,連通區(qū)域


內(nèi)蒙古大學(xué)碩士學(xué)位論文 應(yīng)用本文事先設(shè)定的一些啟發(fā)式規(guī)則和非極大值抑制對獲取到的最大穩(wěn)定值區(qū)域進(jìn)行篩選后,如圖 3.4 所示,雖然它們還存在一些錯誤檢測,但是極大地減少了非文字區(qū)域的候選連通區(qū)域數(shù)量。與此同時,該方法還需要一個強(qiáng)大的文字分類器來區(qū)分蒙古文字連通區(qū)域與非蒙古文字連通區(qū)域。下面介紹一種基于卷積神經(jīng)網(wǎng)絡(luò)的高性能文字分類器。

【參考文獻(xiàn)】:
碩士論文
[1]基于深度學(xué)習(xí)的印刷蒙古文整詞識別技術(shù)研究[D]. 王偉源.內(nèi)蒙古大學(xué) 2019



本文編號:3257177

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3257177.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶49b86***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com