天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的中文OCR算法與系統(tǒng)實(shí)現(xiàn)

發(fā)布時(shí)間:2021-08-23 10:58
  近年來隨著圖像處理技術(shù)的突飛猛進(jìn),特別是深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn),越來越多傳統(tǒng)方法被基于深度學(xué)習(xí)的方法所替代,可是仍有許多應(yīng)用性問題沒有很好的解決方法。在OCR的研究領(lǐng)域里,基于深度學(xué)習(xí)的方法常被用來解決自然場景中的復(fù)雜問題,卻少有人關(guān)注在真實(shí)文本場景中,中文字符的檢測和識別的性能差強(qiáng)人意。針對有干擾背景下的中文檢測與識別算法的系統(tǒng)實(shí)現(xiàn)。本論文主要內(nèi)容包括以下幾個(gè)方面:1.提出了中文干擾背景數(shù)據(jù)集的合成方法:預(yù)處理真實(shí)背景紋理素材,采用旋轉(zhuǎn)、傾斜變形、Image Matting等圖像處理方法,合成中文仿真數(shù)據(jù)集,增加了識別算法的泛化效果。2.提出了基于CTPN+CRNN的復(fù)雜背景下的中文檢測與識別方法:CTPN適合檢測水平文字的特性,將合成的數(shù)據(jù)集與真實(shí)場景的數(shù)據(jù)集結(jié)合,繼續(xù)擴(kuò)充檢測訓(xùn)練集的豐富性,再對檢測模型進(jìn)行訓(xùn)練。使用合成的中文數(shù)據(jù)集對CRNN模型進(jìn)行訓(xùn)練,解決了部分中文無法識別的問題,降低部分字符因背景干擾引起的識別錯(cuò)誤率。3.研發(fā)了基于嵌入式的中文檢測和識別系統(tǒng):將本文的方法在嵌入式端上實(shí)現(xiàn),進(jìn)行測試和分析,設(shè)計(jì)并實(shí)現(xiàn)整個(gè)應(yīng)用系統(tǒng)。本文研究傳統(tǒng)OCR技術(shù)和深度學(xué)習(xí)應(yīng)用場景... 

【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省

【文章頁數(shù)】:83 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的中文OCR算法與系統(tǒng)實(shí)現(xiàn)


(a)文本場景(b)自然場景來源https://www.baidu.com/

中文文本,場景圖,背景,自然場景


場景中的字?jǐn)?shù)多,但是排布規(guī)范,雖然是手機(jī)簡單拍攝,文字。自然場景中的標(biāo)語牌,同樣是手機(jī)隨意的一拍,雖然字?jǐn)?shù)不卻很豐富,不同的大小、字體、角度、顏色等。圖 1.1(a)文本場景(b)自然場景來源 https://www.baidu.com/

示意圖,神經(jīng)網(wǎng)絡(luò),示意圖,定制化


應(yīng)用市場上已經(jīng)有許多提供圖像文字檢測和識別服務(wù)的服務(wù)百度、騰訊、阿里、谷歌、微軟、亞馬遜等大型云服務(wù)互聯(lián)了一些活躍在視頻直播、教育、電子商務(wù)、電子政務(wù)、安全體細(xì)分的行業(yè)服務(wù)企業(yè)。這些企業(yè)一般都是向使用者提供一,直接進(jìn)行場景文本識別、證件數(shù)字的文本識別、掃描文檔。也有的企業(yè)通過出售或定制掃描儀、讀卡器、智能設(shè)備提供的特定的數(shù)據(jù)集訓(xùn)練定制化模型,以及提供定制化 AI 定制化的服務(wù)模型,一般只針對應(yīng)用場景的特定本文有用身份證件等小范圍場景。習(xí)及相關(guān)技術(shù)網(wǎng)絡(luò)

【參考文獻(xiàn)】:
期刊論文
[1]一種用于文本檢測和文本識別的單一神經(jīng)網(wǎng)絡(luò)[J]. 張秀杰,董超俊.  工業(yè)控制計(jì)算機(jī). 2018(08)
[2]深度學(xué)習(xí)在手寫漢字識別中的應(yīng)用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊.  自動化學(xué)報(bào). 2016(08)
[3]試論黑體字的發(fā)展源流及特征[J]. 吳衛(wèi),李婧.  設(shè)計(jì). 2015(09)
[4]自然場景下基于連通域檢測的文字識別算法研究[J]. 劉新瀚,錢侃,王宇飛,朱向霄,孫知信.  計(jì)算機(jī)技術(shù)與發(fā)展. 2015(05)
[5]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正.  計(jì)算機(jī)應(yīng)用研究. 2012(08)
[6]自適應(yīng)最小誤差閾值分割算法[J]. 龍建武,申鉉京,陳海鵬.  自動化學(xué)報(bào). 2012(07)
[7]支持向量機(jī)理論與算法研究綜述[J]. 丁世飛,齊丙娟,譚紅艷.  電子科技大學(xué)學(xué)報(bào). 2011(01)
[8]利用改進(jìn)的Retinex進(jìn)行人臉圖像光照處理[J]. 葛微,李桂菊,程宇奇,薛陳,朱明.  光學(xué)精密工程. 2010(04)
[9]圖像特征點(diǎn)提取及匹配技術(shù)[J]. 楊曉敏,吳煒,卿粼波,華驊,何小海.  光學(xué)精密工程. 2009(09)
[10]一種基于字詞聯(lián)合解碼的中文分詞方法[J]. 宋彥,蔡東風(fēng),張桂平,趙海.  軟件學(xué)報(bào). 2009(09)

博士論文
[1]Web文本挖掘中若干問題的研究[D]. 王占一.北京郵電大學(xué) 2012
[2]文本檢索中若干問題研究[D]. 王秀娟.北京郵電大學(xué) 2006

碩士論文
[1]基于深度學(xué)習(xí)的自然場景文字識別[D]. 黃攀.浙江大學(xué) 2016
[2]基于Tesseract-OCR的名片識別系統(tǒng)的研究與實(shí)現(xiàn)[D]. 萬松.華南理工大學(xué) 2014
[3]論宋體字的形成與特征[D]. 楊艷芳.南京藝術(shù)學(xué)院 2011
[4]隸書的產(chǎn)生及其審美價(jià)值研究[D]. 楊艷.曲阜師范大學(xué) 2010



本文編號:3357736

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3357736.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶72a60***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com