基于深度學(xué)習(xí)的中文OCR算法與系統(tǒng)實(shí)現(xiàn)
發(fā)布時(shí)間:2021-08-23 10:58
近年來(lái)隨著圖像處理技術(shù)的突飛猛進(jìn),特別是深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn),越來(lái)越多傳統(tǒng)方法被基于深度學(xué)習(xí)的方法所替代,可是仍有許多應(yīng)用性問(wèn)題沒(méi)有很好的解決方法。在OCR的研究領(lǐng)域里,基于深度學(xué)習(xí)的方法常被用來(lái)解決自然場(chǎng)景中的復(fù)雜問(wèn)題,卻少有人關(guān)注在真實(shí)文本場(chǎng)景中,中文字符的檢測(cè)和識(shí)別的性能差強(qiáng)人意。針對(duì)有干擾背景下的中文檢測(cè)與識(shí)別算法的系統(tǒng)實(shí)現(xiàn)。本論文主要內(nèi)容包括以下幾個(gè)方面:1.提出了中文干擾背景數(shù)據(jù)集的合成方法:預(yù)處理真實(shí)背景紋理素材,采用旋轉(zhuǎn)、傾斜變形、Image Matting等圖像處理方法,合成中文仿真數(shù)據(jù)集,增加了識(shí)別算法的泛化效果。2.提出了基于CTPN+CRNN的復(fù)雜背景下的中文檢測(cè)與識(shí)別方法:CTPN適合檢測(cè)水平文字的特性,將合成的數(shù)據(jù)集與真實(shí)場(chǎng)景的數(shù)據(jù)集結(jié)合,繼續(xù)擴(kuò)充檢測(cè)訓(xùn)練集的豐富性,再對(duì)檢測(cè)模型進(jìn)行訓(xùn)練。使用合成的中文數(shù)據(jù)集對(duì)CRNN模型進(jìn)行訓(xùn)練,解決了部分中文無(wú)法識(shí)別的問(wèn)題,降低部分字符因背景干擾引起的識(shí)別錯(cuò)誤率。3.研發(fā)了基于嵌入式的中文檢測(cè)和識(shí)別系統(tǒng):將本文的方法在嵌入式端上實(shí)現(xiàn),進(jìn)行測(cè)試和分析,設(shè)計(jì)并實(shí)現(xiàn)整個(gè)應(yīng)用系統(tǒng)。本文研究傳統(tǒng)OCR技術(shù)和深度學(xué)習(xí)應(yīng)用場(chǎng)景...
【文章來(lái)源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁(yè)數(shù)】:83 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
(a)文本場(chǎng)景(b)自然場(chǎng)景來(lái)源https://www.baidu.com/
場(chǎng)景中的字?jǐn)?shù)多,但是排布規(guī)范,雖然是手機(jī)簡(jiǎn)單拍攝,文字。自然場(chǎng)景中的標(biāo)語(yǔ)牌,同樣是手機(jī)隨意的一拍,雖然字?jǐn)?shù)不卻很豐富,不同的大小、字體、角度、顏色等。圖 1.1(a)文本場(chǎng)景(b)自然場(chǎng)景來(lái)源 https://www.baidu.com/
應(yīng)用市場(chǎng)上已經(jīng)有許多提供圖像文字檢測(cè)和識(shí)別服務(wù)的服務(wù)百度、騰訊、阿里、谷歌、微軟、亞馬遜等大型云服務(wù)互聯(lián)了一些活躍在視頻直播、教育、電子商務(wù)、電子政務(wù)、安全體細(xì)分的行業(yè)服務(wù)企業(yè)。這些企業(yè)一般都是向使用者提供一,直接進(jìn)行場(chǎng)景文本識(shí)別、證件數(shù)字的文本識(shí)別、掃描文檔。也有的企業(yè)通過(guò)出售或定制掃描儀、讀卡器、智能設(shè)備提供的特定的數(shù)據(jù)集訓(xùn)練定制化模型,以及提供定制化 AI 定制化的服務(wù)模型,一般只針對(duì)應(yīng)用場(chǎng)景的特定本文有用身份證件等小范圍場(chǎng)景。習(xí)及相關(guān)技術(shù)網(wǎng)絡(luò)
【參考文獻(xiàn)】:
期刊論文
[1]一種用于文本檢測(cè)和文本識(shí)別的單一神經(jīng)網(wǎng)絡(luò)[J]. 張秀杰,董超俊. 工業(yè)控制計(jì)算機(jī). 2018(08)
[2]深度學(xué)習(xí)在手寫漢字識(shí)別中的應(yīng)用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊. 自動(dòng)化學(xué)報(bào). 2016(08)
[3]試論黑體字的發(fā)展源流及特征[J]. 吳衛(wèi),李婧. 設(shè)計(jì). 2015(09)
[4]自然場(chǎng)景下基于連通域檢測(cè)的文字識(shí)別算法研究[J]. 劉新瀚,錢侃,王宇飛,朱向霄,孫知信. 計(jì)算機(jī)技術(shù)與發(fā)展. 2015(05)
[5]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽(yáng)明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[6]自適應(yīng)最小誤差閾值分割算法[J]. 龍建武,申鉉京,陳海鵬. 自動(dòng)化學(xué)報(bào). 2012(07)
[7]支持向量機(jī)理論與算法研究綜述[J]. 丁世飛,齊丙娟,譚紅艷. 電子科技大學(xué)學(xué)報(bào). 2011(01)
[8]利用改進(jìn)的Retinex進(jìn)行人臉圖像光照處理[J]. 葛微,李桂菊,程宇奇,薛陳,朱明. 光學(xué)精密工程. 2010(04)
[9]圖像特征點(diǎn)提取及匹配技術(shù)[J]. 楊曉敏,吳煒,卿粼波,華驊,何小海. 光學(xué)精密工程. 2009(09)
[10]一種基于字詞聯(lián)合解碼的中文分詞方法[J]. 宋彥,蔡?hào)|風(fēng),張桂平,趙海. 軟件學(xué)報(bào). 2009(09)
博士論文
[1]Web文本挖掘中若干問(wèn)題的研究[D]. 王占一.北京郵電大學(xué) 2012
[2]文本檢索中若干問(wèn)題研究[D]. 王秀娟.北京郵電大學(xué) 2006
碩士論文
[1]基于深度學(xué)習(xí)的自然場(chǎng)景文字識(shí)別[D]. 黃攀.浙江大學(xué) 2016
[2]基于Tesseract-OCR的名片識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D]. 萬(wàn)松.華南理工大學(xué) 2014
[3]論宋體字的形成與特征[D]. 楊艷芳.南京藝術(shù)學(xué)院 2011
[4]隸書(shū)的產(chǎn)生及其審美價(jià)值研究[D]. 楊艷.曲阜師范大學(xué) 2010
本文編號(hào):3357736
【文章來(lái)源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁(yè)數(shù)】:83 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
(a)文本場(chǎng)景(b)自然場(chǎng)景來(lái)源https://www.baidu.com/
場(chǎng)景中的字?jǐn)?shù)多,但是排布規(guī)范,雖然是手機(jī)簡(jiǎn)單拍攝,文字。自然場(chǎng)景中的標(biāo)語(yǔ)牌,同樣是手機(jī)隨意的一拍,雖然字?jǐn)?shù)不卻很豐富,不同的大小、字體、角度、顏色等。圖 1.1(a)文本場(chǎng)景(b)自然場(chǎng)景來(lái)源 https://www.baidu.com/
應(yīng)用市場(chǎng)上已經(jīng)有許多提供圖像文字檢測(cè)和識(shí)別服務(wù)的服務(wù)百度、騰訊、阿里、谷歌、微軟、亞馬遜等大型云服務(wù)互聯(lián)了一些活躍在視頻直播、教育、電子商務(wù)、電子政務(wù)、安全體細(xì)分的行業(yè)服務(wù)企業(yè)。這些企業(yè)一般都是向使用者提供一,直接進(jìn)行場(chǎng)景文本識(shí)別、證件數(shù)字的文本識(shí)別、掃描文檔。也有的企業(yè)通過(guò)出售或定制掃描儀、讀卡器、智能設(shè)備提供的特定的數(shù)據(jù)集訓(xùn)練定制化模型,以及提供定制化 AI 定制化的服務(wù)模型,一般只針對(duì)應(yīng)用場(chǎng)景的特定本文有用身份證件等小范圍場(chǎng)景。習(xí)及相關(guān)技術(shù)網(wǎng)絡(luò)
【參考文獻(xiàn)】:
期刊論文
[1]一種用于文本檢測(cè)和文本識(shí)別的單一神經(jīng)網(wǎng)絡(luò)[J]. 張秀杰,董超俊. 工業(yè)控制計(jì)算機(jī). 2018(08)
[2]深度學(xué)習(xí)在手寫漢字識(shí)別中的應(yīng)用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊. 自動(dòng)化學(xué)報(bào). 2016(08)
[3]試論黑體字的發(fā)展源流及特征[J]. 吳衛(wèi),李婧. 設(shè)計(jì). 2015(09)
[4]自然場(chǎng)景下基于連通域檢測(cè)的文字識(shí)別算法研究[J]. 劉新瀚,錢侃,王宇飛,朱向霄,孫知信. 計(jì)算機(jī)技術(shù)與發(fā)展. 2015(05)
[5]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽(yáng)明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[6]自適應(yīng)最小誤差閾值分割算法[J]. 龍建武,申鉉京,陳海鵬. 自動(dòng)化學(xué)報(bào). 2012(07)
[7]支持向量機(jī)理論與算法研究綜述[J]. 丁世飛,齊丙娟,譚紅艷. 電子科技大學(xué)學(xué)報(bào). 2011(01)
[8]利用改進(jìn)的Retinex進(jìn)行人臉圖像光照處理[J]. 葛微,李桂菊,程宇奇,薛陳,朱明. 光學(xué)精密工程. 2010(04)
[9]圖像特征點(diǎn)提取及匹配技術(shù)[J]. 楊曉敏,吳煒,卿粼波,華驊,何小海. 光學(xué)精密工程. 2009(09)
[10]一種基于字詞聯(lián)合解碼的中文分詞方法[J]. 宋彥,蔡?hào)|風(fēng),張桂平,趙海. 軟件學(xué)報(bào). 2009(09)
博士論文
[1]Web文本挖掘中若干問(wèn)題的研究[D]. 王占一.北京郵電大學(xué) 2012
[2]文本檢索中若干問(wèn)題研究[D]. 王秀娟.北京郵電大學(xué) 2006
碩士論文
[1]基于深度學(xué)習(xí)的自然場(chǎng)景文字識(shí)別[D]. 黃攀.浙江大學(xué) 2016
[2]基于Tesseract-OCR的名片識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D]. 萬(wàn)松.華南理工大學(xué) 2014
[3]論宋體字的形成與特征[D]. 楊艷芳.南京藝術(shù)學(xué)院 2011
[4]隸書(shū)的產(chǎn)生及其審美價(jià)值研究[D]. 楊艷.曲阜師范大學(xué) 2010
本文編號(hào):3357736
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3357736.html
最近更新
教材專著