基于深度學(xué)習(xí)的字符級(jí)場(chǎng)景漢字檢測(cè)與識(shí)別問題研究
發(fā)布時(shí)間:2024-01-14 11:34
文字承載著各個(gè)國(guó)家的文化與文明,也是人類交流的載體。如今隨著多媒體時(shí)代的發(fā)展,文字的表現(xiàn)形式也愈加豐富。中國(guó)的漢字歷史悠久、字體形式多變,演變至今不僅具備文學(xué)研究意義,同時(shí)為計(jì)算機(jī)視覺領(lǐng)域提供豐富的研究課題。尤其在自然場(chǎng)景圖片中,文本的內(nèi)容擁有豐富的語義信息,研究人員可以通過對(duì)這些文字的閱讀和理解提取到相關(guān)重要的信息,用于如文獻(xiàn)檢索、城市監(jiān)控、無人駕駛、醫(yī)學(xué)治療等工業(yè)應(yīng)用。目前傳統(tǒng)的光學(xué)字符識(shí)別(Optical Character Recognition,OCR)技術(shù)在文檔分析中已有廣泛的應(yīng)用且識(shí)別效果顯著。與傳統(tǒng)印刷體不同,自然場(chǎng)景中的文字不僅字體樣式多變,背景也較為復(fù)雜,然而目前的算法多針對(duì)英文,難以應(yīng)對(duì)場(chǎng)景漢字的復(fù)雜性。場(chǎng)景漢字的檢測(cè)識(shí)別仍是一項(xiàng)具有挑戰(zhàn)的研究工作,因此本文針對(duì)場(chǎng)景漢字的檢測(cè)與識(shí)別任務(wù)做了如下工作:1.本文針對(duì)現(xiàn)有檢測(cè)算法在中文應(yīng)用上的不足,提出一種基于多尺度特征與多目標(biāo)函數(shù)的場(chǎng)景文本檢測(cè)算法。同時(shí)適用于文本行和字符的檢測(cè),和現(xiàn)有方法相比具有多方面的優(yōu)勢(shì)。具體的網(wǎng)絡(luò)設(shè)計(jì)如下:(1)多尺度特征提取網(wǎng)絡(luò)。借鑒語義分割的思想,在調(diào)整后的骨干網(wǎng)絡(luò)Res Net-50后接入...
【文章頁數(shù)】:86 頁
【學(xué)位級(jí)別】:碩士
本文編號(hào):3878151
【文章頁數(shù)】:86 頁
【學(xué)位級(jí)別】:碩士
本文編號(hào):3878151
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3878151.html
最近更新
教材專著