OCR技術(shù)在審計(jì)現(xiàn)場(chǎng)中的應(yīng)用研究
發(fā)布時(shí)間:2021-01-30 13:08
電網(wǎng)企業(yè)目前的計(jì)算機(jī)審計(jì)工作主要基于數(shù)據(jù)庫(kù)中的電子數(shù)據(jù)進(jìn)行分析,而從審計(jì)經(jīng)驗(yàn)看,被審計(jì)單位的各類紙質(zhì)文件中往往隱藏著大量的審計(jì)線索和疑點(diǎn),如何充分利用相關(guān)數(shù)據(jù)是本課題的核心;诖,本文首先要解決的問(wèn)題就把相關(guān)紙質(zhì)文件轉(zhuǎn)化成計(jì)算機(jī)能夠識(shí)別的文字,這需要企業(yè)利用掃描儀將相關(guān)文件掃描成圖片;其次,本文研究了OCR圖片識(shí)別技術(shù),將掃描后的圖片文件進(jìn)行OCR處理,并抽取成文字文檔,為相關(guān)文檔的深度挖掘和利用奠定基礎(chǔ)。
【文章來(lái)源】:中國(guó)管理信息化. 2020,23(16)
【文章頁(yè)數(shù)】:3 頁(yè)
【部分圖文】:
財(cái)務(wù)報(bào)表識(shí)別步驟
影響識(shí)別準(zhǔn)確率的技術(shù)瓶頸是文字檢測(cè)和文本識(shí)別,而這兩部分也是OCR技術(shù)的重中之重。在傳統(tǒng)OCR技術(shù)中,圖像預(yù)處理指針對(duì)存在圖像的成像、內(nèi)容等問(wèn)題進(jìn)行修正。常見(jiàn)的預(yù)處理過(guò)程包括:幾何變換(透視、扭曲、旋轉(zhuǎn)等)、畸變校正、去除模糊、圖像增強(qiáng)和光線校正等。文字檢測(cè)即檢測(cè)文本的所在位置和范圍及其內(nèi)容和布局。一般包括文字版面分析和內(nèi)容文字行檢測(cè)等。文字檢測(cè)主要解決的問(wèn)題是哪里出現(xiàn)文字、文字的范圍涵蓋有多大等。文本識(shí)別是在文本預(yù)檢測(cè)和行檢測(cè)的基礎(chǔ)上,對(duì)文本內(nèi)容進(jìn)行識(shí)別,將圖像中的文本信息轉(zhuǎn)化為文本信息。文字識(shí)別主要解決的問(wèn)題是每個(gè)文字是什么。識(shí)別出的文本通常需要再次核對(duì)以保證其正確性。其中,當(dāng)識(shí)別的內(nèi)容是由詞庫(kù)中的詞匯組成時(shí),可以稱為詞典識(shí)別(Lexicon-based),反之稱為無(wú)詞典識(shí)別(Lexicon-free)。(1)圖像預(yù)處理
【參考文獻(xiàn)】:
期刊論文
[1]推進(jìn)內(nèi)部審計(jì)整改工作的思考[J]. 袁芳. 財(cái)會(huì)學(xué)習(xí). 2017(15)
[2]淺談OCR技術(shù)的發(fā)展和應(yīng)用[J]. 王文華. 福建電腦. 2012(06)
碩士論文
[1]基于Tesseract光學(xué)字符辨識(shí)應(yīng)用的設(shè)計(jì)與實(shí)現(xiàn)[D]. 張揚(yáng).西安電子科技大學(xué) 2013
本文編號(hào):3008956
【文章來(lái)源】:中國(guó)管理信息化. 2020,23(16)
【文章頁(yè)數(shù)】:3 頁(yè)
【部分圖文】:
財(cái)務(wù)報(bào)表識(shí)別步驟
影響識(shí)別準(zhǔn)確率的技術(shù)瓶頸是文字檢測(cè)和文本識(shí)別,而這兩部分也是OCR技術(shù)的重中之重。在傳統(tǒng)OCR技術(shù)中,圖像預(yù)處理指針對(duì)存在圖像的成像、內(nèi)容等問(wèn)題進(jìn)行修正。常見(jiàn)的預(yù)處理過(guò)程包括:幾何變換(透視、扭曲、旋轉(zhuǎn)等)、畸變校正、去除模糊、圖像增強(qiáng)和光線校正等。文字檢測(cè)即檢測(cè)文本的所在位置和范圍及其內(nèi)容和布局。一般包括文字版面分析和內(nèi)容文字行檢測(cè)等。文字檢測(cè)主要解決的問(wèn)題是哪里出現(xiàn)文字、文字的范圍涵蓋有多大等。文本識(shí)別是在文本預(yù)檢測(cè)和行檢測(cè)的基礎(chǔ)上,對(duì)文本內(nèi)容進(jìn)行識(shí)別,將圖像中的文本信息轉(zhuǎn)化為文本信息。文字識(shí)別主要解決的問(wèn)題是每個(gè)文字是什么。識(shí)別出的文本通常需要再次核對(duì)以保證其正確性。其中,當(dāng)識(shí)別的內(nèi)容是由詞庫(kù)中的詞匯組成時(shí),可以稱為詞典識(shí)別(Lexicon-based),反之稱為無(wú)詞典識(shí)別(Lexicon-free)。(1)圖像預(yù)處理
【參考文獻(xiàn)】:
期刊論文
[1]推進(jìn)內(nèi)部審計(jì)整改工作的思考[J]. 袁芳. 財(cái)會(huì)學(xué)習(xí). 2017(15)
[2]淺談OCR技術(shù)的發(fā)展和應(yīng)用[J]. 王文華. 福建電腦. 2012(06)
碩士論文
[1]基于Tesseract光學(xué)字符辨識(shí)應(yīng)用的設(shè)計(jì)與實(shí)現(xiàn)[D]. 張揚(yáng).西安電子科技大學(xué) 2013
本文編號(hào):3008956
本文鏈接:http://sikaile.net/jingjilunwen/sjlw/3008956.html
最近更新
教材專著