天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的發(fā)票識(shí)別研究

發(fā)布時(shí)間:2024-03-09 07:37
  在現(xiàn)代信息社會(huì),由于國(guó)民經(jīng)濟(jì)的健康發(fā)展與科學(xué)技術(shù)的提高,人們的經(jīng)濟(jì)活動(dòng)也變得更加頻繁,發(fā)票成為了記錄經(jīng)濟(jì)活動(dòng)的重要載體。然而,在傳統(tǒng)的發(fā)票錄入流程中,大多數(shù)錄入工作都需要人工完成,這種錄入方式效率低下且浪費(fèi)人力資源。隨著光學(xué)字符識(shí)別(Optical Character Recognition,OCR)技術(shù)與深度學(xué)習(xí)技術(shù)的興起,給人們自動(dòng)化的信息提取提供了極大的便利,因此,利用深度學(xué)習(xí)技術(shù)來(lái)解決發(fā)票的快速識(shí)別具有重要的現(xiàn)實(shí)意義。本文基于深度學(xué)習(xí)技術(shù)對(duì)發(fā)票識(shí)別算法開展研究工作,以最常見的發(fā)票為例,根據(jù)發(fā)票圖片的內(nèi)容特點(diǎn),將發(fā)票識(shí)別任務(wù)分為兩個(gè)主要步驟:文本區(qū)域檢測(cè)和文字識(shí)別,并通過兩個(gè)基于深度學(xué)習(xí)的算法模型實(shí)現(xiàn)發(fā)票的快速識(shí)別,本文主要工作如下:(1)發(fā)票文本區(qū)域檢測(cè)部分,選用Pse Net網(wǎng)絡(luò)模型作為基本框架進(jìn)行發(fā)票文本區(qū)域檢測(cè)。在原有的網(wǎng)絡(luò)結(jié)構(gòu)中加入了可以擴(kuò)大感受野的形變卷積,提高了模型的特征提取能力;結(jié)合工作實(shí)際,根據(jù)發(fā)票文本的實(shí)際場(chǎng)景進(jìn)行分析,引入了dice coefficient loss損失函數(shù),有效避免了檢測(cè)結(jié)果偏向非文本區(qū)域;收集發(fā)票圖片并制作發(fā)票數(shù)據(jù)集作為模型訓(xùn)練數(shù)據(jù),進(jìn)一...

【文章頁(yè)數(shù)】:64 頁(yè)

【部分圖文】:

圖1.1發(fā)票圖像

圖1.1發(fā)票圖像

南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第一章緒論1第一章緒論課題的研究背景及意義在日常生活中,我們會(huì)在多個(gè)場(chǎng)合使用到增值稅發(fā)票,對(duì)于一般納稅人都可合理合法使用它進(jìn)行經(jīng)濟(jì)活動(dòng)。對(duì)比普通稅收類別的發(fā)票,增值稅發(fā)票對(duì)稅金扣稅的項(xiàng)目標(biāo)明也更加的清晰,所以可以成為記錄銷貨方納稅和購(gòu)貨方進(jìn)稅....


圖2.2基于MSER的發(fā)票定位效果

圖2.2基于MSER的發(fā)票定位效果

南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第二章定位與識(shí)別相關(guān)工作分析7到255之間,在此操作中二值化的閾值由0開始遞增最大為255,在閾值上升的過程中記錄下那些變化不大或是沒有變化的連通型區(qū)域,這樣合并后的區(qū)域就是MSER區(qū)域。利用MSER的特點(diǎn)進(jìn)行文本區(qū)域定位時(shí),能夠?qū)⑽谋颈尘皥D....


圖2.3FCN網(wǎng)絡(luò)結(jié)構(gòu)

圖2.3FCN網(wǎng)絡(luò)結(jié)構(gòu)

南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第二章定位與識(shí)別相關(guān)工作分析8FCN在CNN的基礎(chǔ)上,將CNN的最后的全連接層換成了卷積層,從而保證輸入圖像后輸出已經(jīng)標(biāo)簽好的輸出圖片,實(shí)現(xiàn)了end-to-end的直接分割。這樣既保留了原始像素空間反映出來(lái)的特征還同時(shí)獲得了整體的像素空間反映....


圖2.4RPN流程

圖2.4RPN流程

動(dòng)到特征圖像的某一位置時(shí),滑動(dòng)窗口的中心點(diǎn)所在的特征圖像的位置正好與原始輸入文本圖像矩陣的其中某部分子矩陣形成映射。其中原始圖像當(dāng)前區(qū)域以中心點(diǎn)為基準(zhǔn)生成k個(gè)候選文本框,k是候選框參數(shù)表示候選框數(shù)目,大小視實(shí)際場(chǎng)景而定。其這些候選框的面積大小不同,邊長(zhǎng)也有區(qū)別,但都是規(guī)整的矩形框....



本文編號(hào):3923125

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3923125.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3fef0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com