基于深度學(xué)習(xí)的發(fā)票識(shí)別研究
【文章頁(yè)數(shù)】:64 頁(yè)
【部分圖文】:
圖1.1發(fā)票圖像
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第一章緒論1第一章緒論課題的研究背景及意義在日常生活中,我們會(huì)在多個(gè)場(chǎng)合使用到增值稅發(fā)票,對(duì)于一般納稅人都可合理合法使用它進(jìn)行經(jīng)濟(jì)活動(dòng)。對(duì)比普通稅收類別的發(fā)票,增值稅發(fā)票對(duì)稅金扣稅的項(xiàng)目標(biāo)明也更加的清晰,所以可以成為記錄銷貨方納稅和購(gòu)貨方進(jìn)稅....
圖2.2基于MSER的發(fā)票定位效果
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第二章定位與識(shí)別相關(guān)工作分析7到255之間,在此操作中二值化的閾值由0開始遞增最大為255,在閾值上升的過程中記錄下那些變化不大或是沒有變化的連通型區(qū)域,這樣合并后的區(qū)域就是MSER區(qū)域。利用MSER的特點(diǎn)進(jìn)行文本區(qū)域定位時(shí),能夠?qū)⑽谋颈尘皥D....
圖2.3FCN網(wǎng)絡(luò)結(jié)構(gòu)
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第二章定位與識(shí)別相關(guān)工作分析8FCN在CNN的基礎(chǔ)上,將CNN的最后的全連接層換成了卷積層,從而保證輸入圖像后輸出已經(jīng)標(biāo)簽好的輸出圖片,實(shí)現(xiàn)了end-to-end的直接分割。這樣既保留了原始像素空間反映出來(lái)的特征還同時(shí)獲得了整體的像素空間反映....
圖2.4RPN流程
動(dòng)到特征圖像的某一位置時(shí),滑動(dòng)窗口的中心點(diǎn)所在的特征圖像的位置正好與原始輸入文本圖像矩陣的其中某部分子矩陣形成映射。其中原始圖像當(dāng)前區(qū)域以中心點(diǎn)為基準(zhǔn)生成k個(gè)候選文本框,k是候選框參數(shù)表示候選框數(shù)目,大小視實(shí)際場(chǎng)景而定。其這些候選框的面積大小不同,邊長(zhǎng)也有區(qū)別,但都是規(guī)整的矩形框....
本文編號(hào):3923125
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3923125.html