基于深度卷積神經(jīng)網(wǎng)絡(luò)的水表讀數(shù)識別
發(fā)布時間:2021-04-10 21:20
如今社會上仍存在許多老式水表需要人工抄讀,但僅依靠人工抄讀與檢測水表讀數(shù)的方式需要消耗大量的時間和精力。為解決這一問題,利用計算機視覺技術(shù)對水表讀數(shù)進行自動識別可以有效得解決這一問題。然而在現(xiàn)實中水表大多位于陰暗潮濕等各種復(fù)雜的環(huán)境下,所以所采集到的水表圖像會存在多種問題:一為水表表盤自身問題,如表盤污損嚴(yán)重;二為人工采集問題,如人工采集時會有相機曝光、拍攝角度多樣、表盤方向多樣等問題。因此如果使用傳統(tǒng)的圖像識別方法會出現(xiàn)水表讀數(shù)識別的識別準(zhǔn)確率不夠高,且速度較低的問題。但隨著機器硬件的發(fā)展,利用深度學(xué)習(xí)的方法對水表讀數(shù)進行檢測與識別成為一種有效的解決方案。論文旨在研究基于深度學(xué)習(xí)的目標(biāo)檢測算法對水表讀數(shù)進行檢測與識別,主要工作包括:1.自制了實際情況拍攝下的包含各種復(fù)雜情況的水表讀數(shù)圖像數(shù)據(jù)集。并整理了真實情況下采集的水表讀數(shù),可能存在的問題如:表盤污損、圖片模糊未對焦、存在光斑、表盤方向多樣等,可以用于檢測與識別模型的訓(xùn)練,提高其魯棒性;為了有利于檢測識別工作,針對水表讀數(shù)圖像設(shè)計了一套標(biāo)注規(guī)則。2.針對各種復(fù)雜環(huán)境下的人工任意角度拍攝的水表讀數(shù)圖片,本文提出了一種魯棒性強的自動識...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
傳統(tǒng)水表檢測流程
重慶郵電大學(xué)碩士學(xué)位論文第2章基于深度卷積神經(jīng)網(wǎng)絡(luò)的水表讀數(shù)識別相關(guān)理論7第2章基于深度卷積神經(jīng)網(wǎng)絡(luò)的水表讀數(shù)識別相關(guān)理論2.1卷積神經(jīng)網(wǎng)絡(luò)隨著近年來深度學(xué)習(xí)方面的重大突破,把卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetworks,CNN)[25-27]應(yīng)用于計算機視覺方面,對圖像識別方面的問題取得了巨大的進展。卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)可以說是一個多層感知機的變種,神經(jīng)認(rèn)知機可以將視覺模式分解成多個子模塊(特征)。卷積神經(jīng)網(wǎng)絡(luò)可以在訓(xùn)練過程中自動地抽取特征并不斷提高特征提取能力,由此解決了傳統(tǒng)識別方法需要手工設(shè)計特征的問題。且在處理圖像問題時,特別是識別位移、縮放及其他形式扭曲不變性的應(yīng)用上具有良好的魯棒性和運算效率等。其優(yōu)點在于局部連接和權(quán)值共享。卷積神經(jīng)網(wǎng)絡(luò)一般可以由輸入層、卷積層、池化層、全連接層以及最后的損失函數(shù)輸出層來組成,圖像輸入卷積神經(jīng)網(wǎng)絡(luò)后會先經(jīng)過卷積層,而卷積層的主要作用使對特征進行提取和融合從而產(chǎn)生特征圖,再把卷積層的輸出作為輸入放入池化層。其中卷積層的輸入為特征圖像然后利用卷積核進行計算,再利用激活函數(shù)輸出卷積層的特征圖,而池化層作用為壓縮特征譜圖,它能夠使特征圖變小,降低網(wǎng)絡(luò)計算的復(fù)雜度;并對特征進行壓縮,提取主要特征。最后再把輸出結(jié)果輸入全連接層,全連接層的主要工作是連接所有特征,將輸出值送給最后的損失函數(shù)輸出層。其結(jié)構(gòu)如圖2.1所示。圖2.1簡單卷積神經(jīng)網(wǎng)絡(luò)
重慶郵電大學(xué)碩士學(xué)位論文第2章基于深度卷積神經(jīng)網(wǎng)絡(luò)的水表讀數(shù)識別相關(guān)理論82.1.1卷積神經(jīng)網(wǎng)絡(luò)基本模塊1.卷積層深度卷積神經(jīng)網(wǎng)絡(luò)一般包含多個卷積層(ConvolutionalLayer),而卷積層又由若干個卷積核(Convolutionalkernel)構(gòu)成。在做卷積運算時,會設(shè)定一個hwkk*大小的卷積核,而這個卷積核的大小則稱之為感受野。卷積核的深度d和輸入層的深度d要保持一致,所以一般會有大小為d**hwkk的卷積核。在進行卷積運算時,有時候輸入的矩陣和卷積核的寬度和高度是不一樣的,且輸出矩陣的大小再經(jīng)過卷積運算后相比較于輸入可能變校所以可以在輸入矩陣的周圍填充零,此稱為padding,大小為p。同時進行卷積運算時,卷積核需要在輸入矩陣上移動,進行點積運算,其移動的步長為stride,稱為步幅s。所以假設(shè)輸入矩陣的寬度為wn、高度為hn時,輸出矩陣的大小如公式2.1所示:1212spknspknhhww(2.1)2.池化層池化層(PoolingLayer)同卷積層一樣取一個固定形狀的窗口對輸入數(shù)據(jù)進行計算。其主要作用使對特征譜圖進行壓縮,使從卷積層提取的特征圖變小,簡化網(wǎng)絡(luò)計算復(fù)雜度,同時進行特征壓縮把主要特征提取出來。如今池化操作有兩種平均池化(AveragePooling)和最大池化(MaxPooling)。其中最大池化使用最為廣泛,最大池化首先會讓池化窗口從輸入矩陣的最左上方開始,依次按從左往右、從上往下的順序在輸入矩陣上滑動。當(dāng)池化窗口滑動到某一位置時,窗口中的輸入矩陣的最大值即輸出矩陣中相應(yīng)位置的元素。最大池化運算過程如下圖2.2所示:圖2.2最大池化層運算過程
【參考文獻】:
期刊論文
[1]改進特征匹配算法在銀行卡號識別中的應(yīng)用[J]. 董延華,陳中華,宋和燁,黃雨. 吉林大學(xué)學(xué)報(理學(xué)版). 2018(01)
[2]粗糙集和支持向量機的表具識別算法研究[J]. 唐亮,仲元昌,沈甲甲,馬天智. 計算機工程與應(yīng)用. 2018(02)
[3]基于全卷積網(wǎng)絡(luò)的數(shù)字儀表字符識別方法[J]. 蔡夢倩,張蕾,王炎,莫娟. 現(xiàn)代計算機(專業(yè)版). 2018(02)
[4]卷積神經(jīng)網(wǎng)絡(luò)特征重要性分析及增強特征選擇模型[J]. 盧泓宇,張敏,劉奕群,馬少平. 軟件學(xué)報. 2017(11)
[5]基于人工神經(jīng)網(wǎng)絡(luò)的數(shù)字識別[J]. 史興宇,鄧洪敏,林宇鋒,安旭驍. 計算機應(yīng)用. 2017(S1)
[6]利用多種投票策略的水表讀數(shù)字符分割與識別[J]. 林陽,郭丙軒,肖雄武,?瓶,趙欣,李大軍. 科學(xué)技術(shù)與工程. 2017(10)
[7]基于圖像處理的水表智能檢定系統(tǒng)研究[J]. 張寧,郭增軍,李靜. 北京石油化工學(xué)院學(xué)報. 2017(01)
[8]手寫體數(shù)字字符識別算法仿真比較研究[J]. 陳龍,郄小美,黃信靜,林虎. 實驗室研究與探索. 2017(01)
[9]雙半字識別算法在水表字符識別系統(tǒng)中的應(yīng)用[J]. 徐平,許彬,常英杰. 杭州電子科技大學(xué)學(xué)報(自然科學(xué)版). 2016(01)
[10]基于改進Hough變換和BP網(wǎng)絡(luò)的指針儀表識別[J]. 朱海霞. 電測與儀表. 2015(05)
碩士論文
[1]基于機器視覺的嵌入式儀表讀數(shù)識別系統(tǒng)研究[D]. 屠震元.浙江理工大學(xué) 2015
[2]基于圖像識別的表盤讀數(shù)系統(tǒng)研究[D]. 李媛.沈陽工業(yè)大學(xué) 2009
[3]水表表頭數(shù)字讀數(shù)的識別方法研究[D]. 何珣.南京理工大學(xué) 2007
[4]圖像式水表讀數(shù)識別方法研究[D]. 吳夢麟.南京理工大學(xué) 2006
本文編號:3130355
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
傳統(tǒng)水表檢測流程
重慶郵電大學(xué)碩士學(xué)位論文第2章基于深度卷積神經(jīng)網(wǎng)絡(luò)的水表讀數(shù)識別相關(guān)理論7第2章基于深度卷積神經(jīng)網(wǎng)絡(luò)的水表讀數(shù)識別相關(guān)理論2.1卷積神經(jīng)網(wǎng)絡(luò)隨著近年來深度學(xué)習(xí)方面的重大突破,把卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetworks,CNN)[25-27]應(yīng)用于計算機視覺方面,對圖像識別方面的問題取得了巨大的進展。卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)可以說是一個多層感知機的變種,神經(jīng)認(rèn)知機可以將視覺模式分解成多個子模塊(特征)。卷積神經(jīng)網(wǎng)絡(luò)可以在訓(xùn)練過程中自動地抽取特征并不斷提高特征提取能力,由此解決了傳統(tǒng)識別方法需要手工設(shè)計特征的問題。且在處理圖像問題時,特別是識別位移、縮放及其他形式扭曲不變性的應(yīng)用上具有良好的魯棒性和運算效率等。其優(yōu)點在于局部連接和權(quán)值共享。卷積神經(jīng)網(wǎng)絡(luò)一般可以由輸入層、卷積層、池化層、全連接層以及最后的損失函數(shù)輸出層來組成,圖像輸入卷積神經(jīng)網(wǎng)絡(luò)后會先經(jīng)過卷積層,而卷積層的主要作用使對特征進行提取和融合從而產(chǎn)生特征圖,再把卷積層的輸出作為輸入放入池化層。其中卷積層的輸入為特征圖像然后利用卷積核進行計算,再利用激活函數(shù)輸出卷積層的特征圖,而池化層作用為壓縮特征譜圖,它能夠使特征圖變小,降低網(wǎng)絡(luò)計算的復(fù)雜度;并對特征進行壓縮,提取主要特征。最后再把輸出結(jié)果輸入全連接層,全連接層的主要工作是連接所有特征,將輸出值送給最后的損失函數(shù)輸出層。其結(jié)構(gòu)如圖2.1所示。圖2.1簡單卷積神經(jīng)網(wǎng)絡(luò)
重慶郵電大學(xué)碩士學(xué)位論文第2章基于深度卷積神經(jīng)網(wǎng)絡(luò)的水表讀數(shù)識別相關(guān)理論82.1.1卷積神經(jīng)網(wǎng)絡(luò)基本模塊1.卷積層深度卷積神經(jīng)網(wǎng)絡(luò)一般包含多個卷積層(ConvolutionalLayer),而卷積層又由若干個卷積核(Convolutionalkernel)構(gòu)成。在做卷積運算時,會設(shè)定一個hwkk*大小的卷積核,而這個卷積核的大小則稱之為感受野。卷積核的深度d和輸入層的深度d要保持一致,所以一般會有大小為d**hwkk的卷積核。在進行卷積運算時,有時候輸入的矩陣和卷積核的寬度和高度是不一樣的,且輸出矩陣的大小再經(jīng)過卷積運算后相比較于輸入可能變校所以可以在輸入矩陣的周圍填充零,此稱為padding,大小為p。同時進行卷積運算時,卷積核需要在輸入矩陣上移動,進行點積運算,其移動的步長為stride,稱為步幅s。所以假設(shè)輸入矩陣的寬度為wn、高度為hn時,輸出矩陣的大小如公式2.1所示:1212spknspknhhww(2.1)2.池化層池化層(PoolingLayer)同卷積層一樣取一個固定形狀的窗口對輸入數(shù)據(jù)進行計算。其主要作用使對特征譜圖進行壓縮,使從卷積層提取的特征圖變小,簡化網(wǎng)絡(luò)計算復(fù)雜度,同時進行特征壓縮把主要特征提取出來。如今池化操作有兩種平均池化(AveragePooling)和最大池化(MaxPooling)。其中最大池化使用最為廣泛,最大池化首先會讓池化窗口從輸入矩陣的最左上方開始,依次按從左往右、從上往下的順序在輸入矩陣上滑動。當(dāng)池化窗口滑動到某一位置時,窗口中的輸入矩陣的最大值即輸出矩陣中相應(yīng)位置的元素。最大池化運算過程如下圖2.2所示:圖2.2最大池化層運算過程
【參考文獻】:
期刊論文
[1]改進特征匹配算法在銀行卡號識別中的應(yīng)用[J]. 董延華,陳中華,宋和燁,黃雨. 吉林大學(xué)學(xué)報(理學(xué)版). 2018(01)
[2]粗糙集和支持向量機的表具識別算法研究[J]. 唐亮,仲元昌,沈甲甲,馬天智. 計算機工程與應(yīng)用. 2018(02)
[3]基于全卷積網(wǎng)絡(luò)的數(shù)字儀表字符識別方法[J]. 蔡夢倩,張蕾,王炎,莫娟. 現(xiàn)代計算機(專業(yè)版). 2018(02)
[4]卷積神經(jīng)網(wǎng)絡(luò)特征重要性分析及增強特征選擇模型[J]. 盧泓宇,張敏,劉奕群,馬少平. 軟件學(xué)報. 2017(11)
[5]基于人工神經(jīng)網(wǎng)絡(luò)的數(shù)字識別[J]. 史興宇,鄧洪敏,林宇鋒,安旭驍. 計算機應(yīng)用. 2017(S1)
[6]利用多種投票策略的水表讀數(shù)字符分割與識別[J]. 林陽,郭丙軒,肖雄武,?瓶,趙欣,李大軍. 科學(xué)技術(shù)與工程. 2017(10)
[7]基于圖像處理的水表智能檢定系統(tǒng)研究[J]. 張寧,郭增軍,李靜. 北京石油化工學(xué)院學(xué)報. 2017(01)
[8]手寫體數(shù)字字符識別算法仿真比較研究[J]. 陳龍,郄小美,黃信靜,林虎. 實驗室研究與探索. 2017(01)
[9]雙半字識別算法在水表字符識別系統(tǒng)中的應(yīng)用[J]. 徐平,許彬,常英杰. 杭州電子科技大學(xué)學(xué)報(自然科學(xué)版). 2016(01)
[10]基于改進Hough變換和BP網(wǎng)絡(luò)的指針儀表識別[J]. 朱海霞. 電測與儀表. 2015(05)
碩士論文
[1]基于機器視覺的嵌入式儀表讀數(shù)識別系統(tǒng)研究[D]. 屠震元.浙江理工大學(xué) 2015
[2]基于圖像識別的表盤讀數(shù)系統(tǒng)研究[D]. 李媛.沈陽工業(yè)大學(xué) 2009
[3]水表表頭數(shù)字讀數(shù)的識別方法研究[D]. 何珣.南京理工大學(xué) 2007
[4]圖像式水表讀數(shù)識別方法研究[D]. 吳夢麟.南京理工大學(xué) 2006
本文編號:3130355
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3130355.html
最近更新
教材專著