工程圖紙的關(guān)鍵信息智能提取技術(shù)
發(fā)布時間:2021-11-24 11:51
隨著制圖軟件的廣泛應(yīng)用,面對逐漸積累的大量工程圖紙,如何快速對現(xiàn)有圖紙進行信息提取和檢索查詢,已成為迫切需要解決的問題。目前主要是通過人工比對的方式對數(shù)據(jù)庫中的圖紙進行查找,流程繁瑣同時效率較低。因此快速提取工程圖紙中的關(guān)鍵信息并建立圖紙信息數(shù)據(jù)庫和相似圖紙查找系統(tǒng),將大大提高工程圖紙的管理效率。以此為背景,本文研究了利用人工智能技術(shù),快速自動提取工程圖紙中關(guān)鍵信息的技術(shù),主要對工程圖紙中的標(biāo)題欄信息以及標(biāo)注尺寸信息進行了提取,建立圖紙信息數(shù)據(jù)庫,設(shè)計了一套信息提取與查詢系統(tǒng)。本文主要的研究工作如下:首先,本文對工程圖紙的標(biāo)題欄信息提取方法進行了研究。主要涉及到文字區(qū)域定位與文字識別兩方面。鑒于表格標(biāo)題欄格式較為固定,利用切分表格單元格的形式對關(guān)鍵信息進行了定位分析;诰矸e神經(jīng)網(wǎng)絡(luò)設(shè)計了文字識別模型,實驗表明,文字識別率相比傳統(tǒng)文字識別率得到了有效的提升,實現(xiàn)了對標(biāo)題欄信息的自動化提取。其次,考慮到傳統(tǒng)基于特征的標(biāo)注尺寸檢測方法效率較低,同時標(biāo)注信息的提取是字符與圖元相結(jié)合的結(jié)果,所以本文創(chuàng)新性的使用深度學(xué)習(xí)的方法對標(biāo)注尺寸與字符同時進行檢測,通過實驗發(fā)現(xiàn),該方法可以準(zhǔn)確的對標(biāo)注尺寸...
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-4灰度直方圖??Fig.2-4?Gray?histogram??
根據(jù)像素點局部鄰域窗計算像素點閾值,在局部窗內(nèi)計算閾值,有平均值法,高斯??加權(quán)法等,局部二值化方法速度一般較慢。對于圖紙標(biāo)題欄,其灰度直方圖的分布??基本如圖2-4所示,背景與目標(biāo)相差較為明顯,所以在對表格標(biāo)題欄進行二值化時??可以使用OTSU算法,或者使用固定閾值進行二值化。??HEI??a)原始圖??a)?Original?image??b)二值化圖??b)?Binarization?graph??圖2-3圖像二值化??Fig.2-3?Image?binaryzation??70000?-??60000?-??50000?-??in??1??^?40000?-?|??〇??|?30000-??2??20000?-??10000?-?{??0?plBllla??,?1?1?1?—*——-??0?50?100?150?200?250??Grayscale??
對每個窗口采用單字識別模型對其進行識別。可以使用貪心算法或者是非極大??值抑制算法來規(guī)劃最終的識別路徑。這種識別方法存在兩個問題,滑動步長過大容??易造成信息丟失,滑動步長過小計算量太大,所以很難選定一個合適的步長,同時??對單字識別模型的依賴程度較高。??語音識別,手寫識別,文本識別其實都有一個共同的特點,就是需要對時序進??行建模,這就衍生出了序列學(xué)習(xí)[3G,31]。盡管文字行圖像是二維的,但也都是以序列??的形式出現(xiàn),識別過程中通常需要預(yù)測一系列的標(biāo)簽。文字識別也有其上下文的聯(lián)??系,將從左到右的識別類比為時序,則文字識別也可歸類為序列識別。通過端到端??的學(xué)習(xí),無需進行矯正,分割等處理,輸入文本行直接出來預(yù)測結(jié)果,以此提升序??列學(xué)習(xí)的效果,這己經(jīng)成為當(dāng)前研究的熱點;舅悸肥蔷矸e神經(jīng)網(wǎng)絡(luò)??(Convolutional?Neural?Networks,CNN)與循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent?Neural?Network,??RNN)結(jié)合:CNN被廣泛的應(yīng)用于特征提取,得到的特征可以充分的表征目標(biāo),而??RNN即有前饋連接又有反饋連接,決定了其適合處理序列問題。這種混合的文本??字符串識別網(wǎng)絡(luò)突破了以往的文字識別方法,取得了不錯的文字識別效果。??lnPU,image?ConvolutionalsandRelu
【參考文獻】:
期刊論文
[1]基于雅克比稀疏自動編碼機的手寫數(shù)字識別算法[J]. 王慧玲,宋威. 計算機應(yīng)用研究. 2018(12)
[2]一種基于Android平臺的圖像文字識別系統(tǒng)[J]. 趙思寧. 中國科技信息. 2018(02)
[3]基于圖像分塊的局部閾值二值化方法[J]. 張潔玉. 計算機應(yīng)用. 2017(03)
[4]基于特征加權(quán)模糊模板匹配的字符識別[J]. 朱顥東,李紅嬋. 蘭州理工大學(xué)學(xué)報. 2013(01)
[5]工程圖紙字符串及標(biāo)注信息提取[J]. 范帆,關(guān)佶紅. 計算機工程與應(yīng)用. 2012(07)
[6]工程圖紙標(biāo)題欄的自動生成及其信息提取的方法實現(xiàn)[J]. 苗帥,王衛(wèi)東. 計算機應(yīng)用與軟件. 2011(09)
[7]面向工程圖紙離線式表格信息提取與識別方法研究[J]. 董玉德,劉孫,朱長江,杜立,王仁敏,馬云峰. 工程圖學(xué)學(xué)報. 2009(01)
[8]工程圖紙標(biāo)題欄信息自動提取方法的研究[J]. 李賢兵,張應(yīng)中,羅曉芳. 計算機工程與設(shè)計. 2004(11)
[9]機械圖紙掃描圖像尺寸信息提取[J]. 張習(xí)文,歐宗瑛. 機械科學(xué)與技術(shù). 2001(02)
碩士論文
[1]基于OCR技術(shù)的通用證件識別系統(tǒng)[D]. 常參參.南昌大學(xué) 2018
[2]深度卷積神經(jīng)網(wǎng)絡(luò)在OCR問題中的應(yīng)用研究[D]. 汪一文.電子科技大學(xué) 2018
[3]A汽車制造公司供應(yīng)商管理研究[D]. 趙滿生.武漢工程大學(xué) 2016
[4]CAD圖紙文本信息提取與處理技術(shù)研究[D]. 顏立坤.河南工業(yè)大學(xué) 2013
[5]工程圖三維重建中的信息提取與預(yù)處理技術(shù)研究[D]. 石嵐峰.湖南大學(xué) 2006
本文編號:3515917
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-4灰度直方圖??Fig.2-4?Gray?histogram??
根據(jù)像素點局部鄰域窗計算像素點閾值,在局部窗內(nèi)計算閾值,有平均值法,高斯??加權(quán)法等,局部二值化方法速度一般較慢。對于圖紙標(biāo)題欄,其灰度直方圖的分布??基本如圖2-4所示,背景與目標(biāo)相差較為明顯,所以在對表格標(biāo)題欄進行二值化時??可以使用OTSU算法,或者使用固定閾值進行二值化。??HEI??a)原始圖??a)?Original?image??b)二值化圖??b)?Binarization?graph??圖2-3圖像二值化??Fig.2-3?Image?binaryzation??70000?-??60000?-??50000?-??in??1??^?40000?-?|??〇??|?30000-??2??20000?-??10000?-?{??0?plBllla??,?1?1?1?—*——-??0?50?100?150?200?250??Grayscale??
對每個窗口采用單字識別模型對其進行識別。可以使用貪心算法或者是非極大??值抑制算法來規(guī)劃最終的識別路徑。這種識別方法存在兩個問題,滑動步長過大容??易造成信息丟失,滑動步長過小計算量太大,所以很難選定一個合適的步長,同時??對單字識別模型的依賴程度較高。??語音識別,手寫識別,文本識別其實都有一個共同的特點,就是需要對時序進??行建模,這就衍生出了序列學(xué)習(xí)[3G,31]。盡管文字行圖像是二維的,但也都是以序列??的形式出現(xiàn),識別過程中通常需要預(yù)測一系列的標(biāo)簽。文字識別也有其上下文的聯(lián)??系,將從左到右的識別類比為時序,則文字識別也可歸類為序列識別。通過端到端??的學(xué)習(xí),無需進行矯正,分割等處理,輸入文本行直接出來預(yù)測結(jié)果,以此提升序??列學(xué)習(xí)的效果,這己經(jīng)成為當(dāng)前研究的熱點;舅悸肥蔷矸e神經(jīng)網(wǎng)絡(luò)??(Convolutional?Neural?Networks,CNN)與循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent?Neural?Network,??RNN)結(jié)合:CNN被廣泛的應(yīng)用于特征提取,得到的特征可以充分的表征目標(biāo),而??RNN即有前饋連接又有反饋連接,決定了其適合處理序列問題。這種混合的文本??字符串識別網(wǎng)絡(luò)突破了以往的文字識別方法,取得了不錯的文字識別效果。??lnPU,image?ConvolutionalsandRelu
【參考文獻】:
期刊論文
[1]基于雅克比稀疏自動編碼機的手寫數(shù)字識別算法[J]. 王慧玲,宋威. 計算機應(yīng)用研究. 2018(12)
[2]一種基于Android平臺的圖像文字識別系統(tǒng)[J]. 趙思寧. 中國科技信息. 2018(02)
[3]基于圖像分塊的局部閾值二值化方法[J]. 張潔玉. 計算機應(yīng)用. 2017(03)
[4]基于特征加權(quán)模糊模板匹配的字符識別[J]. 朱顥東,李紅嬋. 蘭州理工大學(xué)學(xué)報. 2013(01)
[5]工程圖紙字符串及標(biāo)注信息提取[J]. 范帆,關(guān)佶紅. 計算機工程與應(yīng)用. 2012(07)
[6]工程圖紙標(biāo)題欄的自動生成及其信息提取的方法實現(xiàn)[J]. 苗帥,王衛(wèi)東. 計算機應(yīng)用與軟件. 2011(09)
[7]面向工程圖紙離線式表格信息提取與識別方法研究[J]. 董玉德,劉孫,朱長江,杜立,王仁敏,馬云峰. 工程圖學(xué)學(xué)報. 2009(01)
[8]工程圖紙標(biāo)題欄信息自動提取方法的研究[J]. 李賢兵,張應(yīng)中,羅曉芳. 計算機工程與設(shè)計. 2004(11)
[9]機械圖紙掃描圖像尺寸信息提取[J]. 張習(xí)文,歐宗瑛. 機械科學(xué)與技術(shù). 2001(02)
碩士論文
[1]基于OCR技術(shù)的通用證件識別系統(tǒng)[D]. 常參參.南昌大學(xué) 2018
[2]深度卷積神經(jīng)網(wǎng)絡(luò)在OCR問題中的應(yīng)用研究[D]. 汪一文.電子科技大學(xué) 2018
[3]A汽車制造公司供應(yīng)商管理研究[D]. 趙滿生.武漢工程大學(xué) 2016
[4]CAD圖紙文本信息提取與處理技術(shù)研究[D]. 顏立坤.河南工業(yè)大學(xué) 2013
[5]工程圖三維重建中的信息提取與預(yù)處理技術(shù)研究[D]. 石嵐峰.湖南大學(xué) 2006
本文編號:3515917
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3515917.html
最近更新
教材專著