天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

工程圖紙的關鍵信息智能提取技術

發(fā)布時間:2021-11-24 11:51
  隨著制圖軟件的廣泛應用,面對逐漸積累的大量工程圖紙,如何快速對現(xiàn)有圖紙進行信息提取和檢索查詢,已成為迫切需要解決的問題。目前主要是通過人工比對的方式對數(shù)據(jù)庫中的圖紙進行查找,流程繁瑣同時效率較低。因此快速提取工程圖紙中的關鍵信息并建立圖紙信息數(shù)據(jù)庫和相似圖紙查找系統(tǒng),將大大提高工程圖紙的管理效率。以此為背景,本文研究了利用人工智能技術,快速自動提取工程圖紙中關鍵信息的技術,主要對工程圖紙中的標題欄信息以及標注尺寸信息進行了提取,建立圖紙信息數(shù)據(jù)庫,設計了一套信息提取與查詢系統(tǒng)。本文主要的研究工作如下:首先,本文對工程圖紙的標題欄信息提取方法進行了研究。主要涉及到文字區(qū)域定位與文字識別兩方面。鑒于表格標題欄格式較為固定,利用切分表格單元格的形式對關鍵信息進行了定位分析。基于卷積神經(jīng)網(wǎng)絡設計了文字識別模型,實驗表明,文字識別率相比傳統(tǒng)文字識別率得到了有效的提升,實現(xiàn)了對標題欄信息的自動化提取。其次,考慮到傳統(tǒng)基于特征的標注尺寸檢測方法效率較低,同時標注信息的提取是字符與圖元相結合的結果,所以本文創(chuàng)新性的使用深度學習的方法對標注尺寸與字符同時進行檢測,通過實驗發(fā)現(xiàn),該方法可以準確的對標注尺寸... 

【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:73 頁

【學位級別】:碩士

【部分圖文】:

工程圖紙的關鍵信息智能提取技術


圖2-4灰度直方圖??Fig.2-4?Gray?histogram??

圖像二值化


根據(jù)像素點局部鄰域窗計算像素點閾值,在局部窗內(nèi)計算閾值,有平均值法,高斯??加權法等,局部二值化方法速度一般較慢。對于圖紙標題欄,其灰度直方圖的分布??基本如圖2-4所示,背景與目標相差較為明顯,所以在對表格標題欄進行二值化時??可以使用OTSU算法,或者使用固定閾值進行二值化。??HEI??a)原始圖??a)?Original?image??b)二值化圖??b)?Binarization?graph??圖2-3圖像二值化??Fig.2-3?Image?binaryzation??70000?-??60000?-??50000?-??in??1??^?40000?-?|??〇??|?30000-??2??20000?-??10000?-?{??0?plBllla??,?1?1?1?—*——-??0?50?100?150?200?250??Grayscale??

序列,神經(jīng)網(wǎng)絡,文字識別,單字識別


對每個窗口采用單字識別模型對其進行識別。可以使用貪心算法或者是非極大??值抑制算法來規(guī)劃最終的識別路徑。這種識別方法存在兩個問題,滑動步長過大容??易造成信息丟失,滑動步長過小計算量太大,所以很難選定一個合適的步長,同時??對單字識別模型的依賴程度較高。??語音識別,手寫識別,文本識別其實都有一個共同的特點,就是需要對時序進??行建模,這就衍生出了序列學習[3G,31]。盡管文字行圖像是二維的,但也都是以序列??的形式出現(xiàn),識別過程中通常需要預測一系列的標簽。文字識別也有其上下文的聯(lián)??系,將從左到右的識別類比為時序,則文字識別也可歸類為序列識別。通過端到端??的學習,無需進行矯正,分割等處理,輸入文本行直接出來預測結果,以此提升序??列學習的效果,這己經(jīng)成為當前研究的熱點;舅悸肥蔷矸e神經(jīng)網(wǎng)絡??(Convolutional?Neural?Networks,CNN)與循環(huán)神經(jīng)網(wǎng)絡(Recurrent?Neural?Network,??RNN)結合:CNN被廣泛的應用于特征提取,得到的特征可以充分的表征目標,而??RNN即有前饋連接又有反饋連接,決定了其適合處理序列問題。這種混合的文本??字符串識別網(wǎng)絡突破了以往的文字識別方法,取得了不錯的文字識別效果。??lnPU,image?ConvolutionalsandRelu

【參考文獻】:
期刊論文
[1]基于雅克比稀疏自動編碼機的手寫數(shù)字識別算法[J]. 王慧玲,宋威.  計算機應用研究. 2018(12)
[2]一種基于Android平臺的圖像文字識別系統(tǒng)[J]. 趙思寧.  中國科技信息. 2018(02)
[3]基于圖像分塊的局部閾值二值化方法[J]. 張潔玉.  計算機應用. 2017(03)
[4]基于特征加權模糊模板匹配的字符識別[J]. 朱顥東,李紅嬋.  蘭州理工大學學報. 2013(01)
[5]工程圖紙字符串及標注信息提取[J]. 范帆,關佶紅.  計算機工程與應用. 2012(07)
[6]工程圖紙標題欄的自動生成及其信息提取的方法實現(xiàn)[J]. 苗帥,王衛(wèi)東.  計算機應用與軟件. 2011(09)
[7]面向工程圖紙離線式表格信息提取與識別方法研究[J]. 董玉德,劉孫,朱長江,杜立,王仁敏,馬云峰.  工程圖學學報. 2009(01)
[8]工程圖紙標題欄信息自動提取方法的研究[J]. 李賢兵,張應中,羅曉芳.  計算機工程與設計. 2004(11)
[9]機械圖紙掃描圖像尺寸信息提取[J]. 張習文,歐宗瑛.  機械科學與技術. 2001(02)

碩士論文
[1]基于OCR技術的通用證件識別系統(tǒng)[D]. 常參參.南昌大學 2018
[2]深度卷積神經(jīng)網(wǎng)絡在OCR問題中的應用研究[D]. 汪一文.電子科技大學 2018
[3]A汽車制造公司供應商管理研究[D]. 趙滿生.武漢工程大學 2016
[4]CAD圖紙文本信息提取與處理技術研究[D]. 顏立坤.河南工業(yè)大學 2013
[5]工程圖三維重建中的信息提取與預處理技術研究[D]. 石嵐峰.湖南大學 2006



本文編號:3515917

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3515917.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶e5d76***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com