印刷體數(shù)學(xué)公式識別關(guān)鍵問題研究
本文關(guān)鍵詞: 公式識別 粘連符號 公式切分 卷積神經(jīng)網(wǎng)絡(luò) 深度學(xué)習(xí) 出處:《沈陽工業(yè)大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:印刷體數(shù)學(xué)公式識別是指將以圖像方式輸入的數(shù)學(xué)公式轉(zhuǎn)化為可編輯的符號,從而實現(xiàn)公式的重用。目前,主流的OCR系統(tǒng)對普通文本的識別已達到較高水平,但在數(shù)學(xué)公式的識別方面還不理想,其中由于數(shù)學(xué)公式復(fù)雜的二維結(jié)構(gòu)所導(dǎo)致的多種符號粘連以及數(shù)學(xué)符號種類、字體、大小的多樣性是影響識別率的主要因素,需要更為有效的粘連符號切分和識別方法,從而提高數(shù)學(xué)公式整體的識別質(zhì)量。論文首先對印刷體數(shù)學(xué)公式識別系統(tǒng)的構(gòu)成及關(guān)鍵技術(shù)、識別中的難點進行介紹和討論。其次,對數(shù)學(xué)公式粘連符號的切分方法進行了深入研究。針對普遍存在也更為復(fù)雜的斜體粘連問題,提出了基于優(yōu)選路徑評估的切分算法。該方法首先找到可能的粘連位置,利用特征因子對可能的粘連處切分線進行兩步綜合評估,選出性能良好的切分線,再針對不同粘連方向構(gòu)建相應(yīng)的組合折線切分路徑,完成最終的圖像切分。該方法提高了切分路徑預(yù)測的準(zhǔn)確性,有效地避免了切分對正常筆畫的破壞。此外,應(yīng)用深度學(xué)習(xí)理論中的卷積神經(jīng)網(wǎng)絡(luò)模型進行公式符號的識別,構(gòu)建了識別公式字符的卷積神經(jīng)網(wǎng)絡(luò),并通過實驗優(yōu)化網(wǎng)絡(luò)參數(shù)。該卷積神經(jīng)網(wǎng)絡(luò)具有2個交替的卷積層與采樣層,卷積層與采樣窗口大小分別為5×5和2×2大小,選擇線性矯正單元作為激活函數(shù),并在網(wǎng)絡(luò)的連接中使用了Dropout連接方式。通過大量的學(xué)習(xí)訓(xùn)練實現(xiàn)數(shù)學(xué)符號模式特征的自動提取并分類,從而解決現(xiàn)存方法中人工提取特征的不足,提高數(shù)學(xué)公式符號識別的準(zhǔn)確性。為了驗證方法的有效性,本文在Visual Studio 2010環(huán)境下,使用C++語言并結(jié)合OpenCV技術(shù)編程實現(xiàn)了基于優(yōu)選評估的切分算法,用Keras框架搭建了面向公式識別的卷積神經(jīng)網(wǎng)絡(luò)。通過實驗對比,本文所提出的切分方法準(zhǔn)確率可達到90.14%,水平粘連符號切分準(zhǔn)確率可達到85.60%。在識別測試中,神經(jīng)網(wǎng)絡(luò)對普通的公式字符集進行識別,識別率為97.46%,對經(jīng)過切分處理前后的公式字符集進行識別,識別率分別為88.24%和97.29%。
[Abstract]:Print mathematical formula recognition is to convert the mathematical formula input by image into an editable symbol, so as to realize the reuse of the formula. At present, the mainstream OCR system has achieved a higher level of recognition of ordinary text. However, the recognition of mathematical formulas is not ideal, among which the diversity of mathematical symbols, typeface and size are the main factors that affect the recognition rate, which are caused by the complex two-dimensional structure of mathematical formulas, such as the adhesion of various symbols, the variety of mathematical symbols, the type of fonts and the size of mathematical symbols. In order to improve the recognition quality of mathematical formula, the paper first introduces and discusses the structure and key technology of printed mathematical formula recognition system, and the difficulties in recognition. In this paper, the segmentation method of mathematical formula adhesion symbol is deeply studied. Aiming at the problem of italic adhesion, a segmentation algorithm based on optimal path evaluation is proposed. The possible adhesion location is first found by this method. Using the characteristic factors to evaluate the possible splicing lines of adhesion in two steps, the segmentation lines with good performance are selected, and the corresponding combined broken line segmentation paths are constructed according to the different adhesion directions. The final image segmentation is completed. The method improves the accuracy of segmentation path prediction and effectively avoids the damage of segmentation to the normal stroke. In addition, the convolution neural network model in depth learning theory is used to recognize the formula symbols. A convolution neural network for recognizing formula characters is constructed, and the network parameters are optimized by experiments. The neural network has two alternating convolution layers and sampling layers. The size of the convolution layer and the sampling window are 5 脳 5 and 2 脳 2, respectively. The linear correction unit is chosen as the activation function, and the Dropout connection mode is used in the connection of the network. Through a lot of learning and training, the feature of mathematical symbol pattern can be automatically extracted and classified. In order to solve the problem of artificial feature extraction and improve the accuracy of mathematical formula symbol recognition, in order to verify the validity of the method, this paper is based on the Visual Studio 2010 environment. The segmentation algorithm based on optimal selection and evaluation is realized by using C language and OpenCV technology, and the convolution neural network oriented to formula recognition is built with Keras framework. The accuracy of the segmentation method proposed in this paper can reach 90.14, and the accuracy of horizontal adhesion symbol segmentation can reach 85.60. In the recognition test, the neural network can recognize the common formula character set. The recognition rate is 97.46 and the recognition rate of the formula character set before and after segmentation is 88.24% and 97.29 respectively.
【學(xué)位授予單位】:沈陽工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP183;TP391.4
【相似文獻】
相關(guān)期刊論文 前10條
1 王衛(wèi)華;;隨意輸入復(fù)雜數(shù)學(xué)公式[J];電腦迷;2009年17期
2 羅德智;全屏幕數(shù)學(xué)公式編排軟件初探[J];小型微型計算機系統(tǒng);1989年06期
3 文合平;數(shù)學(xué)公式的計算機表達[J];現(xiàn)代教育技術(shù);2003年02期
4 肖建于;洪留榮;胡智文;;基于模糊理論的數(shù)學(xué)公式上下標(biāo)關(guān)系判別[J];計算機工程與設(shè)計;2008年04期
5 郝保水;;Equation Chapter 1 Section 1聯(lián)機手寫數(shù)學(xué)公式識別技術(shù)[J];大眾科技;2011年06期
6 郝保水;;聯(lián)機手寫數(shù)學(xué)公式識別技術(shù)[J];大眾科技;2011年09期
7 馬鴻鍵;李文釗;陳俏;;網(wǎng)絡(luò)化教學(xué)中數(shù)學(xué)公式輸入的簡便實現(xiàn)[J];電腦知識與技術(shù);2013年16期
8 王可勝;;透鏡數(shù)學(xué)公式設(shè)計法問世[J];儀器制造;1984年01期
9 張曉東;;數(shù)學(xué)公式編排軟件的結(jié)構(gòu)與實現(xiàn)[J];計算機應(yīng)用與軟件;1988年03期
10 羅亮生;;數(shù)學(xué)公式編排中的美學(xué)原則[J];編輯之友;1989年04期
相關(guān)會議論文 前3條
1 靳簡明;江紅英;;印刷體數(shù)學(xué)公式處理研究現(xiàn)狀[A];2001年中國智能自動化會議論文集(上冊)[C];2001年
2 肖敏;黃磊;劉迎建;;數(shù)學(xué)公式識別系統(tǒng)[A];第八屆全國漢字識別學(xué)術(shù)會議論文集[C];2002年
3 王慶林;周東華;劉文;;Croos下垂問題的數(shù)學(xué)模型及驗證[A];1996中國控制與決策學(xué)術(shù)年會論文集[C];1996年
相關(guān)重要報紙文章 前10條
1 許中銀;編輯數(shù)學(xué)試卷的 小技巧[N];中國電腦教育報;2004年
2 張清;數(shù)學(xué)公式輸入不求人[N];中國電腦教育報;2002年
3 楊振中;漢王發(fā)布手寫公式[N];電子資訊時報;2006年
4 張亞君;如何實現(xiàn)公式顏色的更改[N];中國電腦教育報;2007年
5 山東 呂立霞;一步一步學(xué)數(shù)學(xué)公式的輸入[N];電腦報;2005年
6 李剛;在WPSOffice2003中編輯數(shù)學(xué)試卷的小技巧[N];江蘇經(jīng)濟報;2004年
7 江山;漢王發(fā)布手寫公式[N];中華工商時報;2006年
8 特派記者 彭瑞球;用數(shù)學(xué)公式開解時裝[N];21世紀(jì)經(jīng)濟報道;2013年
9 楊建鄴;數(shù)學(xué)公式還會嚇跑人嗎?[N];中國圖書商報;2006年
10 特約記者 王握文 本報通訊員 徐莎 本報記者 唐先武;數(shù)學(xué)的威力有多大?[N];科技日報;2012年
相關(guān)博士學(xué)位論文 前2條
1 李峰;英文科技文檔中數(shù)學(xué)公式的定位、識別與重建[D];大連理工大學(xué);2007年
2 蘇偉;基于Web的數(shù)學(xué)公式輸入及可訪問性關(guān)鍵問題研究[D];蘭州大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 徐偉欣;面向檢索的Word文檔數(shù)學(xué)公式提取方法[D];河北大學(xué);2015年
2 徐月霞;面向語義的數(shù)學(xué)公式N-grams索引結(jié)構(gòu)研究[D];蘭州大學(xué);2015年
3 程銘;數(shù)學(xué)公式的線性輸入方法研究[D];蘭州大學(xué);2015年
4 白華;數(shù)學(xué)公式讀法歧義性研究[D];蘭州大學(xué);2016年
5 郭俊楠;MathML格式數(shù)學(xué)公式查重檢測算法研究[D];渤海大學(xué);2016年
6 洪賽;數(shù)學(xué)公式搜索的功能分類研究[D];蘭州大學(xué);2016年
7 王宇;文本中數(shù)學(xué)公式定位與識別算法研究與實現(xiàn)[D];北京交通大學(xué);2016年
8 張虹揚;在線手寫體數(shù)學(xué)公式的分割與識別算法研究[D];電子科技大學(xué);2016年
9 彭玉南;多特征融合的數(shù)學(xué)公式字符識別技術(shù)研究[D];華中師范大學(xué);2016年
10 陳凱燕;中文文檔圖像的數(shù)學(xué)公式定位[D];華中師范大學(xué);2016年
,本文編號:1530283
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1530283.html