基于編碼器—解碼器和注意力機(jī)制神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)公式識別方法
發(fā)布時間:2021-03-11 14:31
數(shù)學(xué)公式識別是紙質(zhì)文獻(xiàn)進(jìn)行電子化轉(zhuǎn)錄領(lǐng)域的一項(xiàng)關(guān)鍵技術(shù),同時隨著近年來觸摸設(shè)備的普及,在線手寫體數(shù)學(xué)公式識別技術(shù)也變得越發(fā)重要,該技術(shù)的發(fā)展可以促進(jìn)一種新型的人機(jī)交互方式,尤其在數(shù)字化教學(xué)、數(shù)學(xué)文檔撰寫等領(lǐng)域?qū)順O大的便利。數(shù)學(xué)公式識別問題屬于光學(xué)字符識別的一種,但又有其自身的特殊性。數(shù)學(xué)公式識別問題的特殊性體現(xiàn)在:公式中存在大量書寫歧義、字符歧義、分割歧義以及結(jié)構(gòu)歧義等難點(diǎn)。這些難點(diǎn)使得該問題存在諸多的挑戰(zhàn),因此并不能使用傳統(tǒng)光學(xué)字符識別技術(shù)來解決該問題。根據(jù)數(shù)學(xué)公式的表示格式來劃分的話,可以分為印刷體和書寫體兩種。手寫體公式會引入更多歧義,因此相對印刷體公式來說識別也更加困難,本文將主要研究手寫體數(shù)學(xué)公式識別問題。根據(jù)是否是實(shí)時數(shù)據(jù)來劃分的話,手寫體數(shù)學(xué)公式又可以分為在線的和離線的。所謂在線指的是公式被表示為動態(tài)軌跡坐標(biāo)信息;所謂離線指的是公式被表示為靜態(tài)圖片像素信息;當(dāng)然根據(jù)動態(tài)軌跡信息可以得到靜態(tài)圖片信息,反之則不然。由于近來便攜式電子觸摸設(shè)備的流行,使得在線數(shù)學(xué)公式識別問題受到研究者越來越多的重視,因此本文的研究重點(diǎn)是在線手寫體數(shù)學(xué)公式識別問題,并且本文將采用在線手寫體數(shù)學(xué)...
【文章來源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1數(shù)學(xué)公式語法樹??
圖1.2句號上下文敏感??
編碼器一解碼器映射為統(tǒng)一語義空間
本文編號:3076615
【文章來源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1數(shù)學(xué)公式語法樹??
圖1.2句號上下文敏感??
編碼器一解碼器映射為統(tǒng)一語義空間
本文編號:3076615
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3076615.html
最近更新
教材專著