MathML格式數(shù)學(xué)公式查重檢測(cè)算法研究
本文關(guān)鍵詞:MathML格式數(shù)學(xué)公式查重檢測(cè)算法研究
更多相關(guān)文章: MathML 數(shù)學(xué)公式 查重檢測(cè) 結(jié)構(gòu)碼 樹 XML
【摘要】:隨著互聯(lián)網(wǎng)的快速發(fā)展,學(xué)術(shù)研究成果的交流也趨于信息化、網(wǎng)絡(luò)化,資源共享性越來(lái)越高。但隨之而來(lái)的是學(xué)術(shù)抄襲現(xiàn)象日益增多。因此,對(duì)學(xué)術(shù)論文查重檢測(cè)技術(shù)的研究已成為當(dāng)前研究的熱點(diǎn)。目前,對(duì)于純文本內(nèi)容的檢測(cè)研究已經(jīng)取得了很大的進(jìn)展并得到廣泛的應(yīng)用。但對(duì)數(shù)學(xué)公式的查重檢測(cè)技術(shù)的研究尚處于探索階段。由于學(xué)術(shù)論文,特別是理工類學(xué)術(shù)論文,其核心思想都是通過(guò)數(shù)學(xué)公式表示。因此,為了防止學(xué)術(shù)抄襲、剽竊,對(duì)數(shù)學(xué)公式查重檢測(cè)技術(shù)的研究具有十分重要的意義。本文提出了一種MathML格式的數(shù)學(xué)公式查重檢測(cè)算法。首先,根據(jù)MathML的編碼特征在待檢測(cè)文檔中查找數(shù)學(xué)公式,并依據(jù)數(shù)學(xué)公式編碼生成其樹形結(jié)構(gòu)表示,利用規(guī)則庫(kù)和多模式匹配算法對(duì)樹形結(jié)構(gòu)作歸一化處理。然后,先序遍歷樹,對(duì)變量名作歸一化處理,層次遍歷樹,得到樹的結(jié)構(gòu)碼,在公式檢測(cè)庫(kù)中查找表名為該結(jié)構(gòu)碼的數(shù)據(jù)表,若在檢測(cè)庫(kù)中找到表名為該結(jié)構(gòu)碼的數(shù)據(jù)表,則遍歷樹得到其先序遍歷序列和后序遍歷序列。最后,在數(shù)據(jù)表中查找與遍歷序列相同的記錄,若存在這樣的記錄,則顯示包含該數(shù)學(xué)公式的文檔信息。實(shí)驗(yàn)結(jié)果表明,該算法準(zhǔn)確地實(shí)現(xiàn)了MathML格式數(shù)學(xué)公式的查重檢測(cè),不僅可以實(shí)現(xiàn)結(jié)構(gòu)相同的數(shù)學(xué)公式的檢測(cè),對(duì)于語(yǔ)義相同的數(shù)學(xué)公式的檢測(cè)也適用。該算法檢測(cè)速度快,實(shí)用性較強(qiáng)。
【關(guān)鍵詞】:MathML 數(shù)學(xué)公式 查重檢測(cè) 結(jié)構(gòu)碼 樹 XML
【學(xué)位授予單位】:渤海大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41
【目錄】:
- 摘要4-5
- ABSTRACT5-11
- 1 緒論11-15
- 1.1 研究背景與意義11
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-13
- 1.3 論文主要工作及結(jié)構(gòu)13-15
- 2 相關(guān)知識(shí)和技術(shù)15-29
- 2.1 XML語(yǔ)言15
- 2.2 MathML語(yǔ)言15-18
- 2.3 數(shù)學(xué)公式識(shí)別技術(shù)18-19
- 2.3.1 分支定界文本行識(shí)別方法18
- 2.3.2 基于文本行的數(shù)學(xué)公式識(shí)別方法18
- 2.3.3 基于基線結(jié)構(gòu)的數(shù)學(xué)公式識(shí)別方法18-19
- 2.4 數(shù)學(xué)公式檢索技術(shù)19
- 2.4.1 分層索引法19
- 2.4.2 MathWebSearch檢索方法19
- 2.4.3 基于文本的數(shù)學(xué)符號(hào)索引方法19
- 2.5 數(shù)學(xué)公式匹配技術(shù)19-28
- 2.5.1 單模式匹配算法--KMP20-21
- 2.5.2 單模式匹配算法--BM21-23
- 2.5.3 多模式匹配算法--AC23-26
- 2.5.4 多模式匹配算法--SWM26-28
- 2.6 本章小結(jié)28-29
- 3 一種MATHML格式數(shù)學(xué)公式匹配算法29-35
- 3.1 數(shù)學(xué)公式的樹型結(jié)構(gòu)表示29-31
- 3.2 歸一化處理31-32
- 3.3 數(shù)學(xué)公式匹配算法32-33
- 3.4 實(shí)驗(yàn)結(jié)果與分析33-34
- 3.5 本章小結(jié)34-35
- 4 一種XML格式數(shù)學(xué)公式查重檢測(cè)算法35-40
- 4.1 數(shù)學(xué)公式識(shí)別與提取35
- 4.2 數(shù)據(jù)庫(kù)設(shè)計(jì)35-36
- 4.3 復(fù)制檢測(cè)算法36-38
- 4.4 實(shí)驗(yàn)結(jié)果與分析38-39
- 4.5 本章小結(jié)39-40
- 5 總結(jié)與展望40-41
- 參考文獻(xiàn)41-46
- 發(fā)表論文情況46-47
- 致謝47-48
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王衛(wèi)華;;隨意輸入復(fù)雜數(shù)學(xué)公式[J];電腦迷;2009年17期
2 羅德智;全屏幕數(shù)學(xué)公式編排軟件初探[J];小型微型計(jì)算機(jī)系統(tǒng);1989年06期
3 文合平;數(shù)學(xué)公式的計(jì)算機(jī)表達(dá)[J];現(xiàn)代教育技術(shù);2003年02期
4 肖建于;洪留榮;胡智文;;基于模糊理論的數(shù)學(xué)公式上下標(biāo)關(guān)系判別[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年04期
5 郝保水;;Equation Chapter 1 Section 1聯(lián)機(jī)手寫數(shù)學(xué)公式識(shí)別技術(shù)[J];大眾科技;2011年06期
6 郝保水;;聯(lián)機(jī)手寫數(shù)學(xué)公式識(shí)別技術(shù)[J];大眾科技;2011年09期
7 馬鴻鍵;李文釗;陳俏;;網(wǎng)絡(luò)化教學(xué)中數(shù)學(xué)公式輸入的簡(jiǎn)便實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2013年16期
8 王可勝;;透鏡數(shù)學(xué)公式設(shè)計(jì)法問(wèn)世[J];儀器制造;1984年01期
9 張曉東;;數(shù)學(xué)公式編排軟件的結(jié)構(gòu)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用與軟件;1988年03期
10 羅亮生;;數(shù)學(xué)公式編排中的美學(xué)原則[J];編輯之友;1989年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 靳簡(jiǎn)明;江紅英;;印刷體數(shù)學(xué)公式處理研究現(xiàn)狀[A];2001年中國(guó)智能自動(dòng)化會(huì)議論文集(上冊(cè))[C];2001年
2 肖敏;黃磊;劉迎建;;數(shù)學(xué)公式識(shí)別系統(tǒng)[A];第八屆全國(guó)漢字識(shí)別學(xué)術(shù)會(huì)議論文集[C];2002年
3 王慶林;周東華;劉文;;Croos下垂問(wèn)題的數(shù)學(xué)模型及驗(yàn)證[A];1996中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];1996年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 許中銀;編輯數(shù)學(xué)試卷的 小技巧[N];中國(guó)電腦教育報(bào);2004年
2 張清;數(shù)學(xué)公式輸入不求人[N];中國(guó)電腦教育報(bào);2002年
3 楊振中;漢王發(fā)布手寫公式[N];電子資訊時(shí)報(bào);2006年
4 張亞君;如何實(shí)現(xiàn)公式顏色的更改[N];中國(guó)電腦教育報(bào);2007年
5 山東 呂立霞;一步一步學(xué)數(shù)學(xué)公式的輸入[N];電腦報(bào);2005年
6 李剛;在WPSOffice2003中編輯數(shù)學(xué)試卷的小技巧[N];江蘇經(jīng)濟(jì)報(bào);2004年
7 江山;漢王發(fā)布手寫公式[N];中華工商時(shí)報(bào);2006年
8 特派記者 彭瑞球;用數(shù)學(xué)公式開解時(shí)裝[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2013年
9 楊建鄴;數(shù)學(xué)公式還會(huì)嚇跑人嗎?[N];中國(guó)圖書商報(bào);2006年
10 特約記者 王握文 本報(bào)通訊員 徐莎 本報(bào)記者 唐先武;數(shù)學(xué)的威力有多大?[N];科技日?qǐng)?bào);2012年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 李峰;英文科技文檔中數(shù)學(xué)公式的定位、識(shí)別與重建[D];大連理工大學(xué);2007年
2 蘇偉;基于Web的數(shù)學(xué)公式輸入及可訪問(wèn)性關(guān)鍵問(wèn)題研究[D];蘭州大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 徐偉欣;面向檢索的Word文檔數(shù)學(xué)公式提取方法[D];河北大學(xué);2015年
2 徐月霞;面向語(yǔ)義的數(shù)學(xué)公式N-grams索引結(jié)構(gòu)研究[D];蘭州大學(xué);2015年
3 程銘;數(shù)學(xué)公式的線性輸入方法研究[D];蘭州大學(xué);2015年
4 王琪輝;基于深度學(xué)習(xí)的印刷體數(shù)學(xué)公式符號(hào)識(shí)別方法研究[D];沈陽(yáng)工業(yè)大學(xué);2016年
5 白華;數(shù)學(xué)公式讀法歧義性研究[D];蘭州大學(xué);2016年
6 郭俊楠;MathML格式數(shù)學(xué)公式查重檢測(cè)算法研究[D];渤海大學(xué);2016年
7 盧托;科技文檔中數(shù)學(xué)公式的描述與檢索[D];華中科技大學(xué);2007年
8 徐旭明;在線手寫數(shù)學(xué)公式識(shí)別的研究[D];淮北師范大學(xué);2010年
9 孫友艷;數(shù)學(xué)公式到中國(guó)盲文自動(dòng)轉(zhuǎn)換研究[D];蘭州大學(xué);2013年
10 張婷;網(wǎng)絡(luò)數(shù)學(xué)公式轉(zhuǎn)換的研究與實(shí)現(xiàn)[D];蘭州大學(xué);2009年
,本文編號(hào):1054714
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1054714.html