天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向語義的數(shù)學(xué)公式N-grams索引結(jié)構(gòu)研究

發(fā)布時(shí)間:2017-11-01 10:01

  本文關(guān)鍵詞:面向語義的數(shù)學(xué)公式N-grams索引結(jié)構(gòu)研究


  更多相關(guān)文章: 搜索引擎 MathSearch 公式搜索 N-grams劃分 子公式權(quán)重 常見計(jì)算


【摘要】:近幾年來,數(shù)學(xué)公式搜索已經(jīng)成為信息學(xué)科領(lǐng)域的熱點(diǎn)問題。數(shù)學(xué)公式結(jié)構(gòu)復(fù)雜且語義豐富,會(huì)出現(xiàn)一種表示形式多種含義以及一種含義多種表示形式等問題,而且子公式的檢索、公式類型劃分與常見計(jì)算也成為數(shù)學(xué)公式搜索的一個(gè)研究點(diǎn)。國內(nèi)外一些知名的數(shù)學(xué)搜索研究機(jī)構(gòu)在檢索數(shù)學(xué)公式時(shí),沒有考慮數(shù)學(xué)公式的結(jié)構(gòu)特點(diǎn)和語義信息,對(duì)等價(jià)公式、相關(guān)公式的檢索也沒有展開相關(guān)研究。本論文首先對(duì)現(xiàn)有的幾種數(shù)學(xué)搜索系統(tǒng)的索引結(jié)構(gòu)進(jìn)行了仔細(xì)研究,并借鑒文本搜索引擎的N-gram方法,提出了數(shù)學(xué)公式N-grams劃分的方法,通過實(shí)驗(yàn)確定了劃分的粒度,即N∈[2,15],并提出了一種基于公式復(fù)雜度、N-grams長度和深度的計(jì)算子公式權(quán)重的方法。其次,本論文給出了等價(jià)公式、相關(guān)公式的定義,它們應(yīng)該和查詢公式是高度相關(guān)的,應(yīng)該作為數(shù)學(xué)搜索排序過程中重點(diǎn)考慮的因素,實(shí)現(xiàn)等價(jià)公式和相關(guān)公式的有效存儲(chǔ)與管理。本論文通過Wolfram Alpha對(duì)數(shù)學(xué)公式常見類型進(jìn)行了研究,結(jié)合數(shù)學(xué)公式的特點(diǎn)和用戶搜索意圖,對(duì)公式類型做了三級(jí)分類,其中,一級(jí)分類有27種,二級(jí)分類有50種,三級(jí)分類有77種,制定了數(shù)學(xué)公式類型標(biāo)準(zhǔn),并通過實(shí)驗(yàn)對(duì)250個(gè)公式進(jìn)行了統(tǒng)計(jì),確定了不同類型公式的相關(guān)計(jì)算,找出了每一種常見計(jì)算的影響因素,通過這些因素來判定常見計(jì)算的類型。同時(shí),本論文對(duì)數(shù)學(xué)公式的存儲(chǔ)結(jié)構(gòu)及流程進(jìn)行了詳細(xì)設(shè)計(jì)和分析,能夠?qū)崿F(xiàn)等價(jià)公式、相關(guān)公式和子公式搜索,實(shí)現(xiàn)了存儲(chǔ)數(shù)據(jù)和查詢數(shù)據(jù)的有機(jī)統(tǒng)一。綜上,本論文借鑒現(xiàn)有系統(tǒng)的長處,彌補(bǔ)其不足,構(gòu)建了適合數(shù)學(xué)搜索的面向語義的數(shù)學(xué)公式N-grams索引機(jī)制。本文提出的方法是一種基于語義的快速方便的存儲(chǔ)和查詢數(shù)學(xué)表達(dá)式和符號(hào)的方法,該方法可以實(shí)現(xiàn)子公式、等價(jià)公式、相關(guān)公式的有效搜索,滿足不同用戶對(duì)數(shù)學(xué)公式搜索的需求,提高數(shù)學(xué)公式的查全率和查準(zhǔn)率,能夠在很大程度上提升數(shù)學(xué)搜索的語義檢索效率,促進(jìn)數(shù)學(xué)知識(shí)的交流與共享。
【關(guān)鍵詞】:搜索引擎 MathSearch 公式搜索 N-grams劃分 子公式權(quán)重 常見計(jì)算
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3
【目錄】:
  • 中文摘要3-4
  • Abstract4-8
  • 第一章 緒論8-14
  • 1.1 研究背景及意義8-9
  • 1.2 國內(nèi)外研究現(xiàn)狀9-13
  • 1.2.1 數(shù)學(xué)公式搜索引擎索引模型簡(jiǎn)介9-12
  • 1.2.2 小結(jié)12-13
  • 1.3 文章組織結(jié)構(gòu)13-14
  • 第二章 數(shù)學(xué)公式N-grams劃分14-29
  • 2.1 MathSearch概述14-15
  • 2.2 文本搜索引擎中的N-grams技術(shù)研究15-16
  • 2.3 數(shù)學(xué)公式的N-grams劃分16-21
  • 2.3.1 數(shù)學(xué)公式的特點(diǎn)17-18
  • 2.3.2 數(shù)學(xué)公式的N-grams劃分18-21
  • 2.4 N-grams實(shí)驗(yàn)---N的范圍確定21-24
  • 2.4.1 文本搜索中N值的選擇21-22
  • 2.4.2 數(shù)學(xué)搜索中N的范圍確定22-24
  • 2.5 N-grams劃分下子公式權(quán)重計(jì)算方法24-27
  • 2.6 小結(jié)27-29
  • 第三章 公式類型與常見計(jì)算研究29-44
  • 3.1 數(shù)學(xué)公式標(biāo)準(zhǔn)化29-30
  • 3.2 相關(guān)公式30-31
  • 3.3 公式類型與常見計(jì)算31-43
  • 3.4 小結(jié)43-44
  • 第四章 數(shù)學(xué)公式存儲(chǔ)研究44-54
  • 4.1 數(shù)據(jù)庫設(shè)計(jì)44-48
  • 4.2 數(shù)學(xué)公式的存儲(chǔ)流程48-50
  • 4.3 數(shù)學(xué)公式的查詢流程50-52
  • 4.4 小結(jié)52-54
  • 第五章 總結(jié)與展望54-57
  • 5.1 總結(jié)54-55
  • 5.2 展望55-57
  • 參考文獻(xiàn)57-59
  • 附錄59-68
  • 附錄一 數(shù)學(xué)公式測(cè)試集(250個(gè))59-68
  • 在學(xué)期間的研究成果68-69
  • 致謝69

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前2條

1 劉金紅;陸余良;;基于Ontology改進(jìn)的N-Gram文本分類模型研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年13期

2 余小軍;劉峰;張春;;基于N-Gram文本特征提取的改進(jìn)算法[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2012年34期

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 蘇偉;基于Web的數(shù)學(xué)公式輸入及可訪問性關(guān)鍵問題研究[D];蘭州大學(xué);2010年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 劉志偉;數(shù)學(xué)搜索引擎研究[D];蘭州大學(xué);2011年

,

本文編號(hào):1126307

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1126307.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶84188***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com