基于猶豫模糊權重的數(shù)學表達式檢索
發(fā)布時間:2022-01-09 20:57
【目的】從大量數(shù)學表達式中檢索出與查詢表達式相似的表達式,并對檢索結果排序。【方法】提取單個數(shù)學表達式的特征子式,利用猶豫模糊集理論計算每個特征子式的權重值;將屬于同一表達式的子式權重值進行累加,計算表達式間的相似度得分,按照分數(shù)從高到低的順序排列檢索結果!窘Y果】從時間和相似度的角度進行分析,本文方法檢索效率較高,檢索結果較準確,本文排序方法的NDCG值最高為0.88,表明該排序方法較合理!揪窒蕖勘疚呐判蚍椒ú⒎峭耆嫦驍(shù)學表達式語義檢索!窘Y論】引入猶豫模糊集計算子式權重能夠更準確地檢索出具有相同結構特征的數(shù)學表達式。
【文章來源】:數(shù)據(jù)分析與知識發(fā)現(xiàn). 2020,4(07)北大核心CSSCICSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
數(shù)學表達式檢索總體流程
除倒排表以外,還有數(shù)學表達式索引表,設置三個字段,分別記錄表達式編號、表達式LaTeX碼、所有子式特征碼及權重值。該表采用順序索引方式構建,在此不再贅述。3.3 猶豫模糊權重子式檢索與相似度計算方法
以一個包含兩個子式的數(shù)學表達式f(md5-subf1,md5-subf2)為例,展示檢索過程,如圖3所示。表達式l和m均包含兩個子式,表達式n只包含第二個子式,則score(l)和score(m)均為兩個加權權重值的累加,score(n)僅等于第二個子式的加權權重值。4 實驗與分析
【參考文獻】:
期刊論文
[1]基于文本和公式的科技文檔相似度計算[J]. 徐建民,許彩云. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(10)
[2]基于消息摘要算法第五版和IDEA的混合加密算法[J]. 李夏夢,潘廣貞. 科學技術與工程. 2017(09)
[3]LaTeX數(shù)學表達式解析與索引方法[J]. 周南,田學東. 計算機應用. 2016(03)
碩士論文
[1]基于猶豫模糊集的數(shù)學檢索結果排序研究[D]. 張凱歌.河北大學 2017
[2]基于層次結構特征的數(shù)學表達式檢索模型[D]. 周南.河北大學 2016
[3]面向語義的數(shù)學公式N-grams索引結構研究[D]. 徐月霞.蘭州大學 2015
[4]基于本體的數(shù)學表達式檢索技術研究[D]. 王小龍.重慶大學 2014
[5]網(wǎng)絡數(shù)學搜索中的數(shù)學查詢語言與索引的研究[D]. 景珂.蘭州大學 2009
本文編號:3579430
【文章來源】:數(shù)據(jù)分析與知識發(fā)現(xiàn). 2020,4(07)北大核心CSSCICSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
數(shù)學表達式檢索總體流程
除倒排表以外,還有數(shù)學表達式索引表,設置三個字段,分別記錄表達式編號、表達式LaTeX碼、所有子式特征碼及權重值。該表采用順序索引方式構建,在此不再贅述。3.3 猶豫模糊權重子式檢索與相似度計算方法
以一個包含兩個子式的數(shù)學表達式f(md5-subf1,md5-subf2)為例,展示檢索過程,如圖3所示。表達式l和m均包含兩個子式,表達式n只包含第二個子式,則score(l)和score(m)均為兩個加權權重值的累加,score(n)僅等于第二個子式的加權權重值。4 實驗與分析
【參考文獻】:
期刊論文
[1]基于文本和公式的科技文檔相似度計算[J]. 徐建民,許彩云. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(10)
[2]基于消息摘要算法第五版和IDEA的混合加密算法[J]. 李夏夢,潘廣貞. 科學技術與工程. 2017(09)
[3]LaTeX數(shù)學表達式解析與索引方法[J]. 周南,田學東. 計算機應用. 2016(03)
碩士論文
[1]基于猶豫模糊集的數(shù)學檢索結果排序研究[D]. 張凱歌.河北大學 2017
[2]基于層次結構特征的數(shù)學表達式檢索模型[D]. 周南.河北大學 2016
[3]面向語義的數(shù)學公式N-grams索引結構研究[D]. 徐月霞.蘭州大學 2015
[4]基于本體的數(shù)學表達式檢索技術研究[D]. 王小龍.重慶大學 2014
[5]網(wǎng)絡數(shù)學搜索中的數(shù)學查詢語言與索引的研究[D]. 景珂.蘭州大學 2009
本文編號:3579430
本文鏈接:http://sikaile.net/kejilunwen/yysx/3579430.html
最近更新
教材專著