基于數(shù)學(xué)表達(dá)式特征的科技文檔檢索模型
【圖文】:
2( ) 2mathQ a b n p q;成析取范式(1,0,1) (0,1,1) (1,1,1)mathQDNF ;文檔 A 和文檔 B 的三元組分別對(duì)應(yīng)的是(1,1,0)和(1,1,1其匹配成功,作為結(jié)果集。間模型型[3,4]是上世紀(jì) 70 年代 Salton 等人提出來(lái)的檢索效果較檢索模型。檔1d 、2d 以及3d 含有索引項(xiàng)公式1T 、2T 以及3T ,查詢,其中文檔1d 、2d 以及3d 的權(quán)重分別為(2,3,5),(3,73d 可以表示為1 1 2 3D 2T 3T 5T,2 1 2 3D 3T 7T T,2 D
圖 2 科技文檔檢索模型圖文檔特征的提取的資源信息的存儲(chǔ)形式可以分為兩類:第一類,將資源信息手動(dòng)或自動(dòng)的方式對(duì)其進(jìn)行組織和管理;第二類,將資源信上,可以采用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)將資源站點(diǎn)上科技文檔的資源信進(jìn)行組織和管理。學(xué)表達(dá)式解析式解析的目標(biāo)是對(duì)數(shù)學(xué)表達(dá)式的特征信息進(jìn)行提取。特征提準(zhǔn)確地描述一個(gè)大型的數(shù)據(jù)集[45]。針對(duì) LaTex 格式描述的數(shù)維文本形式的數(shù)學(xué)表達(dá)式進(jìn)行分析和提取,得到數(shù)學(xué)表達(dá)式構(gòu)。針對(duì) MathML 格式描述的數(shù)學(xué)表達(dá)式解析的目標(biāo)是對(duì) X進(jìn)行分析和提取,得到數(shù)學(xué)表達(dá)式的各種成分以及二維運(yùn)算技文檔索引的構(gòu)建
【學(xué)位授予單位】:河北大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 張明寶;米傳民;;一種改進(jìn)的基于文檔結(jié)構(gòu)的信息檢索方法[J];情報(bào)理論與實(shí)踐;2009年08期
2 盧托;于俊清;廖兆存;聶江;;基于Web的數(shù)學(xué)公式檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];微處理機(jī);2008年02期
相關(guān)碩士學(xué)位論文 前10條
1 劉惠叢;基于互關(guān)聯(lián)后繼樹(shù)的數(shù)學(xué)表達(dá)式檢索模型[D];河北大學(xué);2017年
2 李彬;基于SFE的LaTeX表達(dá)式檢索系統(tǒng)[D];河北大學(xué);2017年
3 周南;基于層次結(jié)構(gòu)特征的數(shù)學(xué)表達(dá)式檢索模型[D];河北大學(xué);2016年
4 徐月霞;面向語(yǔ)義的數(shù)學(xué)公式N-grams索引結(jié)構(gòu)研究[D];蘭州大學(xué);2015年
5 李遠(yuǎn)輝;數(shù)學(xué)表達(dá)式檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];重慶大學(xué);2014年
6 陶啟立;基于語(yǔ)義的科技文檔信息資源檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西北大學(xué);2011年
7 劉志偉;數(shù)學(xué)搜索引擎研究[D];蘭州大學(xué);2011年
8 劉東閣;基于MathML的公式檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];東北大學(xué);2009年
9 景珂;網(wǎng)絡(luò)數(shù)學(xué)搜索中的數(shù)學(xué)查詢語(yǔ)言與索引的研究[D];蘭州大學(xué);2009年
10 盧托;科技文檔中數(shù)學(xué)公式的描述與檢索[D];華中科技大學(xué);2007年
,本文編號(hào):2583351
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2583351.html