天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于數(shù)學(xué)表達(dá)式特征的科技文檔檢索模型

發(fā)布時(shí)間:2020-02-27 18:40
【摘要】:數(shù)學(xué)表達(dá)式是科技信息交流的重要載體和科技文獻(xiàn)中的重要成分,但由于數(shù)學(xué)表達(dá)式有別于普通文本的特殊屬性,導(dǎo)致目前面向普通文本的檢索技術(shù)和搜索引擎難以實(shí)現(xiàn)以數(shù)學(xué)表達(dá)式為特征的科技文獻(xiàn)檢索,影響了科技信息的傳播與交流,是目前信息檢索與人工智能領(lǐng)域亟待解決的關(guān)鍵問(wèn)題之一。針對(duì)上述問(wèn)題,本文通過(guò)對(duì)科技文檔構(gòu)成元素與結(jié)構(gòu)的分析,研究、設(shè)計(jì)基于數(shù)學(xué)表達(dá)式特征的科技文檔檢索模型,實(shí)現(xiàn)以數(shù)學(xué)表達(dá)式為查詢語(yǔ)言的科技文檔檢索。首先,在科技文檔檢索特征的選擇與提取階段,提取科技文檔的重要信息并組織成文檔信息表及公式信息表;其次,在科技文檔索引階段,利用文檔特征信息和文檔內(nèi)公式特征信息以及利用數(shù)學(xué)公式解析算法得到的數(shù)學(xué)表達(dá)式的子式信息,采用分層索引思想構(gòu)建科技文檔索引表與子式索引表;然后,在檢索階段,根據(jù)數(shù)學(xué)查詢表達(dá)式的特征信息構(gòu)建特征向量,設(shè)計(jì)了精確匹配、包含匹配和相似匹配等匹配模式檢索出符合要求的科技文檔結(jié)果集;最后,根據(jù)查詢項(xiàng)出現(xiàn)在文檔不同區(qū)域的重要程度以及與查詢式的匹配程度,結(jié)合tf-idf加權(quán)方法,采用余弦相似度進(jìn)行科技文檔的相似度計(jì)算,得到有序的科技文檔檢索結(jié)果。實(shí)驗(yàn)結(jié)果表明,該模型實(shí)現(xiàn)了以數(shù)學(xué)表達(dá)式為特征對(duì)科技文檔進(jìn)行檢索的目標(biāo)。
【圖文】:

文檔,向量圖,析取范式,檢索模型


2( ) 2mathQ a b n p q;成析取范式(1,0,1) (0,1,1) (1,1,1)mathQDNF ;文檔 A 和文檔 B 的三元組分別對(duì)應(yīng)的是(1,1,0)和(1,1,1其匹配成功,作為結(jié)果集。間模型型[3,4]是上世紀(jì) 70 年代 Salton 等人提出來(lái)的檢索效果較檢索模型。檔1d 、2d 以及3d 含有索引項(xiàng)公式1T 、2T 以及3T ,查詢,其中文檔1d 、2d 以及3d 的權(quán)重分別為(2,3,5),(3,73d 可以表示為1 1 2 3D 2T 3T 5T,2 1 2 3D 3T 7T T,2 D

檢索模型,數(shù)學(xué)表達(dá)式,格式描述


圖 2 科技文檔檢索模型圖文檔特征的提取的資源信息的存儲(chǔ)形式可以分為兩類:第一類,將資源信息手動(dòng)或自動(dòng)的方式對(duì)其進(jìn)行組織和管理;第二類,將資源信上,可以采用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)將資源站點(diǎn)上科技文檔的資源信進(jìn)行組織和管理。學(xué)表達(dá)式解析式解析的目標(biāo)是對(duì)數(shù)學(xué)表達(dá)式的特征信息進(jìn)行提取。特征提準(zhǔn)確地描述一個(gè)大型的數(shù)據(jù)集[45]。針對(duì) LaTex 格式描述的數(shù)維文本形式的數(shù)學(xué)表達(dá)式進(jìn)行分析和提取,得到數(shù)學(xué)表達(dá)式構(gòu)。針對(duì) MathML 格式描述的數(shù)學(xué)表達(dá)式解析的目標(biāo)是對(duì) X進(jìn)行分析和提取,得到數(shù)學(xué)表達(dá)式的各種成分以及二維運(yùn)算技文檔索引的構(gòu)建
【學(xué)位授予單位】:河北大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 張明寶;米傳民;;一種改進(jìn)的基于文檔結(jié)構(gòu)的信息檢索方法[J];情報(bào)理論與實(shí)踐;2009年08期

2 盧托;于俊清;廖兆存;聶江;;基于Web的數(shù)學(xué)公式檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];微處理機(jī);2008年02期

相關(guān)碩士學(xué)位論文 前10條

1 劉惠叢;基于互關(guān)聯(lián)后繼樹(shù)的數(shù)學(xué)表達(dá)式檢索模型[D];河北大學(xué);2017年

2 李彬;基于SFE的LaTeX表達(dá)式檢索系統(tǒng)[D];河北大學(xué);2017年

3 周南;基于層次結(jié)構(gòu)特征的數(shù)學(xué)表達(dá)式檢索模型[D];河北大學(xué);2016年

4 徐月霞;面向語(yǔ)義的數(shù)學(xué)公式N-grams索引結(jié)構(gòu)研究[D];蘭州大學(xué);2015年

5 李遠(yuǎn)輝;數(shù)學(xué)表達(dá)式檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];重慶大學(xué);2014年

6 陶啟立;基于語(yǔ)義的科技文檔信息資源檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西北大學(xué);2011年

7 劉志偉;數(shù)學(xué)搜索引擎研究[D];蘭州大學(xué);2011年

8 劉東閣;基于MathML的公式檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];東北大學(xué);2009年

9 景珂;網(wǎng)絡(luò)數(shù)學(xué)搜索中的數(shù)學(xué)查詢語(yǔ)言與索引的研究[D];蘭州大學(xué);2009年

10 盧托;科技文檔中數(shù)學(xué)公式的描述與檢索[D];華中科技大學(xué);2007年

,

本文編號(hào):2583351

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2583351.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7ee15***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
亚洲午夜福利视频在线| 日本不卡在线视频中文国产| 91日韩在线视频观看| 欧美不卡午夜中文字幕| 在线欧美精品二区三区| 日系韩系还是欧美久久| 国产精品不卡免费视频| 欧美日韩乱码一区二区三区| 国产欧美一区二区三区精品视| 国内真实露脸偷拍视频| 国产精品免费视频视频| 国产主播精品福利午夜二区| 日本在线高清精品人妻| 日本东京热视频一区二区三区| 我想看亚洲一级黄色录像| 果冻传媒在线观看免费高清| 久热99中文字幕视频在线| 久久精品福利在线观看| 国产激情一区二区三区不卡| 国产一区二区三区午夜精品| 中文久久乱码一区二区| 日本不卡在线视频中文国产| 亚洲精品成人福利在线| 中文字幕精品一区二区年下载| 一区二区在线激情视频| 国语对白刺激高潮在线视频| 99热九九热这里只有精品| 亚洲一区二区三区日韩91| 成人国产一区二区三区精品麻豆| 日韩夫妻午夜性生活视频| 亚洲免费视频中文字幕在线观看 | 国产香蕉国产精品偷在线观看| 久久久精品区二区三区| 中文日韩精品视频在线| 国内真实露脸偷拍视频| 亚洲熟妇熟女久久精品| 午夜福利大片亚洲一区| 日韩一区二区三区嘿嘿| 亚洲精品欧美精品一区三区| 夜夜躁狠狠躁日日躁视频黑人| 少妇人妻一级片一区二区三区|