基于Lucene的教學(xué)資源垂直檢索系統(tǒng)的研究與實現(xiàn)
【圖文】:
圖 2.1 Lucene 體系結(jié)構(gòu)圖上圖中,Org.apache.lucene.index(索引)模塊主要負(fù)責(zé)對初始文檔進(jìn)行建立索引、刪除索引、更新索引等操作,其中包含 IndexReader 和 IndexWriter 兩個類,IndexReader主要對已生成的索引進(jìn)行優(yōu)化、刪除、更新等操作,IndexWriter 主要對文本創(chuàng)建索引。Org.apache.lucene.search(搜索)模塊主要負(fù)責(zé)將用戶查詢(query)在 Analysis 模塊解析后,,在生成的索引文件進(jìn)行搜索,并按照一定的評分機(jī)制,對結(jié)果排序返回給用戶。對索引的檢索利用 IndexSearch 類來實現(xiàn)。Org.apache.lucene.analysis(分析)模塊主要負(fù)責(zé)對用戶查詢和建立的索引中的文本內(nèi)容進(jìn)行切詞、去掉停用詞和標(biāo)點(diǎn)符號、過濾等一系列操作,最終都轉(zhuǎn)換成基本單元Term。Org.apache.lucene.queryPaser(查詢解析)模塊主要負(fù)責(zé)對用戶查詢請求進(jìn)行語法解析,完成詞項之間的邏輯計算。Org.apache.lucene.store(數(shù)據(jù)存儲)模塊主要負(fù)責(zé)創(chuàng)建索引時底層的 I/O 操作。
本論文采用的教學(xué)資源是 XML 格式的電子期刊,這些電子期刊大多來自于新聞、報紙、政府文獻(xiàn)(比如能源部報告)和專利等。每一篇文檔都有惟一的一個文檔編號。本系統(tǒng)用到的 XML 格式的文檔集合包含 3500 個文件,共 310MB。圖 3.2 中展示了本系統(tǒng)用到的部分文檔集合。
【學(xué)位授予單位】:西北大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:G434
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊月華;杜軍平;平源;;基于本體的智能信息檢索系統(tǒng)[J];軟件學(xué)報;2015年07期
2 胡德華;種樂熹;邱均平;李俊;;國內(nèi)外知識檢索研究的進(jìn)展與趨勢[J];圖書情報知識;2015年03期
3 李愛明;;基于本體和用戶查詢意圖的查詢擴(kuò)展方法研究[J];情報科學(xué);2015年05期
4 田野;楊眉;祝忠明;張靜蓓;;關(guān)聯(lián)數(shù)據(jù)驅(qū)動的查詢擴(kuò)展技術(shù)研究[J];圖書情報工作;2015年04期
5 黃偉群;;基于用戶視角的交互式查詢擴(kuò)展研究[J];圖書情報工作;2014年05期
6 白培發(fā);王成良;徐玲;;一種融合詞語位置特征的Lucene相似度評分算法[J];計算機(jī)工程與應(yīng)用;2014年02期
7 周軍鋒;孟小峰;;XML關(guān)鍵字查詢處理研究[J];計算機(jī)學(xué)報;2012年12期
8 趙琳;;幾種信息檢索模型的比較[J];煤炭技術(shù);2012年08期
9 李小青;廖湖聲;張曉博;;XQuery實現(xiàn)技術(shù)研究綜述[J];計算機(jī)科學(xué);2012年03期
10 張新華;何永前;;軟件測試方法概述[J];科技視界;2012年04期
相關(guān)會議論文 前1條
1 馬少平;張敏;;信息檢索研究:過去三十年中我們走了多遠(yuǎn)[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年
相關(guān)博士學(xué)位論文 前1條
1 劉喜平;XML文檔搜索中的查詢處理技術(shù)研究[D];江西財經(jīng)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 賀驥波;高職院校教學(xué)資源庫管理系統(tǒng)的設(shè)計與實現(xiàn)[D];湖南大學(xué);2016年
2 陸新鋒;計算機(jī)網(wǎng)絡(luò)教學(xué)資源整合系統(tǒng)設(shè)計與開發(fā)[D];蘇州大學(xué);2016年
3 徐娟;基于用戶行為分析的核能領(lǐng)域垂直檢索系統(tǒng)研究[D];合肥工業(yè)大學(xué);2015年
4 葉浩明;面向高等教育領(lǐng)域的垂直搜索引擎的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2014年
5 張錦;基于教育領(lǐng)域的垂直搜索引擎的研究與設(shè)計[D];蘭州交通大學(xué);2014年
6 胡楠楠;面向XML文檔的信息檢索研究與應(yīng)用[D];山東大學(xué);2013年
7 王\~;基于Lucene的同義詞擴(kuò)展檢索的研究與實現(xiàn)[D];天津財經(jīng)大學(xué);2011年
8 黎立文;XPath查詢模型研究[D];湖南師范大學(xué);2010年
9 周曉濱;基于DTD的XML-GL與XQuery的查詢轉(zhuǎn)算法[D];山東大學(xué);2009年
10 高珊;信息檢索中的查詢擴(kuò)展及相關(guān)技術(shù)研究[D];華中師范大學(xué);2008年
本文編號:2646031
本文鏈接:http://sikaile.net/jiaoyulunwen/jykj/2646031.html