基于WEB的學(xué)科資源垂直搜索引擎的設(shè)計與實(shí)現(xiàn)
發(fā)布時間:2021-02-02 20:48
隨著Internet技術(shù)和應(yīng)用的飛速發(fā)展,Web上的信息資源量正在快速增加。其中存在著大量的對教學(xué)和科研具有參考價值的學(xué)科資源,它們?yōu)閷W(xué)校的教學(xué)和科研帶來了極大的便利。但是,通過像Google、Baidu等這樣的通用搜索引擎在海量的、異構(gòu)的網(wǎng)絡(luò)信息資源中來檢索某一具體學(xué)科資源時,往往不能快速準(zhǔn)確的找到有價值的專業(yè)信息。垂直搜索引擎就正好滿足了這種需求,它是面向某一個領(lǐng)域的專業(yè)搜索引擎,它可以為用戶提供高質(zhì)量的學(xué)科資源。本文以教育技術(shù)學(xué)學(xué)科資源為例。在對搜索引擎方法的研究分析和算法實(shí)現(xiàn)的基礎(chǔ)上,提出了幾點(diǎn)改進(jìn)方法,并據(jù)此初步構(gòu)建出了一個基于WEB的學(xué)科資源垂直搜索引擎的體系結(jié)構(gòu)。然后按照該體系結(jié)構(gòu)的設(shè)計,對其中較為重要的模塊部分進(jìn)行了詳細(xì)的解釋說明。并且在此基礎(chǔ)上,通過運(yùn)用擴(kuò)展開源組件Lucene、 Heritrix以及本體和文本分類技術(shù)實(shí)現(xiàn)了該系統(tǒng)。其目的是幫助廣大學(xué)科領(lǐng)域里的用戶快速精準(zhǔn)的查詢學(xué)科領(lǐng)域資源。本文主要進(jìn)行的工作如下:(1)研究垂直搜索引擎的相關(guān)理論,并對垂直搜索引擎的總體架構(gòu)進(jìn)行分析。(2)基于WEB的學(xué)科資源垂直搜索引擎系統(tǒng)的關(guān)鍵問題研究:構(gòu)建學(xué)科資源本體,并將本體應(yīng)...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 學(xué)科資源導(dǎo)航庫研究現(xiàn)狀
1.2.2 垂直搜索引擎研究現(xiàn)狀
1.2.3 存在的問題
1.3 論文主要工作
1.4 論文組織結(jié)構(gòu)
2 垂直搜索引擎的相關(guān)理論概述
2.1 搜索引擎的內(nèi)涵
2.1.1 搜索引擎是什么
2.1.2 搜索引擎的分類
2.2 垂直搜索引擎
2.2.1 垂直搜索引擎的產(chǎn)生
2.2.2 垂直搜索引擎系統(tǒng)總體架構(gòu)
2.3 垂直搜索引擎系統(tǒng)開發(fā)相關(guān)開源組件
2.3.1 Lucene概述
2.3.2 Heritrix介紹
2.4 本章小結(jié)
3 基于WEB的學(xué)科資源垂直搜索引擎關(guān)鍵問題研究
3.1 學(xué)科資源本體的概述與構(gòu)建
3.1.1 學(xué)科資源本體相關(guān)理論概述
3.1.2 學(xué)科資源本體的構(gòu)建
3.2 文本分類
3.2.1 文本分類概述
3.2.2 文本分類的實(shí)現(xiàn)
3.3 信息過濾
3.3.1 信息過濾概述
3.3.2 信息過濾的實(shí)現(xiàn)
3.4 檢索結(jié)果的可視化
3.4.1 可視化及Jena概述
3.4.2 檢索結(jié)果可視化的實(shí)現(xiàn)
3.5 本章小結(jié)
4 基于WEB的學(xué)科資源垂直搜索引擎的設(shè)計
4.1 設(shè)計思路
4.2 系統(tǒng)體系結(jié)構(gòu)
4.3 功能模塊設(shè)計
4.3.1 信息采集模塊
4.3.2 信息抽取模塊
4.3.3 文本分類模塊
4.3.4 索引模塊
4.3.5 檢索模塊
4.3.6 信息過濾模塊
4.4 數(shù)據(jù)庫設(shè)計
4.5 本章小結(jié)
5 基于WEB的學(xué)科資源垂直搜索引擎的實(shí)現(xiàn)
5.1 開發(fā)環(huán)境
5.2 主要功能模塊實(shí)現(xiàn)
5.2.1 信息采集模塊的實(shí)現(xiàn)
5.2.2 信息抽取模塊的實(shí)現(xiàn)
5.2.3 索引模塊的實(shí)現(xiàn)
5.2.4 檢索模塊的實(shí)現(xiàn)
5.3 系統(tǒng)測試與總結(jié)
5.3.1 測試環(huán)境
5.3.2 信息采集模塊測試
5.3.3 信息抽取模塊測試
5.3.4 索引模塊測試
5.3.5 檢索模塊測試
5.3.6 系統(tǒng)總結(jié)與評價
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 本文總結(jié)
6.2 問題與展望
參考文獻(xiàn)
論文項目資助、攻讀學(xué)位期間參與項目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]農(nóng)業(yè)高校圖書館重點(diǎn)學(xué)科資源導(dǎo)航庫的構(gòu)建及問題探討——以東北農(nóng)業(yè)大學(xué)農(nóng)業(yè)學(xué)科資源導(dǎo)航系統(tǒng)為例[J]. 齊紅,陶和林. 農(nóng)業(yè)圖書情報學(xué)刊. 2011(11)
[2]Heritrix在垂直搜索引擎中的應(yīng)用[J]. 白萬民,蘇希樂. 計算機(jī)時代. 2011(09)
[3]面向主題的垂直搜索引擎系統(tǒng)的研究與實(shí)現(xiàn)[J]. 施佺,王恒山,肖仰華,丁衛(wèi)平. 微電子學(xué)與計算機(jī). 2011(07)
[4]基于DOM的動態(tài)網(wǎng)頁信息抽取方法[J]. 王平根. 科技信息. 2010(31)
[5]垂直搜索引擎的研究與設(shè)計[J]. 劉運(yùn)強(qiáng). 計算機(jī)應(yīng)用與軟件. 2010(07)
[6]基于Lucene全文檢索引擎的研究與實(shí)現(xiàn)[J]. 胡繼鈞. 科技創(chuàng)新導(dǎo)報. 2010(20)
[7]農(nóng)業(yè)搜索引擎的發(fā)展現(xiàn)狀及關(guān)鍵技術(shù)研究[J]. 彭玉容,楊捧,高媛. 安徽農(nóng)業(yè)科學(xué). 2010(20)
[8]基于分類的智能搜索引擎研究與實(shí)現(xiàn)[J]. 程傳鵬. 中原工學(xué)院學(xué)報. 2010(03)
[9]基于語義查詢擴(kuò)展的垂直搜索研究[J]. 趙建偉,鄭誠,吳永俊. 計算機(jī)工程. 2010(12)
[10]面向計算機(jī)教育資源的垂直搜索引擎系統(tǒng)的設(shè)計[J]. 李廣麗,張紅斌. 情報理論與實(shí)踐. 2010(05)
博士論文
[1]文本分類及其相關(guān)技術(shù)研究[D]. 尚文倩.北京交通大學(xué) 2007
碩士論文
[1]基于領(lǐng)域本體的智能檢索技術(shù)應(yīng)用研究[D]. 宋慶.中國農(nóng)業(yè)科學(xué)院 2011
[2]面向領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)[D]. 邱偉林.大連海事大學(xué) 2011
[3]專家信息垂直搜索引擎關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D]. 劉邵斌.中南大學(xué) 2010
[4]數(shù)據(jù)挖掘可視化技術(shù)的研究與實(shí)現(xiàn)[D]. 鄭宏.西安電子科技大學(xué) 2010
[5]中醫(yī)臨床診療垂直搜索系統(tǒng)研究[D]. 莊力.北京交通大學(xué) 2009
[6]基于Lucene的垂直搜索引擎關(guān)鍵技術(shù)的研究應(yīng)用[D]. 劉朋.武漢理工大學(xué) 2009
[7]基于本體的交通導(dǎo)航數(shù)據(jù)語義查詢研究[D]. 王慶連.大連海事大學(xué) 2009
[8]面向?qū)W科的基礎(chǔ)教育資源垂直搜索引擎的研究與實(shí)現(xiàn)[D]. 翟曉玲.東北師范大學(xué) 2009
[9]基于本體的垂直搜索引擎研究[D]. 劉興濤.山東大學(xué) 2009
[10]基于本體的垂直搜索系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D]. 孔楠.北京交通大學(xué) 2008
本文編號:3015348
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 學(xué)科資源導(dǎo)航庫研究現(xiàn)狀
1.2.2 垂直搜索引擎研究現(xiàn)狀
1.2.3 存在的問題
1.3 論文主要工作
1.4 論文組織結(jié)構(gòu)
2 垂直搜索引擎的相關(guān)理論概述
2.1 搜索引擎的內(nèi)涵
2.1.1 搜索引擎是什么
2.1.2 搜索引擎的分類
2.2 垂直搜索引擎
2.2.1 垂直搜索引擎的產(chǎn)生
2.2.2 垂直搜索引擎系統(tǒng)總體架構(gòu)
2.3 垂直搜索引擎系統(tǒng)開發(fā)相關(guān)開源組件
2.3.1 Lucene概述
2.3.2 Heritrix介紹
2.4 本章小結(jié)
3 基于WEB的學(xué)科資源垂直搜索引擎關(guān)鍵問題研究
3.1 學(xué)科資源本體的概述與構(gòu)建
3.1.1 學(xué)科資源本體相關(guān)理論概述
3.1.2 學(xué)科資源本體的構(gòu)建
3.2 文本分類
3.2.1 文本分類概述
3.2.2 文本分類的實(shí)現(xiàn)
3.3 信息過濾
3.3.1 信息過濾概述
3.3.2 信息過濾的實(shí)現(xiàn)
3.4 檢索結(jié)果的可視化
3.4.1 可視化及Jena概述
3.4.2 檢索結(jié)果可視化的實(shí)現(xiàn)
3.5 本章小結(jié)
4 基于WEB的學(xué)科資源垂直搜索引擎的設(shè)計
4.1 設(shè)計思路
4.2 系統(tǒng)體系結(jié)構(gòu)
4.3 功能模塊設(shè)計
4.3.1 信息采集模塊
4.3.2 信息抽取模塊
4.3.3 文本分類模塊
4.3.4 索引模塊
4.3.5 檢索模塊
4.3.6 信息過濾模塊
4.4 數(shù)據(jù)庫設(shè)計
4.5 本章小結(jié)
5 基于WEB的學(xué)科資源垂直搜索引擎的實(shí)現(xiàn)
5.1 開發(fā)環(huán)境
5.2 主要功能模塊實(shí)現(xiàn)
5.2.1 信息采集模塊的實(shí)現(xiàn)
5.2.2 信息抽取模塊的實(shí)現(xiàn)
5.2.3 索引模塊的實(shí)現(xiàn)
5.2.4 檢索模塊的實(shí)現(xiàn)
5.3 系統(tǒng)測試與總結(jié)
5.3.1 測試環(huán)境
5.3.2 信息采集模塊測試
5.3.3 信息抽取模塊測試
5.3.4 索引模塊測試
5.3.5 檢索模塊測試
5.3.6 系統(tǒng)總結(jié)與評價
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 本文總結(jié)
6.2 問題與展望
參考文獻(xiàn)
論文項目資助、攻讀學(xué)位期間參與項目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]農(nóng)業(yè)高校圖書館重點(diǎn)學(xué)科資源導(dǎo)航庫的構(gòu)建及問題探討——以東北農(nóng)業(yè)大學(xué)農(nóng)業(yè)學(xué)科資源導(dǎo)航系統(tǒng)為例[J]. 齊紅,陶和林. 農(nóng)業(yè)圖書情報學(xué)刊. 2011(11)
[2]Heritrix在垂直搜索引擎中的應(yīng)用[J]. 白萬民,蘇希樂. 計算機(jī)時代. 2011(09)
[3]面向主題的垂直搜索引擎系統(tǒng)的研究與實(shí)現(xiàn)[J]. 施佺,王恒山,肖仰華,丁衛(wèi)平. 微電子學(xué)與計算機(jī). 2011(07)
[4]基于DOM的動態(tài)網(wǎng)頁信息抽取方法[J]. 王平根. 科技信息. 2010(31)
[5]垂直搜索引擎的研究與設(shè)計[J]. 劉運(yùn)強(qiáng). 計算機(jī)應(yīng)用與軟件. 2010(07)
[6]基于Lucene全文檢索引擎的研究與實(shí)現(xiàn)[J]. 胡繼鈞. 科技創(chuàng)新導(dǎo)報. 2010(20)
[7]農(nóng)業(yè)搜索引擎的發(fā)展現(xiàn)狀及關(guān)鍵技術(shù)研究[J]. 彭玉容,楊捧,高媛. 安徽農(nóng)業(yè)科學(xué). 2010(20)
[8]基于分類的智能搜索引擎研究與實(shí)現(xiàn)[J]. 程傳鵬. 中原工學(xué)院學(xué)報. 2010(03)
[9]基于語義查詢擴(kuò)展的垂直搜索研究[J]. 趙建偉,鄭誠,吳永俊. 計算機(jī)工程. 2010(12)
[10]面向計算機(jī)教育資源的垂直搜索引擎系統(tǒng)的設(shè)計[J]. 李廣麗,張紅斌. 情報理論與實(shí)踐. 2010(05)
博士論文
[1]文本分類及其相關(guān)技術(shù)研究[D]. 尚文倩.北京交通大學(xué) 2007
碩士論文
[1]基于領(lǐng)域本體的智能檢索技術(shù)應(yīng)用研究[D]. 宋慶.中國農(nóng)業(yè)科學(xué)院 2011
[2]面向領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)[D]. 邱偉林.大連海事大學(xué) 2011
[3]專家信息垂直搜索引擎關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D]. 劉邵斌.中南大學(xué) 2010
[4]數(shù)據(jù)挖掘可視化技術(shù)的研究與實(shí)現(xiàn)[D]. 鄭宏.西安電子科技大學(xué) 2010
[5]中醫(yī)臨床診療垂直搜索系統(tǒng)研究[D]. 莊力.北京交通大學(xué) 2009
[6]基于Lucene的垂直搜索引擎關(guān)鍵技術(shù)的研究應(yīng)用[D]. 劉朋.武漢理工大學(xué) 2009
[7]基于本體的交通導(dǎo)航數(shù)據(jù)語義查詢研究[D]. 王慶連.大連海事大學(xué) 2009
[8]面向?qū)W科的基礎(chǔ)教育資源垂直搜索引擎的研究與實(shí)現(xiàn)[D]. 翟曉玲.東北師范大學(xué) 2009
[9]基于本體的垂直搜索引擎研究[D]. 劉興濤.山東大學(xué) 2009
[10]基于本體的垂直搜索系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D]. 孔楠.北京交通大學(xué) 2008
本文編號:3015348
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3015348.html
最近更新
教材專著