基于WEB的學(xué)科資源垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-02-02 20:48
隨著Internet技術(shù)和應(yīng)用的飛速發(fā)展,Web上的信息資源量正在快速增加。其中存在著大量的對(duì)教學(xué)和科研具有參考價(jià)值的學(xué)科資源,它們?yōu)閷W(xué)校的教學(xué)和科研帶來(lái)了極大的便利。但是,通過(guò)像Google、Baidu等這樣的通用搜索引擎在海量的、異構(gòu)的網(wǎng)絡(luò)信息資源中來(lái)檢索某一具體學(xué)科資源時(shí),往往不能快速準(zhǔn)確的找到有價(jià)值的專業(yè)信息。垂直搜索引擎就正好滿足了這種需求,它是面向某一個(gè)領(lǐng)域的專業(yè)搜索引擎,它可以為用戶提供高質(zhì)量的學(xué)科資源。本文以教育技術(shù)學(xué)學(xué)科資源為例。在對(duì)搜索引擎方法的研究分析和算法實(shí)現(xiàn)的基礎(chǔ)上,提出了幾點(diǎn)改進(jìn)方法,并據(jù)此初步構(gòu)建出了一個(gè)基于WEB的學(xué)科資源垂直搜索引擎的體系結(jié)構(gòu)。然后按照該體系結(jié)構(gòu)的設(shè)計(jì),對(duì)其中較為重要的模塊部分進(jìn)行了詳細(xì)的解釋說(shuō)明。并且在此基礎(chǔ)上,通過(guò)運(yùn)用擴(kuò)展開源組件Lucene、 Heritrix以及本體和文本分類技術(shù)實(shí)現(xiàn)了該系統(tǒng)。其目的是幫助廣大學(xué)科領(lǐng)域里的用戶快速精準(zhǔn)的查詢學(xué)科領(lǐng)域資源。本文主要進(jìn)行的工作如下:(1)研究垂直搜索引擎的相關(guān)理論,并對(duì)垂直搜索引擎的總體架構(gòu)進(jìn)行分析。(2)基于WEB的學(xué)科資源垂直搜索引擎系統(tǒng)的關(guān)鍵問(wèn)題研究:構(gòu)建學(xué)科資源本體,并將本體應(yīng)...
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 學(xué)科資源導(dǎo)航庫(kù)研究現(xiàn)狀
1.2.2 垂直搜索引擎研究現(xiàn)狀
1.2.3 存在的問(wèn)題
1.3 論文主要工作
1.4 論文組織結(jié)構(gòu)
2 垂直搜索引擎的相關(guān)理論概述
2.1 搜索引擎的內(nèi)涵
2.1.1 搜索引擎是什么
2.1.2 搜索引擎的分類
2.2 垂直搜索引擎
2.2.1 垂直搜索引擎的產(chǎn)生
2.2.2 垂直搜索引擎系統(tǒng)總體架構(gòu)
2.3 垂直搜索引擎系統(tǒng)開發(fā)相關(guān)開源組件
2.3.1 Lucene概述
2.3.2 Heritrix介紹
2.4 本章小結(jié)
3 基于WEB的學(xué)科資源垂直搜索引擎關(guān)鍵問(wèn)題研究
3.1 學(xué)科資源本體的概述與構(gòu)建
3.1.1 學(xué)科資源本體相關(guān)理論概述
3.1.2 學(xué)科資源本體的構(gòu)建
3.2 文本分類
3.2.1 文本分類概述
3.2.2 文本分類的實(shí)現(xiàn)
3.3 信息過(guò)濾
3.3.1 信息過(guò)濾概述
3.3.2 信息過(guò)濾的實(shí)現(xiàn)
3.4 檢索結(jié)果的可視化
3.4.1 可視化及Jena概述
3.4.2 檢索結(jié)果可視化的實(shí)現(xiàn)
3.5 本章小結(jié)
4 基于WEB的學(xué)科資源垂直搜索引擎的設(shè)計(jì)
4.1 設(shè)計(jì)思路
4.2 系統(tǒng)體系結(jié)構(gòu)
4.3 功能模塊設(shè)計(jì)
4.3.1 信息采集模塊
4.3.2 信息抽取模塊
4.3.3 文本分類模塊
4.3.4 索引模塊
4.3.5 檢索模塊
4.3.6 信息過(guò)濾模塊
4.4 數(shù)據(jù)庫(kù)設(shè)計(jì)
4.5 本章小結(jié)
5 基于WEB的學(xué)科資源垂直搜索引擎的實(shí)現(xiàn)
5.1 開發(fā)環(huán)境
5.2 主要功能模塊實(shí)現(xiàn)
5.2.1 信息采集模塊的實(shí)現(xiàn)
5.2.2 信息抽取模塊的實(shí)現(xiàn)
5.2.3 索引模塊的實(shí)現(xiàn)
5.2.4 檢索模塊的實(shí)現(xiàn)
5.3 系統(tǒng)測(cè)試與總結(jié)
5.3.1 測(cè)試環(huán)境
5.3.2 信息采集模塊測(cè)試
5.3.3 信息抽取模塊測(cè)試
5.3.4 索引模塊測(cè)試
5.3.5 檢索模塊測(cè)試
5.3.6 系統(tǒng)總結(jié)與評(píng)價(jià)
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 本文總結(jié)
6.2 問(wèn)題與展望
參考文獻(xiàn)
論文項(xiàng)目資助、攻讀學(xué)位期間參與項(xiàng)目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]農(nóng)業(yè)高校圖書館重點(diǎn)學(xué)科資源導(dǎo)航庫(kù)的構(gòu)建及問(wèn)題探討——以東北農(nóng)業(yè)大學(xué)農(nóng)業(yè)學(xué)科資源導(dǎo)航系統(tǒng)為例[J]. 齊紅,陶和林. 農(nóng)業(yè)圖書情報(bào)學(xué)刊. 2011(11)
[2]Heritrix在垂直搜索引擎中的應(yīng)用[J]. 白萬(wàn)民,蘇希樂(lè). 計(jì)算機(jī)時(shí)代. 2011(09)
[3]面向主題的垂直搜索引擎系統(tǒng)的研究與實(shí)現(xiàn)[J]. 施佺,王恒山,肖仰華,丁衛(wèi)平. 微電子學(xué)與計(jì)算機(jī). 2011(07)
[4]基于DOM的動(dòng)態(tài)網(wǎng)頁(yè)信息抽取方法[J]. 王平根. 科技信息. 2010(31)
[5]垂直搜索引擎的研究與設(shè)計(jì)[J]. 劉運(yùn)強(qiáng). 計(jì)算機(jī)應(yīng)用與軟件. 2010(07)
[6]基于Lucene全文檢索引擎的研究與實(shí)現(xiàn)[J]. 胡繼鈞. 科技創(chuàng)新導(dǎo)報(bào). 2010(20)
[7]農(nóng)業(yè)搜索引擎的發(fā)展現(xiàn)狀及關(guān)鍵技術(shù)研究[J]. 彭玉容,楊捧,高媛. 安徽農(nóng)業(yè)科學(xué). 2010(20)
[8]基于分類的智能搜索引擎研究與實(shí)現(xiàn)[J]. 程傳鵬. 中原工學(xué)院學(xué)報(bào). 2010(03)
[9]基于語(yǔ)義查詢擴(kuò)展的垂直搜索研究[J]. 趙建偉,鄭誠(chéng),吳永俊. 計(jì)算機(jī)工程. 2010(12)
[10]面向計(jì)算機(jī)教育資源的垂直搜索引擎系統(tǒng)的設(shè)計(jì)[J]. 李廣麗,張紅斌. 情報(bào)理論與實(shí)踐. 2010(05)
博士論文
[1]文本分類及其相關(guān)技術(shù)研究[D]. 尚文倩.北京交通大學(xué) 2007
碩士論文
[1]基于領(lǐng)域本體的智能檢索技術(shù)應(yīng)用研究[D]. 宋慶.中國(guó)農(nóng)業(yè)科學(xué)院 2011
[2]面向領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)[D]. 邱偉林.大連海事大學(xué) 2011
[3]專家信息垂直搜索引擎關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D]. 劉邵斌.中南大學(xué) 2010
[4]數(shù)據(jù)挖掘可視化技術(shù)的研究與實(shí)現(xiàn)[D]. 鄭宏.西安電子科技大學(xué) 2010
[5]中醫(yī)臨床診療垂直搜索系統(tǒng)研究[D]. 莊力.北京交通大學(xué) 2009
[6]基于Lucene的垂直搜索引擎關(guān)鍵技術(shù)的研究應(yīng)用[D]. 劉朋.武漢理工大學(xué) 2009
[7]基于本體的交通導(dǎo)航數(shù)據(jù)語(yǔ)義查詢研究[D]. 王慶連.大連海事大學(xué) 2009
[8]面向?qū)W科的基礎(chǔ)教育資源垂直搜索引擎的研究與實(shí)現(xiàn)[D]. 翟曉玲.東北師范大學(xué) 2009
[9]基于本體的垂直搜索引擎研究[D]. 劉興濤.山東大學(xué) 2009
[10]基于本體的垂直搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 孔楠.北京交通大學(xué) 2008
本文編號(hào):3015348
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 學(xué)科資源導(dǎo)航庫(kù)研究現(xiàn)狀
1.2.2 垂直搜索引擎研究現(xiàn)狀
1.2.3 存在的問(wèn)題
1.3 論文主要工作
1.4 論文組織結(jié)構(gòu)
2 垂直搜索引擎的相關(guān)理論概述
2.1 搜索引擎的內(nèi)涵
2.1.1 搜索引擎是什么
2.1.2 搜索引擎的分類
2.2 垂直搜索引擎
2.2.1 垂直搜索引擎的產(chǎn)生
2.2.2 垂直搜索引擎系統(tǒng)總體架構(gòu)
2.3 垂直搜索引擎系統(tǒng)開發(fā)相關(guān)開源組件
2.3.1 Lucene概述
2.3.2 Heritrix介紹
2.4 本章小結(jié)
3 基于WEB的學(xué)科資源垂直搜索引擎關(guān)鍵問(wèn)題研究
3.1 學(xué)科資源本體的概述與構(gòu)建
3.1.1 學(xué)科資源本體相關(guān)理論概述
3.1.2 學(xué)科資源本體的構(gòu)建
3.2 文本分類
3.2.1 文本分類概述
3.2.2 文本分類的實(shí)現(xiàn)
3.3 信息過(guò)濾
3.3.1 信息過(guò)濾概述
3.3.2 信息過(guò)濾的實(shí)現(xiàn)
3.4 檢索結(jié)果的可視化
3.4.1 可視化及Jena概述
3.4.2 檢索結(jié)果可視化的實(shí)現(xiàn)
3.5 本章小結(jié)
4 基于WEB的學(xué)科資源垂直搜索引擎的設(shè)計(jì)
4.1 設(shè)計(jì)思路
4.2 系統(tǒng)體系結(jié)構(gòu)
4.3 功能模塊設(shè)計(jì)
4.3.1 信息采集模塊
4.3.2 信息抽取模塊
4.3.3 文本分類模塊
4.3.4 索引模塊
4.3.5 檢索模塊
4.3.6 信息過(guò)濾模塊
4.4 數(shù)據(jù)庫(kù)設(shè)計(jì)
4.5 本章小結(jié)
5 基于WEB的學(xué)科資源垂直搜索引擎的實(shí)現(xiàn)
5.1 開發(fā)環(huán)境
5.2 主要功能模塊實(shí)現(xiàn)
5.2.1 信息采集模塊的實(shí)現(xiàn)
5.2.2 信息抽取模塊的實(shí)現(xiàn)
5.2.3 索引模塊的實(shí)現(xiàn)
5.2.4 檢索模塊的實(shí)現(xiàn)
5.3 系統(tǒng)測(cè)試與總結(jié)
5.3.1 測(cè)試環(huán)境
5.3.2 信息采集模塊測(cè)試
5.3.3 信息抽取模塊測(cè)試
5.3.4 索引模塊測(cè)試
5.3.5 檢索模塊測(cè)試
5.3.6 系統(tǒng)總結(jié)與評(píng)價(jià)
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 本文總結(jié)
6.2 問(wèn)題與展望
參考文獻(xiàn)
論文項(xiàng)目資助、攻讀學(xué)位期間參與項(xiàng)目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]農(nóng)業(yè)高校圖書館重點(diǎn)學(xué)科資源導(dǎo)航庫(kù)的構(gòu)建及問(wèn)題探討——以東北農(nóng)業(yè)大學(xué)農(nóng)業(yè)學(xué)科資源導(dǎo)航系統(tǒng)為例[J]. 齊紅,陶和林. 農(nóng)業(yè)圖書情報(bào)學(xué)刊. 2011(11)
[2]Heritrix在垂直搜索引擎中的應(yīng)用[J]. 白萬(wàn)民,蘇希樂(lè). 計(jì)算機(jī)時(shí)代. 2011(09)
[3]面向主題的垂直搜索引擎系統(tǒng)的研究與實(shí)現(xiàn)[J]. 施佺,王恒山,肖仰華,丁衛(wèi)平. 微電子學(xué)與計(jì)算機(jī). 2011(07)
[4]基于DOM的動(dòng)態(tài)網(wǎng)頁(yè)信息抽取方法[J]. 王平根. 科技信息. 2010(31)
[5]垂直搜索引擎的研究與設(shè)計(jì)[J]. 劉運(yùn)強(qiáng). 計(jì)算機(jī)應(yīng)用與軟件. 2010(07)
[6]基于Lucene全文檢索引擎的研究與實(shí)現(xiàn)[J]. 胡繼鈞. 科技創(chuàng)新導(dǎo)報(bào). 2010(20)
[7]農(nóng)業(yè)搜索引擎的發(fā)展現(xiàn)狀及關(guān)鍵技術(shù)研究[J]. 彭玉容,楊捧,高媛. 安徽農(nóng)業(yè)科學(xué). 2010(20)
[8]基于分類的智能搜索引擎研究與實(shí)現(xiàn)[J]. 程傳鵬. 中原工學(xué)院學(xué)報(bào). 2010(03)
[9]基于語(yǔ)義查詢擴(kuò)展的垂直搜索研究[J]. 趙建偉,鄭誠(chéng),吳永俊. 計(jì)算機(jī)工程. 2010(12)
[10]面向計(jì)算機(jī)教育資源的垂直搜索引擎系統(tǒng)的設(shè)計(jì)[J]. 李廣麗,張紅斌. 情報(bào)理論與實(shí)踐. 2010(05)
博士論文
[1]文本分類及其相關(guān)技術(shù)研究[D]. 尚文倩.北京交通大學(xué) 2007
碩士論文
[1]基于領(lǐng)域本體的智能檢索技術(shù)應(yīng)用研究[D]. 宋慶.中國(guó)農(nóng)業(yè)科學(xué)院 2011
[2]面向領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)[D]. 邱偉林.大連海事大學(xué) 2011
[3]專家信息垂直搜索引擎關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D]. 劉邵斌.中南大學(xué) 2010
[4]數(shù)據(jù)挖掘可視化技術(shù)的研究與實(shí)現(xiàn)[D]. 鄭宏.西安電子科技大學(xué) 2010
[5]中醫(yī)臨床診療垂直搜索系統(tǒng)研究[D]. 莊力.北京交通大學(xué) 2009
[6]基于Lucene的垂直搜索引擎關(guān)鍵技術(shù)的研究應(yīng)用[D]. 劉朋.武漢理工大學(xué) 2009
[7]基于本體的交通導(dǎo)航數(shù)據(jù)語(yǔ)義查詢研究[D]. 王慶連.大連海事大學(xué) 2009
[8]面向?qū)W科的基礎(chǔ)教育資源垂直搜索引擎的研究與實(shí)現(xiàn)[D]. 翟曉玲.東北師范大學(xué) 2009
[9]基于本體的垂直搜索引擎研究[D]. 劉興濤.山東大學(xué) 2009
[10]基于本體的垂直搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 孔楠.北京交通大學(xué) 2008
本文編號(hào):3015348
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3015348.html
最近更新
教材專著