基于Lucene.NET的網(wǎng)絡(luò)信息搜索系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2017-04-20 08:18
本文關(guān)鍵詞:基于Lucene.NET的網(wǎng)絡(luò)信息搜索系統(tǒng)的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:自從進(jìn)入二十一世紀(jì)以來,隨著信息化技術(shù)以及互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展和創(chuàng)新。人類生活的各個方面越來越需要互聯(lián)網(wǎng)上的各種信息和數(shù)據(jù)。因此在互聯(lián)網(wǎng)上的數(shù)據(jù)和信息也在迅速的膨脹。由于互聯(lián)網(wǎng)數(shù)據(jù)信息的廣泛性,人們必須要通過某種手段對自身需要的數(shù)據(jù)信息進(jìn)行篩選和選擇。 互聯(lián)網(wǎng)數(shù)據(jù)信息有著很重要的利用價值,但是在海量的數(shù)據(jù)信息中對用戶所需要的數(shù)據(jù)信息進(jìn)行檢索和篩選是當(dāng)今互聯(lián)網(wǎng)技術(shù)領(lǐng)域以及信息檢索技術(shù)領(lǐng)域的一個熱門話題。利用Lucene技術(shù)開發(fā)的網(wǎng)絡(luò)信息搜索技術(shù)是當(dāng)今互聯(lián)網(wǎng)數(shù)據(jù)信息檢索技術(shù)的熱點。幾乎成為了全文搜索的同義詞。伴隨著.NET開發(fā)平臺不斷地完善和發(fā)展,作為Lucene在.NET開發(fā)平臺的移植版本,Lucene.NET也越來越流行。互聯(lián)網(wǎng)數(shù)據(jù)信息的搜索主要在數(shù)據(jù)的挖掘和查找,多種數(shù)據(jù)信息的檢索,良好的用戶體驗,優(yōu)良的自然語言查詢以及本土化查詢等方面加強(qiáng)發(fā)展。數(shù)據(jù)挖掘技術(shù)主要應(yīng)用在分布式數(shù)據(jù)庫中,互聯(lián)網(wǎng)中的數(shù)據(jù)信息與數(shù)據(jù)挖掘技術(shù)以及數(shù)據(jù)的檢索技術(shù)相結(jié)合,,可以給用戶提供一個新的數(shù)據(jù)信息學(xué)習(xí)模式以及解決問題的方式方法。 將Lucene.NET,C#開發(fā)語言以及數(shù)據(jù)庫相關(guān)的技術(shù)與理論應(yīng)用于互聯(lián)網(wǎng)的數(shù)據(jù)信息資源搜索的過程之中,形成一個功能完善運行穩(wěn)定的網(wǎng)絡(luò)信息搜索系統(tǒng),這樣就能大大提高對互聯(lián)網(wǎng)數(shù)據(jù)資源利用的效率以及準(zhǔn)確性,并且也盡可能的避免了數(shù)據(jù)統(tǒng)計的錯誤,從而達(dá)到高效智能化利用互聯(lián)網(wǎng)數(shù)據(jù)信息資源的目的。 本文的主要內(nèi)容如下: 1.簡要介紹了本文的研究背景,研究現(xiàn)狀以及研究內(nèi)容和意義; 2.主要介紹了互聯(lián)網(wǎng)搜索引擎系統(tǒng)的產(chǎn)生背景,發(fā)展階段以及分類特點,并介紹了其應(yīng)用在實際處理中的優(yōu)點; 3.描述了Lucene.NET以及網(wǎng)絡(luò)爬蟲相關(guān)技術(shù)的特點以及理論知識,并根據(jù)其理論設(shè)計出網(wǎng)絡(luò)信息搜索系統(tǒng)的相關(guān)邏輯以及規(guī)則; 4.網(wǎng)絡(luò)信息搜索系統(tǒng)的實現(xiàn)部分。從系統(tǒng)軟件結(jié)構(gòu),主要功能,數(shù)據(jù)庫設(shè)計以及具體實現(xiàn)界面的角度全面介紹了該系統(tǒng)的實現(xiàn)步驟以及具體功能。 5.對網(wǎng)絡(luò)信息搜索系統(tǒng)的功能模塊進(jìn)行了測試,并根據(jù)測試結(jié)果發(fā)現(xiàn)該系統(tǒng)的不足并加以改進(jìn)。
【關(guān)鍵詞】:互聯(lián)網(wǎng)數(shù)據(jù)信息 Lucene.NET 搜索引擎 網(wǎng)絡(luò)爬蟲技術(shù)
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.3
【目錄】:
- 摘要4-6
- Abstract6-10
- 第1章 緒論10-13
- 1.1 研究背景10
- 1.2 研究現(xiàn)狀10-11
- 1.3 發(fā)展趨勢11
- 1.4 研究內(nèi)容及意義11-12
- 1.5 本文主要結(jié)構(gòu)12-13
- 第2章 基于 LUCENE.NET 網(wǎng)絡(luò)信息搜索系統(tǒng)概述13-19
- 2.1 LUCENE.NET 原理13-14
- 2.2 搜索引擎介紹14
- 2.3 搜索引擎的分類14-15
- 2.4 基于 LUCENE.NET 實現(xiàn)網(wǎng)絡(luò)信息搜索15-18
- 2.4.1 創(chuàng)建和管理索引庫16-17
- 2.4.2 查找索引庫17-18
- 2.4.3 索引的優(yōu)化和合并18
- 2.5 本章小結(jié)18-19
- 第3章 網(wǎng)絡(luò)信息搜索系統(tǒng)關(guān)鍵技術(shù)19-31
- 3.1 網(wǎng)絡(luò)爬蟲技術(shù)19-23
- 3.1.1 網(wǎng)絡(luò)爬蟲技術(shù)的發(fā)展歷程19-20
- 3.1.2 網(wǎng)絡(luò)爬蟲技術(shù)的抓取原理20
- 3.1.3 網(wǎng)絡(luò)爬蟲的架構(gòu)20-22
- 3.1.4 網(wǎng)絡(luò)爬蟲的連接池和日志22-23
- 3.2 自然語言處理23-29
- 3.2.1 文檔重排技術(shù)24-25
- 3.2.2 中文關(guān)鍵詞提取25-26
- 3.2.3 文本摘要26-27
- 3.2.4 文本信息提取27-28
- 3.2.5 中文分詞28-29
- 3.3 本章小結(jié)29-31
- 第4章 系統(tǒng)的設(shè)計與實現(xiàn)31-42
- 4.1 系統(tǒng)需求分析31
- 4.2 系統(tǒng)設(shè)計目標(biāo)31-32
- 4.3 系統(tǒng)主要功能32-33
- 4.4 系統(tǒng)數(shù)據(jù)庫分析33-34
- 4.5 功能模塊設(shè)計34-39
- 4.5.1 爬蟲功能模塊設(shè)計34-37
- 4.5.2 更新功能模塊設(shè)計37-39
- 4.5.3 文檔處理功能模塊設(shè)計39
- 4.6 系統(tǒng)的實現(xiàn)39-41
- 4.7 本章小結(jié)41-42
- 第5章 網(wǎng)絡(luò)信息搜索系統(tǒng)測試42-45
- 5.1 系統(tǒng)測試環(huán)境42
- 5.2 測試用例42-43
- 5.3 本章小結(jié)43-45
- 第6章 總結(jié)與展望45-47
- 6.1 總結(jié)45
- 6.2 展望45-47
- 參考文獻(xiàn)47-49
- 致謝49
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 張曉剛,李明樹;智能搜索引擎技術(shù)的研究與發(fā)展[J];計算機(jī)工程與應(yīng)用;2001年24期
2 陳燕娜,邵志清;基于全文搜索的中文搜索引擎設(shè)計技術(shù)[J];計算機(jī)工程與應(yīng)用;2002年17期
本文關(guān)鍵詞:基于Lucene.NET的網(wǎng)絡(luò)信息搜索系統(tǒng)的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號:318267
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/318267.html
最近更新
教材專著