基于Lucene.NET的網(wǎng)絡(luò)信息搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2017-04-20 08:18
本文關(guān)鍵詞:基于Lucene.NET的網(wǎng)絡(luò)信息搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:自從進(jìn)入二十一世紀(jì)以來(lái),隨著信息化技術(shù)以及互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展和創(chuàng)新。人類(lèi)生活的各個(gè)方面越來(lái)越需要互聯(lián)網(wǎng)上的各種信息和數(shù)據(jù)。因此在互聯(lián)網(wǎng)上的數(shù)據(jù)和信息也在迅速的膨脹。由于互聯(lián)網(wǎng)數(shù)據(jù)信息的廣泛性,人們必須要通過(guò)某種手段對(duì)自身需要的數(shù)據(jù)信息進(jìn)行篩選和選擇。 互聯(lián)網(wǎng)數(shù)據(jù)信息有著很重要的利用價(jià)值,但是在海量的數(shù)據(jù)信息中對(duì)用戶(hù)所需要的數(shù)據(jù)信息進(jìn)行檢索和篩選是當(dāng)今互聯(lián)網(wǎng)技術(shù)領(lǐng)域以及信息檢索技術(shù)領(lǐng)域的一個(gè)熱門(mén)話題。利用Lucene技術(shù)開(kāi)發(fā)的網(wǎng)絡(luò)信息搜索技術(shù)是當(dāng)今互聯(lián)網(wǎng)數(shù)據(jù)信息檢索技術(shù)的熱點(diǎn)。幾乎成為了全文搜索的同義詞。伴隨著.NET開(kāi)發(fā)平臺(tái)不斷地完善和發(fā)展,作為L(zhǎng)ucene在.NET開(kāi)發(fā)平臺(tái)的移植版本,Lucene.NET也越來(lái)越流行;ヂ(lián)網(wǎng)數(shù)據(jù)信息的搜索主要在數(shù)據(jù)的挖掘和查找,多種數(shù)據(jù)信息的檢索,良好的用戶(hù)體驗(yàn),優(yōu)良的自然語(yǔ)言查詢(xún)以及本土化查詢(xún)等方面加強(qiáng)發(fā)展。數(shù)據(jù)挖掘技術(shù)主要應(yīng)用在分布式數(shù)據(jù)庫(kù)中,互聯(lián)網(wǎng)中的數(shù)據(jù)信息與數(shù)據(jù)挖掘技術(shù)以及數(shù)據(jù)的檢索技術(shù)相結(jié)合,,可以給用戶(hù)提供一個(gè)新的數(shù)據(jù)信息學(xué)習(xí)模式以及解決問(wèn)題的方式方法。 將Lucene.NET,C#開(kāi)發(fā)語(yǔ)言以及數(shù)據(jù)庫(kù)相關(guān)的技術(shù)與理論應(yīng)用于互聯(lián)網(wǎng)的數(shù)據(jù)信息資源搜索的過(guò)程之中,形成一個(gè)功能完善運(yùn)行穩(wěn)定的網(wǎng)絡(luò)信息搜索系統(tǒng),這樣就能大大提高對(duì)互聯(lián)網(wǎng)數(shù)據(jù)資源利用的效率以及準(zhǔn)確性,并且也盡可能的避免了數(shù)據(jù)統(tǒng)計(jì)的錯(cuò)誤,從而達(dá)到高效智能化利用互聯(lián)網(wǎng)數(shù)據(jù)信息資源的目的。 本文的主要內(nèi)容如下: 1.簡(jiǎn)要介紹了本文的研究背景,研究現(xiàn)狀以及研究?jī)?nèi)容和意義; 2.主要介紹了互聯(lián)網(wǎng)搜索引擎系統(tǒng)的產(chǎn)生背景,發(fā)展階段以及分類(lèi)特點(diǎn),并介紹了其應(yīng)用在實(shí)際處理中的優(yōu)點(diǎn); 3.描述了Lucene.NET以及網(wǎng)絡(luò)爬蟲(chóng)相關(guān)技術(shù)的特點(diǎn)以及理論知識(shí),并根據(jù)其理論設(shè)計(jì)出網(wǎng)絡(luò)信息搜索系統(tǒng)的相關(guān)邏輯以及規(guī)則; 4.網(wǎng)絡(luò)信息搜索系統(tǒng)的實(shí)現(xiàn)部分。從系統(tǒng)軟件結(jié)構(gòu),主要功能,數(shù)據(jù)庫(kù)設(shè)計(jì)以及具體實(shí)現(xiàn)界面的角度全面介紹了該系統(tǒng)的實(shí)現(xiàn)步驟以及具體功能。 5.對(duì)網(wǎng)絡(luò)信息搜索系統(tǒng)的功能模塊進(jìn)行了測(cè)試,并根據(jù)測(cè)試結(jié)果發(fā)現(xiàn)該系統(tǒng)的不足并加以改進(jìn)。
【關(guān)鍵詞】:互聯(lián)網(wǎng)數(shù)據(jù)信息 Lucene.NET 搜索引擎 網(wǎng)絡(luò)爬蟲(chóng)技術(shù)
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類(lèi)號(hào)】:TP391.3
【目錄】:
- 摘要4-6
- Abstract6-10
- 第1章 緒論10-13
- 1.1 研究背景10
- 1.2 研究現(xiàn)狀10-11
- 1.3 發(fā)展趨勢(shì)11
- 1.4 研究?jī)?nèi)容及意義11-12
- 1.5 本文主要結(jié)構(gòu)12-13
- 第2章 基于 LUCENE.NET 網(wǎng)絡(luò)信息搜索系統(tǒng)概述13-19
- 2.1 LUCENE.NET 原理13-14
- 2.2 搜索引擎介紹14
- 2.3 搜索引擎的分類(lèi)14-15
- 2.4 基于 LUCENE.NET 實(shí)現(xiàn)網(wǎng)絡(luò)信息搜索15-18
- 2.4.1 創(chuàng)建和管理索引庫(kù)16-17
- 2.4.2 查找索引庫(kù)17-18
- 2.4.3 索引的優(yōu)化和合并18
- 2.5 本章小結(jié)18-19
- 第3章 網(wǎng)絡(luò)信息搜索系統(tǒng)關(guān)鍵技術(shù)19-31
- 3.1 網(wǎng)絡(luò)爬蟲(chóng)技術(shù)19-23
- 3.1.1 網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的發(fā)展歷程19-20
- 3.1.2 網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的抓取原理20
- 3.1.3 網(wǎng)絡(luò)爬蟲(chóng)的架構(gòu)20-22
- 3.1.4 網(wǎng)絡(luò)爬蟲(chóng)的連接池和日志22-23
- 3.2 自然語(yǔ)言處理23-29
- 3.2.1 文檔重排技術(shù)24-25
- 3.2.2 中文關(guān)鍵詞提取25-26
- 3.2.3 文本摘要26-27
- 3.2.4 文本信息提取27-28
- 3.2.5 中文分詞28-29
- 3.3 本章小結(jié)29-31
- 第4章 系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)31-42
- 4.1 系統(tǒng)需求分析31
- 4.2 系統(tǒng)設(shè)計(jì)目標(biāo)31-32
- 4.3 系統(tǒng)主要功能32-33
- 4.4 系統(tǒng)數(shù)據(jù)庫(kù)分析33-34
- 4.5 功能模塊設(shè)計(jì)34-39
- 4.5.1 爬蟲(chóng)功能模塊設(shè)計(jì)34-37
- 4.5.2 更新功能模塊設(shè)計(jì)37-39
- 4.5.3 文檔處理功能模塊設(shè)計(jì)39
- 4.6 系統(tǒng)的實(shí)現(xiàn)39-41
- 4.7 本章小結(jié)41-42
- 第5章 網(wǎng)絡(luò)信息搜索系統(tǒng)測(cè)試42-45
- 5.1 系統(tǒng)測(cè)試環(huán)境42
- 5.2 測(cè)試用例42-43
- 5.3 本章小結(jié)43-45
- 第6章 總結(jié)與展望45-47
- 6.1 總結(jié)45
- 6.2 展望45-47
- 參考文獻(xiàn)47-49
- 致謝49
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 張曉剛,李明樹(shù);智能搜索引擎技術(shù)的研究與發(fā)展[J];計(jì)算機(jī)工程與應(yīng)用;2001年24期
2 陳燕娜,邵志清;基于全文搜索的中文搜索引擎設(shè)計(jì)技術(shù)[J];計(jì)算機(jī)工程與應(yīng)用;2002年17期
本文關(guān)鍵詞:基于Lucene.NET的網(wǎng)絡(luò)信息搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):318267
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/318267.html
最近更新
教材專(zhuān)著