網(wǎng)絡(luò)搜索引擎的設(shè)計與實現(xiàn)
發(fā)布時間:2017-10-28 23:31
本文關(guān)鍵詞:網(wǎng)絡(luò)搜索引擎的設(shè)計與實現(xiàn)
更多相關(guān)文章: 搜索引擎 網(wǎng)絡(luò)蜘蛛 索引器 檢索器
【摘要】:提出了一個基于Java的全文搜索引擎設(shè)計方案,該方案包括基于HTMLParser設(shè)計的網(wǎng)絡(luò)蜘蛛、基于Lucene設(shè)計的索引器和檢索器3部分。網(wǎng)絡(luò)蜘蛛采用標(biāo)簽爬行策略和寬度優(yōu)先遍歷算法,實現(xiàn)了對網(wǎng)頁的遍歷;索引器對網(wǎng)絡(luò)蜘蛛抓取到的網(wǎng)頁創(chuàng)建索引,建立了索引數(shù)據(jù)庫;檢索器根據(jù)用戶輸入的關(guān)鍵詞對索引數(shù)據(jù)庫進行檢索并將檢索結(jié)果反饋給用戶。檢索實驗證明,該搜索引擎是一個比較高效的檢索工具。
【作者單位】: 南陽廣播電視大學(xué);
【關(guān)鍵詞】: 搜索引擎 網(wǎng)絡(luò)蜘蛛 索引器 檢索器
【分類號】:TP391.3
【正文快照】: 0引言隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)中的信息量也越來越大,如何更加有效地利用這些信息資源,已經(jīng)越來越受到人們的關(guān)注;ヂ(lián)網(wǎng)中存在的信息來源十分廣泛,與此同時,存在的形式也是多種多樣,包括圖像、文本、視頻、音頻等不同的形式,面對著不同來源,不同形式的海量信息,如何
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 孫宏;李戴維;董旭陽;季澤旭;;搜索引擎技術(shù)與發(fā)展綜述[J];計算機光盤軟件與應(yīng)用;2012年14期
2 李浩;蔣,
本文編號:1110472
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1110472.html
最近更新
教材專著