基于Lucene構(gòu)建的校園網(wǎng)黃頁系統(tǒng)研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于Lucene構(gòu)建的校園網(wǎng)黃頁系統(tǒng)研究與實(shí)現(xiàn)
更多相關(guān)文章: 校園網(wǎng) Lucene 搜索引擎 黃頁系統(tǒng) 網(wǎng)絡(luò)爬蟲
【摘要】:網(wǎng)站黃頁系統(tǒng)是一個(gè)自動生成網(wǎng)站黃頁目錄并以此為基礎(chǔ)為用戶提供一系列服務(wù)的系統(tǒng)。它通過快速收集網(wǎng)絡(luò)上的教育資源,并自動化地對其進(jìn)行高質(zhì)量的分類和信息抽取,形成教育網(wǎng)站黃頁,為用戶提供瀏覽、檢索等服務(wù)。未經(jīng)過二次開發(fā)的黃頁系統(tǒng)檢索的準(zhǔn)確性普遍較低,不適合校園網(wǎng)絡(luò)的使用.針對普通搜索引擎的固有缺陷,提出了一種應(yīng)用于新聞檢索的搜索引擎,該引擎是利用開源的網(wǎng)絡(luò)爬蟲工具將互聯(lián)網(wǎng)信息抓取到本地,并利用Lucene開放的API,對特定的信息進(jìn)行索引和搜索。
【作者單位】: 安慶師范學(xué)院現(xiàn)代教育技術(shù)中心;
【關(guān)鍵詞】: 校園網(wǎng) Lucene 搜索引擎 黃頁系統(tǒng) 網(wǎng)絡(luò)爬蟲
【分類號】:TP393.18;TP393.08
【正文快照】: 引言隨著互聯(lián)網(wǎng)的迅速發(fā)展,信息爆炸的時(shí)代已經(jīng)來臨,人們每天在網(wǎng)絡(luò)上要面對無數(shù)的信息和數(shù)據(jù)。如何對這些數(shù)據(jù)進(jìn)行篩選和甄別,從中選取出真實(shí)有效且有用的信息,是一件非常困難的事情,特別是當(dāng)沒有一套行之有效的判別標(biāo)準(zhǔn)的時(shí)候。傳統(tǒng)搜索引擎的出現(xiàn)很大程度上解決了此類問題,
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 ;搜狐黃頁,您上了沒有?[J];現(xiàn)代電子技術(shù);2003年14期
2 ;搜狐黃頁,您上了沒有?[J];現(xiàn)代電子技術(shù);2003年15期
3 ;搜狐黃頁,您上了沒有?[J];現(xiàn)代電子技術(shù);2003年04期
4 王炯;網(wǎng)上指南針——網(wǎng)上黃頁[J];計(jì)算機(jī)周刊;1999年34期
5 郭飛躍;網(wǎng)上常用的十類查詢引介[J];現(xiàn)代電子技術(shù);1999年07期
6 陸寧,王明文,尤晉元;一種Internet移動代理系統(tǒng)的黃頁服務(wù)模型[J];計(jì)算機(jī)工程;2000年10期
7 陳海朋;精選網(wǎng)址[J];電腦知識與技術(shù);1998年08期
8 倪俊峰,俞立峰,陸鈞,高峻,張根度;網(wǎng)上黃頁站點(diǎn)中矢量電子地圖的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2000年08期
9 倪俊峰,李琦;使用ISAPI和Java技術(shù)實(shí)現(xiàn)黃頁網(wǎng)站的電子地圖系統(tǒng)[J];計(jì)算機(jī)應(yīng)用研究;2000年12期
10 高東升;互聯(lián)網(wǎng)老照片——追憶似水流年[J];網(wǎng)絡(luò)與信息;2003年02期
中國重要報(bào)紙全文數(shù)據(jù)庫 前3條
1 ;搜索引擎檢索[N];中國海洋報(bào);2000年
2 中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC) 梁嘉華;UDDI與Web Service[N];計(jì)算機(jī)世界;2003年
3 鄧侃;UDDI地球村童話的網(wǎng)絡(luò)版[N];中國計(jì)算機(jī)報(bào);2002年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 曹卓文;基礎(chǔ)教育網(wǎng)站黃頁系統(tǒng)研究[D];南京師范大學(xué);2008年
2 王莉莉;基于B/S模式的網(wǎng)通黃頁信息網(wǎng)站的設(shè)計(jì)與實(shí)現(xiàn)[D];遼寧科技大學(xué);2008年
,本文編號:662299
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/662299.html