面向校園垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn).pdf 全文免費(fèi)在線閱讀
本文關(guān)鍵詞:面向校園的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
文檔介紹:
面向校園的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)摘要摘要隨著互聯(lián)網(wǎng)的迅速發(fā)展,網(wǎng)頁數(shù)量越來越多。面對(duì)如此巨大的信息,搜索引擎技術(shù)給人們帶來了極大的方便。通過搜索引擎,人們可以方便地訪問自己不知道的網(wǎng)頁,從中獲取跟多有用的信息。然而,隨著互聯(lián)網(wǎng)上網(wǎng)頁數(shù)量的不斷增加,很多搜索引擎搜索信息時(shí)往往產(chǎn)生搜索到的頁面過多、網(wǎng)頁重復(fù)現(xiàn)象嚴(yán)重、網(wǎng)頁數(shù)據(jù)更新慢、符合搜索要求的網(wǎng)頁比較少,甚至由于搜索引擎的網(wǎng)絡(luò)蜘蛛訪問導(dǎo)致網(wǎng)絡(luò)擁塞的現(xiàn)象也時(shí)常發(fā)生。垂直搜索技術(shù)的產(chǎn)生給這些問題的解決帶來了希望,它面向某一個(gè)具體領(lǐng)域,數(shù)據(jù)往往針對(duì)主題、數(shù)據(jù)及時(shí)有效、符合搜索要求程度高。近年來,各個(gè)領(lǐng)域的垂直搜索引擎層出不窮。本文從理論和實(shí)踐的兩個(gè)方面,以學(xué)校和教育領(lǐng)域的網(wǎng)頁為對(duì)象,探討了網(wǎng)頁獲取、頁面分析、信息索引排序等技術(shù)在垂直搜索引擎上的應(yīng)用。論文首先介紹了搜索引擎和它的工作原理,然后再把當(dāng)前比較熱門的垂直搜索技術(shù)進(jìn)行了研究和討論,在比較性能和實(shí)現(xiàn)代價(jià)的基礎(chǔ)上,對(duì)垂直搜索引擎所使用的專業(yè)網(wǎng)絡(luò)蜘蛛進(jìn)行了設(shè)計(jì)、對(duì)頁面分類和信息結(jié)構(gòu)化方面做了研究和選擇,最后使用成熟高效的Lucene框架來實(shí)現(xiàn)索引和檢索,并對(duì)系統(tǒng)優(yōu)化作出了嘗試。關(guān)鍵詞:垂直搜索;主題爬蟲;中文分詞;鏈...
內(nèi)容來自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:面向校園的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
本文編號(hào):112605
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/112605.html