面向遠(yuǎn)程教育主題搜索引擎的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:面向遠(yuǎn)程教育主題搜索引擎的研究與實(shí)現(xiàn)
更多相關(guān)文章: 遠(yuǎn)程教育 搜索引擎 主題搜索
【摘要】:隨著Internet和網(wǎng)絡(luò)多媒體技術(shù)的高速發(fā)展,遠(yuǎn)程教育信息資源日益豐富,成為人們獲得知識(shí)的一種重要途徑,遠(yuǎn)程教育資源不僅滿足了廣大學(xué)習(xí)者的學(xué)習(xí)新知識(shí)的需求,同時(shí)也為建設(shè)學(xué)習(xí)型社會(huì)和實(shí)現(xiàn)終身教育做出了巨大的貢獻(xiàn)。但是隨著數(shù)據(jù)量的不斷增大,通過手動(dòng)的瀏覽網(wǎng)頁或者傳統(tǒng)的搜索引擎在海量的網(wǎng)絡(luò)資源中定位自己需要的資源也越來越困難。面向遠(yuǎn)程教育的主題搜索引擎正是在這樣的背景下誕生的,它能幫助學(xué)習(xí)者快速的定位自己需要的信息資源。 本論文以遠(yuǎn)程教育學(xué)院資源建設(shè)為出發(fā)點(diǎn),以部分遠(yuǎn)程教育學(xué)院的網(wǎng)站為研究對(duì)象,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)面向遠(yuǎn)程教育的主題搜索引擎。面向遠(yuǎn)程教育的主題搜索引擎首先確定了遠(yuǎn)程教育專業(yè)詞庫的構(gòu)建方法,提出一種基于Heritrix的主題網(wǎng)頁過濾方法。其次,借助HTMLParser對(duì)抓取的網(wǎng)頁進(jìn)行信息提取,形成文本文件。最后,由Lucene完成索引和搜索,本文還對(duì)Lucene的索引過程進(jìn)行了優(yōu)化,提高了索引的速度,,另外對(duì)Lucene排序算法進(jìn)行了改進(jìn)。通過試驗(yàn)測(cè)試,驗(yàn)證了本文設(shè)計(jì)的面向遠(yuǎn)程教育的主題搜索引擎各子系統(tǒng)的可行性,并與傳統(tǒng)搜索引擎進(jìn)行對(duì)比,在保證查全率的基礎(chǔ)上能夠更高效、更準(zhǔn)確地進(jìn)行信息資源定位。
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:G40-057
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 劉世濤;;簡(jiǎn)析搜索引擎中網(wǎng)絡(luò)爬蟲的搜索策略[J];阜陽師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2006年03期
2 趙善明;崔翔;楊書濤;;主題搜索引擎搜索淺析[J];才智;2008年13期
3 王慶民;;互聯(lián)網(wǎng)搜索引擎的發(fā)展、應(yīng)用和特點(diǎn)[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2009年05期
4 白萬民;蘇希樂;;Heritrix在垂直搜索引擎中的應(yīng)用[J];計(jì)算機(jī)時(shí)代;2011年09期
5 張巍,李志蜀;基于PageRank算法的搜索引擎優(yōu)化策略[J];計(jì)算機(jī)應(yīng)用;2005年07期
6 張文靜;;搜索引擎的分類及發(fā)展趨勢(shì)[J];焦作大學(xué)學(xué)報(bào);2006年03期
7 張煥武;;搜索引擎技術(shù)研究的現(xiàn)狀與展望[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2009年03期
8 賈花萍;;元搜索引擎小議[J];科技信息(學(xué)術(shù)研究);2007年15期
9 黃日昆;網(wǎng)絡(luò)引文搜索引擎CiteSeer評(píng)析[J];情報(bào)雜志;2004年06期
10 孫庚;馮艷紅;于紅;史鵬輝;;一種基于Heritrix的網(wǎng)絡(luò)定題爬蟲算法——以漁業(yè)信息網(wǎng)絡(luò)為例[J];軟件導(dǎo)刊;2010年05期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 吳代文;基于Lucene的二次全文檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
2 張贏;個(gè)性化多媒體資源垂直搜索引擎技術(shù)研究[D];華東交通大學(xué);2009年
3 陳杰;主題搜索引擎中網(wǎng)絡(luò)蜘蛛搜索策略研究[D];浙江大學(xué);2006年
4 蔣科;基于領(lǐng)域概念定制的主題爬蟲系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2007年
5 董祥千;搜索引擎設(shè)計(jì)分析與結(jié)果聚類改進(jìn)[D];電子科技大學(xué);2007年
6 孫靜;搜索引擎網(wǎng)頁快照的安全性研究[D];北京化工大學(xué);2007年
7 王啟戶;面向遠(yuǎn)程教育的搜索引擎系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2008年
8 張楠;面向汽車主題的垂直搜索引擎研究與實(shí)現(xiàn)[D];西南交通大學(xué);2010年
9 田浩;基于PageRank值的文本相似度改進(jìn)模型[D];湖北工業(yè)大學(xué);2010年
本文編號(hào):1212525
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyugaigechuangxinlunwen/1212525.html