基于PageRank的Lucene排序算法優(yōu)化與實現(xiàn)
本文選題:Lucene + PageRank; 參考:《計算機工程與科學》2012年10期
【摘要】:隨著Web技術(shù)的迅速發(fā)展,提供個性化服務(wù)的搜索引擎技術(shù)受到用戶的廣泛關(guān)注,網(wǎng)頁排序是其中的關(guān)鍵技術(shù)之一。本文利用PageRank算法對原有的Lucene網(wǎng)頁排序進行了改進,設(shè)計并實現(xiàn)了關(guān)于手機信息搜索的個性化搜索引擎。實驗結(jié)果證明,改進后的排序算法能夠較好地提高信息檢索的準確度,為用戶帶來了優(yōu)于Lucene自身排序的搜索體驗。
[Abstract]:With the rapid development of Web technology, the search engine technology which provides personalized services has been widely concerned by users, among which the ranking of web pages is one of the key technologies. In this paper, the PageRank algorithm is used to improve the ranking of the original Lucene pages, and a personalized search engine for mobile phone information search is designed and implemented. Experimental results show that the improved sorting algorithm can improve the accuracy of information retrieval and bring users a better search experience than Lucene itself.
【作者單位】: 湖北工業(yè)大學計算機學院;
【基金】:國家自然科學基金資助項目(61075059) 湖北工業(yè)大學校教研項目資助(2011006)
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前1條
1 黃知義,周寧;Google搜索引擎的PageRank技術(shù)及其優(yōu)化研究[J];圖書館學研究;2005年08期
相關(guān)碩士學位論文 前3條
1 壽周翔;專業(yè)搜索引擎的研究與設(shè)計[D];浙江大學;2005年
2 史鵬輝;專業(yè)服務(wù)網(wǎng)站搜索引擎的設(shè)計與實現(xiàn)[D];大連理工大學;2004年
3 王亮;搜索引擎及其相關(guān)性排序研究[D];武漢大學;2004年
【共引文獻】
相關(guān)期刊論文 前10條
1 汪濤,樊孝忠,顧益軍,劉林;基于概念分析的主題爬蟲設(shè)計[J];北京理工大學學報;2004年10期
2 徐金雷;楊曉江;;基礎(chǔ)教育資源搜索引擎的排序算法研究[J];電化教育研究;2007年02期
3 唐培和,楊新倫,劉浩;Google搜索引擎及其實現(xiàn)技術(shù)[J];廣西工學院學報;2004年02期
4 劉林,汪濤,樊孝忠;主題爬蟲的解決方案[J];華南理工大學學報(自然科學版);2004年S1期
5 楊海東,張莉;PageRank技術(shù)分析與搜索引擎檢索效率研究[J];淮陰師范學院學報(自然科學版);2003年03期
6 楊沅釗,吳薇,喻曉莉,楊國才;搜索引擎排名改進算法分析[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2005年02期
7 汪濤,樊孝忠;主題爬蟲的設(shè)計與實現(xiàn)[J];計算機應(yīng)用;2004年S1期
8 汪濤,樊孝忠;鏈接分析對主題爬蟲的改進[J];計算機應(yīng)用;2004年S2期
9 陳再良;凌力;周強;;dPageRank——一種改進的分布式PageRank算法[J];計算機應(yīng)用;2006年01期
10 葛蓉;利用網(wǎng)絡(luò)日志分析提高搜索引擎的檢準率[J];情報科學;2004年10期
相關(guān)會議論文 前1條
1 陸勇;侯漢清;;基于詞典注釋的漢語同義詞自動識別[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2004年
相關(guān)博士學位論文 前2條
1 常春;Ontology在農(nóng)業(yè)信息管理中的構(gòu)建和轉(zhuǎn)化[D];中國農(nóng)業(yè)科學院;2004年
2 宗校軍;中文網(wǎng)頁定題采集及分類研究[D];華中科技大學;2006年
相關(guān)碩士學位論文 前10條
1 趙立剛;搜索引擎的研究與設(shè)計[D];吉林大學;2005年
2 張巍;基于PageRank算法的搜索引擎優(yōu)化策略研究[D];四川大學;2005年
3 朱素媛;網(wǎng)絡(luò)教育中的智能搜索引擎的研究[D];合肥工業(yè)大學;2004年
4 譚德坤;文本挖掘及其在UDDI Registry智能檢索中的應(yīng)用[D];昆明理工大學;2004年
5 吳東華;Web信息獲取技術(shù)研究[D];南京理工大學;2004年
6 陸勇;面向信息檢索的漢語同義詞自動識別[D];南京農(nóng)業(yè)大學;2005年
7 王斐;基于增量反饋和自適應(yīng)機制的主題爬蟲系統(tǒng)的設(shè)計與實現(xiàn)[D];南京理工大學;2005年
8 張玲莉;使用二維可視化技術(shù)的網(wǎng)站可用性分析方法的研究與應(yīng)用[D];大連海事大學;2005年
9 張波;個性化Web搜索系統(tǒng)研究[D];燕山大學;2006年
10 丁邦旭;基于P2P的分布式中文搜索引擎的應(yīng)用研究[D];南昌大學;2006年
【二級參考文獻】
相關(guān)期刊論文 前7條
1 林亞平,李彥,童調(diào)生,尹鋒;漢語自動分詞中的神經(jīng)網(wǎng)絡(luò)技術(shù)研究[J];湖南大學學報(自然科學版);1997年06期
2 殷建平;漢語自動分詞方法[J];計算機工程與科學;1998年03期
3 李潔;搜索引擎中相關(guān)性測算發(fā)展研究[J];情報雜志;2003年12期
4 桂曉玲;網(wǎng)絡(luò)環(huán)境下信息資源的組織和管理[J];圖書館界;2002年01期
5 劉琨,鄭有才;搜索引擎剖析[J];微機發(fā)展;2004年03期
6 許濤,吳淑燕;Google搜索引擎及其技術(shù)簡介[J];現(xiàn)代圖書情報技術(shù);2003年04期
7 曹玉霞;搜索引擎新思維[J];現(xiàn)代圖書情報技術(shù);2000年05期
【相似文獻】
相關(guān)期刊論文 前10條
1 張旭;;構(gòu)建基于本地服務(wù)的垂直搜索引擎[J];才智;2011年18期
2 劉兆偉;黃永峰;;面向主題搜索引擎的實現(xiàn)與優(yōu)化[J];數(shù)據(jù)通信;2011年04期
3 王福海;;基于PageRank的主題過濾算法改進[J];科技信息;2011年15期
4 梁永演;;淺析搜索引擎的超鏈接分析排序算法[J];晉圖學刊;2011年04期
5 李遠方;鄧世昆;聞玉彪;韓月陽;;Hadoop-MapReduce下的PageRank矩陣分塊算法[J];計算機技術(shù)與發(fā)展;2011年08期
6 佟興帆;鄧輝宇;李志明;;上海光源產(chǎn)品管理系統(tǒng)及其全文檢索子系統(tǒng)的改進[J];核技術(shù);2011年07期
7 陶鎮(zhèn)威;周雨程;;基于Compass框架的高級搜索系統(tǒng)的設(shè)計與實現(xiàn)[J];重慶理工大學學報(自然科學);2011年08期
8 倪靖;;一種基于云計算的Web結(jié)構(gòu)挖掘算法[J];電腦知識與技術(shù);2011年24期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)會議論文 前10條
1 藺繼國;徐錫山;;一種基于用戶點擊數(shù)據(jù)的個性化PageRank算法[A];第六屆全國信息檢索學術(shù)會議論文集[C];2010年
2 李明宙;羅艷;王宗義;;Lucene全文檢索引擎的研究及應(yīng)用[A];廣西計算機學會2010年學術(shù)年會論文集[C];2010年
3 申兵一;鞏青歌;;基于Lucene桌面搜索引擎系統(tǒng)的設(shè)計和實現(xiàn)[A];江蘇省電子學會2010年學術(shù)年會論文集[C];2010年
4 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系統(tǒng)中的應(yīng)用研究[A];圖像圖形技術(shù)與應(yīng)用進展——第三屆圖像圖形技術(shù)與應(yīng)用學術(shù)會議論文集[C];2008年
5 李應(yīng)興;付婷;李勇;;基于LUCENE的藏文信息檢索的研究與應(yīng)用[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學術(shù)研討會論文集[C];2007年
6 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
7 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁排序研究[A];第三屆學生計算語言學研討會論文集[C];2006年
8 劉源;詹舒波;;基于Solr的行業(yè)垂直搜索平臺的研究[A];2008通信理論與技術(shù)新進展——第十三屆全國青年通信學術(shù)會議論文集(上)[C];2008年
9 劉壽強;;基于Lucene的分級鑒權(quán)企業(yè)搜索引擎研究與設(shè)計[A];第二十一次全國計算機安全學術(shù)交流會論文集[C];2006年
10 王富強;馬德濤;張立朝;王建明;;地方志數(shù)據(jù)庫全文信息檢索研究[A];中國地理信息系統(tǒng)協(xié)會第四次會員代表大會暨第十一屆年會論文集[C];2007年
相關(guān)重要報紙文章 前1條
1 李映 哲一 (本報記者 李映);微軟雅虎結(jié)盟 搜索市場風云再起[N];中國電子報;2009年
相關(guān)博士學位論文 前3條
1 王菁華;文本中知識的獲取[D];北京郵電大學;2008年
2 孟佳娜;遷移學習在文本分類中的應(yīng)用研究[D];大連理工大學;2011年
3 韋福如;基于圖模型多文檔自動文摘研究[D];武漢大學;2009年
相關(guān)碩士學位論文 前10條
1 姚林濤;基于Lucene的Web搜索引擎實現(xiàn)[D];西安電子科技大學;2008年
2 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學;2011年
3 蘇景春;基于Lucene的全文檢索系統(tǒng)的研究與應(yīng)用[D];北京交通大學;2010年
4 陳航哲;基于Lucene的垂直搜索引擎的研究與應(yīng)用[D];暨南大學;2010年
5 李建林;基于Lucene的Web搜索引擎的研究[D];蘭州理工大學;2010年
6 王冬坡;基于Lucene的主題搜索引擎的研究與實現(xiàn)[D];河北科技大學;2010年
7 張彬;基于lucene的搜索引擎[D];上海師范大學;2010年
8 高欣;基于Lucene的全文檢索系統(tǒng)的研究與實現(xiàn)[D];天津師范大學;2010年
9 杜先撰;基于Lucene全文索引系統(tǒng)設(shè)計與實現(xiàn)[D];南京大學;2011年
10 周月紅;基于Lucene的站內(nèi)搜索引擎的設(shè)計與開發(fā)[D];華東理工大學;2011年
,本文編號:2101271
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2101271.html