基于Lucene的垂直搜索引擎的設(shè)計(jì)和實(shí)現(xiàn)
本文關(guān)鍵詞:基于Lucene的垂直搜索引擎的設(shè)計(jì)和實(shí)現(xiàn)
更多相關(guān)文章: Lucene 索引 搜索 搜索引擎
【摘要】:在研究垂直搜索引擎原理和開源工具Lucene等技術(shù)基礎(chǔ)上,實(shí)現(xiàn)了對網(wǎng)絡(luò)數(shù)據(jù)的抓取、分析、建立索引和檢索。闡述了基于Lucene技術(shù)的索引和檢索的實(shí)現(xiàn)方法。實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)具有較高的檢索效率和準(zhǔn)確率。
【作者單位】: 蘇州市職業(yè)大學(xué);
【關(guān)鍵詞】: Lucene 索引 搜索 搜索引擎
【分類號】:TP391.3
【正文快照】: 1.引言搜索引擎已經(jīng)成為一個(gè)搜索資源的重要工具。一個(gè)高效、簡潔的搜索引擎,如Google和Baidu,能夠快速地在網(wǎng)絡(luò)中把用戶需要的內(nèi)容找出來,反饋給用戶。它們憑借著自己強(qiáng)大的技術(shù)和檢索功能,逐步脫穎而出。與此同時(shí),還有一類搜索引擎也受到了部分人群的青睞,他們常常在某一個(gè)
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 任惠靜;;基于Lucene的面向主題搜索引擎的索引技術(shù)的研究[J];電腦知識與技術(shù);2010年04期
2 印鑒,陳憶群,張鋼;搜索引擎技術(shù)研究與發(fā)展[J];計(jì)算機(jī)工程;2005年14期
3 趙珂;逯鵬;李永強(qiáng);;基于Lucene的搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2011年16期
4 劉建生;周志輝;;個(gè)性化搜索引擎綜述[J];計(jì)算機(jī)與數(shù)字工程;2010年10期
5 鄒燕飛;于成尊;趙亮;;基于Lucene的文本搜索引擎的設(shè)計(jì)和實(shí)現(xiàn)[J];計(jì)算機(jī)與現(xiàn)代化;2011年09期
6 丁兆貴;金敏;;基于Lucene的個(gè)性化搜索引擎研究與實(shí)現(xiàn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年02期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張澎;王魯達(dá);唐日成;;電子商務(wù)中的數(shù)據(jù)挖掘[J];湘南學(xué)院學(xué)報(bào);2009年02期
2 丁偉;謝彥峰;張忠林;;一種基于用戶興趣的搜索引擎輸入信息處理方法[J];電腦與信息技術(shù);2008年05期
3 王晶;陳衛(wèi)衛(wèi);;AJAX搜索引擎研究[J];電腦知識與技術(shù);2009年19期
4 胡雙雙;秦杰;;搜索引擎技術(shù)及其發(fā)展趨勢[J];福建電腦;2008年06期
5 徐周昶;章美仁;;垂直搜索引擎系統(tǒng)的架構(gòu)研究[J];福建電腦;2011年11期
6 楊元峰;趙敏涯;廖黎莉;;基于Lucene的客服知識庫系統(tǒng)結(jié)構(gòu)設(shè)計(jì)[J];福建電腦;2012年01期
7 吳建;;基于Lucene的校園網(wǎng)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];湖南工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年02期
8 彭軻;廖聞劍;;基于瀏覽器服務(wù)的網(wǎng)絡(luò)爬蟲[J];硅谷;2009年04期
9 王立遠(yuǎn);;基于lucene的AutoMatching公共控件的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2012年03期
10 喬東枝;;新一代搜索引擎的智能化特征及技術(shù)進(jìn)展[J];高校圖書館工作;2007年04期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 劉雪芹;齊大朝;;基于robot的全文搜索引擎原理剖析[A];2011年全國電子信息技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2011年
2 李家舒;曹守峰;范文慶;黃瑋;;基于移動(dòng)平臺的黃頁個(gè)性化搜索建模技術(shù)研究[A];第九屆中國通信學(xué)會學(xué)術(shù)年會論文集[C];2012年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 田俊華;基于本體知識庫的教學(xué)資源自動(dòng)采集技術(shù)研究[D];南京師范大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 徐財(cái)應(yīng);基于Lucene的搜索引擎技術(shù)的研究與改進(jìn)[D];長春理工大學(xué);2010年
2 孫原;基于酉變換的權(quán)威頁面挖掘算法研究[D];哈爾濱工程大學(xué);2010年
3 巫昌凱;企業(yè)知識庫系統(tǒng)中復(fù)雜查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2010年
4 陳可欽;基于垂直搜索引擎的主題爬蟲算法的研究[D];中南林業(yè)科技大學(xué);2009年
5 戚學(xué)磊;基于Lucene的站內(nèi)搜索引擎技術(shù)的研究與應(yīng)用[D];太原理工大學(xué);2011年
6 孫華昱;Lucene在醫(yī)學(xué)影像資源檢索平臺中的應(yīng)用[D];沈陽工業(yè)大學(xué);2011年
7 劉海濤;基于自然語言理解的中文搜索引擎[D];河北科技大學(xué);2011年
8 李玨伶;搜索引擎網(wǎng)頁相關(guān)性評估方法設(shè)計(jì)及其在rank模型上的應(yīng)用[D];北京交通大學(xué);2011年
9 范先爽;基于個(gè)性化服務(wù)的汽車信息搜索引擎的研究[D];武漢理工大學(xué);2011年
10 林捷;主題網(wǎng)絡(luò)爬蟲的研究和實(shí)現(xiàn)[D];武漢理工大學(xué);2011年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 徐白雁;JAVA編程語言及其應(yīng)用[J];電腦與信息技術(shù);1996年04期
2 丁夷;金永賢;;基于Struts+Spring+Hibernate框架的手機(jī)圖書館服務(wù)系統(tǒng)[J];大學(xué)圖書館學(xué)報(bào);2011年01期
3 張春元,康耀紅,王曙光,張莉;中文搜索引擎的缺陷與改進(jìn)[J];海南大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年01期
4 郭立力;趙春江;;高效FTP搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期
5 王繼成,蕭嶸,孫正興,張福炎;Web信息檢索研究進(jìn)展[J];計(jì)算機(jī)研究與發(fā)展;2001年02期
6 費(fèi)洪曉,康松林,朱小娟,謝文彪;基于詞頻統(tǒng)計(jì)的中文分詞的研究[J];計(jì)算機(jī)工程與應(yīng)用;2005年07期
7 左雄輝,糜麒;個(gè)性化搜索引擎研究[J];計(jì)算機(jī)工程與應(yīng)用;2005年17期
8 王麗坤;王宏;陸玉昌;;文本挖掘及其關(guān)鍵技術(shù)與方法[J];計(jì)算機(jī)科學(xué);2002年12期
9 曹元大,賀海軍,涂哲明,王琴;全文檢索字索引技術(shù)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2002年06期
10 朱茂盛,王斌,程學(xué)旗;元搜索引擎及其實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2002年11期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 劉平冰;基于Lucene的Web站內(nèi)信息搜索系統(tǒng)[D];電子科技大學(xué);2005年
2 何世林;基于Java技術(shù)的搜索引擎研究與實(shí)現(xiàn)[D];西南交通大學(xué);2006年
3 馮斌;基于Lucene小型搜索引擎的研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2008年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉敏娜;葛萌;陳娟;;基于Lucene的全文搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];福建電腦;2009年05期
2 任惠靜;;基于Lucene的面向主題搜索引擎的索引技術(shù)的研究[J];電腦知識與技術(shù);2010年04期
3 侯云;;構(gòu)建基于Lucene的網(wǎng)站站內(nèi)搜索[J];信息與電腦(理論版);2010年02期
4 劉建湘;楊文濤;;基于Lucene的搜索引擎在Struts中的應(yīng)用[J];軟件導(dǎo)刊;2007年03期
5 周平;;Lucene全文檢索引擎技術(shù)及應(yīng)用[J];重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版);2007年04期
6 溫艷鴻;;基于lucene的文件搜索引擎的設(shè)計(jì)與擴(kuò)展[J];福建電腦;2007年08期
7 李靖;文登敏;張潤偉;;基于Lucene的全文檢索引擎的研究與應(yīng)用[J];淮陰工學(xué)院學(xué)報(bào);2008年01期
8 馬志強(qiáng);劉利民;蘇依拉;馬瑞明;;基于Lucene的站內(nèi)搜索引擎研究[J];內(nèi)蒙古工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期
9 嚴(yán)良達(dá);;基于Lucene搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];寧波職業(yè)技術(shù)學(xué)院學(xué)報(bào);2009年02期
10 黃少林;王華;張玉紅;蔣一峰;;基于Lucene的索引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代情報(bào);2009年07期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2001年
2 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會第五屆學(xué)術(shù)年會論文集[C];2008年
3 岑榮偉;劉奕群;張敏;茹立云;馬少平;;網(wǎng)絡(luò)搜索引擎用戶行為分析和研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
4 薩曉靜;;網(wǎng)絡(luò)化生存下的圖書館改革之路[A];福建省圖書館學(xué)會2008年學(xué)術(shù)年會論文集[C];2008年
5 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學(xué)會年會暨學(xué)術(shù)研討會論文集[C];2010年
6 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國索引學(xué)會年會暨學(xué)術(shù)研討會論文集[C];2005年
7 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2006)——第2屆中國普適計(jì)算學(xué)術(shù)會議(PCC'06)論文集[C];2006年
8 賈彥國;李培德;;Web檢索結(jié)果聚類算法的改進(jìn)[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會——通信與信息技術(shù)會議論文集(上)[C];2006年
9 申琪君;;電子地圖搜索引擎比較[A];中國地理學(xué)會2007年學(xué)術(shù)年會論文摘要集[C];2007年
10 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 劉文君;搜索引擎也在尋求創(chuàng)新[N];大眾科技報(bào);2007年
2 博文邋譯;你的隱私 搜索引擎知道[N];計(jì)算機(jī)世界;2007年
3 ;法國挑戰(zhàn)谷歌推出衛(wèi)星地圖搜索引擎[N];人民日報(bào);2006年
4 楊潔;搜索引擎營銷市場生變[N];中國計(jì)算機(jī)報(bào);2007年
5 MirrorCity.net技術(shù)總監(jiān) 姚浩;讓搜索引擎回歸最初夢想[N];中國文化報(bào);2008年
6 本報(bào)記者 操秀英;國雙科技以技術(shù)加服務(wù)贏得市場[N];科技日報(bào);2009年
7 趙敏;“魚群理論”破解搜索營銷謎局[N];中國企業(yè)報(bào);2007年
8 ;微軟展示搜索引擎新技術(shù)[N];人民郵電;2006年
9 諶力;第三代搜索,Google的心病[N];網(wǎng)絡(luò)世界;2006年
10 本報(bào)記者 樊哲高;搜索引擎三國紛爭 中文市場兩軍對壘[N];中國電子報(bào);2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
5 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
6 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
7 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
8 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
9 費(fèi)巍;搜索引擎檢索功能的性能評價(jià)研究[D];武漢大學(xué);2010年
10 黃河;農(nóng)業(yè)復(fù)雜自適應(yīng)搜索模型研究及實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張彬;基于lucene的搜索引擎[D];上海師范大學(xué);2010年
2 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學(xué);2011年
3 徐財(cái)應(yīng);基于Lucene的搜索引擎技術(shù)的研究與改進(jìn)[D];長春理工大學(xué);2010年
4 楊曉丹;基于Lucene的主題搜索引擎模板的設(shè)計(jì)與實(shí)現(xiàn)[D];浙江工商大學(xué);2011年
5 李建林;基于Lucene的Web搜索引擎的研究[D];蘭州理工大學(xué);2010年
6 何世林;基于Java技術(shù)的搜索引擎研究與實(shí)現(xiàn)[D];西南交通大學(xué);2006年
7 潘亭瀝;基于Lucene的面向商業(yè)應(yīng)用的搜索引擎研究與實(shí)現(xiàn)[D];電子科技大學(xué);2007年
8 劉琳;校園網(wǎng)搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山東大學(xué);2007年
9 劉加發(fā);EBM網(wǎng)絡(luò)搜索引擎的研究與實(shí)現(xiàn)[D];大連海事大學(xué);2008年
10 孫曉峰;基于輕量級框架的互動(dòng)問答平臺的設(shè)計(jì)與實(shí)現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2008年
,本文編號:1028698
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1028698.html