一種基于Lucene的影片搜索引擎的研究和應用
本文選題:Lucene 切入點:搜索引擎 出處:《計算機工程與應用》2008年29期
【摘要】:Lucene是一個優(yōu)秀的開源搜索引擎框架,已經(jīng)廣泛應用于信息搜索領域。分析點播門戶中現(xiàn)有的搜索引擎存在的不足,設計一種基于雙字哈希算法支持中文的分詞器,并利用該分詞器和Lucene工具包,設計并實現(xiàn)了一個視頻點播影片快速搜索引擎,它不僅支持中文檢索,還具有搜索速度快、易于擴展等優(yōu)點。仿真實驗證明提出的基于Lucene的影片搜索引擎具有良好的性能。
[Abstract]:Lucene is an excellent open source search engine framework, which has been widely used in the field of information search. A fast search engine for video-on-demand video is designed and implemented with the help of the word segmentation device and Lucene toolkit. It not only supports Chinese retrieval, but also has a fast search speed. The simulation results show that the video search engine based on Lucene has good performance.
【作者單位】: 中國科學院研究生院;中國科學院聲學研究所國家網(wǎng)絡新媒體工程技術研究中心;
【基金】:國家科技支撐計劃項目(No.2008BAH28B04) 中科院聲學研究所創(chuàng)新前瞻項目(No.GS12CXJ01)
【分類號】:TP391.3
【參考文獻】
相關期刊論文 前2條
1 李慶虎,陳玉健,孫家廣;一種中文分詞詞典新機制——雙字哈希機制[J];中文信息學報;2003年04期
2 張校乾,金玉玲,侯麗波;一種基于Lucene檢索引擎的全文數(shù)據(jù)庫的研究與實現(xiàn)[J];現(xiàn)代圖書情報技術;2005年02期
相關碩士學位論文 前1條
1 黃杰;基于Lucene的全文檢索系統(tǒng)模型的研究[D];暨南大學;2007年
【共引文獻】
相關期刊論文 前10條
1 于源,衣襲;中文全切分快速分詞方法[J];大連鐵道學院學報;2005年02期
2 潘以鋒;;基于Lucene的網(wǎng)站全文檢索系統(tǒng)的開發(fā)[J];廣西教育學院學報;2006年05期
3 蔣斌;楊超;趙歡;;基于二字詞位圖表的漢語自動分詞詞典機制[J];湖南大學學報(自然科學版);2006年01期
4 馬哲,姚敏;一種改進的基于PATRICIA樹的漢語自動分詞詞典機制[J];華南理工大學學報(自然科學版);2004年S1期
5 翟鳳文;赫楓齡;左萬利;;基于統(tǒng)計規(guī)則的交集型歧義處理方法[J];吉林大學學報(理學版);2006年02期
6 費洪曉;胡海苗;鞏燕玲;;基于Hash結構的機械統(tǒng)計分詞系統(tǒng)研究[J];計算機工程與應用;2006年05期
7 肖紅;許少華;李欣;;具有三級索引詞庫結構的中文分詞方法研究[J];計算機應用研究;2006年08期
8 王思力;張華平;王斌;;雙數(shù)組Trie樹算法優(yōu)化及其應用研究[J];中文信息學報;2006年05期
9 李江波;周強;陳祖舜;;漢語詞典的快速查詢算法研究[J];中文信息學報;2006年05期
10 蔣國瑞;孫明;;基于Lucene的TBT文檔管理Agent系統(tǒng)研究[J];情報雜志;2006年05期
相關博士學位論文 前2條
1 楊雨圖;支持雙語的協(xié)同CAPP系統(tǒng)若干關鍵技術研究[D];南京航空航天大學;2006年
2 楊傳耀;中文信息檢索索引模型及相關技術研究[D];復旦大學;2007年
相關碩士學位論文 前10條
1 馬哲;垃圾郵件過濾系統(tǒng)的研究與實現(xiàn)[D];浙江大學;2005年
2 楊才峰;基于自動分類的元搜索引擎的研究與應用[D];華北電力大學(河北);2005年
3 李遂;通用電視節(jié)目管理平臺[D];湖南大學;2005年
4 楊超;基于最大匹配的書面漢語自動分詞研究[D];湖南大學;2004年
5 王紅雨;網(wǎng)絡教學漢語答疑系統(tǒng)關鍵技術的研究與應用[D];大連理工大學;2006年
6 張曉淼;基于神經(jīng)網(wǎng)絡的中文分詞算法的研究[D];大連理工大學;2006年
7 姜鵬;基于雙數(shù)組的分詞詞典研究與實現(xiàn)[D];大連理工大學;2006年
8 熊冬明;漢語自動分詞和中文人名識別技術研究[D];浙江大學;2006年
9 王新梅;基于內(nèi)容挖掘的垃圾郵件過濾技術[D];武漢理工大學;2006年
10 潘照明;智能中文搜索引擎若干關鍵技術的研究與實現(xiàn)[D];浙江大學;2006年
【二級參考文獻】
相關期刊論文 前10條
1 鄭延斌;書面漢語自動分詞及歧義分析[J];河南師范大學學報(自然科學版);1997年04期
2 胡俊華,楊波,李金屏;自然語言理解研究略述[J];濟南大學學報(社會科學版);2001年05期
3 陳燕娜,邵志清;基于全文搜索的中文搜索引擎設計技術[J];計算機工程與應用;2002年17期
4 丁承,邵志清;基于字表的中文搜索引擎分詞系統(tǒng)的設計與實現(xiàn)[J];計算機工程;2001年02期
5 吳棟,滕育平;中文信息檢索引擎中的分詞與檢索技術[J];計算機應用;2004年07期
6 楊廣翔,俞寧,諶莉;搜索引擎結果的重排序方法[J];計算機應用;2005年02期
7 付東來;李元;;Web多媒體數(shù)據(jù)實時索引的設計與實現(xiàn)[J];計算機與數(shù)字工程;2006年03期
8 韓客松,王永成,陳桂林;漢語語言的無詞典分詞模型系統(tǒng)[J];計算機應用研究;1999年10期
9 鄒海山,吳勇,吳月珠,陳陣;中文搜索引擎中的中文信息處理技術[J];計算機應用研究;2000年12期
10 肖創(chuàng)柏,李玉鑒,鄭廣順,向和平;基于全文檢索技術的商業(yè)信函處理系統(tǒng)的設計與實現(xiàn)[J];計算機應用研究;2004年01期
【相似文獻】
相關期刊論文 前10條
1 陶鎮(zhèn)威;周雨程;;基于Compass框架的高級搜索系統(tǒng)的設計與實現(xiàn)[J];重慶理工大學學報(自然科學);2011年08期
2 周拴龍;;Lucene.net中文分詞算法分析[J];鄭州大學學報(理學版);2011年03期
3 魏蕾如;;基于搜索引擎的網(wǎng)絡中文信息檢索工具評價[J];數(shù)字技術與應用;2011年06期
4 ;創(chuàng)新工業(yè)搜索引擎[J];中國制造業(yè)信息化;2011年12期
5 胡風華;王磊;;基于知識庫系統(tǒng)的智能搜索引擎研究[J];中國新技術新產(chǎn)品;2011年18期
6 方亞會;;Google失敗后快速切換搜索引擎[J];電腦迷;2011年11期
7 李國鋒;李春偉;;網(wǎng)絡搜索引擎技術探析[J];廊坊師范學院學報;2005年04期
8 冷國華;;網(wǎng)頁快照幫我快速獲取資料[J];電腦愛好者;2011年10期
9 閆淑紅;;基于搜索引擎的信息查詢技術研究[J];電腦開發(fā)與應用;2011年07期
10 康亞娟;;淺談站內(nèi)信息搜索系統(tǒng)[J];硅谷;2011年13期
相關會議論文 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學會第五屆學術年會論文集[C];2008年
2 鄧長壽;郭景峰;楊焱林;鄧安遠;;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2001年
3 倪俊峰;;基于黃頁搜索引擎的關鍵字排名廣告系統(tǒng)的設計與實現(xiàn)[A];2005年中國索引學會年會暨學術研討會論文集[C];2005年
4 張怡;查貴庭;;SEO在信息服務中的應用研究[A];2010年中國索引學會年會暨學術研討會論文集[C];2010年
5 陳援非;何哲;朱珍民;;基于普適計算的個性化搜索技術[A];第二屆和諧人機環(huán)境聯(lián)合學術會議(HHME2006)——第2屆中國普適計算學術會議(PCC'06)論文集[C];2006年
6 楊萌;李春麗;朱明;;網(wǎng)絡搜索技術下的編輯工作[A];學報編輯論叢(第十一集)[C];2003年
7 陳磊;茹立云;馬少平;;基于用戶日志挖掘的搜索引擎廣告效果分析[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
8 申琪君;;電子地圖搜索引擎比較[A];中國地理學會2007年學術年會論文摘要集[C];2007年
9 岑榮偉;劉奕群;張敏;茹立云;馬少平;;網(wǎng)絡搜索引擎用戶行為分析和研究[A];第五屆全國信息檢索學術會議論文集[C];2009年
10 薩曉靜;;網(wǎng)絡化生存下的圖書館改革之路[A];福建省圖書館學會2008年學術年會論文集[C];2008年
相關重要報紙文章 前10條
1 本報記者 朱杰;搜索引擎應用性能分析報告[N];中國計算機報;2009年
2 記者 李建偉;第4代搜索引擎在鄭州問世[N];中國知識產(chǎn)權報;2009年
3 記者 趙志鵬;媒體稱俄擬建國家搜索引擎[N];新華每日電訊;2010年
4 吳前;搜索引擎“碳排量”驚人[N];中國文化報;2010年
5 記者 李大慶;新型搜索引擎能向用戶直接提供所需內(nèi)容[N];科技日報;2010年
6 深圳大學傳播學院、傳媒與文化發(fā)展研究中心 周裕瓊;誰動了我的大腦[N];社會科學報;2010年
7 李大慶;新型搜索引擎直接為用戶提供所需內(nèi)容[N];中國技術市場報;2010年
8 余建斌;搜索引擎市場“烽煙四起”[N];中國高新技術產(chǎn)業(yè)導報;2010年
9 邁巴赫 編譯;搜索引擎20年[N];計算機世界;2010年
10 記者 秦羽 通訊員 施銀峰;全球搜索引擎營銷大會在甬舉行[N];寧波日報;2010年
相關博士學位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學;2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學;2011年
3 蘇君華;面向搜索引擎的技術接受模型研究[D];南京大學;2011年
4 劉佐達;分布協(xié)作式搜索引擎模型及算法研究[D];清華大學;2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學;2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學;2012年
7 李莎莎;面向搜索引擎的自然語言處理關鍵技術研究[D];國防科學技術大學;2011年
8 白玉琪;空間信息搜索引擎研究[D];中國科學院研究生院(遙感應用研究所);2003年
9 費巍;搜索引擎檢索功能的性能評價研究[D];武漢大學;2010年
10 黃河;農(nóng)業(yè)復雜自適應搜索模型研究及實現(xiàn)[D];中國科學技術大學;2010年
相關碩士學位論文 前10條
1 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學;2011年
2 張彬;基于lucene的搜索引擎[D];上海師范大學;2010年
3 徐財應;基于Lucene的搜索引擎技術的研究與改進[D];長春理工大學;2010年
4 楊曉丹;基于Lucene的主題搜索引擎模板的設計與實現(xiàn)[D];浙江工商大學;2011年
5 李建林;基于Lucene的Web搜索引擎的研究[D];蘭州理工大學;2010年
6 尉建興;基于Lucene搜索引擎的研究與應用[D];太原理工大學;2011年
7 潘亭瀝;基于Lucene的面向商業(yè)應用的搜索引擎研究與實現(xiàn)[D];電子科技大學;2007年
8 何世林;基于Java技術的搜索引擎研究與實現(xiàn)[D];西南交通大學;2006年
9 王冬坡;基于Lucene的主題搜索引擎的研究與實現(xiàn)[D];河北科技大學;2010年
10 馮斌;基于Lucene小型搜索引擎的研究與實現(xiàn)[D];武漢理工大學;2008年
,本文編號:1668736
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1668736.html