基于Lucene的數(shù)字作品搜索引擎的研究與設(shè)計
本文關(guān)鍵詞:基于Lucene的數(shù)字作品搜索引擎的研究與設(shè)計
更多相關(guān)文章: Lucene 分詞算法 索引 相關(guān)度排序算法 分布式
【摘要】:在Lucene的全文檢索工具包的基礎(chǔ)上,分析現(xiàn)有的主流中文分詞算法和Lucene相關(guān)度排序算法,提出了改進的分詞算法和改進的相關(guān)度排序算法。還采用倒排索引、檢索技術(shù)、分布式存儲和并行計算等技術(shù),分析并設(shè)計了一個對海量數(shù)字作品信息的搜索引擎,為用戶提供對海量數(shù)字作品信息的快速、準確的搜索服務(wù)。實驗分析比較了分詞速度和分詞效果,還比較了關(guān)鍵詞搜索結(jié)果的響應(yīng)時間、命中數(shù)量、準確率和召回率。實驗結(jié)果表明,本系統(tǒng)在很大程度上提高了搜索速度,保證了搜索結(jié)果的準確性。
【作者單位】: 北方工業(yè)大學(xué)信息工程學(xué)院;
【基金】:國家科技部支撐計劃課題基金資助項目(2012BAH04f03) 科研基地—科研創(chuàng)新平臺資助項目(PXM2013_014212_000011)
【分類號】:TP391.3
【正文快照】: 1引言中國版權(quán)保護中心在深入研究國際現(xiàn)有的版權(quán)保護技術(shù)、相關(guān)的法規(guī)和標準后,認為從根本上解決數(shù)字作品產(chǎn)業(yè)鏈中各個參與者的利益分享和技術(shù)創(chuàng)新,實現(xiàn)快速高效的維權(quán)機制,是互聯(lián)網(wǎng)版權(quán)保護的核心命題[1]。中國版權(quán)保護中心結(jié)合數(shù)字資源出版服務(wù)領(lǐng)域的發(fā)展趨勢,對數(shù)字資源
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 李振龍;;Web信息檢索的技術(shù)分析與發(fā)展策略研究[J];計算機科學(xué);2006年04期
2 趙珂;逯鵬;李永強;;基于Lucene的搜索引擎設(shè)計與實現(xiàn)[J];計算機工程;2011年16期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 馬福晶;;基于網(wǎng)絡(luò)信息檢索技術(shù)的數(shù)據(jù)包捕獲[J];重慶科技學(xué)院學(xué)報(自然科學(xué)版);2008年05期
2 楊元峰;趙敏涯;廖黎莉;;基于Lucene的客服知識庫系統(tǒng)結(jié)構(gòu)設(shè)計[J];福建電腦;2012年01期
3 諶超;強保華;石龍;;基于Hadoop MapReduce的大規(guī)模數(shù)據(jù)索引構(gòu)建與集群性能分析[J];桂林電子科技大學(xué)學(xué)報;2012年04期
4 許昊;王躍勝;;基于Lucene的FTP搜索引擎的設(shè)計與實現(xiàn)[J];福建電腦;2012年07期
5 洪穎;;基于Lucene的服裝領(lǐng)域?qū)I(yè)搜索引擎研究[J];北京服裝學(xué)院學(xué)報(自然科學(xué)版);2012年03期
6 許璐蕾;周莉;湯可金;姜艷萍;;基于Lucene的垂直搜索引擎的設(shè)計和實現(xiàn)[J];電腦與電信;2013年03期
7 馬福晶;;淺議數(shù)據(jù)包捕獲技術(shù)[J];黑龍江科技信息;2008年32期
8 郭喜平;蒙應(yīng)杰;;模糊查詢中的策略優(yōu)化[J];計算機工程與應(yīng)用;2008年34期
9 蔡海尼;朱曉飛;;基于Z39.50協(xié)議的分布式檢索在復(fù)合型圖書館系統(tǒng)中的應(yīng)用[J];計算機科學(xué);2008年08期
10 葛彥強;汪向征;栗青生;宋世楨;;基于Lucene的甲骨文全文檢索系統(tǒng)構(gòu)建[J];科技通報;2012年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 尹世群;Web文本分類關(guān)鍵技術(shù)研究[D];西南大學(xué);2008年
2 程明智;電子商務(wù)環(huán)境中信息快速加密及內(nèi)容安全管理相關(guān)技術(shù)研究[D];北京郵電大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 向丹;專業(yè)搜索引擎中的多Agent協(xié)調(diào)研究[D];西華大學(xué);2008年
2 郭浩軍;基于本體的Web跨語言信息檢索研究[D];華北電力大學(xué)(河北);2009年
3 張宇;WEB中文文本聚類分類系統(tǒng)的設(shè)計與實現(xiàn)[D];西南交通大學(xué);2009年
4 閆曉妍;Web2.0環(huán)境下網(wǎng)絡(luò)信息檢索模式研究[D];鄭州大學(xué);2009年
5 李建林;基于Lucene的Web搜索引擎的研究[D];蘭州理工大學(xué);2010年
6 張珍;主題搜索引擎中的多Agent爬行策略研究[D];西華大學(xué);2010年
7 姜鑫;教學(xué)視頻信息文本化檢索平臺的構(gòu)建與應(yīng)用[D];華東師范大學(xué);2012年
8 王偉;基于HGML的目標信息地理位置檢索機制研究[D];成都理工大學(xué);2012年
9 陳忱;DBFS技術(shù)及其在遠洋運輸業(yè)務(wù)郵件管理中的應(yīng)用研究[D];南京航空航天大學(xué);2012年
10 張琦玉;基于Lucene的應(yīng)用系統(tǒng)內(nèi)部搜索的研究與設(shè)計[D];南京理工大學(xué);2013年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 郭立力;趙春江;;高效FTP搜索引擎的設(shè)計與實現(xiàn)[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2009年01期
2 張宇;王映輝;張翔南;;基于Spring的MVC框架設(shè)計與實現(xiàn)[J];計算機工程;2010年04期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 蔣一峰;王華;張玉紅;黃少林;;基于Lucene的語義檢索系統(tǒng)的設(shè)計和實現(xiàn)[J];計算機工程與設(shè)計;2008年20期
2 趙旭;王慶樺;;向LUCENE搜索引擎中加入中文同義詞查詢[J];科技信息;2011年07期
3 藍永健;;基于Lucene的校園網(wǎng)垂直搜索引擎的設(shè)計與實現(xiàn)[J];廣東教育學(xué)院學(xué)報;2009年03期
4 張香梅;徐立;;lucene中文切詞算法的改進[J];科技信息;2009年28期
5 葛振國;李建;何林糠;吳軍;;基于Lucene的Oracle數(shù)據(jù)庫全文檢索[J];信息技術(shù);2010年03期
6 向暉;郭一平;王亮;;基于Lucene的中文字典分詞模塊的設(shè)計與實現(xiàn)[J];現(xiàn)代圖書情報技術(shù);2006年08期
7 王繼明;楊國林;;基于Lucene的中文文本分詞[J];內(nèi)蒙古工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2007年03期
8 陳艷春;李雙平;;基于Lucene的企業(yè)級搜索引擎的設(shè)計與實現(xiàn)[J];現(xiàn)代圖書情報技術(shù);2007年08期
9 蔡小艷;寇應(yīng)展;沈巍;鄭偉;;Nutch-0.9中JE中文分詞的實現(xiàn)[J];科學(xué)技術(shù)與工程;2008年17期
10 李穎;李志蜀;鄧歡;;基于Lucene的中文分詞方法設(shè)計與實現(xiàn)[J];四川大學(xué)學(xué)報(自然科學(xué)版);2008年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 韓希先;李建中;;分布式有序表中一種有效的在線計劃批量插入方法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
2 楊柳;鐘誠;陸向艷;;基于P2P網(wǎng)絡(luò)的分布式聚類算法研究分析[A];2009年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(上冊)[C];2009年
3 郭柯;代璐;周林;;分布式并網(wǎng)發(fā)電系統(tǒng)孤島檢測方法綜述[A];重慶市電機工程學(xué)會2010年學(xué)術(shù)會議論文集[C];2010年
4 吳成海;張克芳;;跨平臺分布式自動測試系統(tǒng)設(shè)計[A];全國第二屆總線技術(shù)與測控系統(tǒng)工程學(xué)術(shù)報告會論文集[C];2001年
5 張德明;;構(gòu)建分布式聲納信號處理系統(tǒng)[A];中國聲學(xué)學(xué)會2002年全國聲學(xué)學(xué)術(shù)會議論文集[C];2002年
6 李其瑩;張洪霞;;配電網(wǎng)中實現(xiàn)小電流接地選線一種方案[A];華東六省一市電機工程(電力)學(xué)會輸配電技術(shù)研討會2002年年會山東電機工程學(xué)會交流論文集[C];2002年
7 周詳;王龍明;;建立分布式防護的安全體系[A];中國煙草行業(yè)信息化研討會論文集[C];2004年
8 申排偉;陸鋒;;一種基于視圖的分布式幾何對象類型空間數(shù)據(jù)庫更新技術(shù)[A];中國地理信息系統(tǒng)協(xié)會第八屆年會論文集[C];2004年
9 魏德榮;趙花城;秦一濤;張弘;;分布式光纖監(jiān)測技術(shù)在我國的發(fā)展[A];2004年全國碾壓混凝土壩筑壩技術(shù)交流會論文集[C];2004年
10 祝保英;滕光輝;;智能溫室分布式環(huán)境控制系統(tǒng)[A];中國農(nóng)業(yè)工程學(xué)會第七次會員代表大會論文集[C];2004年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 記者 張磊;分布式能源技術(shù)研討會在京召開[N];中國電力報;2004年
2 蓋俊飛 林楠;分布式ISA防火墻與服務(wù)器的配置[N];電腦報;2003年
3 劉軼軒;IONA:分布式SOA四兩撥千斤[N];通信產(chǎn)業(yè)報;2007年
4 曉京;做分布式呼叫中心[N];中國計算機報;2003年
5 ;中興通訊分布式“3G”服務(wù)[N];中國計算機報;2002年
6 章文;分布式能源技術(shù)市場前景廣闊[N];中國建材報;2005年
7 ;整理SQL Server的索引碎片[N];電腦報;2004年
8 國家高性能計算機工程技術(shù)研究中心 黃華 楊德志 張建剛;分布式文件系統(tǒng)的歷史與現(xiàn)狀[N];中國計算機報;2005年
9 國家高性能計算機工程技術(shù)研究中心 黃華 楊德志 張建剛;分布式文件系統(tǒng)趨向成熟[N];中國計算機報;2005年
10 國防科學(xué)技術(shù)大學(xué)計算機學(xué)院軟件所 董勇 周恩強;構(gòu)建分布式文件系統(tǒng)[N];中國計算機報;2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王宇翔;分布式網(wǎng)絡(luò)地理信息系統(tǒng)研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2002年
2 董紅軍;基于多Agent的分布式CAPP及工藝信息管理研究[D];西北工業(yè)大學(xué);2000年
3 婁淵勝;基于構(gòu)件的分布式防汛信息系統(tǒng)框架研究[D];河海大學(xué);2002年
4 劉峰;儀用主從耦合分布式并行處理容錯系統(tǒng)體系結(jié)構(gòu)研究[D];浙江大學(xué);2003年
5 唐秋華;分布式虛擬環(huán)境建模研究[D];武漢理工大學(xué);2005年
6 王加虎;分布式水文模型理論與方法研究[D];河海大學(xué);2006年
7 傅濤;基于數(shù)據(jù)挖掘的分布式網(wǎng)絡(luò)入侵協(xié)同檢測系統(tǒng)研究及實現(xiàn)[D];南京理工大學(xué);2008年
8 侯梅毅;分布式同步發(fā)電機的孤島檢測原理與實現(xiàn)[D];山東大學(xué);2010年
9 楊峰;分布式并行索引研究[D];電子科技大學(xué);2003年
10 陳犖;分布式地理空間數(shù)據(jù)服務(wù)集成技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 徐財應(yīng);基于Lucene的搜索引擎技術(shù)的研究與改進[D];長春理工大學(xué);2010年
2 劉天元;基于Lucene的海量生殖健康數(shù)據(jù)集成系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學(xué);2011年
3 付敏;一個改進的中文分詞算法及其在Lucene中的應(yīng)用[D];華中科技大學(xué);2010年
4 張彬;基于lucene的搜索引擎[D];上海師范大學(xué);2010年
5 王冬坡;基于Lucene的主題搜索引擎的研究與實現(xiàn)[D];河北科技大學(xué);2010年
6 高欣;基于Lucene的全文檢索系統(tǒng)的研究與實現(xiàn)[D];天津師范大學(xué);2010年
7 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學(xué);2011年
8 杜先撰;基于Lucene全文索引系統(tǒng)設(shè)計與實現(xiàn)[D];南京大學(xué);2011年
9 周月紅;基于Lucene的站內(nèi)搜索引擎的設(shè)計與開發(fā)[D];華東理工大學(xué);2011年
10 姜華;基于Lucene面向主題搜索引擎的研究與設(shè)計[D];華東師范大學(xué);2007年
,本文編號:1226811
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1226811.html