基于Lucene的數(shù)字版權(quán)資源庫的構(gòu)建與應(yīng)用研究
[Abstract]:With the rapid development of the Internet, the storage and dissemination of information has undergone tremendous changes. Due to the easy diffusion and dissemination of digital resources, digital resources not only bring great convenience to people, but also bring unprecedented challenges to digital rights management. First of all, digital copyright resources rely on the traditional storage mode, can not effectively solve the growing number of digital resources storage problems. Secondly, it is more and more difficult to quickly search for useful information from the mass of digital works. Therefore, it is necessary to construct a digital copyright database which has the function of mass storage and fast search for digital works. In this paper, the HDFS distributed file system under the framework of Hadoop is used to solve the problem of mass storage of digital works. In the aspect of fast search of digital copyright database, firstly, Lucene full-text retrieval technology is used to create index of copyright metadata information and search index file. Then the Elasticsearch distributed search technology is used to store and distribute the index files of Luc ene. Finally, the search engine provides user-friendly operation functions: digital work management, digital rights management, database index, database search and so on. The difficulties and innovations of this paper are as follows: firstly, this paper analyzes the characteristics of digital copyright resources, designs a cloud storage scheme which is easy to expand, highly fault-tolerant and supports massive data sets, studies Lucene technology, designs a full-text retrieval scheme of digital copyright resources metadata, and designs a full-text retrieval scheme of digital copyright resources metadata. The index file of digital copyright database is partitioned by Elasticsearch, and the distributed index and distributed search of digital copyright database are realized. The main achievement of this paper is to use HDFS distributed file system to realize the mass storage of digital copyright resources. Lucene full-text retrieval and Elasticsearch index slicing technology are used for distributed indexing and fast retrieval of copyright resources. Finally, an efficient and distributed digital copyright resource database is constructed, which ensures the safe and reliable storage of massive digital works, promotes the integration of resources in digital copyright industry, and reduces the transmission cost of digital works. Provides low-level support for registration, filing, search and detection of copyright information for digital works.
【學(xué)位授予單位】:北方工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.3
【相似文獻】
相關(guān)期刊論文 前10條
1 李云;;版權(quán)補償金制度在圖書館的適用與建構(gòu)[J];現(xiàn)代情報;2009年07期
2 屈華;;版權(quán)補償金制度在圖書館應(yīng)用初探[J];圖書館工作與研究;2009年12期
3 ;方正數(shù)字版權(quán)保護技術(shù)被評為“2003年信息產(chǎn)業(yè)重大技術(shù)發(fā)明”[J];圖書情報工作;2004年01期
4 ;SafeNet多項解決方案獲2006年度科迪獎最終名單提名[J];電腦編程技巧與維護;2006年03期
5 許波;馬海群;;從公共借閱權(quán)制度到數(shù)字版權(quán)補償金制度的理性思考[J];情報資料工作;2006年04期
6 周曉;;互聯(lián)網(wǎng)數(shù)字版權(quán)課題研究[J];信息安全與通信保密;2007年11期
7 ;DRM Fusion:為移動電視、音樂和視頻提供數(shù)字保護[J];通訊世界;2007年09期
8 ;大英圖書館采用新的數(shù)字版權(quán)管理平臺提高電子傳遞效率[J];圖書館建設(shè);2010年01期
9 孫樂;;從谷歌著作權(quán)糾紛案看我國的信息網(wǎng)絡(luò)傳播權(quán)[J];法制與社會;2010年19期
10 ;美聯(lián)社擬建數(shù)字版權(quán)交易中心[J];新聞記者;2010年11期
相關(guān)會議論文 前10條
1 李明宙;羅艷;王宗義;;Lucene全文檢索引擎的研究及應(yīng)用[A];廣西計算機學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年
2 申兵一;鞏青歌;;基于Lucene桌面搜索引擎系統(tǒng)的設(shè)計和實現(xiàn)[A];江蘇省電子學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年
3 李應(yīng)興;付婷;李勇;;基于LUCENE的藏文信息檢索的研究與應(yīng)用[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
4 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系統(tǒng)中的應(yīng)用研究[A];圖像圖形技術(shù)與應(yīng)用進展——第三屆圖像圖形技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2008年
5 劉源;詹舒波;;基于Solr的行業(yè)垂直搜索平臺的研究[A];2008通信理論與技術(shù)新進展——第十三屆全國青年通信學(xué)術(shù)會議論文集(上)[C];2008年
6 劉壽強;;基于Lucene的分級鑒權(quán)企業(yè)搜索引擎研究與設(shè)計[A];第二十一次全國計算機安全學(xué)術(shù)交流會論文集[C];2006年
7 ;Web搜索引擎原理與應(yīng)用[A];四川省通信學(xué)會2005年學(xué)術(shù)年會論文集[C];2005年
8 王富強;馬德濤;張立朝;王建明;;地方志數(shù)據(jù)庫全文信息檢索研究[A];中國地理信息系統(tǒng)協(xié)會第四次會員代表大會暨第十一屆年會論文集[C];2007年
9 蘇毅;王文力;閻姍;鄧峰;;基于Ajax技術(shù)信息動態(tài)查詢的設(shè)計與實現(xiàn)[A];2008通信理論與技術(shù)新進展——第十三屆全國青年通信學(xué)術(shù)會議論文集(上)[C];2008年
10 蘇亮;孫斌;;一種基于Lucene的Hash改進中文分詞算法的實現(xiàn)[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年
相關(guān)重要報紙文章 前10條
1 記者 竇新穎 實習(xí)記者 楊冬;國家數(shù)字版權(quán)研究基地揭牌[N];中國知識產(chǎn)權(quán)報;2009年
2 本報見習(xí)記者 廖小珊;用集體管理方式解決數(shù)字版權(quán)問題[N];中國新聞出版報;2010年
3 本報記者 馬子雷;數(shù)字出版困局如何化解[N];中國文化報;2010年
4 記者 賴名芳;中國數(shù)字版權(quán)維權(quán)聯(lián)盟成立[N];中國新聞出版報;2011年
5 商報記者 陳杰;“數(shù)字版權(quán)第一案”中華書局?jǐn)≡V[N];北京商報;2011年
6 記者 陳t,
本文編號:2443041
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2443041.html