天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向多數(shù)據(jù)源的分布式格文檔管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2017-12-28 18:06

  本文關(guān)鍵詞:面向多數(shù)據(jù)源的分布式格文檔管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 出處:《華南理工大學(xué)》2015年碩士論文 論文類型:學(xué)位論文


  更多相關(guān)文章: 大數(shù)據(jù) 異構(gòu)數(shù)據(jù) 復(fù)合文檔 知識(shí)管理 驅(qū)動(dòng)器


【摘要】:在大數(shù)據(jù)的場景中,各類文檔數(shù)據(jù)數(shù)量龐大、種類繁多。除了面向數(shù)據(jù)進(jìn)行一般的處理之外,如何將紛亂復(fù)雜、海量分布的數(shù)據(jù)資源,組織、提煉為面向領(lǐng)域的概括性的、綜合型的、抽象性的信息——知識(shí),同樣是重要任務(wù)。因此,面向知識(shí)管理的數(shù)據(jù)組織與建模是很有必要的。格文檔系統(tǒng)通過復(fù)合文檔的形式,支持用戶有效的組織與提煉信息,生成知識(shí)大數(shù)據(jù)。為了實(shí)現(xiàn)對(duì)各種類型數(shù)據(jù)的統(tǒng)一集成處理,本文根據(jù)齊德昱教授提出的格文檔(GriDoc)模型,進(jìn)一步研究了格文檔的體系與實(shí)現(xiàn)方法,給出了一個(gè)面向多數(shù)據(jù)源的格文檔管理器。該管理器支持對(duì)異構(gòu)、多源文檔的統(tǒng)一顯示和輸出,支持文檔遠(yuǎn)端同步,并集成全文檢索功能,實(shí)現(xiàn)了知識(shí)管理效果。格文檔管理器采用Java RMI遠(yuǎn)程通信技術(shù)實(shí)現(xiàn)文檔數(shù)據(jù)的遠(yuǎn)程同步,并使用基于lucene的二次開發(fā)搜索引擎以及mmseg4j中文分詞器實(shí)現(xiàn)文檔全文檢索功能。本文對(duì)實(shí)現(xiàn)的功能模塊進(jìn)行實(shí)驗(yàn)和應(yīng)用,系統(tǒng)的試運(yùn)行和測試表明系統(tǒng)達(dá)到了設(shè)計(jì)目標(biāo)的要求。該系統(tǒng)運(yùn)行可靠,使用方便,使用戶能夠以統(tǒng)一的方式訪問和處理異構(gòu)數(shù)據(jù),提高了文檔管理工作的效率。
[Abstract]:In the scene of large data, all kinds of document data are large and varied. In addition to dealing with data in general, how to organize and extract complex, massive data resources into a general, comprehensive and abstract knowledge -- knowledge is also an important task. Therefore, it is necessary for the data organization and modeling to be oriented to knowledge management. In the form of complex documents, the grid document system supports the user to organize and extract information effectively and generate large knowledge data. In order to realize the unified integration of all kinds of data, this paper further studies the system and implementation method of lattice document based on the lattice document (GriDoc) model proposed by Professor Qi Deyu, and gives a lattice document manager for multiple data sources. The manager supports unified display and output of heterogeneous and multi-source documents, supports remote synchronization of documents, and integrates full-text retrieval function, achieving the effect of knowledge management. Lattice document manager implements remote synchronization of document data by Java RMI remote communication technology, and implements full-text retrieval function based on Lucene, the two development search engine and mmseg4j Chinese word segmentation device. The experiment and application of the functional modules are carried out in this paper. The test run and test of the system show that the system meets the requirements of the design goal. The system is reliable and easy to use. Users can access and process heterogeneous data in a unified way, and improve the efficiency of document management.
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.52

【參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 李瑞軒,盧正鼎,肖衛(wèi)軍,李兵;多數(shù)據(jù)庫系統(tǒng)中基于XIDM的模式映射方法研究[J];計(jì)算機(jī)研究與發(fā)展;2004年03期

2 王寧,徐宏炳,王能斌;數(shù)據(jù)樹── 一種用于異構(gòu)數(shù)據(jù)源集成的公共數(shù)據(jù)模型[J];計(jì)算機(jī)研究與發(fā)展;1998年07期

3 孫凌玲;許春艷;田晶;;完全高校文檔管理系統(tǒng)的研究與分析[J];科技傳播;2010年14期

相關(guān)碩士學(xué)位論文 前2條

1 謝佳明;企業(yè)文檔管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2012年

2 馮梓健;GriDoc文檔管理器的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2013年



本文編號(hào):1346853

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1346853.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶31241***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com