基于hadoop高校數(shù)字圖書館系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn).pdf 全文免費(fèi)在線閱讀
本文關(guān)鍵詞:基于Hadoop高校數(shù)字圖書館系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
網(wǎng)友jd234568近日為您收集整理了關(guān)于基于hadoop高校數(shù)字圖書館系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)的文檔,希望對(duì)您的工作和學(xué)習(xí)有所幫助。以下是文檔介紹:分類號(hào)密級(jí)UDC注1學(xué)位論文基于Hadoop高校數(shù)字圖書館系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)(題名和副題名)董園園(作者姓名)指導(dǎo)教師夏琦副教授電子科技大學(xué)成都任天新高工濟(jì)南旭景科技有限公司濟(jì)南(姓名、職稱、單位名稱)申請(qǐng)學(xué)位級(jí)別碩士專業(yè)學(xué)位類別工程碩士工程領(lǐng)域名稱軟件工程提交論文日期2014.09.25論文答辯日期2014.11.21學(xué)位授予單位和日期電子科技大學(xué)2014年12月25日答辯委員會(huì)主席評(píng)閱人注1:注明《國際十進(jìn)分類法UDC》的類號(hào)。DESIGNANDIMPLEMENTATION OFUNIVERSITYDIGTILLIBRARYSYSTEMBASEDONHADOOPAMasterThesisSubmittedtoUniversityof ElectronicScienceandTechnologyofChinaMajor:Masterof EngineeringAuthor:DongYuanyuanAdvisor:XiaQiSchool:School ofInformation and Software Engineering獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得電子科技大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示謝意。作者簽名:日期:年月日論文使用授權(quán)本學(xué)位論文作者完全了解電子科技大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和磁盤,允許論文被查閱和借閱。本人授權(quán)電子科技大學(xué)可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后應(yīng)遵守此規(guī)定)作者簽名:導(dǎo)師簽名:日期:年月日摘要I摘要隨著計(jì)算機(jī)技術(shù)的發(fā)展,人類社會(huì)步入了信息時(shí)代,電子出版物盛行,網(wǎng)絡(luò)數(shù)據(jù)以爆炸式的速度激增,海量的多類型數(shù)據(jù)給信息檢索帶來了極大的困難,嚴(yán)重制約了數(shù)據(jù)的利用率,在此背景下,數(shù)字圖書館這一新的數(shù)據(jù)組織管理模式受到越來越多的關(guān)注。數(shù)字圖書館是一種沒有時(shí)空限制的、便于使用的、超大規(guī)模的知識(shí)中心,它面向電子數(shù)據(jù),以統(tǒng)一的標(biāo)注和規(guī)范構(gòu)建知識(shí)組織體系,通常以分布式存儲(chǔ),信息檢索和計(jì)算機(jī)網(wǎng)絡(luò)為技術(shù)支撐,實(shí)現(xiàn)豐富多彩的多媒體信息的有效傳播。本文研究高校圖書館系統(tǒng)中數(shù)字圖書館系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),首先,我們基于傳統(tǒng)圖書館管理理論,結(jié)合數(shù)字圖書館的實(shí)際應(yīng)用,在分析國內(nèi)外優(yōu)秀的數(shù)字圖書館系統(tǒng)的基礎(chǔ)上,對(duì)數(shù)字圖書館的數(shù)據(jù)范圍和業(yè)務(wù)內(nèi)容進(jìn)行了清晰的定義。其次,論文詳細(xì)闡述了數(shù)字圖書館建設(shè)的整體架構(gòu)、業(yè)務(wù)流程以及數(shù)據(jù)模型,系統(tǒng)采用B/S結(jié)構(gòu),基于流程圖建模各項(xiàng)業(yè)務(wù)流程,通過關(guān)系數(shù)據(jù)模型建模電子資料的元數(shù)據(jù)。然后,我們采用J2EE環(huán)境下的MVC分層開發(fā)框架,闡述了系統(tǒng)核心功能的實(shí)現(xiàn)過程,具體包括4個(gè)部分:元數(shù)據(jù)抽取,數(shù)據(jù)存儲(chǔ),建立索引以及用戶服務(wù)。對(duì)應(yīng)以上4個(gè)核心功能,我們分別設(shè)計(jì)了基于啟發(fā)式規(guī)則的電子文檔的元數(shù)據(jù)抽取方法,基于Hadoop的文件存儲(chǔ)策略,在Hadoop平臺(tái)建立基于Lucene的全文索引和基于元數(shù)據(jù)的關(guān)系數(shù)據(jù)索引,在以查詢?yōu)楹诵牡挠脩舴⻊?wù)功能中,我們?cè)O(shè)計(jì)了基于下載和查詢記錄的查詢優(yōu)化技術(shù)。在論文最后,我們對(duì)系統(tǒng)進(jìn)行了整體測試并對(duì)測試結(jié)果進(jìn)行了分析。面向高校的數(shù)字圖書館系統(tǒng)不僅可以幫助高校組織管理現(xiàn)有的電子資料,例如教學(xué)視頻、電子期刊、電子文獻(xiàn)以及科研數(shù)據(jù)等,提高數(shù)據(jù)的檢索準(zhǔn)確性;還可以數(shù)字化現(xiàn)有的實(shí)體書刊,集成網(wǎng)絡(luò)信息資源,為教育和科研提供統(tǒng)一的信息資源平臺(tái),提高知識(shí)的獲取效率。關(guān)鍵詞:數(shù)字圖書館,元數(shù)據(jù),全文索引,Lucene,putertechnology,wehaveenteredtheinformationagenowadays.workdatagrowsintheformofexplosion.Avastamountofdatawithmultipletypeshasbroughtgeartdifficultiestoinformationretrievalandseverelyrestrictsthedatautilization.Inthisbackground,digitallibrary,anizationandmanagementform,hasattractedmoreandmoreattention.Digitallibraryisakindofnotimeandspacelimit,easytouseandverylargescaleknowledgecenter.Takingdigitaldataasmanagementobject,digitallibrary,supportedbydistributedstroe,technologies,adoptsunifiedknowledgesystemtosaveandtransmitmutilmediainformation.Thisthesisfocusesontheresearchofthedesignandimplementoftheuniversity-orienteddigitallibrarysystembasedonHadoop,whichisanimportantpartofmordenlibrarysystem.Firstly,inthestepofrequirementanalysis,basedonlibrarymanagementtheoryandthepraticalapplicationbackgroundofdigitallibrary,wegivethedefinitionofsystemscopeandcontentthoughttheanalysisofdomesticandforeignexcellentlibrarysystemsandpracticalresearch.Then,inthestageofsystemdesign,weintroducethesystemstructure,businessprocessanddatamodel.Indetail,thesystemadoptB/Sthreelayerarchitecture,modeltheprocessthoughprocessgraphandbuildmetadatamodelbasedonrelationdatabase.Finally,weadoptMVCframeworktodevelopthesystem,including4improtantparts:metadataextraction,datastorage,indexstrategyandsystemfunctionsforusers.Detailly,weextractmetadatafromelectronic
12>
播放器加載中,請(qǐng)稍候...
系統(tǒng)無法檢測到您的Adobe Flash Player版本
建議您在線安裝最新版本的Flash Player 在線安裝
本文關(guān)鍵詞:基于Hadoop高校數(shù)字圖書館系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):167672
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/167672.html