基于Hadoop的實(shí)時(shí)文獻(xiàn)資料搜索引擎研究
本文關(guān)鍵詞:基于Hadoop的實(shí)時(shí)文獻(xiàn)資料搜索引擎研究
更多相關(guān)文章: 實(shí)時(shí)搜索引擎 云存儲(chǔ) 文獻(xiàn)資料 內(nèi)存索引 熱度積累
【摘要】:數(shù)據(jù)的存儲(chǔ)和檢索是大數(shù)據(jù)時(shí)代有效構(gòu)建系統(tǒng)應(yīng)用的關(guān)鍵技術(shù)問題。針對(duì)高校教育信息系統(tǒng)數(shù)據(jù)量大、存儲(chǔ)異構(gòu)、查找困難等問題,提出一種基于分類索引以及熱度積累的云存儲(chǔ)及實(shí)時(shí)搜索引擎設(shè)計(jì)方案。該方法首先建立持久性硬盤分類索引。然后,通過(guò)一種索引熱點(diǎn)數(shù)據(jù)緩存技術(shù)和一種高效的熱度累積緩存替換策略,利用內(nèi)存提升查詢性能,降低對(duì)硬盤索引表的磁盤訪問開銷。
【作者單位】: 廣東金融學(xué)院;桂林電子科技大學(xué);
【基金】:全國(guó)教育科學(xué)“十二五”規(guī)劃課題(DCA130225) 廣東省高等院校學(xué)科與專業(yè)建設(shè)專項(xiàng)(2013KJCX0134) 國(guó)家863計(jì)劃項(xiàng)目(2012AA011005)
【分類號(hào)】:TP311.13;TP391.3
【正文快照】: 隨著高校信息化的發(fā)展,信息管理系統(tǒng)應(yīng)用大大促進(jìn)高校教學(xué)和管理現(xiàn)代化。這些信息系統(tǒng)產(chǎn)生的數(shù)字信息,日積月累形成海量數(shù)據(jù),但這些信息資源受制于傳統(tǒng)數(shù)據(jù)庫(kù)架構(gòu),具有海量、復(fù)雜、異構(gòu)、動(dòng)態(tài)變化等特點(diǎn),存在高成本、低效率、低可靠性、管理難度大、并行處理程序開發(fā)復(fù)雜等諸
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 鄭瑋;;Hadoop釋放大數(shù)據(jù)潛能[J];軟件和信息服務(wù);2012年10期
2 劉爾凱;崔振東;;基于HADOOP技術(shù) 實(shí)現(xiàn)銀行歷史數(shù)據(jù)線上化研究[J];金融電子化;2014年01期
3 鄒群;;一種基于Hadoop的數(shù)字圖書存儲(chǔ)系統(tǒng)設(shè)計(jì)方案[J];黑龍江史志;2014年01期
4 諶章義;畢偉;向萬(wàn)紅;王國(guó)安;吳愛國(guó);;基于Hadoop的海量電費(fèi)數(shù)據(jù)處理模型[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2014年05期
5 ;大數(shù)據(jù)不等于Hadoop[J];辦公自動(dòng)化;2014年06期
6 ;保障Hadoop數(shù)據(jù)安全的十大措施[J];計(jì)算機(jī)與網(wǎng)絡(luò);2013年08期
7 蘇小會(huì);何婧媛;;Hadoop中任務(wù)調(diào)度算法的改進(jìn)[J];電子設(shè)計(jì)工程;2012年22期
8 黃德才;陳歡;;Hadoop平臺(tái)下海量數(shù)據(jù)排行榜過(guò)濾算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2012年03期
9 周航;申秋慧;王迤冉;;基于Hadoop平臺(tái)的任務(wù)調(diào)度方案分析[J];周口師范學(xué)院學(xué)報(bào);2013年02期
10 陳吉榮;樂嘉錦;;基于Hadoop生態(tài)系統(tǒng)的大數(shù)據(jù)解決方案綜述[J];計(jì)算機(jī)工程與科學(xué);2013年10期
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前3條
1 本報(bào)記者 郭濤;機(jī)器大數(shù)據(jù)也離不開Hadoop[N];中國(guó)計(jì)算機(jī)報(bào);2013年
2 樂天 編譯;Hadoop:打開大數(shù)據(jù)之門的金鑰匙[N];計(jì)算機(jī)世界;2012年
3 范范 編譯;Hadoop用戶可以使用多種搜索引擎[N];網(wǎng)絡(luò)世界;2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 汲磊舉;大數(shù)據(jù)環(huán)境下動(dòng)車組故障關(guān)聯(lián)關(guān)系分析關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];北京交通大學(xué);2016年
2 王鄭委;基于大數(shù)據(jù)Hadoop平臺(tái)的出租車載客熱點(diǎn)區(qū)域挖掘研究[D];北京交通大學(xué);2016年
3 張博洋;基于Hadoop的動(dòng)車組故障診斷關(guān)鍵技術(shù)的研究與實(shí)現(xiàn)[D];北京交通大學(xué);2016年
4 施云霄;Hadoop組件管理軟件Data Hub的設(shè)計(jì)與實(shí)現(xiàn)[D];南京大學(xué);2014年
5 宋瑩瑋;Hadoop云平臺(tái)下基于本體的圖像檢索系統(tǒng)研究[D];吉林大學(xué);2016年
6 王霄霄;基于Hadoop的電信云計(jì)算開放平臺(tái)研究設(shè)計(jì)[D];南京郵電大學(xué);2015年
7 白亮;基于Hadoop的民航高價(jià)值旅客發(fā)現(xiàn)方法研究[D];中國(guó)民航大學(xué);2015年
8 張麗云;基于Hadoop的企業(yè)知識(shí)管理系統(tǒng)的主要功能的研究與實(shí)現(xiàn)[D];東北師范大學(xué);2014年
9 夏志剛;基于Hadoop的數(shù)字大棚云系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[D];大連理工大學(xué);2014年
10 楊寧;基于Hadoop平臺(tái)的廣告檢測(cè)系統(tǒng)研究與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2012年
,本文編號(hào):1276515
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1276515.html