基于密度劃分的復(fù)雜大數(shù)據(jù)存儲(chǔ)方法與技術(shù)研究
【學(xué)位單位】:北方工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP311.13;TP333
【部分圖文】:
適用于數(shù)據(jù)庫(kù)中的數(shù)據(jù)符合特定的數(shù)據(jù)結(jié)構(gòu)的情況之下,二分查找查詢算法只適??用于數(shù)據(jù)庫(kù)中的數(shù)據(jù)是事先有序的,才能用二分查找算法進(jìn)行數(shù)據(jù)查詢。而數(shù)據(jù)??庫(kù)中的數(shù)據(jù)本身的組織結(jié)構(gòu)并不能滿足所有數(shù)據(jù)結(jié)構(gòu)特性的要求(如,理論上而??言,數(shù)據(jù)庫(kù)中的數(shù)據(jù)不可能同時(shí)依據(jù)兩列數(shù)據(jù)按照順序結(jié)構(gòu)進(jìn)行組織)。所以,在??數(shù)據(jù)庫(kù)中的數(shù)據(jù)之外,一個(gè)好的數(shù)據(jù)庫(kù)系統(tǒng)還需要維護(hù)一個(gè)滿足特定的數(shù)據(jù)查詢??算法的數(shù)據(jù)結(jié)構(gòu)要求,這些數(shù)據(jù)結(jié)構(gòu)依據(jù)某種方式指向數(shù)據(jù)庫(kù)中對(duì)應(yīng)的數(shù)據(jù),這??樣就可以在這些數(shù)據(jù)結(jié)構(gòu)上實(shí)現(xiàn)更為高級(jí)的數(shù)據(jù)查詢算法,這種結(jié)構(gòu),就是索引。??對(duì)于數(shù)據(jù)庫(kù)索引的理解,其在功能上與書本的目錄相同,書中的內(nèi)容對(duì)應(yīng)的??是數(shù)據(jù)庫(kù)表里的記錄,而書的li]錄對(duì)應(yīng)的就是該表的索引。目錄與書本內(nèi)容存在??一一對(duì)應(yīng)的關(guān)系,通過(guò)目錄可以查詢到書本中對(duì)應(yīng)的內(nèi)容,索引與數(shù)據(jù)庫(kù)表中的??記錄存在一一對(duì)應(yīng)的關(guān)系,通過(guò)索引可以查詢到數(shù)據(jù)庫(kù)表中對(duì)應(yīng)的記錄數(shù)據(jù)。所??以,索引就是以某個(gè)字段值(或一組字段值的組合)作為輸入條件,依據(jù)輸入的條??件在數(shù)據(jù)庫(kù)索引屮找出該字段值對(duì)應(yīng)的索引,再根據(jù)索引查詢到數(shù)據(jù)庫(kù)該索丨對(duì)??應(yīng)的記錄數(shù)據(jù)。以下圖為例:??Coll?CqI2??
查詢完所有的葉子節(jié)點(diǎn)中的關(guān)鍵碼數(shù)組后,仍未匹配到與給定的值信息相同的關(guān)??鍵字Key,則視為查詢失敗,即本次查詢沒(méi)有找到,返回〇(或返回-1)。??圖2.2為深度2的B-Tree結(jié)構(gòu)示意圖:??1?15?1?I.?S6?r?—]?77?;??data?/?data?\?data?\??/?\?I.??data?data??圖2.2?B樹數(shù)據(jù)結(jié)構(gòu)??2.3?LZW壓縮算法??LZW壓縮算法作為數(shù)據(jù)壓縮研究領(lǐng)域內(nèi)經(jīng)典的壓縮算法,對(duì)其做進(jìn)一步的??深入研究是非常具有參考價(jià)值的,并且本課題在下一章節(jié)與LZW壓縮算法做了??橫向?qū)Ρ�,下面是�?duì)LZW壓縮算法的詳細(xì)介紹。??LZW壓縮算法是_?.種新穎的壓縮方法,由Lemple-Ziv-Welch三人共同創(chuàng)造,??算法由他們的名字首字母組成。它采用了一種先進(jìn)的串表壓縮,所以LZW算法??又叫、?串表壓縮算法”,其思想是將每個(gè)第一次出現(xiàn)的串放在一個(gè)字典中,用一個(gè)??數(shù)字來(lái)表示串,壓縮文件只存貯數(shù)字,則不存貯串,從而使數(shù)據(jù)文件的壓縮效率??得到較大的提高。LZW算法的基本原理簡(jiǎn)述如下:??首先建立一張字典(也稱之為字符串表)
第二章相關(guān)理論和技術(shù)介紹??圖2.3?LZW算法字典結(jié)構(gòu)??2.4?HDFS分布式文件系統(tǒng)技術(shù)??Hadoop分布式文件系統(tǒng)(HDFS)旨在可靠地存儲(chǔ)非常大的數(shù)據(jù)集,并將這??些數(shù)據(jù)集以高帶寬傳輸?shù)接脩魬?yīng)用程序。在大型集群中,數(shù)千臺(tái)服務(wù)器都托管??直接連接的存儲(chǔ)并執(zhí)行用戶應(yīng)用程序任務(wù)。通過(guò)在多臺(tái)服務(wù)器之間分配存儲(chǔ)和??計(jì)算,資源可以隨需求增長(zhǎng),同時(shí)在各種規(guī)模上保持經(jīng)濟(jì)性。??Hadoop提供了一個(gè)分布式文件系統(tǒng)和一個(gè)框架,用于使用MapReduce??[DG04]范例分析和轉(zhuǎn)換非常大的數(shù)據(jù)集。雖然HDFS的接口是在Unix文件系??統(tǒng)之后形成的,但修改了很多格式,以改善手頭應(yīng)用程序的性能。Hadoop的一??個(gè)重要特性是跨多臺(tái)(數(shù)千臺(tái))主機(jī)對(duì)數(shù)據(jù)和計(jì)算進(jìn)行分區(qū),并行執(zhí)行與其數(shù)據(jù)??并行的應(yīng)用程序計(jì)算。Hadoop集群通過(guò)簡(jiǎn)單地添加商品服務(wù)器來(lái)擴(kuò)展計(jì)算容量,??存儲(chǔ)容量和I/O帶寬。雅虎Hadoop集群跨越40
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 仲盛;;特約主編寄語(yǔ)[J];南京信息工程大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年05期
2 馮英偉;王慶福;吉高卿;;云計(jì)算環(huán)境下高校網(wǎng)絡(luò)教學(xué)資源數(shù)據(jù)存儲(chǔ)研究[J];信息與電腦(理論版);2016年03期
3 鄭盛姣;;簡(jiǎn)單的數(shù)據(jù)修復(fù)[J];文理導(dǎo)航(中旬);2017年01期
4 丁茜;;云計(jì)算在移動(dòng)社交中的應(yīng)用研究[J];中小學(xué)電教;2017年06期
5 黃浩星;;空間高效的分布式數(shù)據(jù)存儲(chǔ)方案[J];數(shù)碼世界;2017年11期
6 崔志敏;黃斌;周利宏;;PACS數(shù)據(jù)存儲(chǔ)方案和安全性策略[J];實(shí)用醫(yī)技雜志;2006年20期
7 鄭士貴;數(shù)據(jù)存儲(chǔ)的全面管理[J];管理科學(xué)文摘;1997年09期
8 本刊編輯部;;《高密度光學(xué)數(shù)據(jù)存儲(chǔ)材料》通過(guò)鑒定[J];光電子.激光;1988年06期
9 姜天海;;新技術(shù)讓數(shù)據(jù)存儲(chǔ)時(shí)間逼近“永恒”[J];科學(xué)新聞;2017年01期
10 李華平;許鵬;胡曉明;;高職院校教育資源云平臺(tái)的數(shù)據(jù)存儲(chǔ)研究[J];洛陽(yáng)師范學(xué)院學(xué)報(bào);2017年05期
相關(guān)博士學(xué)位論文 前10條
1 蔚趙春;無(wú)線傳感器網(wǎng)絡(luò)中自適應(yīng)數(shù)據(jù)存儲(chǔ)與kNN查詢處理研究[D];復(fù)旦大學(xué);2008年
2 付松齡;分布式在線社交網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)及優(yōu)化技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
3 郝行軍;物聯(lián)網(wǎng)大數(shù)據(jù)存儲(chǔ)與管理技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2017年
4 宋亞奇;云平臺(tái)下電力設(shè)備監(jiān)測(cè)大數(shù)據(jù)存儲(chǔ)優(yōu)化與并行處理技術(shù)研究[D];華北電力大學(xué)(北京);2016年
5 解煒;射頻識(shí)別系統(tǒng)安全協(xié)議研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
6 樊華;面向物聯(lián)網(wǎng)的RFID不確定數(shù)據(jù)清洗與存儲(chǔ)技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
7 高超;無(wú)線傳感器網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)算法與應(yīng)用技術(shù)研究[D];華中科技大學(xué);2012年
8 湯啟云;模板誘導(dǎo)的嵌段共聚物和納米粒子自組裝[D];南京大學(xué);2011年
9 李芳芳;無(wú)線傳感器網(wǎng)絡(luò)實(shí)時(shí)數(shù)據(jù)管理關(guān)鍵技術(shù)研究[D];東北大學(xué);2008年
10 劉健;模糊XML數(shù)據(jù)存儲(chǔ)與查詢技術(shù)的研究[D];東北大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 向淑貞;基于壓縮感知的采樣和存儲(chǔ)方法研究[D];湖南大學(xué);2017年
2 黃容;基于FTP服務(wù)的HDFS數(shù)據(jù)存儲(chǔ)與遷移研究[D];湖南大學(xué);2017年
3 李春良;基于密度劃分的復(fù)雜大數(shù)據(jù)存儲(chǔ)方法與技術(shù)研究[D];北方工業(yè)大學(xué);2018年
4 姜偉;基于壓縮位圖索引的RDF數(shù)據(jù)存儲(chǔ)與管理[D];北京交通大學(xué);2017年
5 李立;教育領(lǐng)域數(shù)據(jù)存儲(chǔ)問(wèn)題研究[D];華東師范大學(xué);2003年
6 趙晉;基于寬表的多租戶數(shù)據(jù)存儲(chǔ)模式研究[D];鄭州大學(xué);2014年
7 單旭;異構(gòu)大數(shù)據(jù)存儲(chǔ)方法研究[D];北京交通大學(xué);2014年
8 薩日娜;一種基于綜合閾值的分布式數(shù)據(jù)存儲(chǔ)方法[D];哈爾濱工程大學(xué);2011年
9 張洪梅;大規(guī)模智能電網(wǎng)中數(shù)據(jù)存儲(chǔ)方法的研究[D];遼寧大學(xué);2012年
10 孟偉;面向智慧油田數(shù)據(jù)存儲(chǔ)機(jī)制的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2017年
本文編號(hào):2853262
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2853262.html