地震數(shù)據(jù)存儲系統(tǒng)中的索引研究
本文關(guān)鍵詞:地震數(shù)據(jù)存儲系統(tǒng)中的索引研究
更多相關(guān)文章: 地震數(shù)據(jù) 兩級索引 索引優(yōu)化 Trie樹 T~*樹 FastDFS
【摘要】:經(jīng)濟的快速發(fā)展及能源緊缺導(dǎo)致了石油需求的增長,在這種需求下,地震勘探作為石油勘探最有效的方法,正在向著高精度、高密度、多維度方向發(fā)展。隨之產(chǎn)生的大規(guī)模地震勘探數(shù)據(jù)需要及時進行存儲、分析及處理,這些數(shù)據(jù)的讀取具有塊小量大的特點。常規(guī)磁盤所用的數(shù)據(jù)讀取方式,其處理速度緩慢,因此不僅要對地震數(shù)據(jù)底層存儲系統(tǒng)進行改善,給系統(tǒng)加入索引機制來提高數(shù)據(jù)訪問速度,也是必不可少的。因此為地震數(shù)據(jù)存儲系統(tǒng)研究一種新型的索引結(jié)構(gòu)、索引算法就變得很有意義。 索引技術(shù)可以有效地提高數(shù)據(jù)的查詢處理能力,降低查詢時間,減少磁盤I/0訪問次數(shù)。針對地震數(shù)據(jù)的存取,目前方案多是采用索引與數(shù)據(jù)分開存儲,索引服務(wù)器采用集中式管理,容易造成內(nèi)存溢出、單點故障等問題。也有學(xué)者對大數(shù)據(jù)索引提出不同方案,根據(jù)關(guān)鍵字特點采用分級索引,使得時間和空間開銷有所降低,但他們分級后的索引同樣是在同一個節(jié)點中存儲。 地震數(shù)據(jù)存儲系統(tǒng)(Seismic Data File System,簡稱為SDFS)系統(tǒng)將地震數(shù)據(jù)分塊后均勻分布到各個服務(wù)器節(jié)點進行存儲。本文利用SDFS的分布式與分級式的特點,針對地震數(shù)據(jù)特殊的訪問需求,提出基于炮號和道號的兩級索引結(jié)構(gòu)來記錄分塊后的數(shù)據(jù)位置。通過對兩級索引進行研究后,分別采用Trie樹、紅黑樹、AVL樹對索引進行了實現(xiàn)。最后提出一種混合索引機制T*-Trie樹對一級索引進行實現(xiàn)。實驗結(jié)果表明,采用T*-Trie樹可以滿足系統(tǒng)隨機讀和順序讀取的需求,在速度上有所提高,且使元數(shù)據(jù)服務(wù)器內(nèi)存消耗也得到了降低。
【關(guān)鍵詞】:地震數(shù)據(jù) 兩級索引 索引優(yōu)化 Trie樹 T~*樹 FastDFS
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP333;TP391.3
【目錄】:
- 摘要5-6
- ABSTRACT6-7
- 目錄7-9
- 插圖9-11
- 第1章 緒論11-17
- 1.1 研究背景與意義11-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-15
- 1.3 論文研究內(nèi)容15-16
- 1.4 論文組織架構(gòu)16-17
- 第2章 相關(guān)技術(shù)17-31
- 2.1 地震勘探相關(guān)知識17-20
- 2.1.1 地震勘探17-18
- 2.1.2 地震數(shù)據(jù)文件格式18
- 2.1.3 地震數(shù)據(jù)讀取方式18-20
- 2.2 FastDFS介紹20-24
- 2.2.1 FastDFS及其設(shè)計理念20-21
- 2.2.2 FastDFS架構(gòu)21-22
- 2.2.3 FasDFS操作流程22-23
- 2.2.4 FastDFS文件名策略23-24
- 2.3 索引技術(shù)24-30
- 2.3.1 數(shù)組索引25
- 2.3.2 哈希索引25
- 2.3.3 B樹和B+樹索引25-26
- 2.3.4 Trie樹26-27
- 2.3.5 紅黑樹27-29
- 2.3.6 T樹及其變種29-30
- 2.4 本章小結(jié)30-31
- 第3章 SDFS的兩級索引結(jié)構(gòu)31-41
- 3.1 SDFS介紹31-34
- 3.1.1 地震數(shù)據(jù)存取特點及FastDFS適應(yīng)性研究31-32
- 3.1.2 SDFS中地震數(shù)據(jù)格式32
- 3.1.3 SDFS數(shù)據(jù)分塊策略32-34
- 3.2 兩級索引結(jié)構(gòu)34-37
- 3.2.3 兩級索引結(jié)構(gòu)的提出34-36
- 3.2.4 兩級索引的實現(xiàn)36-37
- 3.3 兩級索引性能測試37-40
- 3.3.1 隨機讀速度測試38-39
- 3.3.2 順序讀速度測試39-40
- 3.3.3 其他方面性能測試40
- 3.4 本章小結(jié)40-41
- 第4章 SDFS兩級索引的改進41-55
- 4.1 AVL樹優(yōu)化二級索引41-45
- 4.1.1 AVL樹介紹41-43
- 4.1.2 兩級索引性能測試43-45
- 4.2 索引機制的進一步改進45-53
- 4.2.1 T樹45-48
- 4.2.2 T~*樹48-49
- 4.2.3 改進的索引機制T~*-Trie樹49-53
- 4.3 本章小結(jié)53-55
- 第5章 T~*-Trie樹索引性能的測試55-59
- 5.1 兩級索引的實現(xiàn)55
- 5.2 兩級索引性能測試55-58
- 5.2.1 隨機讀速度測試55-56
- 5.2.2 順序讀速度測試56-57
- 5.2.3 分塊大小對性能影響57
- 5.2.4 其他方面性能57-58
- 5.3 結(jié)論58-59
- 第6章 總結(jié)與展望59-61
- 參考文獻61-65
- 致謝65-67
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果67
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 董玉敏;宋雪峰;關(guān)宇;許濤;;淺析地震資料處理系統(tǒng)中存儲技術(shù)需求[J];中國管理信息化;2014年02期
2 吳廣君;王樹鵬;陳明;李超;;海量結(jié)構(gòu)化數(shù)據(jù)存儲檢索系統(tǒng)[J];計算機研究與發(fā)展;2012年S1期
3 吳煒;蘇永紅;李瑞軒;盧正鼎;;基于DHT的分布式索引技術(shù)研究與實現(xiàn)[J];計算機科學(xué);2010年02期
4 林鵬,李航,徐學(xué)洲;關(guān)鍵業(yè)務(wù)中內(nèi)存數(shù)據(jù)庫的T樹索引優(yōu)化[J];計算機工程;2004年17期
5 周進剛;邢鐵軍;紀(jì)勇;趙大哲;;一種結(jié)構(gòu)化數(shù)據(jù)緩存方法[J];計算機工程;2010年20期
6 喻波;趙國鴻;陳曙暉;;一種基于共享前綴的兩級索引結(jié)構(gòu)[J];計算機工程與科學(xué);2010年12期
7 牛德姣;蔡濤;詹永照;鞠時光;;海量存儲系統(tǒng)中的元數(shù)據(jù)分級索引算法[J];計算機應(yīng)用研究;2012年02期
8 趙改善;我們需要多大和多快的計算機[J];勘探地球物理進展;2004年01期
9 湯羽;王英杰;范愛華;姚遠哲;;基于HDFS開源架構(gòu)與多級索引表的海量數(shù)據(jù)檢索mDHT算法[J];計算機科學(xué);2013年02期
10 周江;王偉平;孟丹;馬燦;古曉艷;蔣杰;;面向大數(shù)據(jù)分析的分布式文件系統(tǒng)關(guān)鍵技術(shù)[J];計算機研究與發(fā)展;2014年02期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 李懷良;復(fù)雜山地多波寬頻帶地震數(shù)據(jù)采集關(guān)鍵技術(shù)研究[D];成都理工大學(xué);2013年
,本文編號:866058
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/866058.html