面向大數(shù)據(jù)處理的并行計算模型及性能優(yōu)化

發(fā)布時間：2016-12-01 12:04

本文關鍵詞：面向大數(shù)據(jù)處理的并行計算模型及性能優(yōu)化，由筆耕文化傳播整理發(fā)布。

面向大數(shù)據(jù)處理的并行計算模型及性能優(yōu)化 投稿：史聲聳

　　不少高血壓患者會要求查血粘度。然后，拿著化驗單來問醫(yī)生：血粘度增高了，我該怎么辦？　　血粘度增高的情況，到底有沒有必要擔心呢？血粘度增高，通俗地講，就是血液過度粘稠了。此時，血液中的紅細胞聚集成串，使血液的粘稠度增加，循環(huán)阻力增大，出現(xiàn)微循環(huán)…

世界著名半導體公司 2009-08-21 15:06 以下是我所了解的一些著名半導體公司的概況，公司排名依據(jù)是iSuppli分析報告的各公司2008年收入，25家公司中美國10家，日本9家，歐洲3家，韓國2家，臺灣1家，不當之處，還請各位多多指教。 …

　　摘要隨著社會的不斷進步以及科技的不斷發(fā)展，人們更加容易的獲得了大量的數(shù)據(jù)，數(shù)據(jù)信息在國民的工商業(yè)發(fā)展中起著越來越重要的作用，世界已經(jīng)進入大數(shù)據(jù)時代。雖然海量的數(shù)據(jù)信息能被人們獲取，但帶來的問題就是人們不可能通過傳統(tǒng)的處理數(shù)據(jù)信息的方法來處理得到的海量數(shù)據(jù)。為了減小人們從海量數(shù)據(jù)信息中獲得有效信息得難度，研究者們近年來一直致力于處理海量數(shù)據(jù)的并行計算模型與并行計算模型的性能優(yōu)化。筆者根據(jù)自己多年的實驗經(jīng)驗對面向大數(shù)據(jù)處理的計算模型及其優(yōu)化方法進行了詳細分析，為同行提供一定的參考。

　　【關鍵詞】大數(shù)據(jù)處理并行計算模型性能優(yōu)化數(shù)據(jù)信息海量數(shù)據(jù)
　　1 引言
　　雖然現(xiàn)在人們更加容易的獲取數(shù)量量且形式多樣的的數(shù)據(jù)，但是所獲得的數(shù)據(jù)量過于巨大且有效信息相對于海量的數(shù)據(jù)所占比例太小。在實際應用中，人們通過傳統(tǒng)的一些處理數(shù)據(jù)的方法來從這些海量數(shù)據(jù)中獲取對自己有用的數(shù)據(jù)信息顯然是不現(xiàn)實的。海量的數(shù)據(jù)對人們來說既是機遇又是挑戰(zhàn)，利用好海量的數(shù)據(jù)，人們就能抓住事物的發(fā)展規(guī)律，獲取更多的利益。為了處理得到的海量數(shù)據(jù)，人們需對處理大數(shù)據(jù)的傳統(tǒng)的并行計算模型進行更加深入的研究，優(yōu)化并行計算模型性能，提高人們處理海量數(shù)據(jù)信息的效率，使人們能夠充分抓住大數(shù)據(jù)時代帶給人們寶貴的機遇，充分發(fā)掘海量數(shù)據(jù)帶給我們的每一份效益。
　　2 面向大數(shù)據(jù)處理的計算模型分析
　　2.1 模型概述
　　隨著電子信息與互聯(lián)網(wǎng)技術的快速進步，對面向大數(shù)據(jù)的并行計算模型研究取得了長足的進展。并行計算模型主要用于幫助專業(yè)人員分析數(shù)據(jù)與處理數(shù)據(jù)，然而面對日益增長的海量的數(shù)據(jù)，傳統(tǒng)的并行計算模型越來越顯得力不從心，人們迫切需要性能更加優(yōu)良的并行計算模型來處理這些數(shù)據(jù)。成熟的面向大數(shù)據(jù)的并行計算模型含有兩大組成部分：
　�。�1）模型相關設備具體參數(shù)；
　�。�2）模型成本函數(shù)。
　　這兩方面的分析研究為面向大數(shù)據(jù)的并行計算模型的進一步發(fā)展奠定了理論基礎。衡量面向大數(shù)據(jù)的并行計算模型的性能優(yōu)劣衡量標準包括擴展性與容錯性兩方面，研究人員應該對這兩因素劃分精準的統(tǒng)一標準。目前人們提出的對計算模型進行優(yōu)化一般只是指對某一系統(tǒng)或者某一計算模型的某些性能進行優(yōu)化，比如減小數(shù)據(jù)存儲空間，加快數(shù)據(jù)通訊等等，并沒有公認的性能優(yōu)化標準指標，面向大數(shù)據(jù)的并行計算模型性能優(yōu)化必須提出統(tǒng)一的標準理論，設計出一種可以針對全部計算模型的優(yōu)化方法。
　　2.2 p-DOT模型分析
　　p-DOT模型是以BPS模型為設計藍本，由三個層次組成。
　　第一層為數(shù)據(jù)層――D-layer。數(shù)據(jù)層分布結(jié)構(gòu)為分布式，數(shù)據(jù)存儲位置為各個數(shù)據(jù)節(jié)點。
　　第二層為計算層――O-layer。在并行計算模型中的某一個運行階段，系統(tǒng)內(nèi)全部節(jié)點同時對數(shù)據(jù)進行分析處理，并且每個節(jié)點之間沒有相互聯(lián)系，互不干擾。開始階段人為輸入的數(shù)據(jù)以及運行過程中系統(tǒng)產(chǎn)生的新的數(shù)據(jù)都是節(jié)點處理數(shù)據(jù)的來源。各個節(jié)點處理完數(shù)據(jù)后立即存儲在并行計算模型內(nèi)。
　　最后一層為通信層――T-layer。在并行計算模型中的某一個運行階段，系統(tǒng)內(nèi)節(jié)點在處理分析數(shù)據(jù)過程中會產(chǎn)生數(shù)據(jù)處理中間結(jié)果，進而產(chǎn)生了大量的數(shù)據(jù)消息，這些數(shù)據(jù)消息全部是通過通信操作子以點對點的方式在計算模型內(nèi)進行傳輸?shù)�。通信操作子將這些數(shù)據(jù)消息傳送到數(shù)據(jù)處理的下一個階段。這樣的數(shù)據(jù)處理過程也就是上一階段的數(shù)據(jù)處理結(jié)果是下一階段數(shù)據(jù)處理的輸入數(shù)據(jù)。假如兩階段之間沒有實現(xiàn)通信或者說某階段處理完數(shù)據(jù)后不存在數(shù)據(jù)處理的下一個階段，那么最后的處理數(shù)據(jù)就是我們得到的數(shù)據(jù)處理的最終結(jié)果。
　　3 基于計算模型的性能優(yōu)化方法分析
　　3.1 D-layer的優(yōu)化
　　在數(shù)據(jù)處理過程中，操作人員有可能會操作失誤或者系統(tǒng)穩(wěn)定性并不是很好，在這種情況下很容易造成數(shù)據(jù)信息大量丟失。為了提高系統(tǒng)的容錯率，專業(yè)人員都要對數(shù)據(jù)進行定期備份，并且為了保險起見一般數(shù)據(jù)的備份量不會少于三份，并且這些數(shù)據(jù)備份不會儲藏在同一地方。一旦數(shù)據(jù)層出現(xiàn)數(shù)據(jù)丟失情況，這些備份就會拿來進行數(shù)據(jù)恢復。在數(shù)據(jù)備份的過程中，專業(yè)人員可以將每個數(shù)據(jù)塊的備份儲存在相應的節(jié)點；在機架數(shù)目眾多的情況下，單個機架一般能夠儲存單個數(shù)據(jù)塊的單個備份。這種數(shù)據(jù)備份儲存方式大大提高了系統(tǒng)的容錯率。
　　3.2 O-layer的優(yōu)化
　　隨著社會的不斷進步以及科技的不斷發(fā)展，人們對處理大數(shù)據(jù)的效率提出了更高的標準。一般的系統(tǒng)為了進一步提高數(shù)據(jù)處理的效率，都會默認支持系統(tǒng)的一些橫向擴展。目前多核處理器的應用變得越來越普及，計算模型的數(shù)據(jù)處理效率越來越強，對高性能硬件的利用率越來越高。傳統(tǒng)的并行計算模型內(nèi)部依賴進程進行通信，經(jīng)過性能優(yōu)化以后的并行計算模型則是依賴線程進行通信，顯著提高了模型的運算效率。
　　3.3 T-layer的優(yōu)化
　　模型的通信性能也是影響并行計算模型運算效率的一個重要因素。系統(tǒng)的每一次迭代處理都會消耗系統(tǒng)大量的通信開銷，為了優(yōu)化傳統(tǒng)并行計算模型的通信性能，專業(yè)人員需對模型進行不間斷的更新優(yōu)化。假如系統(tǒng)中運行的機器數(shù)目龐大，為了完成數(shù)據(jù)運算，系統(tǒng)中的每一臺機器都需要進行數(shù)據(jù)運算與參數(shù)同步，系統(tǒng)的數(shù)據(jù)處理效率不是取決于運行速度快的機器，而是取決于運行速度慢的機器，這就是數(shù)據(jù)處理的短板效應。為了盡量減小數(shù)據(jù)處理的短板效應，，專業(yè)人員需對運算性能較差的機器進行升級或者更換，優(yōu)化并行計算模型。
　　4 結(jié)語
　　目前，隨著世界經(jīng)濟的高速發(fā)展以及信息技術的不斷進步，人們已經(jīng)進入了大數(shù)據(jù)時代。在這個數(shù)據(jù)就是機遇與財富的年代，傳統(tǒng)的數(shù)據(jù)處理模型已經(jīng)遠遠不能夠滿足人們對海量數(shù)據(jù)處理效率的需求，優(yōu)化并行計算模型在一定程度上能提高人們對海量數(shù)據(jù)的處理效率。在本文中，筆者通過自己多年的教學實驗經(jīng)驗筆者對面向大數(shù)據(jù)處理的計算模型及其優(yōu)化方法進行了詳細的分析與研究，具有一定的參考價值。
　　參考文獻
　　[1]覃雄派，王會舉.大數(shù)據(jù)分析――RDBMS與M apR educe的競爭與共生[J].軟件學報，2012，23（1）.
　　[2]程果，景寧.柵格數(shù)據(jù)處理中鄰域型算法的并行優(yōu)化方法[J].國防科技大學學報，2012，34（4）.
　　[3]潘巍，李戰(zhàn)懷.大數(shù)據(jù)環(huán)境下并行計算模型的研究進展[J].華東師范大學學報（自然科學版），2014（5）.
　　[4]張延松，焦敏.海量數(shù)據(jù)分析的O ne-size-fits-allO LAP技術[J].計算機學報，2011，34（10）.
　　[5]董新華，李瑞軒.H adoop系統(tǒng)性能優(yōu)化與功能增強綜述[J].計算機研究與發(fā)展，2013（5）.

本文由第一文庫網(wǎng)()首發(fā)，轉(zhuǎn)載請保留網(wǎng)址和出處！

>> 查看更多相關文檔

免費下載文檔：

本文關鍵詞：面向大數(shù)據(jù)處理的并行計算模型及性能優(yōu)化，由筆耕文化傳播整理發(fā)布。

本文編號：180849

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/shoufeilunwen/xxkjbs/180849.html

上一篇：入侵雜草優(yōu)化算法在陣列天線綜合中的應用
下一篇：硅基微環(huán)諧振器特性研究及其應用

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向大數(shù)據(jù)處理的并行計算模型及性能優(yōu)化