天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

基于迭代填充的內(nèi)存計算框架分區(qū)映射算法

發(fā)布時間:2018-08-10 22:33
【摘要】:針對內(nèi)存計算框架Spark在作業(yè)Shuffle階段一次分區(qū)產(chǎn)生的數(shù)據(jù)傾斜問題,提出一種內(nèi)存計算框架的迭代填充分區(qū)映射算法(IFPM)。首先,分析Spark作業(yè)的執(zhí)行機制,建立作業(yè)效率模型和分區(qū)映射模型,給出作業(yè)執(zhí)行時間和分配傾斜度的定義,證明這些定義與作業(yè)執(zhí)行效率的因果邏輯關(guān)系;然后,根據(jù)模型和定義求解,設(shè)計擴(kuò)展式數(shù)據(jù)分區(qū)算法(EPA)和迭代式分區(qū)映射算法(IMA),在Map端建立一對多分區(qū)函數(shù),并通過分區(qū)函數(shù)將部分?jǐn)?shù)據(jù)填入擴(kuò)展區(qū)內(nèi),在數(shù)據(jù)分布局部感知后再執(zhí)行擴(kuò)展區(qū)迭代式的多輪數(shù)據(jù)分配,根據(jù)Reduce端已分配數(shù)據(jù)量建立適應(yīng)性的擴(kuò)展區(qū)映射規(guī)則,對原生區(qū)的數(shù)據(jù)傾斜進(jìn)行逐步修正,以此保障數(shù)據(jù)分配的均衡性。實驗結(jié)果表明,在不同源數(shù)據(jù)分布條件下,算法均提高了作業(yè)Shuffle過程分區(qū)映射合理性,縮減了寬依賴Stage的同步時間,提高了作業(yè)執(zhí)行效率。
[Abstract]:Aiming at the problem of data skew caused by the primary partition of memory computing framework (Spark) in the stage of job Shuffle, an iterative padding partition mapping algorithm (IFPM).) for memory computing framework is proposed. Firstly, the execution mechanism of Spark jobs is analyzed, the job efficiency model and partition mapping model are established, the definitions of job execution time and assignment inclination are given, and the causal logic relationship between these definitions and job execution efficiency is proved. According to the model and definition, the extended data partition algorithm (EPA) and the iterative partition mapping algorithm (IMA),) are designed to establish one-to-many partition functions at the Map end. After the local perception of the data distribution, the extended region iterative multi-round data allocation is performed. According to the amount of data allocated on the Reduce terminal, the adaptive extended region mapping rules are established, and the data tilt of the native area is modified step by step. In order to ensure the balance of data distribution. The experimental results show that the algorithm improves the rationality of job Shuffle process partition mapping, reduces the synchronization time of wide dependent Stage, and improves the efficiency of job execution under the condition of different data distribution.
【作者單位】: 新疆大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國家自然科學(xué)基金資助項目(61262088,61462079,61363083,61562086) 新疆維吾爾自治區(qū)高?蒲杏媱濏椖(XJEDU2016S106)~~
【分類號】:TP333;TP301.6

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 徐紅波;;空間填充曲線映射算法研究[J];科技信息(科學(xué)教研);2007年35期

2 孫培展;袁國良;;改進(jìn)的隱式空間映射算法的研究[J];電子設(shè)計工程;2012年09期

3 趙文慶;基于性能驅(qū)動的工藝映射算法[J];計算機輔助設(shè)計與圖形學(xué)學(xué)報;1992年03期

4 黎洪松;;一種改進(jìn)的自組織特征映射算法[J];中國民航學(xué)院學(xué)報;2006年01期

5 徐德智;黃利輝;陳建二;;一種新的基于樹分割的本體映射算法[J];小型微型計算機系統(tǒng);2009年11期

6 吳國福;竇強;竇文華;;基于查表的空間填充曲線映射算法[J];國防科技大學(xué)學(xué)報;2010年05期

7 陳];;心動陣列的自動映射算法[J];計算機研究與發(fā)展;1992年05期

8 黃勝;吳川川;楊曉非;王輝;張衛(wèi);;一種基于臨近原則的虛擬網(wǎng)絡(luò)映射算法[J];電信科學(xué);2013年12期

9 柳玉起;李明林;馮少宏;易國鋒;;基于有限元映射算法的試驗網(wǎng)格顯示及其應(yīng)用[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2007年03期

10 王琳珠;單_,

本文編號:2176416


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2176416.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶493b9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
老司机这里只有精品视频| 日韩国产传媒在线精品| 国产美女精品午夜福利视频| 国产一区二区三区色噜噜| 日韩人妻中文字幕精品| 亚洲男人的天堂久久a| 久久亚洲国产视频三级黄| 色播五月激情五月婷婷| 国产一二三区不卡视频| 国产成人精品国内自产拍| 欧美大黄片在线免费观看| 在线观看日韩欧美综合黄片| 久久机热频这里只精品| 欧美日韩国产综合特黄| 欧美日韩亚洲国产综合网 | 天堂网中文字幕在线视频| 九九热在线视频观看最新| 午夜视频免费观看成人| 欧美日本道一区二区三区| 丝袜美女诱惑在线观看| 成人精品日韩专区在线观看| 国产永久免费高清在线精品| 福利一区二区视频在线| 亚洲婷婷开心色四房播播| 我要看日本黄色小视频| 久久人人爽人人爽大片av| 精品高清美女精品国产区| 97精品人妻一区二区三区麻豆| 久久精品国产亚洲av麻豆尤物| 欧美一区二区三区喷汁尤物| 99久热只有精品视频最新| 欧美日韩精品久久第一页| 五月激情综合在线视频| 激情亚洲内射一区二区三区| 一区二区三区日韩在线| 国产又粗又长又大的视频| 九九九热视频最新在线| 高清一区二区三区四区五区| 黄色污污在线免费观看| 欧美日韩少妇精品专区性色| 国产精品久久男人的天堂|