基于多核處理器的自適應(yīng)異構(gòu)并行庫的優(yōu)化與實現(xiàn)

發(fā)布時間：2017-07-28 13:32

本文關(guān)鍵詞：基于多核處理器的自適應(yīng)異構(gòu)并行庫的優(yōu)化與實現(xiàn)

更多相關(guān)文章： 并行庫優(yōu)化 自適應(yīng)選擇 線程分配

【摘要】：串行計算的時代已經(jīng)結(jié)束了。隨著多核處理器的出現(xiàn)，高性能并行計算，現(xiàn)在已經(jīng)作為主流出現(xiàn)。而本項目中的并行庫，就是為用戶提供高性能計算的TM并行庫，可協(xié)助開發(fā)者，開發(fā)出性能高效的應(yīng)用程序。本論文是針對并行庫的優(yōu)化與實現(xiàn)展開的，，與英特爾的并行庫TBB作為參照，找到現(xiàn)TM并行庫存在的瓶頸問題及效率慢的原因，并根據(jù)發(fā)現(xiàn)的問題以及多案例提供的數(shù)據(jù)對比來確定優(yōu)化方案，根據(jù)優(yōu)化方案進行具體的編碼實現(xiàn)工作。從技術(shù)難點方面看，涉及到并行子任務(wù)劃分技術(shù)，由于劃分后的每個子任務(wù)在多核處理器下并行運行，因此子任務(wù)的劃分大小直接影響運行效率；線程“復(fù)用”策略，減少線程被“喚醒”的額外時間；串并行路徑的自適應(yīng)學(xué)習(xí)方法，把未經(jīng)學(xué)習(xí)的數(shù)據(jù)通過學(xué)習(xí)過程找到規(guī)律，即判斷出串行走向和并行走向；在判斷走向時，是根據(jù)已知學(xué)習(xí)點進行的曲線擬合，涉及最小二乘法的數(shù)學(xué)優(yōu)化技術(shù)來進行曲線擬合。優(yōu)化過程中，提高運行效率的關(guān)鍵之一就是進行更佳的線程分配策略的過程，優(yōu)化線程分配主要從兩方面入手，一方面是減少線程間的切換，另一方面是充分利用當(dāng)前線程。本項目用C++語言開發(fā)，是一套C++模板庫，TM并行庫的功能包括parallel_for并行算法，Pipeline流水線算法，因此提高這兩大功能的效率，就是提高整體TM并行庫的效率，優(yōu)化功能就是以提高parallel_for和pipeline為目標(biāo)的。parallel_for沿用思路的優(yōu)化與實現(xiàn)，改善了原parallel_for在小數(shù)據(jù)量或小任務(wù)量下運行效率低的問題，并使TM更加具有競爭力。串并行路徑選擇器功能的添加，為后續(xù)運行提供了提示作用，提高小數(shù)據(jù)量下執(zhí)行串行的效率。經(jīng)過多案例下的測試，證明本次優(yōu)化提高并行庫的執(zhí)行性能，且通過功能實現(xiàn)，完成了部分預(yù)期優(yōu)化目標(biāo)，提高TM自身的競爭力，對于用戶具有較高的實用價值。
【關(guān)鍵詞】：并行庫優(yōu)化 自適應(yīng)選擇 線程分配
【學(xué)位授予單位】：哈爾濱工業(yè)大學(xué)
【學(xué)位級別】：碩士
【學(xué)位授予年份】：2014
【分類號】：TP311.1;TP332
【目錄】：

摘要4-5
Abstract5-10
縮略詞和專業(yè)術(shù)語10-11
第1章緒論11-15
1.1 課題來源及研究意義11
1.2 與課題相關(guān)的國內(nèi)外研究綜述11-13
1.2.1 業(yè)內(nèi)類似并行庫介紹11-12
1.2.2 并行研究領(lǐng)域及任務(wù)調(diào)度技術(shù)12-13
1.3 本論文的主要工作內(nèi)容13-15
第2章并行算法介紹及項目關(guān)鍵技術(shù)分析15-23
2.1 并行算法介紹15-17
2.1.1 Parallel_for 算法介紹15-16
2.1.2 Pipeline 算法介紹16-17
2.2 關(guān)鍵技術(shù)分析17-22
2.2.1 線程分配的“遞歸”策略17-19
2.2.2 串并行的自適應(yīng)學(xué)習(xí)算法19-20
2.2.3 曲線擬合最小二乘法20-21
2.2.4 線程分配策略21-22
2.3 本章小結(jié)22-23
第3章并行庫優(yōu)化的需求分析23-31
3.1 調(diào)度流程23-24
3.2 關(guān)鍵接口及任務(wù)類型24-26
3.3 功能需求26-29
3.3.1 明確優(yōu)化方案26-27
3.3.2 Parallel_for 算法優(yōu)化27-28
3.3.3 串并行路徑選擇器功能28-29
3.3.4 Pipeline 算法優(yōu)化29
3.4 優(yōu)化需求29-30
3.4.1 優(yōu)化目標(biāo)30
3.4.2 優(yōu)化內(nèi)容30
3.5 本章小結(jié)30-31
第4章優(yōu)化并行庫的詳細設(shè)計及實現(xiàn)31-60
4.1 Parallel_for 算法優(yōu)化與實現(xiàn)31-40
4.1.1 思路來源31-33
4.1.2 Parallel_for 優(yōu)化具體實現(xiàn)33-37
4.1.3 Parallel_for 優(yōu)化前后對比37-39
4.1.4 Parallel_for 優(yōu)化前后案例數(shù)據(jù)對比39
4.1.5 Parallel_for 優(yōu)化結(jié)論39-40
4.2 串并行路徑選擇器功能40-56
4.2.1 問題提出40-42
4.2.2 動態(tài)估算獲取權(quán)重方案42-45
4.2.3 自適應(yīng)學(xué)習(xí)估算曲線擬合策略45
4.2.4 自適應(yīng)學(xué)習(xí)步長與點數(shù)的選取45-47
4.2.5 串并行具體實現(xiàn)流程47-48
4.2.6 串并行選擇模型48-54
4.2.7 串并行選擇優(yōu)化結(jié)論54-55
4.2.8 串并行路徑選擇器的局限性55-56
4.3 Pipeline 主線程沿用實現(xiàn)及展望56-59
4.3.1 優(yōu)化方案確定56-57
4.3.2 主線程沿用實現(xiàn)57-58
4.3.3 展望功能58-59
4.4 本章小結(jié)59-60
第5章優(yōu)化結(jié)果的案例測試和數(shù)據(jù)分析60-72
5.1 測試環(huán)境60-61
5.2 測試軟件并行庫的對比61
5.3 Parallel_for 優(yōu)化實現(xiàn)測試結(jié)果61-67
5.3.1 一維子字符串查找案例62-64
5.3.2 一維求平均值案例64-66
5.3.3 二維 Mandelbrot 和矩陣相乘案例對比66-67
5.4 串并行路徑選擇器優(yōu)化實現(xiàn)測試結(jié)果67-70
5.4.1 串并行矩陣相乘案例68-69
5.4.2 串并行矩陣相加案例69-70
5.5 Pipeline 主線程沿用優(yōu)化實現(xiàn)測試結(jié)果70-71
5.6 本章小結(jié)71-72
結(jié)論72-74
參考文獻74-79
致謝79-80
個人簡歷80

【參考文獻】

中國期刊全文數(shù)據(jù)庫前9條

1 孫海霞;馬玉鳳;;負載均衡綜述[J];電腦知識與技術(shù);2006年08期

2 ;Linear-regression models and algorithms based on the Total-Least-Squares principle[J];Geodesy and Geodynamics;2012年02期

3 Wang Leyang;;Properties of the total least squares estimation[J];Geodesy and Geodynamics;2012年04期

4 胡斌;袁道華;;TBB多核編程及其混合編程模型的研究[J];計算機技術(shù)與發(fā)展;2009年02期

5 劉巧英;喬玉蘭;孫玉強;;并行技術(shù)領(lǐng)域中調(diào)度算法研究[J];中國科技信息;2009年05期

6 黃伯平;趙蔚;余延冬;;自適應(yīng)學(xué)習(xí)系統(tǒng)參考模型比較分析研究[J];中國電化教育;2009年08期

7 ;Multi-loop adaptive internal model control based on a dynamic partial least squares model[J];Journal of Zhejiang University-Science A(Applied Physics & Engineering);2011年03期

8 楊熾夫;鄭淑濤;靳軍;朱思斌;韓俊偉;;Forward kinematics analysis of parallel manipulator using modified global Newton-Raphson method[J];Journal of Central South University of Technology;2010年06期

9 Xiaolong Xu;Jiaxing Wu;Geng Yang;Ruchuan Wang;;Low-power task scheduling algorithm for large-scale cloud data centers[J];Journal of Systems Engineering and Electronics;2013年05期

本文編號：584319

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/jisuanjikexuelunwen/584319.html

上一篇：智能可穿戴設(shè)備軍事應(yīng)用與發(fā)展趨勢
下一篇：高校計算機機房管理的現(xiàn)狀與對策分析

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多核處理器的自適應(yīng)異構(gòu)并行庫的優(yōu)化與實現(xiàn)