基于多核處理器的自適應異構并行庫的優(yōu)化與實現
本文關鍵詞:基于多核處理器的自適應異構并行庫的優(yōu)化與實現
更多相關文章: 并行庫優(yōu)化 自適應選擇 線程分配
【摘要】:串行計算的時代已經結束了。隨著多核處理器的出現,高性能并行計算,現在已經作為主流出現。而本項目中的并行庫,就是為用戶提供高性能計算的TM并行庫,可協(xié)助開發(fā)者,開發(fā)出性能高效的應用程序。 本論文是針對并行庫的優(yōu)化與實現展開的,,與英特爾的并行庫TBB作為參照,找到現TM并行庫存在的瓶頸問題及效率慢的原因,并根據發(fā)現的問題以及多案例提供的數據對比來確定優(yōu)化方案,根據優(yōu)化方案進行具體的編碼實現工作。 從技術難點方面看,涉及到并行子任務劃分技術,由于劃分后的每個子任務在多核處理器下并行運行,因此子任務的劃分大小直接影響運行效率;線程“復用”策略,減少線程被“喚醒”的額外時間;串并行路徑的自適應學習方法,把未經學習的數據通過學習過程找到規(guī)律,即判斷出串行走向和并行走向;在判斷走向時,是根據已知學習點進行的曲線擬合,涉及最小二乘法的數學優(yōu)化技術來進行曲線擬合。優(yōu)化過程中,提高運行效率的關鍵之一就是進行更佳的線程分配策略的過程,優(yōu)化線程分配主要從兩方面入手,一方面是減少線程間的切換,另一方面是充分利用當前線程。 本項目用C++語言開發(fā),是一套C++模板庫,TM并行庫的功能包括parallel_for并行算法,Pipeline流水線算法,因此提高這兩大功能的效率,就是提高整體TM并行庫的效率,優(yōu)化功能就是以提高parallel_for和pipeline為目標的。parallel_for沿用思路的優(yōu)化與實現,改善了原parallel_for在小數據量或小任務量下運行效率低的問題,并使TM更加具有競爭力。串并行路徑選擇器功能的添加,為后續(xù)運行提供了提示作用,提高小數據量下執(zhí)行串行的效率。 經過多案例下的測試,證明本次優(yōu)化提高并行庫的執(zhí)行性能,且通過功能實現,完成了部分預期優(yōu)化目標,提高TM自身的競爭力,對于用戶具有較高的實用價值。
【關鍵詞】:并行庫優(yōu)化 自適應選擇 線程分配
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP311.1;TP332
【目錄】:
- 摘要4-5
- Abstract5-10
- 縮略詞和專業(yè)術語10-11
- 第1章 緒論11-15
- 1.1 課題來源及研究意義11
- 1.2 與課題相關的國內外研究綜述11-13
- 1.2.1 業(yè)內類似并行庫介紹11-12
- 1.2.2 并行研究領域及任務調度技術12-13
- 1.3 本論文的主要工作內容13-15
- 第2章 并行算法介紹及項目關鍵技術分析15-23
- 2.1 并行算法介紹15-17
- 2.1.1 Parallel_for 算法介紹15-16
- 2.1.2 Pipeline 算法介紹16-17
- 2.2 關鍵技術分析17-22
- 2.2.1 線程分配的“遞歸”策略17-19
- 2.2.2 串并行的自適應學習算法19-20
- 2.2.3 曲線擬合最小二乘法20-21
- 2.2.4 線程分配策略21-22
- 2.3 本章小結22-23
- 第3章 并行庫優(yōu)化的需求分析23-31
- 3.1 調度流程23-24
- 3.2 關鍵接口及任務類型24-26
- 3.3 功能需求26-29
- 3.3.1 明確優(yōu)化方案26-27
- 3.3.2 Parallel_for 算法優(yōu)化27-28
- 3.3.3 串并行路徑選擇器功能28-29
- 3.3.4 Pipeline 算法優(yōu)化29
- 3.4 優(yōu)化需求29-30
- 3.4.1 優(yōu)化目標30
- 3.4.2 優(yōu)化內容30
- 3.5 本章小結30-31
- 第4章 優(yōu)化并行庫的詳細設計及實現31-60
- 4.1 Parallel_for 算法優(yōu)化與實現31-40
- 4.1.1 思路來源31-33
- 4.1.2 Parallel_for 優(yōu)化具體實現33-37
- 4.1.3 Parallel_for 優(yōu)化前后對比37-39
- 4.1.4 Parallel_for 優(yōu)化前后案例數據對比39
- 4.1.5 Parallel_for 優(yōu)化結論39-40
- 4.2 串并行路徑選擇器功能40-56
- 4.2.1 問題提出40-42
- 4.2.2 動態(tài)估算獲取權重方案42-45
- 4.2.3 自適應學習估算曲線擬合策略45
- 4.2.4 自適應學習步長與點數的選取45-47
- 4.2.5 串并行具體實現流程47-48
- 4.2.6 串并行選擇模型48-54
- 4.2.7 串并行選擇優(yōu)化結論54-55
- 4.2.8 串并行路徑選擇器的局限性55-56
- 4.3 Pipeline 主線程沿用實現及展望56-59
- 4.3.1 優(yōu)化方案確定56-57
- 4.3.2 主線程沿用實現57-58
- 4.3.3 展望功能58-59
- 4.4 本章小結59-60
- 第5章 優(yōu)化結果的案例測試和數據分析60-72
- 5.1 測試環(huán)境60-61
- 5.2 測試軟件并行庫的對比61
- 5.3 Parallel_for 優(yōu)化實現測試結果61-67
- 5.3.1 一維子字符串查找案例62-64
- 5.3.2 一維求平均值案例64-66
- 5.3.3 二維 Mandelbrot 和矩陣相乘案例對比66-67
- 5.4 串并行路徑選擇器優(yōu)化實現測試結果67-70
- 5.4.1 串并行矩陣相乘案例68-69
- 5.4.2 串并行矩陣相加案例69-70
- 5.5 Pipeline 主線程沿用優(yōu)化實現測試結果70-71
- 5.6 本章小結71-72
- 結論72-74
- 參考文獻74-79
- 致謝79-80
- 個人簡歷80
【參考文獻】
中國期刊全文數據庫 前9條
1 孫海霞;馬玉鳳;;負載均衡綜述[J];電腦知識與技術;2006年08期
2 ;Linear-regression models and algorithms based on the Total-Least-Squares principle[J];Geodesy and Geodynamics;2012年02期
3 Wang Leyang;;Properties of the total least squares estimation[J];Geodesy and Geodynamics;2012年04期
4 胡斌;袁道華;;TBB多核編程及其混合編程模型的研究[J];計算機技術與發(fā)展;2009年02期
5 劉巧英;喬玉蘭;孫玉強;;并行技術領域中調度算法研究[J];中國科技信息;2009年05期
6 黃伯平;趙蔚;余延冬;;自適應學習系統(tǒng)參考模型比較分析研究[J];中國電化教育;2009年08期
7 ;Multi-loop adaptive internal model control based on a dynamic partial least squares model[J];Journal of Zhejiang University-Science A(Applied Physics & Engineering);2011年03期
8 楊熾夫;鄭淑濤;靳軍;朱思斌;韓俊偉;;Forward kinematics analysis of parallel manipulator using modified global Newton-Raphson method[J];Journal of Central South University of Technology;2010年06期
9 Xiaolong Xu;Jiaxing Wu;Geng Yang;Ruchuan Wang;;Low-power task scheduling algorithm for large-scale cloud data centers[J];Journal of Systems Engineering and Electronics;2013年05期
本文編號:584319
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/584319.html