多核系統(tǒng)中的程序性能優(yōu)化研究
發(fā)布時(shí)間:2020-10-21 10:15
多核處理器在一個(gè)處理器芯片上集成多個(gè)處理器核心,可同時(shí)執(zhí)行多個(gè)線程。長期以來,處理器芯片上的晶體管數(shù)目不斷增加,處理器的設(shè)計(jì)越來越復(fù)雜,但因?yàn)楣暮凸に嚨确矫娴南拗?處理器的時(shí)鐘頻率無法再繼續(xù)提高。隨著處理器廠商紛紛推出各自的多核處理器,多核系統(tǒng)在我們的工作和生活中迅速得到普及,并且每個(gè)處理器中的核數(shù)目還在不斷的增加。多核處理器的普及給應(yīng)用程序的發(fā)展帶來了巨大的挑戰(zhàn),多核處理器中每個(gè)核的計(jì)算能力并沒有增強(qiáng),它是通過組合多個(gè)處理核來提供強(qiáng)大的計(jì)算能力。傳統(tǒng)的串行應(yīng)用程序無法方便的直接借助處理器核數(shù)目的增加提升性能,必須通過并行化或者同時(shí)執(zhí)行多個(gè)程序才能充分發(fā)揮多核系統(tǒng)的計(jì)算能力。 本文從應(yīng)用程序性能優(yōu)化和系統(tǒng)整體性能優(yōu)化兩個(gè)角度,研究了多核系統(tǒng)中的程序性能優(yōu)化方法,并驗(yàn)證其有效性。本文的主要工作和創(chuàng)新點(diǎn)如下: 1.對于多核系統(tǒng)中的應(yīng)用程序性能優(yōu)化,本文分別研究了串行程序性能優(yōu)化方法,并行程序設(shè)計(jì)方法和并行程序性能優(yōu)化方法。通過為程序設(shè)計(jì)并行算法并實(shí)現(xiàn),可以使程序同時(shí)利用多個(gè)核的計(jì)算能力。通過對并行程序進(jìn)行優(yōu)化,可以使程序更充分的發(fā)揮多個(gè)核的計(jì)算能力,其方法包括增加任務(wù)數(shù)量改善負(fù)載均衡,選擇最優(yōu)的線程與處理核之間關(guān)聯(lián)策略,設(shè)計(jì)無鎖機(jī)制減少同步開銷,消除線程間高速緩存?zhèn)喂蚕淼鹊取?2.本文通過對多個(gè)圖像特征提取和馬爾可夫決策過程求解程序進(jìn)行性能優(yōu)化,使這些應(yīng)用程序在多核系統(tǒng)中的性能獲得了較大提升,并驗(yàn)證了所采用的性能優(yōu)化方法能夠有效的提高應(yīng)用程序在多核系統(tǒng)中的性能。 3.對于多核系統(tǒng)整體性能的優(yōu)化,本文研究了多線程之間對共享緩存空間的競爭問題,這種競爭會損害整個(gè)系統(tǒng)以及各個(gè)程序的性能。本文提出了基于工作集模型分析和預(yù)測共享緩存上線程競爭情況的方法,并發(fā)現(xiàn)如果同時(shí)運(yùn)行線程的工作集大小之和超出共享緩存容量,或者同時(shí)運(yùn)行線程的時(shí)間局部性強(qiáng)度差異較大時(shí),線程受到的干擾就會比較劇烈,性能損失比較嚴(yán)重。 4.本文提出了一種基于工作集模型的線程調(diào)度方法。本方法通過一組監(jiān)測單元以較小的代價(jià)獲得線程的工作集大小和時(shí)間局部性強(qiáng)度屬性,并根據(jù)一套線程調(diào)度策略,選取合適的線程同時(shí)運(yùn)行,保證線程的工作集數(shù)據(jù)可以保存在高速緩存之中。實(shí)驗(yàn)結(jié)果表明,基于工作集模型的線程調(diào)度方法較好的緩解了共享緩存上線程間的互相競爭,有效提高了整個(gè)系統(tǒng)和各個(gè)程序的性能。
【學(xué)位單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2010
【中圖分類】:TP332
【部分圖文】:
533 改進(jìn)后的圖像尺度不變特征變換法流程,我們得到一個(gè)改進(jìn)的圖 5.4 所示。在這個(gè)改進(jìn)的并行算表 keypoint_list(圖 5.4 第 3 行得到的特征點(diǎn)加入特征點(diǎn)列表 k,而不是馬上就進(jìn)行對特征點(diǎn)的 行)。這樣我們收集一組尺度空列表,再分配給各個(gè)線程做特征種改進(jìn)后的圖像尺度不變特征變的負(fù)載不均衡狀況被大大改善。
75圖 6.5 并行策略迭代算法流程圖6.5.2 可擴(kuò)放性分析等效率度量標(biāo)準(zhǔn)已被證明是在大多數(shù)并行計(jì)算機(jī)系統(tǒng)上研究問題的可擴(kuò)放性的有效方法(Kumar et al,1994)。在這種方法中,處理器的數(shù)目記為 P,問題的規(guī)模記為 W,即最好的串行算法解決此問題需要的時(shí)間,算法的加速比記為 S,則定義并行算法的效率為E = S P。在通常情況下,如果問題規(guī)模 W 保持不變,則隨著處理器數(shù)目 P 的增加
機(jī)人工智能中廣泛使用了馬爾可夫決策過程(Guestrin et 爾可夫決策過程應(yīng)用于實(shí)際環(huán)境中,我們選擇了使用它來戲中一方的行動。Stratagus 是一個(gè)實(shí)時(shí)戰(zhàn)略游戲免費(fèi)軟agus.sourceforge.net/獲得)。游戲的目標(biāo)是通過控制游戲角軍隊(duì),并最終打敗對手。在游戲中需要進(jìn)行頻繁的交互操過程來說就是對行動的選擇。場景通常被用來測試一個(gè)代理的控制效果(Gearhart,200役場景如圖 6.6 所示,游戲者(在我們的實(shí)驗(yàn)中是游戲智個(gè)步兵(圖 6.6 中紅色步兵),在戰(zhàn)役場景中遭遇到相同數(shù)6 中藍(lán)色步兵)。其中每個(gè)步兵都可以攻擊任意一個(gè)對方步時(shí)刻轉(zhuǎn)換攻擊目標(biāo)。當(dāng)對方步兵被消滅或負(fù)傷失血時(shí),游戰(zhàn)役場景的最終目標(biāo)是盡快消滅對方,并且付出最小的代最少。
【引證文獻(xiàn)】
本文編號:2849992
【學(xué)位單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2010
【中圖分類】:TP332
【部分圖文】:
533 改進(jìn)后的圖像尺度不變特征變換法流程,我們得到一個(gè)改進(jìn)的圖 5.4 所示。在這個(gè)改進(jìn)的并行算表 keypoint_list(圖 5.4 第 3 行得到的特征點(diǎn)加入特征點(diǎn)列表 k,而不是馬上就進(jìn)行對特征點(diǎn)的 行)。這樣我們收集一組尺度空列表,再分配給各個(gè)線程做特征種改進(jìn)后的圖像尺度不變特征變的負(fù)載不均衡狀況被大大改善。
75圖 6.5 并行策略迭代算法流程圖6.5.2 可擴(kuò)放性分析等效率度量標(biāo)準(zhǔn)已被證明是在大多數(shù)并行計(jì)算機(jī)系統(tǒng)上研究問題的可擴(kuò)放性的有效方法(Kumar et al,1994)。在這種方法中,處理器的數(shù)目記為 P,問題的規(guī)模記為 W,即最好的串行算法解決此問題需要的時(shí)間,算法的加速比記為 S,則定義并行算法的效率為E = S P。在通常情況下,如果問題規(guī)模 W 保持不變,則隨著處理器數(shù)目 P 的增加
機(jī)人工智能中廣泛使用了馬爾可夫決策過程(Guestrin et 爾可夫決策過程應(yīng)用于實(shí)際環(huán)境中,我們選擇了使用它來戲中一方的行動。Stratagus 是一個(gè)實(shí)時(shí)戰(zhàn)略游戲免費(fèi)軟agus.sourceforge.net/獲得)。游戲的目標(biāo)是通過控制游戲角軍隊(duì),并最終打敗對手。在游戲中需要進(jìn)行頻繁的交互操過程來說就是對行動的選擇。場景通常被用來測試一個(gè)代理的控制效果(Gearhart,200役場景如圖 6.6 所示,游戲者(在我們的實(shí)驗(yàn)中是游戲智個(gè)步兵(圖 6.6 中紅色步兵),在戰(zhàn)役場景中遭遇到相同數(shù)6 中藍(lán)色步兵)。其中每個(gè)步兵都可以攻擊任意一個(gè)對方步時(shí)刻轉(zhuǎn)換攻擊目標(biāo)。當(dāng)對方步兵被消滅或負(fù)傷失血時(shí),游戰(zhàn)役場景的最終目標(biāo)是盡快消滅對方,并且付出最小的代最少。
【引證文獻(xiàn)】
相關(guān)期刊論文 前1條
1 昌杰;;基于多核處理器的程序性能優(yōu)化方法[J];巢湖學(xué)院學(xué)報(bào);2012年03期
相關(guān)博士學(xué)位論文 前1條
1 吳超;信息檢索中top-k問題的并行算法及優(yōu)化研究[D];中國科學(xué)技術(shù)大學(xué);2011年
相關(guān)碩士學(xué)位論文 前4條
1 王丹;基于RTX與多核技術(shù)的自動分揀系統(tǒng)研究[D];上海交通大學(xué);2012年
2 張修琪;基于Linux多核進(jìn)程調(diào)度的研究[D];電子科技大學(xué);2012年
3 李筱;面向異構(gòu)多核系統(tǒng)的并行計(jì)算模型和調(diào)度算法研究[D];湖南大學(xué);2012年
4 楊川;MPCore多核處理器并行計(jì)算方法的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2014年
本文編號:2849992
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2849992.html
最近更新
教材專著