面向Android應(yīng)用的ARM多核處理器核間通信開銷建模

發(fā)布時(shí)間：2017-10-13 11:27

本文關(guān)鍵詞：面向Android應(yīng)用的ARM多核處理器核間通信開銷建模

【摘要】：近年來,多核亂序處理器在移動(dòng)智能終端上得到了廣泛的應(yīng)用。多核并行執(zhí)行在減少程序執(zhí)行時(shí)間的同時(shí),也引入了核間通信開銷,阻礙了系統(tǒng)性能的進(jìn)一步提高。有研究表明,Cache一致性是影響多核核間通信開銷的一個(gè)關(guān)鍵因素。多核亂序處理器下的一致性缺失次數(shù)可以通過全功能仿真獲取,但整個(gè)過程極其耗時(shí)。本文旨在建立一個(gè)快速而準(zhǔn)確的多核亂序處理器私有LRU-Cache模型,用于評估該級緩存的一致性缺失次數(shù)。本文提出利用訪存堆棧距離分布和對共享數(shù)據(jù)的Invalid信息來預(yù)測一致性缺失次數(shù)。對于順序處理器,該理論是LRU-Cache一致性缺失建模的有效方法,但是通過本文的實(shí)驗(yàn)發(fā)現(xiàn),該理論不能直接應(yīng)用于亂序處理器。本文認(rèn)為這是因?yàn)橹噶顏y序執(zhí)行(Out-Of-Order)、存儲(chǔ)隊(duì)列中加載(Load in Store)和非阻塞發(fā)射(Non-blocking Issue)等因素改變了訪存的帶Invalid信息的堆棧距離分布,進(jìn)而影響Cache一致性缺失次數(shù)的預(yù)測。因此,本文提出了一種基于人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)的模型Uniform來解決上述問題。該模型的輸入是應(yīng)用程序在順序處理器下運(yùn)行得到的帶Invalid信息的堆棧距離分布,模型的輸出是一致性缺失次數(shù)。該神經(jīng)網(wǎng)絡(luò)模型可以在硬件微結(jié)構(gòu)參數(shù)不變的情況下,跨Benchmark預(yù)測一致性缺失次數(shù)。為了評估模型的精確度,本文選用了Mobybench 2.0和Parsec 3.0兩大測試集。實(shí)驗(yàn)結(jié)果顯示,全功能仿真得到一致性缺失次數(shù)的誤差小于1%。以Gem5全仿真獲取的數(shù)據(jù)為基準(zhǔn),Uniform模型的平均相對誤差小于9%。用該模型預(yù)測一致性缺失,時(shí)間上較全仿真平均減少了約56.8%,用訓(xùn)練好的1個(gè)人工神經(jīng)網(wǎng)絡(luò)模型跨3個(gè)Benchmark進(jìn)行預(yù)測時(shí),相對于全仿真時(shí)間減少82%。
【關(guān)鍵詞】：核間通信開銷 一致性缺失 亂序處理器 非阻塞Cache 人工神經(jīng)網(wǎng)絡(luò)
【學(xué)位授予單位】：東南大學(xué)
【學(xué)位級別】：碩士
【學(xué)位授予年份】：2016
【分類號】：TP332
【目錄】：

摘要5-6
Abstract6-10
第一章緒論10-16
1.1 背景與意義10-12
1.1.1 背景10-11
1.1.2 意義11-12
1.2 國內(nèi)外研究現(xiàn)狀12-13
1.3 研究內(nèi)容與設(shè)計(jì)指標(biāo)13-14
1.3.1 研究內(nèi)容13-14
1.3.2 設(shè)計(jì)指標(biāo)14
1.4 論文組織14-16
第二章 Cache一致性缺失的機(jī)理分析及建模方法16-34
2.1 一致性缺失產(chǎn)生原因16-19
2.2 Cache一致性協(xié)議策略19-24
2.2.1 基于總線監(jiān)聽的一致性協(xié)議20-24
2.2.2 基于目錄的一致性協(xié)議24
2.3 現(xiàn)有對Cache一致性缺失建模的方法24-27
2.4 堆棧距離理論27-29
2.5 將堆棧距離理論應(yīng)用到一致性缺失預(yù)測上29-32
2.6 本章小結(jié)32-34
第三章亂序執(zhí)行以及Non-blocking Issue對一致性缺失的影響34-52
3.1 亂序執(zhí)行的基本原理及其影響34-39
3.1.1 亂序執(zhí)行的基本原理34-38
3.1.2 亂序執(zhí)行對一致性缺失的影響38-39
3.2 Non-blocking Issue的基本原理及其影響39-42
3.2.1 Non-blocking Issue的基本原理39-41
3.2.2 Non-blocking Issue對一致性缺失的影響41-42
3.3 采用BP神經(jīng)網(wǎng)絡(luò)為亂序處理器Cache一致性建模42-51
3.3.1 采用神經(jīng)網(wǎng)絡(luò)為亂序處理器Cache一致性建模43-44
3.3.2 生物神經(jīng)元44-45
3.3.3 M-P模型45-47
3.3.4 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)47-51
3.4 本章小結(jié)51-52
第四章面向Android應(yīng)用的亂序處理器Cache一致性缺失建模52-62
4.1 Gem5仿真器平臺搭建及參數(shù)設(shè)置52-56
4.1.1 Gem5簡介52-53
4.1.2 Gem5參數(shù)設(shè)置53-56
4.2 帶Invalid信息的堆棧距離分布提取56-59
4.3 BP神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置59-61
4.4 本章小結(jié)61-62
第五章實(shí)驗(yàn)結(jié)果與分析62-76
5.1 實(shí)驗(yàn)環(huán)境介紹62-63
5.2 模型的精度63-69
5.2.1 Gem5全仿真一致性缺失的精度64
5.2.2 不同數(shù)量訓(xùn)練數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)模型精度的影響64-65
5.2.3 神經(jīng)網(wǎng)絡(luò)模型的精度65-66
5.2.4 全功能仿真與模型預(yù)測一致性缺失時(shí)間對比66-67
5.2.5 相同Cache結(jié)構(gòu)下跨Benchmark預(yù)測一致性缺失67-69
5.3 模型的應(yīng)用69-73
5.3.1 不同Cache容量大小下一致性缺失情況69-70
5.3.2 不同Cache組關(guān)聯(lián)數(shù)下一致性缺失情況70-71
5.3.3 不同線程數(shù)量相同Cache結(jié)構(gòu)下一致性缺失情況71-72
5.3.4 不同Cacheline大小下一致性缺失情況72-73
5.4 結(jié)果分析73-75
5.5 論文指標(biāo)完成情況75
5.6 本章小結(jié)75-76
第六章總結(jié)與展望76-78
6.1 總結(jié)76
6.2 展望76-78
致謝78-80
參考文獻(xiàn)80-82

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫前3條

1 孟銳;;處理器中非阻塞cache技術(shù)的研究[J];電子設(shè)計(jì)工程;2015年19期

2 韓樂;陳香蘭;李曦;;一種降低核間通信開銷的調(diào)度算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2014年09期

3 馮葉;鄧倩妮;;非對稱多核體系下的阿姆達(dá)爾定律性能模型研究[J];微電子學(xué)與計(jì)算機(jī);2011年08期

中國博士學(xué)位論文全文數(shù)據(jù)庫前1條

1 高翔;多核處理器的訪存模擬與優(yōu)化技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2007年

中國碩士學(xué)位論文全文數(shù)據(jù)庫前6條

1 倪亞路;共享Cache動(dòng)態(tài)劃分算法及VLSI實(shí)現(xiàn)研究[D];復(fù)旦大學(xué);2012年

2 楊鵬飛;多核環(huán)境Cache一致性協(xié)議研究[D];哈爾濱工程大學(xué);2011年

3 傅yN暉;高性能DSP一級Cache缺失流水設(shè)計(jì)與實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2009年

4 吳昌友;神經(jīng)網(wǎng)絡(luò)的研究及應(yīng)用[D];東北農(nóng)業(yè)大學(xué);2007年

5 信磊;對稱多核處理器中Cache一致性的研究與實(shí)現(xiàn)[D];合肥工業(yè)大學(xué);2007年

6 陳石坤;多核處理器中CACHE一致性協(xié)議研究和實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2005年

，

本文編號：1024605

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1024605.html

上一篇：基于圖分割的流應(yīng)用多處理器映射算法
下一篇：基于NoSQL技術(shù)的PDM數(shù)據(jù)云存儲(chǔ)與完整性研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向Android應(yīng)用的ARM多核處理器核間通信開銷建模