MACT:高通量眾核處理器離散訪存請求批量處理機制
本文選題:高通量處理器 切入點:訪存請求收集表 出處:《計算機研究與發(fā)展》2015年06期
【摘要】:網(wǎng)絡服務等新型高通量應用的迅速興起給傳統(tǒng)處理器設計帶來了巨大的挑戰(zhàn).高通量眾核處理器作為面向此類應用的新型處理器結構成為研究熱點.然而,隨著片上處理核數(shù)量的劇增,加之高通量應用的數(shù)據(jù)密集型特點,"存儲墻"問題進一步加劇.通過分析高通量應用訪存行為,發(fā)現(xiàn)此類應用存在著大量的細粒度訪存,降低了訪存帶寬的有效利用率.基于此分析,在高通量處理器設計中通過添加訪存請求收集表(memory access collection table,MACT)硬件機制,結合消息式內(nèi)存機制,用于收集離散的訪存請求并進行批量處理.MACT硬件機制的實現(xiàn),提高了訪存帶寬的有效利用率,同時也提高了執(zhí)行效率;并通過時間窗口機制,確保訪存請求在最晚期限之前發(fā)送出去,保證任務的實時性.實驗以典型高通量應用WordCount,TeraSort,Search為基準測試程序.添加MACT硬件機制后,訪存數(shù)量減少約49%,訪存帶寬提高約24%,平均執(zhí)行速度提高約89%.
[Abstract]:The rapid rise of new high-throughput applications such as network services brings great challenges to the traditional processor design.As a new processor architecture for such applications, high throughput multicore processor has become a research hotspot.However, with the rapid increase in the number of cores processed on a chip and the data-intensive characteristics of high-throughput applications, the "storage wall" problem is exacerbated.By analyzing the memory access behavior of high-throughput applications, it is found that there are a large number of fine-grained memory access in such applications, which reduces the effective utilization of access bandwidth.Based on this analysis, the memory access collection table MACT-based hardware mechanism is added to the design of high throughput processor, and combined with the message memory mechanism, it is used to collect discrete memory requests and implement the batch processing of .MACT hardware mechanism.The efficiency of accessing bandwidth is improved, and the execution efficiency is improved, and the time window mechanism is used to ensure that the access request is sent out before the latest deadline to ensure the real-time performance of the task.The experiment is based on the typical high throughput application of WordCountl Tera sort search as a benchmark program.After adding the MACT hardware mechanism, the number of access memory is reduced by 49%, the access bandwidth is increased about 24%, and the average execution speed is increased about 89%.
【作者單位】: 計算機體系結構國家重點實驗室(中國科學院計算技術研究所);中國科學院大學計算機與控制學院;數(shù)學工程與先進計算國家重點實驗室;中國科學技術大學計算機科學與技術學院;
【基金】:國家“九七三”重點基礎研究發(fā)展計劃基金項目(2011CB302501) 國家“八六三”高技術研究發(fā)展計劃基金項目(2012AA010901,2015AA011204) “核高基”國家科技重大專項基金項目(2013ZX0102-8001-001-001) 國家自然科學基金項目(61173007,61332009,61204047)
【分類號】:TP332
【參考文獻】
相關期刊論文 前2條
1 王元卓;靳小龍;程學旗;;網(wǎng)絡大數(shù)據(jù):現(xiàn)狀與展望[J];計算機學報;2013年06期
2 陳荔城;陳明宇;阮元;黃永兵;崔澤漢;盧天越;包云崗;;MIMS:Towards a Message Interface Based Memory System[J];Journal of Computer Science & Technology;2014年02期
【共引文獻】
相關期刊論文 前10條
1 郎波;張博宇;;面向大數(shù)據(jù)的非結構化數(shù)據(jù)管理平臺關鍵技術[J];信息技術與標準化;2013年10期
2 邵景峰;崔尊民;王進富;白曉波;;大數(shù)據(jù)下紡織制造執(zhí)行系統(tǒng)的構建[J];紡織器材;2013年06期
3 張亞楠;譚躍生;;基于MapReduce的并行遮蓋文本聚類算法[J];內(nèi)蒙古科技大學學報;2013年03期
4 周國亮;朱永利;王桂蘭;;CC-MRSJ:Hadoop平臺下緩存敏感的星型聯(lián)接算法[J];電信科學;2013年10期
5 劉瓊;;大數(shù)據(jù)背景下圖書館服務體系創(chuàng)新與重構[J];科技創(chuàng)新與應用;2014年06期
6 王鵬;黃焱;劉峰;安俊秀;;大數(shù)據(jù)技術中計算與數(shù)據(jù)的協(xié)作機制[J];成都信息工程學院學報;2014年01期
7 杜政頡;王鵬;黃焱;郎福通;;一種基于Storm編程模型的迭代Topology方案[J];成都信息工程學院學報;2014年01期
8 范飛;黃文明;鄧珍榮;;Oozie工作流在Mahout分布式數(shù)據(jù)挖掘中的應用[J];桂林電子科技大學學報;2014年01期
9 陳為;李健;胡康;;食品藥品檢驗行業(yè)大數(shù)據(jù)應用探討[J];中國醫(yī)藥導刊;2014年02期
10 丁玉成;諸葛晴鳳;沙行勉;;云計算環(huán)境下排序算法的性能分析[J];重慶大學學報;2014年04期
相關會議論文 前6條
1 喬媛媛;劉芳;凌艷;尹勁松;;云計算環(huán)境下MapReduce的資源建模與性能預測[A];2013年全國通信軟件學術會議論文集[C];2013年
2 Xiaoguang Han;Jigang Sun;Wu Qu;Xuanxia Yao;;Distributed Malware Detection based on Binary File Features in Cloud Computing Environment[A];第26屆中國控制與決策會議論文集[C];2014年
3 陳佐旗;余柏蒗;吳健平;;基于GPU通用計算的遙感數(shù)據(jù)處理——以計算地表太陽輻射值為例[A];第十八屆中國環(huán)境遙感應用技術論壇論文集[C];2014年
4 白永超;付偉;辛陽;;基于Hadoop和Nutch的分布式搜索引擎研究與仿真[A];第十九屆全國青年通信學術年會論文集[C];2014年
5 李超越;徐國勝;;Hadoop公平調(diào)度算法的改進[A];第十九屆全國青年通信學術年會論文集[C];2014年
6 高露雄;肖志遠;王立海;;基于大數(shù)據(jù)環(huán)境的水文GIS應用發(fā)展初探[A];大數(shù)據(jù)時代的信息化建設——2015(第三屆)中國水利信息化與數(shù)字水利技術論壇論文集[C];2015年
相關博士學位論文 前10條
1 李健;云計算環(huán)境下最小化運營開銷的調(diào)度技術研究[D];北京郵電大學;2013年
2 王金寶;云計算系統(tǒng)中索引與查詢處理技術研究[D];哈爾濱工業(yè)大學;2013年
3 韓晶;大數(shù)據(jù)服務若干關鍵技術研究[D];北京郵電大學;2013年
4 程祥;高效可靠的虛擬網(wǎng)絡映射技術研究[D];北京郵電大學;2013年
5 李韌;基于Hadoop的大規(guī)模語義Web本體數(shù)據(jù)查詢與推理關鍵技術研究[D];重慶大學;2013年
6 盧風順;面向CPU/GPU異構體系結構的并行計算關鍵技術研究[D];國防科學技術大學;2012年
7 孫鵬;動車組維修物聯(lián)網(wǎng)及其關鍵技術研究[D];中國鐵道科學研究院;2013年
8 肖奎;維基百科大數(shù)據(jù)的知識挖掘與管理方法研究[D];武漢大學;2013年
9 程興國;仿生算法的動態(tài)反饋機制及其并行化實現(xiàn)方法研究[D];華南理工大學;2013年
10 李清安;面向非易失性片上存儲的編譯技術研究[D];武漢大學;2013年
相關碩士學位論文 前10條
1 陳貞;HDFS環(huán)境下的訪問控制技術研究[D];重慶大學;2013年
2 張丹;HDFS中文件存儲優(yōu)化的相關技術研究[D];南京師范大學;2013年
3 潘吳斌;基于云計算的并行K-means氣象數(shù)據(jù)挖掘研究與應用[D];南京信息工程大學;2013年
4 趙洪昌;云計算下的關聯(lián)分析和模糊聚類研究[D];南京信息工程大學;2013年
5 汪洋;通信網(wǎng)云計算平臺資源調(diào)度策略與算法研究[D];南昌大學;2013年
6 呂天然;基于MapReduce的可視化工作流遙感并行處理平臺及關鍵技術研究[D];河南大學;2013年
7 但光祥;云計算環(huán)境下混合加密算法研究與實現(xiàn)[D];重慶大學;2013年
8 周濤;基于Hadoop的遙感數(shù)字圖像處理方法研究[D];東北師范大學;2013年
9 程偉;海量信令并行即時分析系統(tǒng)的研究與設計[D];中國海洋大學;2013年
10 賈玉輝;面向語音交互的云計算系統(tǒng)的研究[D];中國海洋大學;2013年
【二級參考文獻】
相關期刊論文 前7條
1 周傲英;金澈清;王國仁;李建中;;不確定性數(shù)據(jù)管理技術研究綜述[J];計算機學報;2009年01期
2 高明;金澈清;王曉玲;田秀霞;周傲英;;數(shù)據(jù)世系管理技術研究綜述[J];計算機學報;2010年03期
3 程學旗;郭嘉豐;靳小龍;;網(wǎng)絡信息的檢索與挖掘回顧[J];中文信息學報;2011年06期
4 宮學慶;金澈清;王曉玲;張蓉;周傲英;;數(shù)據(jù)密集型科學與工程:需求和挑戰(zhàn)[J];計算機學報;2012年08期
5 李國杰;程學旗;;大數(shù)據(jù)研究:未來科技及經(jīng)濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考[J];中國科學院院刊;2012年06期
6 郭志懋,周傲英;數(shù)據(jù)質(zhì)量和數(shù)據(jù)清洗研究綜述[J];軟件學報;2002年11期
7 劉偉;孟小峰;凌妍妍;;一種基于圖模型的Web數(shù)據(jù)庫采樣方法[J];軟件學報;2008年02期
【相似文獻】
相關期刊論文 前10條
1 Robert Cravotta;;可配置處理器應用日趨紅火[J];電子設計技術;2003年11期
2 劉磊;鄒候文;唐屹;;一種可編程安全處理器體系結構的研究與實現(xiàn)[J];廣州大學學報(自然科學版);2006年04期
3 張錚;趙榮彩;顏峻;邰銘;陳科;;網(wǎng)絡處理器體系結構和應用綜述[J];信息工程大學學報;2006年04期
4 張怡,孫志剛;基于IPSec的下一代高性能安全處理器的體系結構[J];國防科技大學學報;2003年02期
5 岳虹;戴葵;王志英;;一種面向數(shù)字信號處理的嵌入式處理器體系結構設計[J];計算機工程與科學;2006年10期
6 許珊琳;;適合嵌入應用的嵌入式處理器[J];中國集成電路;2009年02期
7 張磊;王穎;陳云霽;徐志偉;張立新;;可重塑處理器:用戶可定義的加速器中處理器架構[J];網(wǎng)絡新媒體技術;2012年06期
8 Robert Cravotta;;一個處理器能兼顧控制與信號處理嗎?[J];電子設計技術;2002年07期
9 朱丹;李暾;郭陽;李思昆;;微處理器體系結構級測試程序自動生成技術[J];軟件學報;2005年12期
10 ;高性能處理器云集市場[J];每周電腦報;1997年15期
相關會議論文 前3條
1 宋緋;劉曉寧;;DSP/MCU結構的新型處理器[A];第九屆全國青年通信學術會議論文集[C];2004年
2 趙秋平;楊燦群;王鋒;;LBM算法在Cell處理器上的實現(xiàn)和優(yōu)化[A];2008'中國信息技術與應用學術論壇論文集(二)[C];2008年
3 周巍;孫冰;戰(zhàn)立明;呂建華;王國仁;于戈;;基于DOM模型的XML查詢處理器的設計與實現(xiàn)[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2001年
相關重要報紙文章 前10條
1 ;處理器上演多核大戲[N];計算機世界;2005年
2 心元;PC“心臟”的搏擊[N];計算機世界;2004年
3 清華大學微處理器與SoC技 術研究中心 王海霞 汪東升;顛覆傳統(tǒng)理念[N];計算機世界;2005年
4 清華大學微處理器與SoC技術研究 中心 汪東升 王海霞 張悠慧 李兆麟;CMP 開啟處理器效能時代[N];計算機世界;2005年
5 江蘇 netfan;體現(xiàn)速度與性能[N];電腦報;2004年
6 四川 王毅;變革進行時[N];電腦報;2004年
7 清華大學微處理器與SoC技術研究中心 汪東升;多核技術天地廣闊[N];計算機世界;2006年
8 本報記者 李獻 王皓;2002年服務器四大景觀[N];計算機世界;2003年
9 ;MontaVista Linux 2.1跨平臺[N];中國計算機報;2002年
10 ;CPU技術進步牛氣沖天[N];計算機世界;2004年
相關博士學位論文 前10條
1 魏繼增;可配置可擴展處理器關鍵問題研究[D];天津大學;2010年
2 霍文捷;嵌入式處理器安全運行機制的研究與設計[D];華中科技大學;2010年
3 從明;類數(shù)據(jù)流驅(qū)動的分片式處理器體系結構[D];中國科學技術大學;2009年
4 徐光;分片式流處理器體系結構[D];中國科學技術大學;2010年
5 李勇;異步數(shù)據(jù)觸發(fā)微處理器體系結構關鍵技術研究與實現(xiàn)[D];國防科學技術大學;2007年
6 任永青;邏輯核動態(tài)可重構的眾核處理器體系結構[D];中國科學技術大學;2010年
7 黎鐵軍;嵌入式流媒體處理器體系結構技術研究[D];國防科學技術大學;2005年
8 黃海林;高可靠處理器體系結構研究[D];中國科學院研究生院(計算技術研究所);2006年
9 劉光輝;高效處理器容錯技術研究與實現(xiàn)[D];國防科學技術大學;2013年
10 溫璞;面向科學計算的PIM體系結構技術研究[D];國防科學技術大學;2007年
相關碩士學位論文 前10條
1 曾斌;分片式處理器體系結構上的超塊優(yōu)化技術[D];中國科學技術大學;2009年
2 黃冕;X處理器存儲一致性模型的研究與實現(xiàn)[D];國防科學技術大學;2008年
3 趙燦明;分片式處理器上激進執(zhí)行模型分析[D];中國科學技術大學;2009年
4 劉晉汾;處理器描述語言的研究與應用[D];解放軍信息工程大學;2011年
5 劉子揚;基于虛擬計算群的眾核處理器動態(tài)在線任務調(diào)度算法研究[D];上海交通大學;2013年
6 邸志雄;多核包處理器數(shù)據(jù)控制總線技術研究[D];西安電子科技大學;2010年
7 方紅霞;基于指令的處理器時延測試產(chǎn)生方法[D];中國科學院研究生院(計算技術研究所);2005年
8 黎寶峰;嵌入式DSP處理器的設計與驗證[D];湖南大學;2003年
9 鐘松延;可配置可擴展處理器編譯器設計[D];天津大學;2012年
10 董亞卓;循環(huán)陣列處理器體系結構的關鍵技術研究與實現(xiàn)[D];國防科學技術大學;2004年
,本文編號:1712107
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1712107.html