可擴展64核處理器關鍵技術研究—單核、加速器架構及H.264解碼器實現(xiàn)
本文關鍵詞:可擴展64核處理器關鍵技術研究—單核、加速器架構及H.264解碼器實現(xiàn)
更多相關文章: 多核處理器 異構加速器 低功耗設計 單指令多進程 H.264解碼器
【摘要】:不斷推陳出新的電子通訊、多媒體、信息安全以及云計算、大數(shù)據(jù)等新興應用,給人們的生活帶來日新月異的便利和享受,然而隨之而來的往往是更加繁重而大量的運算,這無疑對數(shù)據(jù)處理終端,特別是移動嵌入式領域的硬件提出了更高的要求。人們在需求日益高性能的硬件的同時,卻不得不面對“功耗墻”的窘迫。近年來,應運而生的多核處理器看似保持摩爾定律的繼續(xù)發(fā)展。然而,傳統(tǒng)的多核處理器在面對特定復雜應用時,不僅性能上仍難以滿足需求,更表現(xiàn)出較低的能量效率;诖,本文針對上述四個應用領域,分析各個應用的特點,在傳統(tǒng)處理器的可編程性和ASIC的高能效之中做出折衷,設計了面向上述特定應用、擁有豐富異構加速器的64核處理器,同時在單核設計中注重高性能和低功耗的優(yōu)化,降低寄存器堆和指令存儲的功耗,以求達到高能效的目標。論文的主要工作可以歸納為以下幾點:(1)局域網(wǎng)(局部雙向令牌環(huán))+廣域網(wǎng)(全局包交換)的片上互聯(lián)方式本文借鑒計算機通信領域中的局域網(wǎng)+廣域網(wǎng)的概念,設計了全局二維網(wǎng)格結構的包交換網(wǎng)絡,以及局部雙向多令牌環(huán)的電路交換網(wǎng)絡。一般應用的全局通信較弱而局部通信很強,在局部采用了由單一總控制器控制的雙向環(huán)互聯(lián),降低了傳統(tǒng)電路交換申請撤銷路徑的開銷,單周期點到點通信提高了通信效率。全局包交換則可以充分利用片上交換鏈路的帶寬,為整芯片資源共享提供通道。(2)擁有豐富異構加速器的架構設計針對不同的應用程序,提取出相應加速器模塊,用硬件來提升應用程序的性能,在硬件開銷很小的情況下,加速器能夠帶來的系統(tǒng)性能提升可高達10倍,本文還創(chuàng)新性地采用了上述的環(huán)來連接加速器與處理器,處理器與加速器之間基于環(huán)以及FIFO的通信方式使二者的通信表現(xiàn)出高性能低功耗的特性。(3)低功耗寄存器堆設計在嵌入式單核中,寄存器堆的功耗可以占到整個芯片的16%,本文針對寄存器堆存在的無用操作數(shù)的讀取以及廢棄變量的寫回進行屏蔽,分別采用了異步時鐘控制的讀隔離和軟件指導的寫回丟棄,實現(xiàn)了寄存器堆功耗平均37%的降低。(4)單指令多進程的架構設計在嵌入式應用領域中,常有多道并行程序執(zhí)行近乎一致代碼的情形,在傳統(tǒng)多核上的映射將導致多個核取同樣的代碼,從而導致大量的訪問指令存儲的冗余,針對此,本文提出了單指令多進程的架構,當出現(xiàn)上述情況時,可以將若干核重構成主.從模式,主核取指令,從核關閉指令存儲,本設計的單指令多進程在4核主從模式下可降低平均21.9%的系統(tǒng)功耗。(5)H.264基本檔次解碼器設計針對H.264解碼器的特點,提取出濃縮的運算核心模塊,設計硬件加速器,并且進行軟硬件的協(xié)同設計,采用四個單核+四個加速器可以實現(xiàn)基本檔次幀內解碼達到1080p@20fps的吞吐率,而利用16核+16加速器實現(xiàn)的并行解碼則可以期望達到1080p@80fps的吞吐率。(6)芯片物理設計本次設計采用了TSMC 65nm GP工藝,進行了芯片的物理設計,在物理設計中,采用了層次化流程,并且利用DC-Topographical+ICC的流程,大量采用了有用時鐘偏差,sign-off時序報告中的關鍵路徑為0.99ns(含0.1ns uncertainty)。實現(xiàn)了1GHz的設計指標要求;赑rime Time PX分析功耗,運行DES解碼器時單節(jié)點功耗21.4mW。
【學位授予單位】:復旦大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP332;TN764
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 任子暉;劉偉;朱慧;徐盛龍;;基于H.264的嵌入式Web網(wǎng)絡視頻監(jiān)控系統(tǒng)設計[J];工礦自動化;2013年06期
2 孫同倫;尹東;;H.264軟件編碼器的優(yōu)化[J];計算機輔助工程;2005年04期
3 穆戰(zhàn)松;黃摯雄;;基于H.264的遠程數(shù)字視頻監(jiān)控系統(tǒng)[J];計算機與數(shù)字工程;2006年03期
4 王磊;;H.264在閘壩遠程視頻監(jiān)控系統(tǒng)中的應用研究[J];計算機與信息技術;2007年12期
5 ;Matrox MXO2 Mini在Avid Media Composer高清預監(jiān)和閃速H.264編碼[J];影視制作;2011年04期
6 魏晴霞;陳寶靖;;基于H.264的遠程視頻監(jiān)控系統(tǒng)的設計[J];黑龍江科技信息;2012年12期
7 彭光輝;汪紀鋒;;基于無線H.264時域誤碼掩蓋算法的改進[J];電訊技術;2009年03期
8 閻金;全子一;門愛東;;基于H.264的時間可分級編碼結構的研究[J];電視技術;2006年01期
9 郝玲;趙春江;楊信廷;陳明;孫傳恒;李文勇;;基于H.264的農產(chǎn)品生產(chǎn)履歷視頻采集系統(tǒng)[J];農機化研究;2012年10期
10 ;2003年內決定H.264授權條件[J];電視技術;2003年08期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 趙勝喟;王德君;王青鵬;楊波;;一種高速高保真H.264編碼器的設計[A];2010年通信理論與信號處理學術年會論文集[C];2010年
2 楊鑫;牛建偉;胡建平;;一種基于H.264的智能手機監(jiān)控系統(tǒng)設計與實現(xiàn)[A];2006年全國開放式分布與并行計算學術會議論文集(一)[C];2006年
3 薛全;趙建東;劉濟林;;H.264中基于拋物面模型的分數(shù)象素快速搜索算法[A];第二屆和諧人機環(huán)境聯(lián)合學術會議(HHME2006)——第15屆中國多媒體學術會議(NCMT'06)論文集[C];2006年
4 劉方;段曉輝;王道憲;楊光臨;詹超慧;;H.264編碼器在TMS320DM642上的存儲空間分配方案[A];第十二屆全國圖象圖形學學術會議論文集[C];2005年
5 王小龍;許超;;H.264中自適應二進制算術編碼器的FPGA實現(xiàn)[A];中國通信集成電路技術與應用研討會論文集[C];2004年
6 蔣建國;包先雨;李化雷;宣曼;陳曉蕊;;FVEA-H:一種用于H.264的快速視頻加密算法[A];計算機技術與應用進展·2007——全國第18屆計算機技術與應用(CACIS)學術會議論文集[C];2007年
中國重要報紙全文數(shù)據(jù)庫 前5條
1 記者 安勇龍;高清H.264熱潮將至 芯片方案紛亮相[N];中國電子報;2006年
2 閆冰;H.264:網(wǎng)絡視頻新高度[N];網(wǎng)絡世界;2008年
3 ;首套H.264互動電臺電視臺系統(tǒng)問世[N];人民郵電;2006年
4 維維;破解H.264專利費之迷[N];通信產(chǎn)業(yè)報;2006年
5 北京 馬子健;高清HDTV影片最佳格式H.264[N];電子報;2006年
中國博士學位論文全文數(shù)據(jù)庫 前2條
1 宋廣華;3D H.264視頻無失真漂移隱寫算法研究[D];華中科技大學;2014年
2 李曉妮;面向H.264的嵌入式音視頻同步編碼技術研究[D];吉林大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 黃宇;基于H.264的網(wǎng)絡視頻監(jiān)控系統(tǒng)設計與實現(xiàn)[D];西安電子科技大學;2011年
2 王立;基于TMS320DM642 DSP的H.264編碼器結構設計與實現(xiàn)[D];北京郵電大學;2011年
3 鄒文暉;基于H.264的網(wǎng)絡視頻監(jiān)控系統(tǒng)設計及其算法分析[D];東華大學;2014年
4 廖順和;H.264在城市軌道交通視頻監(jiān)控中碼率控制的研究[D];東華大學;2008年
5 王必安;基于H.264的嵌入式遠程視頻監(jiān)控系統(tǒng)的設計與實現(xiàn)[D];武漢科技大學;2012年
6 白國濤;基于混沌的H.264視頻加密算法研究與實現(xiàn)[D];東北大學;2013年
7 趙勝鑓;高速高保真H.264編碼器的設計及移植[D];大連理工大學;2010年
8 李海燕;H.264編碼核心算法在流體系結構上的實現(xiàn)[D];國防科學技術大學;2005年
9 潘明;基于H.264的網(wǎng)絡視頻監(jiān)控系統(tǒng)的研究與實現(xiàn)[D];吉林大學;2014年
10 張琳琳;基于H.264規(guī)格的數(shù)字解碼播放軟件庫的開發(fā)[D];吉林大學;2005年
,本文編號:1276982
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1276982.html