高性能低功耗多核處理器研究
發(fā)布時間:2020-07-22 03:52
【摘要】:通信與多媒體等領(lǐng)域?qū)﹄娮赢a(chǎn)品性能、功耗、設(shè)計周期、靈活性的特定要求,決定了專用集成電路或者基于單個處理器的片上系統(tǒng)都不是很好的解決方案。而多核處理器則依靠其優(yōu)秀的性能、通用性、靈活性成為了一個理想的選擇,所以它也是當前學(xué)術(shù)界和產(chǎn)業(yè)界的研究熱點。雖然已經(jīng)有了較多比較優(yōu)秀的多核處理器研究成果,不過由于多核處理器系統(tǒng)的復(fù)雜性和應(yīng)用環(huán)境的多樣性,目前還沒有出現(xiàn)一個最優(yōu)的或者統(tǒng)一的體系架構(gòu),仍然有許多內(nèi)容值得研究和探索。 本論文旨在針對通信和多媒體領(lǐng)域應(yīng)用,設(shè)計一款高性能、低功耗的多核處理器。在分析和借鑒已有的一些較優(yōu)秀的多核處理器設(shè)計的基礎(chǔ)上,論文的研究工作主要是對多核處理器的計算、通信和存儲這三個核心部分進行探索和創(chuàng)新。以下是本論文的主要工作內(nèi)容: (1) SIMD-RISC處理器 本論文以MIPS324KE作為設(shè)計參考,實現(xiàn)了一款能夠部分兼容MIPS32指令集并且支持單指令多數(shù)據(jù)(SIMD)結(jié)構(gòu)的單核SIMD-RISC處理器。在通過利用數(shù)據(jù)并行性來提升處理器性能的同時也大大提高了其能量效率,實現(xiàn)了高性能和低功耗這兩個設(shè)計目標。 (2)可配置寄存器文件 本論文對傳統(tǒng)的寄存器文件進行了改革,采用了以寄存器組為單位的可配置寄存器文件。在無需改變指令的寬度和編碼方式的前提下,允許程序根據(jù)需要靈活配置和使用64個通用寄存器,從而大大減少處理器對外部存儲器的訪問次數(shù)。這樣既可以提高處理器的運算效率還能避免因暫存數(shù)據(jù)而引起的功耗。 (3)簇狀結(jié)構(gòu) 本論文提出了一種以簇狀結(jié)構(gòu)為基本單位的多核處理器陣列。在系統(tǒng)級架構(gòu)層面,簇狀結(jié)構(gòu)使得多核處理器具有幾何對稱和易擴展的特性。簇狀結(jié)構(gòu)本身則實現(xiàn)了對存儲器資源的合理分配以及處理器核間的高效同步。 (4)混合通信方式 本文提出的多核處理器實現(xiàn)了基于片上網(wǎng)絡(luò)的數(shù)據(jù)通信(message-passing)和基于共享數(shù)據(jù)存儲器(shared-memory)的簇內(nèi)通信的混合通信方式;谄暇W(wǎng)絡(luò)的通信采用數(shù)據(jù)包的形式進行數(shù)據(jù)傳遞,具有很好的靈活性,是一種全局的通信方式:基于共享存儲器的簇內(nèi)通信以存儲器訪問帶寬為代價可有效減輕片上網(wǎng)絡(luò)的通信負荷,是一種高效的局部通信方式。 (5)基于65nm工藝的芯片實現(xiàn) 本論文在完成了多核處理器硬件RTL級設(shè)計和驗證后,進一步完成了芯片實現(xiàn)的工作:多核處理器采用了TSMC65納米低功耗工藝庫,在芯片中實現(xiàn)了擁有兩個簇狀結(jié)構(gòu)即16個處理器陣列,芯片的面積為2935.6*3100um,共有124個管腳。根據(jù)IC Compiler的報告分析,在典型工藝角下芯片的最高時鐘頻率可達到600MHz,每個處理器節(jié)點的功耗約為80mw。
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:TP332
【圖文】:
圖1一2處理器性能隨時間的發(fā)展關(guān)系(引自〔3J)對于如圖卜飛這樣的嵌入式系統(tǒng)而言,由于采用的是主從結(jié)構(gòu),所以位于核心地位的嵌入式處理器往往有可能成為系統(tǒng)的瓶頸所在。雖然嵌入式處理器的性能在不斷提升,但是近年來隨著半導(dǎo)體制造進入深亞微米工藝后,其性能的提升速度已大大降低,如圖卜2所示。面對用戶對產(chǎn)品性能要求永無止境的增長,僅僅挖掘單個處理器的性能潛力顯然己不足以提升整個嵌入式系統(tǒng)的系能并滿足用戶的要求。于是在單核處理器體系結(jié)構(gòu)繼續(xù)演進的同時,多核處理器應(yīng)運而生。如圖卜3所示,是一個基于共享總線的多核處理器片上系統(tǒng)在蓋個處理器性能趁近極限的情沉下,多核嵌入式系統(tǒng)能夠通過挖掘任務(wù)級并行往從而有效提升系統(tǒng)整體的性能:但是這樣的多核處理器系統(tǒng)能夠集成的處理器數(shù)據(jù)非常有限,這是因為共享總線的帶寬是一定的,各個處理器需要來競爭私分享這一資源:過多增加系統(tǒng)中處理器的數(shù)目,只會導(dǎo)致大部分數(shù)據(jù)因為無法獲得總線控制權(quán)而處于
AMBA總線:AHB+APBll圖1一l基于單核處理器的典型片上系統(tǒng)10,0001,0001002弓%/丫e盯
本文編號:2765290
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:TP332
【圖文】:
圖1一2處理器性能隨時間的發(fā)展關(guān)系(引自〔3J)對于如圖卜飛這樣的嵌入式系統(tǒng)而言,由于采用的是主從結(jié)構(gòu),所以位于核心地位的嵌入式處理器往往有可能成為系統(tǒng)的瓶頸所在。雖然嵌入式處理器的性能在不斷提升,但是近年來隨著半導(dǎo)體制造進入深亞微米工藝后,其性能的提升速度已大大降低,如圖卜2所示。面對用戶對產(chǎn)品性能要求永無止境的增長,僅僅挖掘單個處理器的性能潛力顯然己不足以提升整個嵌入式系統(tǒng)的系能并滿足用戶的要求。于是在單核處理器體系結(jié)構(gòu)繼續(xù)演進的同時,多核處理器應(yīng)運而生。如圖卜3所示,是一個基于共享總線的多核處理器片上系統(tǒng)在蓋個處理器性能趁近極限的情沉下,多核嵌入式系統(tǒng)能夠通過挖掘任務(wù)級并行往從而有效提升系統(tǒng)整體的性能:但是這樣的多核處理器系統(tǒng)能夠集成的處理器數(shù)據(jù)非常有限,這是因為共享總線的帶寬是一定的,各個處理器需要來競爭私分享這一資源:過多增加系統(tǒng)中處理器的數(shù)目,只會導(dǎo)致大部分數(shù)據(jù)因為無法獲得總線控制權(quán)而處于
AMBA總線:AHB+APBll圖1一l基于單核處理器的典型片上系統(tǒng)10,0001,0001002弓%/丫e盯
本文編號:2765290
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2765290.html
最近更新
教材專著