系統(tǒng)芯片中媒體增強數字信號處理器核設計研究
發(fā)布時間:2020-06-04 02:28
【摘要】: 媒體系統(tǒng)芯片設計開發(fā)中的關鍵問題,就是如何最有效地利用硅片上可用的硬件資源,提供支持目標多媒體應用的單芯片高性加比解決方案。基于總線互連的由一個或多個指令集處理器核、一個或多個專用硬件IP核、一片或多片片上存儲器構成的異質體系結構成為媒體系統(tǒng)芯片的合理選擇。在國家863計劃的支持下,我們開展了系統(tǒng)芯片中媒體增強的數字信號處理器核的設計研究,本文作為部分成果,著重探討了處理器核指令集結構的媒體處理增強、處理器核微結構的設計和優(yōu)化以及系統(tǒng)總線設計和媒體數據流調度的問題。 在系統(tǒng)芯片中媒體數字信號處理器核的設計中,在分析媒體處理應用算法特點的基礎上,本文提出對MIPS-Ⅰ指令體系相兼容的基本指令集結構進行媒體增強擴展,通過支持SIMD亞字并行操作、媒體專用指令和運算結果特殊處理等增強單發(fā)射結構處理器的媒體處理性能,借鑒Intel MMX/SSE/SSE2媒體擴展指令集的思想生成初始指令功能集合,通過與常用媒體處理核心算法的互動進一步優(yōu)化媒體指令集結構,創(chuàng)新性地對與MIPS-Ⅰ相兼容的基本指令體系實現了后向兼容媒體增強擴展,在硬件上通過構造可拆分的數據通道等實現了對媒體增強指令集的支持,以極小的硬件附加開銷獲得了媒體處理性能的顯著提高。 在系統(tǒng)芯片中媒體數字信號處理器核的設計中,在具體分析CPU流水線競爭和處理器異常的基礎上,本文提出并實現了一種基于有限狀態(tài)機的流水線運行控制方案,并從提高鐘頻和降低CPI值兩個方面優(yōu)化處理器性能。為避免流水時鐘頻率受制于某些復雜運算指令較長的運算時間,又要達到單周期完成一條運算指令的吞吐量指標,本文提出對EX級進行可伸縮超流水擴展的思想,提出并實現了一種高性加比的切換控制方案。對于單發(fā)射結構的處理器,降低CPI值的根本途徑在于通過各種軟硬件技術減少流水線的停頓,本文構造了一個RAW相關環(huán)路模型用于分析流水線中寄存器操作數的RAW競爭現象,并提出了一種“動態(tài)”數據旁路優(yōu)化策略,可以最大程度地減少復雜流水線中因數據的RAW競爭而導致的互鎖停頓,理論分析和實測結果充分表明“動態(tài)”數據旁路機構可以有效地降低流水線因RAW互鎖導致的平均CPI增量。 總線設計和媒體數據流的調度是實時媒體系統(tǒng)芯片設計中極其關鍵的問題,本文以VCD、HDTV解碼系統(tǒng)芯片的設計為具體個例,探討了MPEG-1/2視頻解碼軟硬件實現中的數據流調度策略。在分析視頻碼流輸入、解碼處理和視頻顯示的時間參數后,提出以3幀組合為軟件解碼的調度粒度,以及基于啟動期限和完成期限的兩種解碼調度策略,較好地均衡了處理器性能需求和數據緩存需求。提出了一種基于靜態(tài)分時復用調度/動態(tài)固定優(yōu)先級仲裁的混合二級總線仲裁策略,通過分割總線時間片靜態(tài)調度媒體數據流DMA傳輸,使之與解碼流程同步配合,有效地分配和使用總線帶寬,降低了片上數據緩存等硬件開銷。
【圖文】:
后兼容”的方式保證基于原指令體系的軟件可以運行在基于新指令體系的處理器上。以MxPs指令體系[”9]為例,從MIPs一I、MIPs一Ix、MIPs一111、MIPs一Iv到MIPs一v,采取了“向后兼容”的擴展方式,如圖2一8左側所示。對MD32指令集結構的媒體擴展,我們也決定采用“向后兼容”的擴展方式,在與MIPS一I指令體系機器碼級相兼容的基本指令集結構MDF的基礎上,,引入媒體擴展指令集Mns(s表示sIMn或subwordparallelism),如圖2一8右側所示。值得一提的是,MIPS指令體系為了提供對數字媒體應用的支持,在,MIPS一V指令集結構中也引入了媒體擴展MoMx[,4](Mipsnigita一Mediaextension)
作數可直接取自memory,實現了對數字信號處理中頻繁的直接面向memory的操作支持。這樣,原ALu級除跳轉地址計算和Pc控制外,主要完成memory地址的計算,故更名為DA級,并設置2個地址產生單元AGUI和AGUZ(見圖3一1),支持對2個memory操作數的多種尋址模式。DM級相應地可讀取2個memory操作數,一個來自cache系統(tǒng),另一個來自片上數據RAM。(4)數據cache訪問的標志比較DTC和部分字對準操作LA從MEM級分離出來,放在緊隨的后續(xù)流水級。數據memory訪問縮為單相時鐘的一個流水級后,為控制流水級時延,DTC和LA操作宜分離出來,放到后續(xù)的EX級。這是流水級時延均衡調整的結果。(5)將MDS寄存器源操作數的讀取放在DA級。通用寄存器源操作數的讀取放在ID級
【學位授予單位】:浙江大學
【學位級別】:博士
【學位授予年份】:2004
【分類號】:TP332
【圖文】:
后兼容”的方式保證基于原指令體系的軟件可以運行在基于新指令體系的處理器上。以MxPs指令體系[”9]為例,從MIPs一I、MIPs一Ix、MIPs一111、MIPs一Iv到MIPs一v,采取了“向后兼容”的擴展方式,如圖2一8左側所示。對MD32指令集結構的媒體擴展,我們也決定采用“向后兼容”的擴展方式,在與MIPS一I指令體系機器碼級相兼容的基本指令集結構MDF的基礎上,,引入媒體擴展指令集Mns(s表示sIMn或subwordparallelism),如圖2一8右側所示。值得一提的是,MIPS指令體系為了提供對數字媒體應用的支持,在,MIPS一V指令集結構中也引入了媒體擴展MoMx[,4](Mipsnigita一Mediaextension)
作數可直接取自memory,實現了對數字信號處理中頻繁的直接面向memory的操作支持。這樣,原ALu級除跳轉地址計算和Pc控制外,主要完成memory地址的計算,故更名為DA級,并設置2個地址產生單元AGUI和AGUZ(見圖3一1),支持對2個memory操作數的多種尋址模式。DM級相應地可讀取2個memory操作數,一個來自cache系統(tǒng),另一個來自片上數據RAM。(4)數據cache訪問的標志比較DTC和部分字對準操作LA從MEM級分離出來,放在緊隨的后續(xù)流水級。數據memory訪問縮為單相時鐘的一個流水級后,為控制流水級時延,DTC和LA操作宜分離出來,放到后續(xù)的EX級。這是流水級時延均衡調整的結果。(5)將MDS寄存器源操作數的讀取放在DA級。通用寄存器源操作數的讀取放在ID級
【學位授予單位】:浙江大學
【學位級別】:博士
【學位授予年份】:2004
【分類號】:TP332
【相似文獻】
相關期刊論文 前10條
1 本刊記者;;感受電源處理器的神奇功效 MS HD Power電源處理器對比試聽活動[J];家庭影院技術;2011年06期
2 ;Intel Atom處理器力挺Windows平板秀[J];電腦迷;2011年13期
3 YYD;;技嘉主板SmartFan“失靈”[J];電腦迷;2011年18期
4 milk;;又到一年Tick-Tock時 Sandy Bridge開啟智能新視界[J];電腦愛好者;2011年02期
5 zw;;22nm來襲 Intel Ivy Bridge處理器前瞻[J];電腦迷;2011年16期
6 ;電腦裝機方案推薦[J];計算機與網絡;2010年01期
7 王欣;;【徹夜未眠】 ThinkPad X220T[J];個人電腦;2011年07期
8 ;英特爾甲骨文將推新一代處理器[J];硅谷;2011年17期
9 ;完美四核 超值享受 AMD Phenom Ⅱ N930處理器[J];電腦愛好者;2010年23期
10 AIR FORCE;;感受4.9GHz的爽快——實戰(zhàn)Sandy Bridge處理器超頻[J];電腦愛好者;2011年04期
相關會議論文 前10條
1 趙繼敏;姜淑忠;譚
本文編號:2695751
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2695751.html