基于SIMD指令的多核軟件渲染器的設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:基于SIMD指令的多核軟件渲染器的設(shè)計(jì)與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:新研發(fā)的處理器越來越多地加入SIMD向量指令集,增強(qiáng)其數(shù)據(jù)并行處理能力。無錫江南計(jì)算所研發(fā)的國產(chǎn)處理器神威也搭載了SIMD向量處理單元。然而,國產(chǎn)處理器平臺上應(yīng)用匱乏,三維可視化應(yīng)用尤其如此,而三維可視化應(yīng)用的開發(fā)離不開高效的渲染器。因此我們開發(fā)了本文描述的渲染器,期望推進(jìn)國產(chǎn)處理器上三維應(yīng)用的發(fā)展。本文詳細(xì)描述了一個為裝備了SIMD處理單元的多核處理器設(shè)計(jì)的軟件渲染器架構(gòu)。傳統(tǒng)的渲染管線難以并行化,本文中我們設(shè)計(jì)了一個sort-middle架構(gòu)的并行渲染管線,該設(shè)計(jì)能有效利用多核和SIMD處理單元帶來的性能提速。另外,我們也根據(jù)Greene描述的遞歸下降算法設(shè)計(jì)了高效的適合SIMD指令的光柵化方法。根據(jù)這些設(shè)計(jì)我們實(shí)現(xiàn)了一套平臺無關(guān)的渲染框架,并且根據(jù)該框架在Intel Core i7的Windows平臺和神威處理器的Linux平臺上都實(shí)現(xiàn)了渲染器。結(jié)果顯示,渲染器在這兩個平臺上都具有接近線性的可伸縮性。并且在Intel Core i7的Windows平臺上,比廣泛使用的Mesa3D的單線程渲染管線參考Mesa+Gallium+Softpipe快20倍以上,比其多線程渲染引擎Mesa+Swrast還快2.1-3.3倍。該渲染器使用裝箱來減少對內(nèi)存帶寬的需求,并且使鎖爭用減少。目前該渲染器使用x86上的SSE指令或者神威上的SIMD指令可以并行地渲染四個片元。同時,也利用為SIMD指令優(yōu)化過的數(shù)學(xué)函數(shù)進(jìn)行所有的三維變換。通過有技巧地使用處理器上的SIMD和多核并行機(jī)制,該渲染器的性能明顯優(yōu)于串行的實(shí)現(xiàn)。該渲染器能維持渲染順序,并且支持多種特性:可以渲染到多個渲染目標(biāo),可以定制頂點(diǎn)和片元著色器,支持多邊形裁剪,背面等相關(guān)剔除操作,深度緩存以及透視矯正紋理映射。另外,由于軟件實(shí)現(xiàn)的靈活性,我們實(shí)現(xiàn)了平臺無關(guān)的繪制框架,具有高度的可移植性。我們一開始在搭載了Intel Core i7的Windows平臺上開發(fā),后來很便利地移植到了搭載了神威處理器的Linux平臺上。
【關(guān)鍵詞】:軟件渲染器 神威 SSE SIMD 多核 多線程
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP332
【目錄】:
- 摘要3-4
- Abstract4-11
- 第1章 緒論11-19
- 1.1 課題背景11-12
- 1.2 相關(guān)工作12-14
- 1.3 渲染器分類14-17
- 1.4 本文的主要工作和內(nèi)容組織17-18
- 1.5 本章小結(jié)18-19
- 第2章 渲染器設(shè)計(jì)和實(shí)現(xiàn)概要19-28
- 2.1 串行渲染管線19-20
- 2.2 并行優(yōu)化20
- 2.3 渲染管線概覽20-27
- 2.3.1 數(shù)據(jù)流22-23
- 2.3.2 渲染器的關(guān)鍵接口23-24
- 2.3.3 渲染管線的并行處理流程24-27
- 2.4 本章小結(jié)27-28
- 第3章 渲染管線處理階段28-37
- 3.1 幾何處理28-31
- 3.1.1 頂點(diǎn)變換28-29
- 3.1.2 三角形剔除29-31
- 3.2 光柵化簡述31-32
- 3.3 片元處理32-36
- 3.3.1 屬性插值的計(jì)算33-36
- 3.4 本章小結(jié)36-37
- 第4章 光柵化37-53
- 4.1 光柵化簡介37-40
- 4.1.1 半空間測試37-38
- 4.1.2 填充規(guī)則38-40
- 4.2 經(jīng)典光柵化算法40-42
- 4.2.1 掃描轉(zhuǎn)換算法40-41
- 4.2.2 印章橫掃算法41-42
- 4.3 多核與SIMD并行優(yōu)化42-51
- 4.3.1 光柵化過程高層概覽42-46
- 4.3.2 裝箱46-49
- 4.3.3 區(qū)塊內(nèi)部的光柵化49-51
- 4.4 本章小結(jié)51-53
- 第5章 渲染器的性能53-62
- 5.1 性能考量53-54
- 5.2 Intel Core i7和神威處理器架構(gòu)54-55
- 5.3 Intel Core i7和神威上的性能表現(xiàn)55-61
- 5.4 本章小結(jié)61-62
- 第6章 總結(jié)與展望62-64
- 6.1 工作總結(jié)62
- 6.2 未來工作展望62-64
- 參考文獻(xiàn)64-67
- 作者簡歷67-68
- 致謝68
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張為華;臧斌宇;王曄;錢興隆;朱傳琪;;基于共享向量的二維SIMD調(diào)度算法[J];計(jì)算機(jī)學(xué)報;2006年10期
2 李璞;孫亞輝;;64位環(huán)境SIMD性能優(yōu)化技術(shù)研究[J];計(jì)算機(jī)與信息技術(shù);2007年04期
3 卜士喜;竺紅衛(wèi);;軟件SIMD的研究及應(yīng)用[J];計(jì)算機(jī)工程;2010年19期
4 侯永生;趙榮彩;黃磊;韓林;;面向SIMD擴(kuò)展部件的循環(huán)優(yōu)化研究[J];計(jì)算機(jī)科學(xué);2014年05期
5 張為華;臧斌宇;;共享主存多SIMD結(jié)構(gòu)及編譯技術(shù)研究[J];計(jì)算機(jī)科學(xué)與探索;2009年01期
6 郭陽;丁偉;李振濤;;高性能算術(shù)SIMD模塊的電路設(shè)計(jì)[J];微電子學(xué)與計(jì)算機(jī);2010年09期
7 侯永生;趙榮彩;高偉;朱嘉楓;;SIMD擴(kuò)展部件數(shù)據(jù)依賴關(guān)系約束條件研究[J];信息工程大學(xué)學(xué)報;2014年01期
8 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設(shè)計(jì)研究[J];浙江大學(xué)學(xué)報(工學(xué)版);2001年02期
9 周西漢,劉勃,周荷琴,袁非牛;一種基于奔騰SIMD指令的快速背景提取方法[J];計(jì)算機(jī)工程與應(yīng)用;2004年27期
10 張倩;;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[J];計(jì)算機(jī)工程;2009年10期
中國重要會議論文全文數(shù)據(jù)庫 前7條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗(yàn)證[A];第十五屆計(jì)算機(jī)工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 付光遠(yuǎn);;基于SIMD-MPP并行模型的圖像調(diào)度與映射方法研究[A];2006年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(三)[C];2006年
3 高巍;宋妍;;基于SIMD體系結(jié)構(gòu)的數(shù)據(jù)相關(guān)控制語句轉(zhuǎn)化方法[A];2009年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(上冊)[C];2009年
4 朱明慧;;ADI浮點(diǎn)DSP軟件編程中的指令并行與SIMD應(yīng)用[A];中國航空學(xué)會信號與信息處理專業(yè)全國第八屆學(xué)術(shù)會議論文集[C];2004年
5 李彥潔;龐一;孫立峰;;多視點(diǎn)視頻編碼中的SIMD優(yōu)化研究[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議論文集[C];2008年
6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四屆中國衛(wèi)星導(dǎo)航學(xué)術(shù)年會論文集-S7 北斗/GNSS用戶終端技術(shù)[C];2013年
7 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點(diǎn)乘加器的設(shè)計(jì)與實(shí)現(xiàn)[A];第十五屆計(jì)算機(jī)工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 楊惠;面向性能的SIMD DSP指令流調(diào)度技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
2 張為華;共享主存多SIMD結(jié)構(gòu)編譯優(yōu)化及結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2006年
3 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2008年
4 張凱;向量SIMD DSP上高效矩陣運(yùn)算技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年
5 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復(fù)旦大學(xué);2005年
6 姜偉華;針對實(shí)際多媒體程序和多媒體擴(kuò)展指令集的SIMD編譯優(yōu)化[D];復(fù)旦大學(xué);2005年
7 魏帥;面向SIMD的向量化算法及重組技術(shù)研究[D];解放軍信息工程大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 沈陽;基于SIMD指令的多核軟件渲染器的設(shè)計(jì)與實(shí)現(xiàn)[D];浙江大學(xué);2015年
2 張倩;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[D];復(fù)旦大學(xué);2008年
3 李璋輝;支持浮點(diǎn)融合乘加的SIMD運(yùn)算部件設(shè)計(jì)優(yōu)化及實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2013年
4 楊明;基于存儲訪問的SIMD優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2011年
5 劉楷;基于SIMD結(jié)構(gòu)的高性能DSP處理器評測程序的優(yōu)化與實(shí)現(xiàn)[D];西安電子科技大學(xué);2012年
6 陳向;SIMD數(shù)據(jù)置換指令的自動生成與優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2010年
7 彭永克;基于SIMD架構(gòu)的二維DCT/IDCT變換電路模塊的設(shè)計(jì)與實(shí)現(xiàn)[D];上海交通大學(xué);2008年
8 肖瑋;二維SIMD結(jié)構(gòu)的編譯優(yōu)化與功耗研究[D];復(fù)旦大學(xué);2008年
9 王迪;SIMD編譯優(yōu)化技術(shù)研究[D];浙江大學(xué);2008年
10 高偉;面向SIMD的自動向量化優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2013年
本文關(guān)鍵詞:基于SIMD指令的多核軟件渲染器的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號:305421
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/305421.html