天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

深度學習加速器中矩陣向量乘部件設計

發(fā)布時間:2020-07-07 10:48
【摘要】:基于神經(jīng)網(wǎng)絡的深度學習算法是過去幾年發(fā)展最為迅速的計算領域之一。從圖像/視頻/音頻識別,到自動翻譯、業(yè)務分析和自動駕駛,許多新興的高性能和嵌入式應用都依賴于深度學習算法。深度學習模型常常包含巨大的計算量,而深度學習算法目前往往運行在通用的CPU和GPU,它們的吞吐率和能量效率相對較低。近年來學術界和工業(yè)界提出了多種新穎的面向深度學習處理器結構,這些加速器幾乎都以大規(guī)模的矩陣乘加部件為核心,在其基礎上充分考慮深度神經(jīng)網(wǎng)絡的計算特點和數(shù)據(jù)傳輸特點,設計符合其計算模式的存儲層次和互聯(lián)結構。從而在吞吐率和功耗上都取得了極大的改進。本課題所研究的矩陣向量乘部件是深度學習加速器的核心功能部件,占據(jù)了深度學習加速器的大部分面積,并對加速器的吞吐率具有主要貢獻。因此,矩陣向量乘部件的設計與優(yōu)化,對于深度學習加速器的實現(xiàn)有著關鍵的作用。具體研究工作如下:矩陣向量乘部件的邏輯設計。根據(jù)頂層要求完成指令譯碼設置,本設計支持3條矩陣向量運算指令。乘法器和加法陣列是矩陣向量乘模塊的主要部件,根據(jù)不同算法的特點,選取合適的實現(xiàn)方法。乘法器由基4Booth編碼、壓縮樹、并行前綴加法器和溢出判斷4部分構成。其中對壓縮樹和并行前綴加法器的結構進行優(yōu)化,以至于提高乘法器的性能。對于加法陣列部分,本設計使用4-2壓縮樹與并行前綴加法器相結合的方式,完成32個16位有符號數(shù)求和。矩陣向量乘部件的流水化設計、功能驗證和邏輯綜合。由于矩陣向量乘運算的延遲較大,對其進行流水化設計。經(jīng)過仔細的邏輯劃分,將運算過程劃分為5站,并對每站的邏輯延時進行了較好的平衡。對完成的所有設計進行了驗證。驗證的方式為,用另一種算法完成乘法器和32個16位有符號數(shù)求和。為兩種實現(xiàn)方法,輸入相同的數(shù)據(jù),對比結果,從而完成設計的功能驗證。輸入的數(shù)據(jù)采用隨機數(shù)的方式生成。綜合輸出的網(wǎng)表用于后續(xù)物理實現(xiàn)。矩陣向量乘部件的物理實現(xiàn)。采用層次化的物理設計方法。通過對該部件的結構分析,確定了合理的的子模塊劃分方法和合理的子模塊固化大小。在頂層,優(yōu)化了宏模塊布局,并優(yōu)化緩沖器插入以實現(xiàn)長線延時縮減。通過以上方法,完成了該部件的的布局布線,并進行了時序分析和物理驗證。深度學習矩陣向量部件面積為1300um×3600um,工作頻率達到1.1GHz,功耗為1.3W。
【學位授予單位】:西安電子科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP18;TP332.2
【圖文】:

結構圖,結構圖


ensor Processing Unit)處理器。深度學習處理器代表了現(xiàn)今計算密集和訪存密集的神經(jīng)網(wǎng)絡處理器體沿,它們都特別強調(diào)對具體神經(jīng)網(wǎng)絡算法應用的支持?v覽這幾類典型理,它們都以一個大規(guī)模的乘加矩陣作為核心,提供強大的計算能力。量乘部件的設計是整個深度學習處理器的關鍵之一。.1 國內(nèi)研究現(xiàn)狀幾年,中科院計算所 Tianshi Chen 等人提出的 Diannao 系類的神經(jīng)網(wǎng)絡前神經(jīng)網(wǎng)絡硬件實現(xiàn)領域最好的芯片。如圖 1.1 Diannao 結構圖所示。絡模型的數(shù)據(jù)局部特點以及計算的特點,進行存儲體系以及專用硬件更好的性能。之前常用的神經(jīng)網(wǎng)絡的硬件實現(xiàn)方案,即將每個神經(jīng)元映件計算單元上,具體示意結構圖 1.2 全硬件實現(xiàn)方案。方案的優(yōu)點很明顯,實現(xiàn)方案簡單,計算性能高,功耗低。缺點也不難,模型的結構和尺寸的增加都會導致該模型失效。

硬件實現(xiàn),方案


圖 1.2 全硬件實現(xiàn)方案是一種專門針對深度神經(jīng)網(wǎng)絡的加速器,它的核心思想將為多次的小的運算。包含了一個權重暫存(Scratchpad M(Neural Function Unit,NFU)和一個控制處理[11](Contro寬度的差異,所以將存儲劃分為 3 部分,分為 NBin,SB矩陣,NBin 和 NBout 存儲的是輸入輸出向量,把 NBin 和數(shù)據(jù)沖突。NFU 分為 3 站,分別進行乘法、累加(或 po這 3 站完成神經(jīng)網(wǎng)絡的核心計算。CP 中運行深度神經(jīng)網(wǎng)和計算。針對一個大網(wǎng)絡器模型參數(shù)會依此加載到 SB 里被依此加載到 NBin,計算結果被寫入到 NBout。NFU 里體神經(jīng)元或權重參數(shù)綁定。通過這種設計,Diannao 在支明顯的改進。12]可以認為是 Diannao 面向服務器應用的升級版。在服務嚴格的指標,反之吞吐率變得更為重要。針對主流神經(jīng)網(wǎng)

結構圖,結構圖,架構,神經(jīng)網(wǎng)絡技術


圖 1.3 單個 tile 結構圖udiannao 也是屬于 Diannao 系列。ShiDianNao 的享的特點。將卷積神經(jīng)網(wǎng)絡模型加載到靜態(tài)存。并將加速器直接與視頻圖像傳感器相連,以o 則是對 7 種機器學習常見算法進行總結,并方案。新的面向特定領域指令集架構(Instruction Se采用 load-store 架構,基于對現(xiàn)有神經(jīng)網(wǎng)絡技術、邏輯運算,以及數(shù)據(jù)傳輸和控制指令。Cambr活性,能夠支持 10 類不同的神經(jīng)網(wǎng)路算法;同

【相似文獻】

相關期刊論文 前10條

1 傅君明;;高中數(shù)學中向量問題的分類解析[J];高中數(shù)學教與學;2016年22期

2 金鵬;;在探究中加深理解 在領悟中提升素養(yǎng)——以“向量的概念及表示”的教學為例[J];中學數(shù)學月刊;2017年05期

3 周志云;;平面向量備考策略[J];高中數(shù)理化;2017年05期

4 楊天育;楊龍婷;;向量在高考數(shù)學解題中的應用[J];數(shù)學大世界(下旬);2017年06期

5 宋禹;姚誠智;;基于向量方法提出關于空間圖形穩(wěn)定性的設想[J];中學生數(shù)理化(學習研究);2017年08期

6 周科;;對考查向量的試題背景分析與教學備考建議[J];數(shù)學大世界(上旬);2017年08期

7 崔華梅;戴宏照;;構造圓解決向量問題[J];中學生數(shù)學;2017年15期

8 彭雪純;;基于平面幾何性質(zhì)的向量問題思考[J];數(shù)碼世界;2017年09期

9 楊春梅;;題有多變 貴在尋根——例談向量中的三角形中線性質(zhì)[J];高中數(shù)理化;2017年17期

10 馮寅;;架起內(nèi)心和向量之間的橋梁[J];數(shù)理化解題研究;2017年22期

相關會議論文 前10條

1 張曉艷;王挺;陳火旺;;基于多向量和實體模糊匹配的話題關聯(lián)識別[A];第三屆全國信息檢索與內(nèi)容安全學術會議論文集[C];2007年

2 劉暢;劉必慰;彭瑾;;深度學習加速器矩陣向量乘部件設計[A];第二十二屆計算機工程與工藝年會暨第八屆微處理器技術論壇論文集[C];2018年

3 白維娟;;基于APOS理論的向量概念分析[A];教師教育論壇(第一輯)[C];2019年

4 王丹丹;;向量血流圖評價房顫患者左心室內(nèi)流場變化情況[A];中國超聲醫(yī)學工程學會第十一屆全國腹部超聲醫(yī)學學術會議論文匯編[C];2016年

5 王丹丹;;向量血流圖評價房顫患者左心室內(nèi)流場變化情況[A];中國超聲醫(yī)學工程學會第十四屆全國超聲心動圖學術會議論文匯編[C];2018年

6 王丹丹;;向量血流圖評價房顫患者左心室內(nèi)流場變化情況[A];中國超聲醫(yī)學工程學會第十三屆全國超聲心動圖學術會議論文匯編[C];2016年

7 王震;趙陽;楊學林;;薄膜結構的向量式有限元斷裂行為分析[A];第十五屆空間結構學術會議論文集[C];2014年

8 繆浩然;黎塔;梁宏;;改進的詞向量特征和CNN在語句分類中的應用[A];第十四屆全國人機語音通訊學術會議(NCMMSC’2017)論文集[C];2017年

9 李鋒剛;張亞南;汪兵;;基于詞向量和AP聚類的短文本主題演化分析[A];第十三屆(2018)中國管理學年會論文集[C];2018年

10 陳進于;錢若軍;;流固耦合問題的數(shù)值分析[A];慶祝劉錫良教授八十華誕暨第八屆全國現(xiàn)代結構工程學術研討會論文集[C];2008年

相關博士學位論文 前5條

1 張明;表示學習詞向量提取及其在情感分析中的應用研究[D];江南大學;2019年

2 曾紹華;支持向量回歸機算法理論研究與應用[D];重慶大學;2006年

3 曾志強;支持向量分類機的訓練與簡化算法研究[D];浙江大學;2007年

4 王鑫;基于表示學習的情感分析關鍵技術研究[D];哈爾濱工業(yè)大學;2017年

5 步紅剛;基于混合特征向量和單分類檢測器的織物瑕疵自動檢測研究[D];東華大學;2010年

相關碩士學位論文 前10條

1 譚富文;房產(chǎn)數(shù)據(jù)向量對齊的算法研究[D];成都理工大學;2019年

2 李丹;基于深度學習的陸空通話復誦校驗方法研究[D];中國民航大學;2019年

3 段敏敏;基于詞典與詞向量融合的文本情感分析研究[D];西安電子科技大學;2019年

4 劉暢;深度學習加速器中矩陣向量乘部件設計[D];西安電子科技大學;2019年

5 馮亦彤;基于攻擊向量自動生成的XSS漏洞檢測系統(tǒng)的研究與設計[D];北京郵電大學;2019年

6 馮姝樺;專業(yè)主觀題自動評閱關鍵技術研究和應用[D];山東大學;2019年

7 劉英杰;在線社交網(wǎng)絡輿情話題分析技術研究與實現(xiàn)[D];上海交通大學;2017年

8 徐山山;基于詞向量的文本分類研究[D];吉林大學;2019年

9 彭晴;基于支持向量劃分的簇標識方法研究[D];吉林大學;2019年

10 徐貝貝;基于詞向量的流感病毒宿主預測和病毒序列鑒定[D];湖南大學;2018年



本文編號:2745028

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2745028.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶6c8ac***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com