天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 電子信息論文 >

人工智能芯片軟件棧的開(kāi)發(fā)及算法研究

發(fā)布時(shí)間:2021-02-19 06:19
  隨著摩爾定律逐漸接近尾聲,一味地通過(guò)提升工藝來(lái)比拼硬件性能將變得越來(lái)越艱難。在現(xiàn)有工藝下,如何改進(jìn)硬件架構(gòu)來(lái)適應(yīng)不斷變化的人工智能算法變得愈發(fā)的重要。為了針對(duì)具體應(yīng)用,研究從底層硬件到上層軟件接口的設(shè)計(jì),保證芯片底層和上層軟件接口設(shè)計(jì)符合具體應(yīng)用的需求,本論文在基于開(kāi)源硬件框架的人工智能芯片研究平臺(tái)和FPGA開(kāi)源軟件框架PYNQ基礎(chǔ)上,開(kāi)發(fā)了所需的軟件棧,并通過(guò)改進(jìn)的YOLOv3-Tiny目標(biāo)檢測(cè)算法實(shí)現(xiàn)了軟件棧的驗(yàn)證。主要工作包括:(1)設(shè)計(jì)了人工智能芯片軟件棧的總體框架,完成了人工智能芯片研究平臺(tái)的軟件開(kāi)發(fā),包括算法的模型訓(xùn)練、模型轉(zhuǎn)換,CNN加速指令及加速硬件的驅(qū)動(dòng)程序開(kāi)發(fā)和CNN應(yīng)用級(jí)API調(diào)用接口開(kāi)發(fā)。(2)特定應(yīng)用場(chǎng)景的目標(biāo)檢測(cè)算法在該平臺(tái)的移植與測(cè)試。傳統(tǒng)檢測(cè)方法在豬群檢測(cè)和計(jì)數(shù)應(yīng)用方面存在的檢測(cè)設(shè)備易損、檢測(cè)結(jié)果不理想等問(wèn)題。本文在YOLOv3-Tiny算法的基礎(chǔ)上,增加了一個(gè)檢測(cè)尺度并進(jìn)行特征密集連接復(fù)用,提高了目標(biāo)檢測(cè)算法的精度。最后將YOLOv3-Tiny移植在人工智能芯片研究平臺(tái)進(jìn)行測(cè)試對(duì)比,測(cè)試結(jié)果顯示設(shè)計(jì)方案獲得了較好的效果。 

【文章來(lái)源】:杭州電子科技大學(xué)浙江省

【文章頁(yè)數(shù)】:77 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

人工智能芯片軟件棧的開(kāi)發(fā)及算法研究


模型轉(zhuǎn)換概念--中間表示ONNX(OpenNeuralNetworkExchange,開(kāi)放神經(jīng)網(wǎng)絡(luò)交換)是一種開(kāi)放式文件格式,專(zhuān)為機(jī)器學(xué)習(xí)設(shè)計(jì),可以令不同AI框架訓(xùn)練得到的模型采用相同格式存儲(chǔ)數(shù)據(jù)并進(jìn)行交互

節(jié)點(diǎn),卷積,模型,張量


浙江省碩士學(xué)位論文9ONNX采用的是protobuf這種序列化數(shù)據(jù)結(jié)構(gòu)協(xié)議來(lái)存儲(chǔ)神經(jīng)網(wǎng)絡(luò)中的參數(shù)信息(類(lèi)似于Caffe),在onnx.proto文件中可以了解數(shù)據(jù)協(xié)議的規(guī)則和一些其他信息。以卷積為例結(jié)構(gòu)如下。圖2.3ONNX中的Node配置ONNX將每一個(gè)網(wǎng)絡(luò)的每一層都當(dāng)作節(jié)點(diǎn)Node,由這些節(jié)點(diǎn)構(gòu)建一個(gè)Graph網(wǎng)絡(luò),最后將這個(gè)Graph和該ONNX模型的其他信息結(jié)合在一起生成的model即為最終的.onnx模型。有了ONNX這樣的工具,可以讓開(kāi)發(fā)者很方便地對(duì)各框架下的模型進(jìn)行轉(zhuǎn)換,比如TensorFlow模型轉(zhuǎn)ONNX,只需如下一條命令即可完成:Pythontensorflow2onnx.pytensorflow_model_pathoutput_layer_namesaved_onnx_path_name針對(duì)運(yùn)用于嵌入式設(shè)備的算法而言,模型轉(zhuǎn)換更多強(qiáng)調(diào)的是網(wǎng)絡(luò)結(jié)構(gòu)轉(zhuǎn)換,以適用于嵌入式設(shè)備進(jìn)行推理。希望盡可能復(fù)用現(xiàn)有模塊,使得在模型推理時(shí)訪(fǎng)問(wèn)DDR的次數(shù)越少越好。常用的有卷積-BN融合、平均池化層轉(zhuǎn)卷積、全連接層轉(zhuǎn)卷積等。2.2.3模型量化方法嵌入式平臺(tái)的深度學(xué)習(xí)算法,要重點(diǎn)關(guān)注四項(xiàng)指標(biāo):推理時(shí)間、內(nèi)存消耗、算法性能和吞吐量、運(yùn)算量。算法的訓(xùn)練與改進(jìn)大都是在PC端進(jìn)行的,一般不會(huì)考慮算法中存儲(chǔ)空間的開(kāi)辟和分配問(wèn)題[27],但由于CNN體量過(guò)大,不太適合用于嵌入式移動(dòng)端,因此目前卷積神經(jīng)網(wǎng)絡(luò)的一大發(fā)展方向就是模型壓縮,即在保持一定的精度的情況下,對(duì)模型大小進(jìn)行壓縮,以減少內(nèi)存占用和加速前向推理。目前現(xiàn)有的深度學(xué)習(xí)模型壓縮方法主要有四種:(1)剪枝:即刪除一些對(duì)準(zhǔn)確率影響不大的冗余項(xiàng)和不重要項(xiàng),如神經(jīng)元、連接、通道等;(2)低秩因子分解:使用矩陣或者張量分解,用精簡(jiǎn)的張量來(lái)表達(dá)復(fù)雜的張量以估計(jì)學(xué)習(xí)模

訓(xùn)練方法


浙江省碩士學(xué)位論文11=×127(2.1)表達(dá)式(2.1)中y表示量化后的8bit數(shù)據(jù),x表示原32位浮點(diǎn)數(shù)據(jù),Round()函數(shù)表示進(jìn)行數(shù)值的四舍五入,t表示輸入數(shù)據(jù)的最大絕對(duì)值,那么通過(guò)執(zhí)行該量化過(guò)程即可將4字節(jié)的float數(shù)據(jù)按比例縮放為[-127,127]范圍內(nèi)的整數(shù),可以減少4倍左右的位寬消耗。圖2.4量化訓(xùn)練方法模型訓(xùn)練可以看作是從輸入到輸出的前向推理以及由輸出到輸入的反向推理共同作用,將32位的輸入數(shù)據(jù)經(jīng)過(guò)卷積層和激活層后將權(quán)重和激活值都量化為8位整型數(shù)據(jù),池化層不做改變,然后根據(jù)真值和預(yù)測(cè)值計(jì)算Loss,再進(jìn)行反向傳播;反向傳播其實(shí)傳播的是weights和bias參數(shù)的導(dǎo)數(shù),不進(jìn)行量化,使用原32位浮點(diǎn)數(shù)進(jìn)行運(yùn)算。PC端經(jīng)過(guò)這種量化方法訓(xùn)練出來(lái)的模型得到的參數(shù)也是8位整型結(jié)果。同理,推理過(guò)程接受到訓(xùn)練得到的int8類(lèi)型輸入數(shù)據(jù),經(jīng)過(guò)量化推理得到int8輸出數(shù)據(jù),但是經(jīng)過(guò)試驗(yàn)發(fā)現(xiàn)將bias進(jìn)行如上的量化之后并沒(méi)有明顯的速度提升,反而會(huì)導(dǎo)致目標(biāo)檢測(cè)精度降低不少,在bias比weights數(shù)據(jù)量少很多的情況下,對(duì)bias進(jìn)行量化得不償失,對(duì)比之下,選擇不對(duì)bias進(jìn)行量化而是采用原始的浮點(diǎn)數(shù)據(jù)參與計(jì)算,得到量化推理方法如下所示:

【參考文獻(xiàn)】:
期刊論文
[1]論人工智能技術(shù)應(yīng)用研究現(xiàn)狀和發(fā)展前景[J]. 王嫄,解文霞,孔德莉,高喜平.  科技與創(chuàng)新. 2019(20)
[2]人工智能芯片國(guó)產(chǎn)化路徑淺析[J]. 王煥寧.  科學(xué)技術(shù)創(chuàng)新. 2019(19)
[3]基于Tiny-yolo的網(wǎng)絡(luò)壓縮與硬件加速方法[J]. 黃智勇,吳海華,虞智,仲元紅.  華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(06)
[4]PYNQ中實(shí)現(xiàn)SoftMax函數(shù)加速器[J]. 孫齊偉.  電子產(chǎn)品世界. 2019(06)
[5]2019年中國(guó)芯片行業(yè)市場(chǎng)現(xiàn)狀及發(fā)展趨勢(shì)分析[J].   變頻器世界. 2019(04)
[6]新一代人工智能研究的回顧與展望[J]. 黃欣榮.  新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版). 2019(04)
[7]基于機(jī)會(huì)窗口的中國(guó)AI芯片行業(yè)追趕研究[J]. 路嘉明.  產(chǎn)業(yè)經(jīng)濟(jì)評(píng)論. 2019(01)
[8]人工智能開(kāi)源平臺(tái)發(fā)展態(tài)勢(shì)研究[J]. 王沖鶄,陳絲.  信息通信技術(shù)與政策. 2018(08)
[9]人工智能整體技術(shù)體系和國(guó)內(nèi)外發(fā)展情況[J]. 沈應(yīng)龍.  科技中國(guó). 2018(07)
[10]卷積神經(jīng)網(wǎng)絡(luò)在圖像分類(lèi)和目標(biāo)檢測(cè)應(yīng)用綜述[J]. 周俊宇,趙艷明.  計(jì)算機(jī)工程與應(yīng)用. 2017(13)

碩士論文
[1]CNN目標(biāo)檢測(cè)系統(tǒng)在嵌入式平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 嚴(yán)敏佳.電子科技大學(xué) 2019
[2]基于深度學(xué)習(xí)的動(dòng)物面部識(shí)別算法研究[D]. 宋各方.杭州電子科技大學(xué) 2019
[3]基于FPGA的目標(biāo)檢測(cè)算法加速與實(shí)現(xiàn)[D]. 吳晉.北京交通大學(xué) 2018
[4]指紋識(shí)別芯片的算法設(shè)計(jì)及其在FPGA上的原型驗(yàn)證[D]. 劉桑.北京交通大學(xué) 2017
[5]基于FPGA的深度學(xué)習(xí)加速器設(shè)計(jì)與實(shí)現(xiàn)[D]. 余奇.中國(guó)科學(xué)技術(shù)大學(xué) 2016



本文編號(hào):3040726

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/3040726.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)92714***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日韩欧美精品一区二区三区| 久久国产精品熟女一区二区三区| 国产免费人成视频尤物| 91久久国产福利自产拍 | 欧美av人人妻av人人爽蜜桃 | 狠色婷婷久久一区二区三区| 91日韩欧美中文字幕| 黄色片一区二区三区高清| 国产白丝粉嫩av在线免费观看| 亚洲一区在线观看蜜桃| 又黄又硬又爽又色的视频| 日韩色婷婷综合在线观看| 91精品国产品国语在线不卡| 国产又大又硬又粗又湿| 麻豆国产精品一区二区三区| 91偷拍视频久久精品| 亚洲a级一区二区不卡| 日本少妇三级三级三级| 国产精品午夜小视频观看| 国产精品色热综合在线| 欧美在线观看视频免费不卡| 麻豆印象传媒在线观看| 亚洲国产成人久久99精品| 国内胖女人做爰视频有没有| 五月婷婷缴情七月丁香| 亚洲一区二区三区四区性色av| 精品国产亚洲免费91| 国产成人精品一区二区三区| 国产亚洲精品俞拍视频福利区| 99久久人妻精品免费一区| 日韩一区二区三区在线欧洲| 99在线视频精品免费播放| 日韩精品一级一区二区| 亚洲精品国产主播一区| 亚洲第一区二区三区女厕偷拍 | 亚洲一区二区三区精选| 亚洲美女国产精品久久| 亚洲一区二区精品免费| 99香蕉精品视频国产版| 日本加勒比中文在线观看| 一区二区三区在线不卡免费|