基于深度學(xué)習(xí)的圖像描述算法研究
【圖文】:
經(jīng)網(wǎng)絡(luò)[221為代表的達(dá)上百層的深度卷積網(wǎng)絡(luò)。逡逑圖像分類的飛速發(fā)展,也促進(jìn)了計(jì)算視覺其它領(lǐng)域的快速發(fā)展,以深yL經(jīng)網(wǎng)絡(luò)為基礎(chǔ),圖像檢測(cè)、圖像分割的性能也得到了飛速的提高,出現(xiàn)Faster-RCNN[81,Mask-RCNN117]在內(nèi)的優(yōu)秀算法,它們的性能己經(jīng)能夠達(dá)級(jí)別,并己經(jīng)應(yīng)用于自動(dòng)駕駛等領(lǐng)域。逡逑1.3.2遞歸神經(jīng)網(wǎng)絡(luò)逡逑遞歸神經(jīng)網(wǎng)絡(luò)(RNN)是一種神經(jīng)網(wǎng)絡(luò)算法,它可以看作不同節(jié)點(diǎn),連接的邊生成一個(gè)有向圖的過(guò)程。該結(jié)構(gòu)使得它能夠在時(shí)間序列上動(dòng)態(tài)的不同的行為。相對(duì)于傳統(tǒng)的前向反饋神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠利用內(nèi)部狀態(tài)序列的輸入。除此之外,,該結(jié)構(gòu)也使得它能夠應(yīng)用于包括手寫體識(shí)別和語(yǔ)等任務(wù)之中。逡逑
逑一個(gè)基本的RNN如圖]-1中左半部分所示,它包括內(nèi)部狀態(tài)/;^是模型的逡逑輸入,0為模型的輸出。RNN本身是一個(gè)迭代的過(guò)程,展開后為圖1-1右半部分逡逑所示的結(jié)構(gòu),即模型的隱藏狀態(tài)隨著時(shí)刻的進(jìn)行,需要不斷的傳遞到下一時(shí)刻之逡逑中,它可以由公式(1-20),公式(1-21)進(jìn)行表示:逡逑ht邋=邋ah(Whxt邋+邐+邋bh)邐(1-20)逡逑ot邋=邋Gt(W0ht邋+邋by)邐(1-21)逡逑其中/it代表了邋RNN在t時(shí)刻的隱藏狀態(tài),1^是RNN在t時(shí)刻的輸入向量,0t表示逡逑模型的輸出向量,?代表模型的訓(xùn)練參數(shù),卟,%為模型的逡逑激活函數(shù)。逡逑由于傳統(tǒng)的RNN存在梯度消失和梯度爆炸的問(wèn)題,所以出現(xiàn)了克服該缺點(diǎn)逡逑的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long邋Short-Term邋Memory,LSTM)邋[36]。LSTM能夠有效地逡逑阻止反向傳播中的梯度消失和梯度爆炸問(wèn)題。LSTM為了更加有效地利用歷史信逡逑息,提出了門的概念。逡逑如圖1-2所不
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.41;TP183
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 湯鵬杰;譚云蘭;李金忠;;融合圖像場(chǎng)景及物體先驗(yàn)知識(shí)的圖像描述生成模型[J];中國(guó)圖象圖形學(xué)報(bào);2017年09期
2 李曉莉;張慧明;李曉光;;多主題的圖像描述生成方法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2019年05期
3 薛一鳴;周雪婧;周小詩(shī);牛少彰;文娟;;基于圖像描述的文本信息隱藏[J];北京郵電大學(xué)學(xué)報(bào);2018年06期
4 張凱;李軍輝;周國(guó)棟;;基于樞軸語(yǔ)言的圖像描述生成研究[J];中文信息學(xué)報(bào);2019年03期
5 周昌;鄭雅羽;周凡;陳耀武;;基于局部圖像描述的目標(biāo)跟蹤方法[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2008年07期
6 楊楠;南琳;張丁一;庫(kù)濤;;基于深度學(xué)習(xí)的圖像描述研究[J];紅外與激光工程;2018年02期
7 李亞棟;莫紅;王世豪;周忠;吳威;;基于圖像描述的人物檢索方法[J];系統(tǒng)仿真學(xué)報(bào);2018年07期
8 陶云松;張麗紅;;基于雙向注意力機(jī)制圖像描述方法研究[J];測(cè)試技術(shù)學(xué)報(bào);2019年04期
9 徐平;;探究曲線運(yùn)動(dòng)的圖像描述[J];物理通報(bào);2013年07期
10 吳娛;趙嘉濟(jì);平子良;杜昊翔;;基于指數(shù)矩的圖像描述[J];現(xiàn)代電子技術(shù);2013年14期
相關(guān)會(huì)議論文 前3條
1 莫華;張燕;岳糧躍;吳智輝;滕維中;;生物臟器滲流分支血管系統(tǒng)的分形特性[A];第四屆西部十二。▍^(qū))市物理學(xué)會(huì)聯(lián)合學(xué)術(shù)交流會(huì)論文集[C];2008年
2 楊秀秀;尹燕寧;徐素鵬;夏勇;印建平;;氟化鎂分子的受激輻射力減速[A];第十七屆全國(guó)量子光學(xué)學(xué)術(shù)會(huì)議報(bào)告摘要集[C];2016年
3 程士德;蘇晶;;中醫(yī)模式形成和特點(diǎn)剖析[A];中醫(yī)藥優(yōu)秀論文選(上)[C];2009年
相關(guān)博士學(xué)位論文 前4條
1 朱欣鑫;基于深度學(xué)習(xí)的圖像描述算法研究[D];北京郵電大學(xué);2019年
2 湯進(jìn);基于圖理論的圖像描述與檢索方法研究[D];安徽大學(xué);2007年
3 顧廣華;面向圖像語(yǔ)義描述的場(chǎng)景分類研究[D];北京交通大學(xué);2013年
4 曲智國(guó);基于圖理論的圖像結(jié)構(gòu)化描述與匹配方法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 趙德海;基于深度學(xué)習(xí)的視頻事件檢測(cè)的研究與應(yīng)用[D];中國(guó)石油大學(xué)(華東);2017年
2 常智;基于深度學(xué)習(xí)的圖像描述方法研究[D];天津理工大學(xué);2019年
3 房超;基于圖像高級(jí)語(yǔ)義與Attention融合的圖像描述方法研究[D];遼寧大學(xué);2018年
4 束炎武;基于多模態(tài)遞歸網(wǎng)絡(luò)的圖像描述研究[D];南京理工大學(xué);2018年
5 倪夢(mèng)s
本文編號(hào):2704258
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2704258.html