天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算模型的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-03-11 05:51
  視覺(jué)邏輯學(xué)習(xí)是計(jì)算機(jī)視覺(jué)學(xué)習(xí)的一個(gè)重要組成部分,它直接從給定的圖像的信息中學(xué)習(xí)邏輯推理模式。視覺(jué)邏輯學(xué)習(xí)在許多應(yīng)用領(lǐng)域(如,制造業(yè)、醫(yī)療診斷、智能交通導(dǎo)航、軍事等領(lǐng)域)的各種智能/自主系統(tǒng)中發(fā)揮了關(guān)鍵作用。算術(shù)運(yùn)算學(xué)習(xí)是視覺(jué)邏輯學(xué)習(xí)中的一個(gè)典型任務(wù),該任務(wù)旨在學(xué)習(xí)輸入圖像和輸出圖像之間的算術(shù)運(yùn)算關(guān)系。本文主要研究和實(shí)現(xiàn)了基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算模型。首先將基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算任務(wù)轉(zhuǎn)換為一個(gè)回歸問(wèn)題,即創(chuàng)建一個(gè)算術(shù)運(yùn)算模型使得預(yù)測(cè)圖像和真實(shí)圖像的差異最小;其次提出了一種基于多標(biāo)簽的算術(shù)運(yùn)算模型,該模型使用算術(shù)運(yùn)算中進(jìn)位/借位的計(jì)算策略來(lái)降低算術(shù)運(yùn)算模型的學(xué)習(xí)難度,從而有效提升了模型的性能。多標(biāo)簽?zāi)P驮谠械乃阈g(shù)運(yùn)算模型上增加了含進(jìn)位/借位標(biāo)簽和無(wú)進(jìn)位/借位標(biāo)簽,將算術(shù)運(yùn)算模型拆分為如下三個(gè)子模型:含進(jìn)位/借位模型、無(wú)進(jìn)位/借位模型以及合成模型。對(duì)于不同的子模型采用了不同的網(wǎng)絡(luò)模型,其中含進(jìn)位/借位模型和無(wú)進(jìn)位/借位模型均使用了長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的網(wǎng)絡(luò)模型,但兩個(gè)子模型的網(wǎng)絡(luò)結(jié)構(gòu)存在一定的差異,而合成模型使用了全連接神經(jīng)網(wǎng)絡(luò)模型。進(jìn)一步在特定的數(shù)據(jù)集中,驗(yàn)證了多標(biāo)簽?zāi)P?.. 

【文章來(lái)源】:西安石油大學(xué)陜西省

【文章頁(yè)數(shù)】:61 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算模型的研究與實(shí)現(xiàn)


解決基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算任務(wù)的方法其一隨著計(jì)算機(jī)軟硬件和深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,計(jì)算機(jī)已經(jīng)可以實(shí)現(xiàn)端到端地學(xué)習(xí)

流程圖,算術(shù),視覺(jué),方法


西安石油大學(xué)碩士學(xué)位論文2務(wù)。一般的感知子任務(wù)包括對(duì)象識(shí)別和分割,認(rèn)知子任務(wù)包括語(yǔ)言建模和翻譯。如圖1-1為目前比較流行、認(rèn)可的解決基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算任務(wù)的流程圖。圖1-1解決基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算任務(wù)的方法其一隨著計(jì)算機(jī)軟硬件和深度神經(jīng)網(wǎng)絡(luò)的發(fā)展,計(jì)算機(jī)已經(jīng)可以實(shí)現(xiàn)端到端地學(xué)習(xí)。例如,Vinyals等人[12]將端到端訓(xùn)練用于圖像到句子的生成;Hannun等人[13]利用端到端訓(xùn)練將圖像生成語(yǔ)音。因此,解決此類(lèi)問(wèn)題的第二種方法也應(yīng)運(yùn)而生了。即使用端對(duì)端學(xué)習(xí)的思想將傳統(tǒng)的兩個(gè)子任務(wù)同時(shí)放入一個(gè)模型中進(jìn)行操作,也就是說(shuō),在一個(gè)模型中同時(shí)完成感知和認(rèn)知任務(wù),這意味著學(xué)習(xí)模型必須隱含地學(xué)習(xí)圖像中的符號(hào)之間的關(guān)系,而無(wú)需事先定義他們的含義。毫無(wú)疑問(wèn),第二種方法比第一種方法難度更大,更加復(fù)雜。圖1-2為采用端到端模型來(lái)解決基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算任務(wù)的一般流程。圖1-2解決基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算任務(wù)的方法其二1.2國(guó)內(nèi)外研究現(xiàn)狀早在1998年Franco和Cannas等人[14]就驗(yàn)證了二進(jìn)制數(shù)的基本算術(shù)運(yùn)算可以使用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的可行性。他們?cè)O(shè)計(jì)出了最優(yōu)的前饋多層網(wǎng)絡(luò)結(jié)構(gòu),用于執(zhí)行不同的二進(jìn)制的基本算術(shù)運(yùn)算,例如位移、兩個(gè)n位數(shù)字的加法和乘法運(yùn)算。2014年,Graves等人[15]通過(guò)使用注意力程序進(jìn)行交互的外部存儲(chǔ)器,增強(qiáng)了神經(jīng)網(wǎng)絡(luò)的性能。其提出新系統(tǒng)中的每個(gè)組件都是可微的,并使用梯度下降高效地進(jìn)行訓(xùn)練。最終的實(shí)驗(yàn)結(jié)果表明,神經(jīng)網(wǎng)絡(luò)可以從輸入和輸出樣本中推斷出簡(jiǎn)單的邏輯,例如,排序。隨著人們對(duì)神經(jīng)網(wǎng)絡(luò)更加深入的研究和硬件設(shè)施性能不斷的提高。研究員們提出了許多高性能的網(wǎng)絡(luò)模型

時(shí)間序列,算術(shù),視覺(jué),圖像


西安石油大學(xué)碩士學(xué)位論文4入為x輸出為y,其中,....}3,2,1),,(|{21ixxxxxiiii,y表示兩輸入操作數(shù)的算術(shù)運(yùn)算結(jié)果值。輸入和輸出的之間的邏輯關(guān)系(加法、減法以及乘法運(yùn)算)表示為R,而本文的目標(biāo)則是y和y之間loss值(均方根誤差)最小,其中y為預(yù)測(cè)輸出圖像。圖1-3基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算任務(wù)圖需要指出的是,這里的輸出和輸入都是直接使用圖像進(jìn)行表示。而且在算術(shù)運(yùn)算模型的訓(xùn)練前不能對(duì)數(shù)據(jù)進(jìn)行數(shù)字分割、數(shù)字識(shí)別等任何的感知子任務(wù)。這就使得算術(shù)運(yùn)算模型不僅要學(xué)習(xí)感知子任務(wù),而且要總結(jié)得到輸入的兩圖像中所嵌入數(shù)字的算術(shù)運(yùn)算關(guān)系。眾所周知,在兩張嵌有數(shù)字的圖像中,若是存在十幾個(gè)甚至幾個(gè)像素點(diǎn)的差異時(shí),兩張圖像就會(huì)呈現(xiàn)出不同的結(jié)果。因?yàn)樗阈g(shù)運(yùn)算模型的輸出是直接使用圖像進(jìn)行表示,所以若要得到正確的預(yù)測(cè)圖像,則需要保證模型有足夠高的計(jì)算精度。圖1-4基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算幀預(yù)測(cè)任務(wù)圖本研究課題也可視為幀間預(yù)測(cè)的問(wèn)題如圖1-4所示。給定一個(gè)時(shí)間序列321,,ttt,而1tmf,2tmf,3tmf分別表示為其時(shí)間序列上所對(duì)應(yīng)的單幀圖像,其中,m...3,2,1為訓(xùn)練樣本數(shù)。本課題研究的內(nèi)容就是,給出第一幀1tmf和第二幀2tmf的單幀圖像,得到視頻的第三幀的預(yù)測(cè)單幀圖像3tmf,課題研究的目標(biāo)就是使得3tmf和3tmf的均方根誤差值(loss)最小,即預(yù)測(cè)得出的單幀圖像無(wú)限接近真實(shí)的單幀圖像。此時(shí),算術(shù)運(yùn)算模型的輸出使用單幀圖像進(jìn)行表示,但其輸入應(yīng)為,tcnmf),,,(tm,其中m和n代表了視頻的尺寸大小,c是表示單幀圖像的通道數(shù),t則是時(shí)間序列。在使用視頻幀預(yù)測(cè)的研究思路去解決基于視覺(jué)學(xué)習(xí)的算術(shù)運(yùn)算任務(wù)時(shí),由于視頻幀訓(xùn)練樣本的時(shí)間序列太短只可以使用兩個(gè)時(shí)刻的單幀圖像進(jìn)行訓(xùn)練,而且在訓(xùn)練樣本視頻中每

【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)分析中的應(yīng)用[J]. 馬俊.  電子技術(shù)與軟件工程. 2019(07)
[2]循環(huán)神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 楊麗,吳雨茜,王俊麗,劉義理.  計(jì)算機(jī)應(yīng)用. 2018(S2)
[3]視覺(jué)問(wèn)答技術(shù)研究[J]. 俞俊,汪亮,余宙.  計(jì)算機(jī)研究與發(fā)展. 2018(09)
[4]可解釋化、結(jié)構(gòu)化、多模態(tài)化的深度神經(jīng)網(wǎng)絡(luò)[J]. 熊紅凱,高星,李劭輝,徐宇輝,王涌壯,余豪陽(yáng),劉昕,張?jiān)骑w.  模式識(shí)別與人工智能. 2018(01)
[5]計(jì)算機(jī)視覺(jué)研究綜述[J]. 倪晨旭.  電子世界. 2018(01)
[6]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍.  計(jì)算機(jī)學(xué)報(bào). 2017(06)
[7]不同池化模型的卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)性能研究[J]. 劉萬(wàn)軍,梁雪劍,曲海成.  中國(guó)圖象圖形學(xué)報(bào). 2016(09)
[8]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航.  計(jì)算機(jī)應(yīng)用. 2016(09)
[9]深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)方法綜述[J]. 殷瑞剛,魏帥,李晗,于洪.  計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(08)
[10]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安.  自動(dòng)化學(xué)報(bào). 2016(09)

博士論文
[1]基于流形的降維方法及其在計(jì)算機(jī)視覺(jué)中的應(yīng)用[D]. 黃東.電子科技大學(xué) 2009
[2]基于計(jì)算機(jī)視覺(jué)的檢測(cè)方法與應(yīng)用研究[D]. 漆隨平.浙江大學(xué) 2005



本文編號(hào):3075972

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3075972.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)ac777***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com