融合語(yǔ)義知識(shí)的深度表達(dá)學(xué)習(xí)及在視覺(jué)理解中的應(yīng)用
本文選題:深度學(xué)習(xí) + 神經(jīng)網(wǎng)絡(luò); 參考:《計(jì)算機(jī)研究與發(fā)展》2017年06期
【摘要】:近幾年來(lái),隨著深度學(xué)習(xí)技術(shù)的日趨完善,傳統(tǒng)的計(jì)算機(jī)視覺(jué)任務(wù)得到了前所未有的發(fā)展.如何將傳統(tǒng)視覺(jué)研究中的領(lǐng)域知識(shí)融入到深度模型中提升深度模型的視覺(jué)表達(dá)能力,從而應(yīng)對(duì)更為復(fù)雜的視覺(jué)任務(wù),成為了學(xué)術(shù)界廣泛關(guān)注的問(wèn)題.鑒于此,以融合了語(yǔ)義知識(shí)的深度表達(dá)學(xué)習(xí)為主線展開(kāi)了一系列研究.取得的主要?jiǎng)?chuàng)新成果包括3個(gè)方面:1)研究了將單類型的語(yǔ)義信息(類別相似性)融入到深度特征的學(xué)習(xí)中,提出了嵌入正則化語(yǔ)義關(guān)聯(lián)的深度Hash學(xué)習(xí)方法,并將其應(yīng)用于圖像的相似性比對(duì)與檢索問(wèn)題中,取得了較大的性能提升;2)研究了將多類型信息(多重上下文信息)融入到深度特征的學(xué)習(xí)中,提出了基于長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的場(chǎng)景上下文學(xué)習(xí)方法,并將其應(yīng)用于復(fù)雜場(chǎng)景的幾何屬性分析問(wèn)題中;3)研究了將視覺(jué)數(shù)據(jù)的結(jié)構(gòu)化語(yǔ)義配置融入到深度表達(dá)的學(xué)習(xí)中,提出了融合語(yǔ)法知識(shí)的表達(dá)學(xué)習(xí)方法,并將其應(yīng)用到復(fù)雜場(chǎng)景下的通用內(nèi)容解析問(wèn)題中.相關(guān)的實(shí)驗(yàn)結(jié)果表明:該方法能有效地對(duì)場(chǎng)景的結(jié)構(gòu)化配置進(jìn)行預(yù)測(cè).
[Abstract]:In recent years, with the improvement of deep learning technology, the traditional computer vision task has been developed unprecedented. How to integrate the domain knowledge of traditional visual research into the depth model to enhance the visual expression ability of the depth model, so as to deal with more complex visual tasks, has become a widespread concern in the academic community. In view of this, a series of researches are carried out based on the deep representation learning of semantic knowledge. The main innovation results obtained include three aspects: 1) this paper studies the integration of single-type semantic information (category similarity) into the learning of depth features, and proposes a method of deep Hash learning with embedded regularized semantic association. It is applied to the similarity comparison and retrieval of images, and a great performance improvement is achieved. (2) the multi-type information (multi-context information) is integrated into the depth feature learning. A scene context learning method based on short and long memory neural networks is proposed and applied to the geometric attribute analysis of complex scenes. (3) the structural semantic configuration of visual data is integrated into the learning of deep representation. This paper proposes a representation learning method of fusion grammar knowledge and applies it to the general content resolution problem in complex scenarios. The experimental results show that the proposed method can effectively predict the structured configuration of the scene.
【作者單位】: 中山大學(xué)數(shù)據(jù)科學(xué)與計(jì)算機(jī)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金優(yōu)秀青年科學(xué)基金項(xiàng)目(6162200366)~~
【分類號(hào)】:TP18;TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 高永建 ,吳健康;神經(jīng)網(wǎng)絡(luò)及其識(shí)別應(yīng)用簡(jiǎn)介[J];電信科學(xué);1990年02期
2 謝國(guó)梁;;神經(jīng)網(wǎng)絡(luò):從希望到現(xiàn)實(shí)[J];激光與光電子學(xué)進(jìn)展;1991年01期
3 鄭士貴;文獻(xiàn)自動(dòng)閱讀神經(jīng)網(wǎng)絡(luò)[J];管理科學(xué)文摘;1996年08期
4 呂芬;趙生妹;;基于Hopfield神經(jīng)網(wǎng)絡(luò)的噪聲字母識(shí)別[J];計(jì)算機(jī)與信息技術(shù);2005年12期
5 李毅;童紅俊;宋貴寶;李冬;;神經(jīng)網(wǎng)絡(luò)在飛行器航跡仿真計(jì)算中的應(yīng)用[J];海軍航空工程學(xué)院學(xué)報(bào);2006年05期
6 林鋼;;基于SOM神經(jīng)網(wǎng)絡(luò)對(duì)潛在客戶的挖掘[J];南寧職業(yè)技術(shù)學(xué)院學(xué)報(bào);2006年04期
7 楊帆;陳勁杰;唐梅華;陳鑫;;簡(jiǎn)論神經(jīng)網(wǎng)絡(luò)在搜索中的應(yīng)用[J];機(jī)械管理開(kāi)發(fā);2008年01期
8 朱紅斌;;LVQ神經(jīng)網(wǎng)絡(luò)在交通事件檢測(cè)中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2008年34期
9 李彤巖;李興明;;神經(jīng)網(wǎng)絡(luò)在確定關(guān)聯(lián)規(guī)則挖掘算法權(quán)值中的應(yīng)用研究[J];計(jì)算機(jī)應(yīng)用研究;2008年05期
10 石文淵;彭軍民;;基于神經(jīng)網(wǎng)絡(luò)的貨幣識(shí)別研究[J];西安理工大學(xué)學(xué)報(bào);2008年02期
相關(guān)會(huì)議論文 前10條
1 陳文新;王長(zhǎng)富;戴蓓倩;;基于神經(jīng)網(wǎng)絡(luò)的漢語(yǔ)四聲識(shí)別[A];第一屆全國(guó)語(yǔ)言識(shí)別學(xué)術(shù)報(bào)告與展示會(huì)論文集[C];1990年
2 李睿;李明軍;;一種模糊高斯基神經(jīng)網(wǎng)絡(luò)在數(shù)值逼近上的仿真[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國(guó)第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2006年
3 許旭萍;臧道青;;采用Hopfield神經(jīng)網(wǎng)絡(luò)實(shí)施缸蓋表面點(diǎn)陣字符識(shí)別[A];第十五屆全國(guó)汽車檢測(cè)技術(shù)年會(huì)論文集[C];2011年
4 朱長(zhǎng)春;;神經(jīng)網(wǎng)絡(luò)用于線性時(shí)固有系統(tǒng)的廣義狀態(tài)轉(zhuǎn)移矩陣的識(shí)別[A];中國(guó)工程物理研究院科技年報(bào)(1999)[C];1999年
5 王玉斌;李永明;王穎;;用數(shù)據(jù)挖掘和神經(jīng)網(wǎng)絡(luò)技術(shù)預(yù)測(cè)工程造價(jià)[A];第十一屆全國(guó)電工數(shù)學(xué)學(xué)術(shù)年會(huì)論文集[C];2007年
6 應(yīng)捷;袁一方;;神經(jīng)網(wǎng)絡(luò)指紋特征點(diǎn)匹配算法的改進(jìn)[A];2007'中國(guó)儀器儀表與測(cè)控技術(shù)交流大會(huì)論文集(二)[C];2007年
7 謝小良;符卓;;基于Hopfield神經(jīng)網(wǎng)絡(luò)的單周期船舶調(diào)度模型及算法[A];2008年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2008年
8 陳意;;神經(jīng)網(wǎng)絡(luò)在船舶識(shí)別一個(gè)應(yīng)用[A];船舶航泊安全的新經(jīng)驗(yàn)新技術(shù)論文集(上冊(cè))[C];2007年
9 王輝;楊杰;黎明;蔡念;;一種基于神經(jīng)網(wǎng)絡(luò)的圖像復(fù)原方法[A];2006年全國(guó)光電技術(shù)學(xué)術(shù)交流會(huì)會(huì)議文集(D 光電信息處理技術(shù)專題)[C];2006年
10 賈睿;徐啟強(qiáng);劉艷;;基于神經(jīng)網(wǎng)絡(luò)的網(wǎng)殼結(jié)構(gòu)近似分析研究[A];第二十一屆全國(guó)振動(dòng)與噪聲高技術(shù)及應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2008年
相關(guān)重要報(bào)紙文章 前1條
1 中國(guó)科技大學(xué)計(jì)算機(jī)系 邢方亮;神經(jīng)網(wǎng)絡(luò)挑戰(zhàn)人類大腦[N];計(jì)算機(jī)世界;2003年
相關(guān)博士學(xué)位論文 前10條
1 李曉剛;基于神經(jīng)網(wǎng)絡(luò)的碼垛機(jī)器人視覺(jué)位姿測(cè)量及伺服控制研究[D];北京林業(yè)大學(xué);2015年
2 戶保田;基于深度神經(jīng)網(wǎng)絡(luò)的文本表示及其應(yīng)用[D];哈爾濱工業(yè)大學(xué);2016年
3 諸勇;正交回歸神經(jīng)網(wǎng)絡(luò)及其在控制系統(tǒng)中的應(yīng)用[D];浙江大學(xué);1998年
4 田景文;地下油藏的仿真與預(yù)測(cè)[D];哈爾濱工程大學(xué);2001年
5 彭宏京;基于稀疏RAM的神經(jīng)網(wǎng)絡(luò)及其人臉識(shí)別應(yīng)用研究[D];南京航空航天大學(xué);2002年
6 王吉權(quán);BP神經(jīng)網(wǎng)絡(luò)的理論及其在農(nóng)業(yè)機(jī)械化中的應(yīng)用研究[D];沈陽(yáng)農(nóng)業(yè)大學(xué);2011年
7 郭海湘;石油儲(chǔ)層縱向預(yù)測(cè)軟硬計(jì)算融合的理論與方法研究[D];中國(guó)地質(zhì)大學(xué);2008年
8 葛利;基于過(guò)程神經(jīng)網(wǎng)絡(luò)的時(shí)序數(shù)據(jù)挖掘研究[D];哈爾濱工程大學(xué);2012年
9 柴冰華;色貌模型CIECAM02若干問(wèn)題的研究[D];北京理工大學(xué);2006年
10 唐云嵐;集成神經(jīng)網(wǎng)絡(luò)和多目標(biāo)進(jìn)化算法的卷煙產(chǎn)品參數(shù)優(yōu)化設(shè)計(jì)方法及應(yīng)用研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 陳彥至;神經(jīng)網(wǎng)絡(luò)降維算法研究與應(yīng)用[D];華南理工大學(xué);2015年
2 蔡邦宇;人臉識(shí)別中單次ERP時(shí)空特征分析及其快速檢索的應(yīng)用[D];浙江大學(xué);2015年
3 鄭川;垃圾評(píng)論檢測(cè)算法的研究[D];西南交通大學(xué);2015年
4 汪濟(jì)民;基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)和性別識(shí)別研究[D];南京理工大學(xué);2015年
5 彭玲玲;基于不確定理論與機(jī)器學(xué)習(xí)的行人檢測(cè)[D];長(zhǎng)安大學(xué);2015年
6 楊陳東;BP-Fisher判別分析法[D];長(zhǎng)安大學(xué);2015年
7 孟鑫;基于Hadoop云平臺(tái)下的客流量預(yù)測(cè)研究[D];長(zhǎng)安大學(xué);2015年
8 張勇;深度卷積神經(jīng)網(wǎng)絡(luò)在車牌和人臉檢測(cè)領(lǐng)域的應(yīng)用研究[D];鄭州大學(xué);2015年
9 宋璐璐;財(cái)經(jīng)職業(yè)技術(shù)學(xué)院票務(wù)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安工業(yè)大學(xué);2015年
10 陳銳浩;基于神經(jīng)網(wǎng)絡(luò)的口令屬性分析工具開(kāi)發(fā)[D];上海交通大學(xué);2015年
,本文編號(hào):1849205
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1849205.html