圖像語義描述技術研究及煤礦場景應用
發(fā)布時間:2021-02-11 09:16
圖像場景語義描述是計算機視覺和自然語言處理領域的交叉任務,其目標是對視覺數據給出語義解釋,實現(xiàn)從視覺空間到語義空間的映射。視覺語義描述技術研究不僅在學術界成為熱點,也在工業(yè)界得到越來越多的關注,具有廣闊的應用前景,如對工業(yè)視頻監(jiān)控系統(tǒng)的智能化推進。當前,煤礦視頻監(jiān)控系統(tǒng)已經在井下普遍應用,但對于異常場景只是通過監(jiān)控人員觀察視頻進行識別,然后采取應對措施解決,效率較低;并且其應用規(guī)模已遠超人力觀察范圍,監(jiān)控視頻更多只用作事后取證,較多隱患問題不能早期識別與處理。將圖像語義描述技術應用于煤礦監(jiān)控視頻系統(tǒng)可以實現(xiàn)煤礦視頻監(jiān)控在線智能化,大幅提升煤礦安全管理水平和事件處理效率。由于圖像底層的視覺特征與高層的語義概念存在很大差異,目前的圖像場景語義描述算法仍然存在較多不足,如確定圖像的關注重點、挖掘更高層次的語義信息以及完善描述句子的細節(jié)信息等。因此本文針對圖像語義描述技術存在的上述問題進行改進,提出基于Global-local Feature和Adaptive-attention圖像語義描述算法,并將其應用于實際場景。本文的研究內容如下:(1)提出基于Global-local Feature和...
【文章來源】:中國礦業(yè)大學江蘇省 211工程院校 教育部直屬院校
【文章頁數】:79 頁
【學位級別】:碩士
【部分圖文】:
Sigmoid函數Figure2-3SigmoidfunctionTanh為雙曲正切函數,取值范圍為1~1,其主要由雙曲正弦函數sinh
圖 2-3 Sigmoid 函數Figure 2-3 Sigmoid function 為雙曲正切函數,取值范圍為 1 ~1,其主要由雙曲正弦函數 cosh 組成,其函數表達式可以表示為:( ) ( )x xx xe ef x tanh xe e 函數圖像如圖 2-4 所示:
圖 2-5 ReLU 函數Figure 2-5 ReLU function視化網絡可以學習圖像的高級特征,Zeiler 等[12]提出反卷積神絡模型提取的圖像特征進行可視化。如圖 2-6 所示,其為特征的特征可視化示意圖,由圖可以看出,隨著卷積神經特征更為復雜、更為抽象,淺層神經網絡提取的邊緣、輪絡提取的為抽象復雜的紋理信息。
【參考文獻】:
期刊論文
[1]基于主成分分析網絡的改進圖像分類算法[J]. 趙小虎,尹良飛,朱亞楠,劉鵬,王學奎,沈雪茹. 激光與光電子學進展. 2019(02)
[2]圖像的文本描述方法研究綜述[J]. 馬龍龍,韓先培,孫樂. 中文信息學報. 2018(04)
[3]基于全文檢索的文本相似度算法應用研究[J]. 王格,吳釗,李向. 計算機與數字工程. 2016(04)
[4]智能分析預警技術在視頻監(jiān)控系統(tǒng)中的應用[J]. 陳貴平. 煤礦機械. 2014(02)
[5]基于視覺特性的井下圖像去噪新方法[J]. 浦江,姜代紅. 河北大學學報(自然科學版). 2014(01)
博士論文
[1]基于關注度機制的圖像理解[D]. 郭聰.中國科學技術大學 2018
[2]煤礦監(jiān)控圖像拼接與識別的方法研究[D]. 姜代紅.中國礦業(yè)大學 2015
[3]井下環(huán)境中運動目標檢測與跟蹤研究[D]. 張辰.中國礦業(yè)大學 2014
碩士論文
[1]基于深度學習的視覺內容描述技術研究[D]. 李林科.電子科技大學 2018
[2]基于語句相似度的中文文本復制檢測技術研究[D]. 張慧云.北京郵電大學 2015
[3]基于鏈接文本相似度和時間因子的Web挖掘算法[D]. 李林洋.哈爾濱工程大學 2013
[4]基于快速相似度的Web結構挖掘的研究[D]. 馬燕.南京信息工程大學 2011
本文編號:3028883
【文章來源】:中國礦業(yè)大學江蘇省 211工程院校 教育部直屬院校
【文章頁數】:79 頁
【學位級別】:碩士
【部分圖文】:
Sigmoid函數Figure2-3SigmoidfunctionTanh為雙曲正切函數,取值范圍為1~1,其主要由雙曲正弦函數sinh
圖 2-3 Sigmoid 函數Figure 2-3 Sigmoid function 為雙曲正切函數,取值范圍為 1 ~1,其主要由雙曲正弦函數 cosh 組成,其函數表達式可以表示為:( ) ( )x xx xe ef x tanh xe e 函數圖像如圖 2-4 所示:
圖 2-5 ReLU 函數Figure 2-5 ReLU function視化網絡可以學習圖像的高級特征,Zeiler 等[12]提出反卷積神絡模型提取的圖像特征進行可視化。如圖 2-6 所示,其為特征的特征可視化示意圖,由圖可以看出,隨著卷積神經特征更為復雜、更為抽象,淺層神經網絡提取的邊緣、輪絡提取的為抽象復雜的紋理信息。
【參考文獻】:
期刊論文
[1]基于主成分分析網絡的改進圖像分類算法[J]. 趙小虎,尹良飛,朱亞楠,劉鵬,王學奎,沈雪茹. 激光與光電子學進展. 2019(02)
[2]圖像的文本描述方法研究綜述[J]. 馬龍龍,韓先培,孫樂. 中文信息學報. 2018(04)
[3]基于全文檢索的文本相似度算法應用研究[J]. 王格,吳釗,李向. 計算機與數字工程. 2016(04)
[4]智能分析預警技術在視頻監(jiān)控系統(tǒng)中的應用[J]. 陳貴平. 煤礦機械. 2014(02)
[5]基于視覺特性的井下圖像去噪新方法[J]. 浦江,姜代紅. 河北大學學報(自然科學版). 2014(01)
博士論文
[1]基于關注度機制的圖像理解[D]. 郭聰.中國科學技術大學 2018
[2]煤礦監(jiān)控圖像拼接與識別的方法研究[D]. 姜代紅.中國礦業(yè)大學 2015
[3]井下環(huán)境中運動目標檢測與跟蹤研究[D]. 張辰.中國礦業(yè)大學 2014
碩士論文
[1]基于深度學習的視覺內容描述技術研究[D]. 李林科.電子科技大學 2018
[2]基于語句相似度的中文文本復制檢測技術研究[D]. 張慧云.北京郵電大學 2015
[3]基于鏈接文本相似度和時間因子的Web挖掘算法[D]. 李林洋.哈爾濱工程大學 2013
[4]基于快速相似度的Web結構挖掘的研究[D]. 馬燕.南京信息工程大學 2011
本文編號:3028883
本文鏈接:http://sikaile.net/kejilunwen/kuangye/3028883.html
最近更新
教材專著