一種聯(lián)合文本和圖像信息的行人檢測方法
本文關(guān)鍵詞: 行人檢測 馬爾科夫隨機(jī)場 文本-圖像信息聯(lián)合 共指關(guān)系 指代消解 出處:《電子學(xué)報(bào)》2017年01期 論文類型:期刊論文
【摘要】:針對純視覺行人檢測方法存在的誤檢、漏檢率高,遮擋目標(biāo)以及小尺度目標(biāo)檢測精度低等問題,提出一種聯(lián)合文本和圖像信息的行人檢測方法.該方法首先利用圖像分析的方法初步獲取圖像目標(biāo)的候選框,其次通過文本分析的方法獲取文本中有關(guān)圖像目標(biāo)的實(shí)體表達(dá),并提出一種基于馬爾科夫隨機(jī)場的模型用于推斷圖像候選框與文本實(shí)體表達(dá)之間的共指關(guān)系(Coreference Relation),以此達(dá)到聯(lián)合圖像和文本信息以輔助機(jī)器視覺提高交通場景下行人檢測精度的目的.在增加了圖像文本描述的加州理工大學(xué)行人檢測數(shù)據(jù)集上進(jìn)行的測評結(jié)果表明,該方法不僅可以在圖像信息的基礎(chǔ)上聯(lián)合文本信息提高交通場景中的行人檢測精度,也能在文本信息的基礎(chǔ)上聯(lián)合圖像信息提高文本中的指代消解(Anaphora Resolution)精度.
[Abstract]:Aiming at the problems of false detection, high missed detection rate, low precision of occluding target and small scale target detection in pure vision pedestrian detection method, A pedestrian detection method combining text and image information is proposed in this paper. Firstly, image analysis is used to obtain the candidate frame of the image target, and then the entity expression of the image object in the text is obtained by the method of text analysis. A model based on Markov random field is proposed to infer the coreference relation between image candidate box and text entity expression, so as to combine image and text information to assist machine vision to improve the downlink of traffic scene. The purpose of human detection accuracy. The result of the test on the pedestrian detection data set of California University of Technology, which has added the image and text description, shows that, This method can not only combine text information with image information to improve pedestrian detection accuracy in traffic scene, but also improve anaphora resolution accuracy on the basis of text information.
【作者單位】: 武漢大學(xué)軟件國家重點(diǎn)實(shí)驗(yàn)室;武漢大學(xué)計(jì)算機(jī)學(xué)院;湖南大學(xué)電氣與信息工程學(xué)院;
【基金】:國家自然科學(xué)基金(No.61272274);國家自然科學(xué)基金青年項(xiàng)目(No.61402340) 湖北省自然科學(xué)基金(No.2014CFB194)
【分類號】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 奚惠寧;任蕊;;判斷有關(guān)醫(yī)學(xué)圖像專利申請是否為非授權(quán)客體[J];電視技術(shù);2013年S2期
2 韓雙旺;崔兆順;李德錄;李芙蓉;;基于閾值的彩色目標(biāo)圖像的提取與測量[J];自動化與儀器儀表;2010年03期
3 林靜;王薇婕;關(guān)丹丹;景軍鋒;;基于浮雕圖像的3D浮雕效果實(shí)現(xiàn)[J];微型機(jī)與應(yīng)用;2012年11期
4 李敏潔;魏仲慧;何昕;;基于FPGA的多功能圖像目標(biāo)發(fā)生器的設(shè)計(jì)與實(shí)現(xiàn)[J];微計(jì)算機(jī)信息;2005年25期
5 韓雙旺;崔兆順;鮑麗紅;李德錄;;基于目標(biāo)圖像的提取與測量[J];上海工程技術(shù)大學(xué)學(xué)報(bào);2007年04期
6 劉進(jìn);孫婧;徐正全;顧鑫;;基于目標(biāo)的圖像輕量級加密[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年06期
7 于明;王倩;郭迎春;;一種圖像的顯著區(qū)域提取方法[J];光電工程;2012年08期
8 郭旭平,李在銘;圖像目標(biāo)的可視識別與智能跟蹤[J];系統(tǒng)工程與電子技術(shù);1998年08期
9 王成;張劍戈;江旭峰;章魯;;基于知識的三維核醫(yī)學(xué)圖像左心室心肌區(qū)的提取[J];中國生物醫(yī)學(xué)工程學(xué)報(bào);2007年01期
10 衛(wèi)穎奇;彭進(jìn)業(yè);張漢寧;;個性化圖像推薦及可視化研究[J];計(jì)算機(jī)工程;2011年02期
相關(guān)會議論文 前5條
1 張林怡;王運(yùn)鋒;王建國;;分維數(shù)在SAR圖像海岸線檢測中的應(yīng)用研究[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
2 李吉成;魯新平;楊衛(wèi)平;張志龍;高穎慧;沈振康;;圖像目標(biāo)的自動識別和快速篩選技術(shù)[A];2006年全國光電技術(shù)學(xué)術(shù)交流會會議文集(D 光電信息處理技術(shù)專題)[C];2006年
3 佘二永;;SAR圖像目標(biāo)解譯技術(shù)分析[A];第九屆全國信息獲取與處理學(xué)術(shù)會議論文集Ⅰ[C];2011年
4 趙朝杰;朱虹;黎璐;董敏;袁承興;;基于內(nèi)容感知的圖像非等比例縮放[A];第十四屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2008年
5 奚惠寧;;淺談有關(guān)醫(yī)學(xué)圖像的專利申請如何判斷是否是非授權(quán)客體[A];2013年中華全國專利代理人協(xié)會年會暨第四屆知識產(chǎn)權(quán)論壇論文匯編第二部分[C];2013年
相關(guān)博士學(xué)位論文 前10條
1 錢智明;面向圖像標(biāo)注的張量表示與語義建模方法研究[D];國防科學(xué)技術(shù)大學(xué);2015年
2 鄧劍勛;多示例圖像檢索算法研究及在人臉識別中的應(yīng)用[D];重慶大學(xué);2012年
3 王亮申;圖像特征提取及基于內(nèi)容圖像數(shù)據(jù)庫檢索理論和方法研究[D];大連理工大學(xué);2002年
4 魏波;點(diǎn)時(shí)空約束圖像目標(biāo)跟蹤理論與實(shí)時(shí)實(shí)現(xiàn)技術(shù)研究[D];電子科技大學(xué);2000年
5 劉俊;基于鉬靶圖像的計(jì)算機(jī)輔助乳腺癌檢測系統(tǒng)中關(guān)鍵技術(shù)研究[D];武漢科技大學(xué);2012年
6 付華柱;圖像協(xié)同關(guān)聯(lián)性約束的研究與應(yīng)用[D];天津大學(xué);2013年
7 廖宜濤;基于圖像與光譜信息的豬肉品質(zhì)在線無損檢測研究[D];浙江大學(xué);2011年
8 陳海林;基于判別學(xué)習(xí)的圖像目標(biāo)分類研究[D];中國科學(xué)技術(shù)大學(xué);2009年
9 王洪元;圖像動態(tài)分析中的若干智能化方法研究[D];南京理工大學(xué);2004年
10 徐麗;面向圖像標(biāo)記的條件隨機(jī)場模型研究[D];長安大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 徐衍魯;基于改進(jìn)的K-means和層次聚類方法的詞袋模型研究[D];上海師范大學(xué);2015年
2 甘洪涌;SAR圖像自動目標(biāo)識別算法研究[D];哈爾濱理工大學(xué);2014年
3 張玉營;基于認(rèn)知理論的高分辨率PolSAR圖像目標(biāo)解譯算法研究[D];哈爾濱工業(yè)大學(xué);2015年
4 王帥;視頻中扇貝圖像的檢測與定位研究[D];大連海洋大學(xué);2015年
5 李偉;改進(jìn)的主顏色提取方法及自適應(yīng)權(quán)重圖像檢索算法研究[D];華中師范大學(xué);2015年
6 李星云;碼垛機(jī)器人視覺控制關(guān)鍵技術(shù)的研究[D];西南科技大學(xué);2015年
7 梁,
本文編號:1518360
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1518360.html