一種聯(lián)合文本和圖像信息的行人檢測(cè)方法
本文關(guān)鍵詞: 行人檢測(cè) 馬爾科夫隨機(jī)場(chǎng) 文本-圖像信息聯(lián)合 共指關(guān)系 指代消解 出處:《電子學(xué)報(bào)》2017年01期 論文類(lèi)型:期刊論文
【摘要】:針對(duì)純視覺(jué)行人檢測(cè)方法存在的誤檢、漏檢率高,遮擋目標(biāo)以及小尺度目標(biāo)檢測(cè)精度低等問(wèn)題,提出一種聯(lián)合文本和圖像信息的行人檢測(cè)方法.該方法首先利用圖像分析的方法初步獲取圖像目標(biāo)的候選框,其次通過(guò)文本分析的方法獲取文本中有關(guān)圖像目標(biāo)的實(shí)體表達(dá),并提出一種基于馬爾科夫隨機(jī)場(chǎng)的模型用于推斷圖像候選框與文本實(shí)體表達(dá)之間的共指關(guān)系(Coreference Relation),以此達(dá)到聯(lián)合圖像和文本信息以輔助機(jī)器視覺(jué)提高交通場(chǎng)景下行人檢測(cè)精度的目的.在增加了圖像文本描述的加州理工大學(xué)行人檢測(cè)數(shù)據(jù)集上進(jìn)行的測(cè)評(píng)結(jié)果表明,該方法不僅可以在圖像信息的基礎(chǔ)上聯(lián)合文本信息提高交通場(chǎng)景中的行人檢測(cè)精度,也能在文本信息的基礎(chǔ)上聯(lián)合圖像信息提高文本中的指代消解(Anaphora Resolution)精度.
[Abstract]:Aiming at the problems of false detection, high missed detection rate, low precision of occluding target and small scale target detection in pure vision pedestrian detection method, A pedestrian detection method combining text and image information is proposed in this paper. Firstly, image analysis is used to obtain the candidate frame of the image target, and then the entity expression of the image object in the text is obtained by the method of text analysis. A model based on Markov random field is proposed to infer the coreference relation between image candidate box and text entity expression, so as to combine image and text information to assist machine vision to improve the downlink of traffic scene. The purpose of human detection accuracy. The result of the test on the pedestrian detection data set of California University of Technology, which has added the image and text description, shows that, This method can not only combine text information with image information to improve pedestrian detection accuracy in traffic scene, but also improve anaphora resolution accuracy on the basis of text information.
【作者單位】: 武漢大學(xué)軟件國(guó)家重點(diǎn)實(shí)驗(yàn)室;武漢大學(xué)計(jì)算機(jī)學(xué)院;湖南大學(xué)電氣與信息工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(No.61272274);國(guó)家自然科學(xué)基金青年項(xiàng)目(No.61402340) 湖北省自然科學(xué)基金(No.2014CFB194)
【分類(lèi)號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 奚惠寧;任蕊;;判斷有關(guān)醫(yī)學(xué)圖像專(zhuān)利申請(qǐng)是否為非授權(quán)客體[J];電視技術(shù);2013年S2期
2 韓雙旺;崔兆順;李德錄;李芙蓉;;基于閾值的彩色目標(biāo)圖像的提取與測(cè)量[J];自動(dòng)化與儀器儀表;2010年03期
3 林靜;王薇婕;關(guān)丹丹;景軍鋒;;基于浮雕圖像的3D浮雕效果實(shí)現(xiàn)[J];微型機(jī)與應(yīng)用;2012年11期
4 李敏潔;魏仲慧;何昕;;基于FPGA的多功能圖像目標(biāo)發(fā)生器的設(shè)計(jì)與實(shí)現(xiàn)[J];微計(jì)算機(jī)信息;2005年25期
5 韓雙旺;崔兆順;鮑麗紅;李德錄;;基于目標(biāo)圖像的提取與測(cè)量[J];上海工程技術(shù)大學(xué)學(xué)報(bào);2007年04期
6 劉進(jìn);孫婧;徐正全;顧鑫;;基于目標(biāo)的圖像輕量級(jí)加密[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年06期
7 于明;王倩;郭迎春;;一種圖像的顯著區(qū)域提取方法[J];光電工程;2012年08期
8 郭旭平,李在銘;圖像目標(biāo)的可視識(shí)別與智能跟蹤[J];系統(tǒng)工程與電子技術(shù);1998年08期
9 王成;張劍戈;江旭峰;章魯;;基于知識(shí)的三維核醫(yī)學(xué)圖像左心室心肌區(qū)的提取[J];中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào);2007年01期
10 衛(wèi)穎奇;彭進(jìn)業(yè);張漢寧;;個(gè)性化圖像推薦及可視化研究[J];計(jì)算機(jī)工程;2011年02期
相關(guān)會(huì)議論文 前5條
1 張林怡;王運(yùn)鋒;王建國(guó);;分維數(shù)在SAR圖像海岸線(xiàn)檢測(cè)中的應(yīng)用研究[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
2 李吉成;魯新平;楊衛(wèi)平;張志龍;高穎慧;沈振康;;圖像目標(biāo)的自動(dòng)識(shí)別和快速篩選技術(shù)[A];2006年全國(guó)光電技術(shù)學(xué)術(shù)交流會(huì)會(huì)議文集(D 光電信息處理技術(shù)專(zhuān)題)[C];2006年
3 佘二永;;SAR圖像目標(biāo)解譯技術(shù)分析[A];第九屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集Ⅰ[C];2011年
4 趙朝杰;朱虹;黎璐;董敏;袁承興;;基于內(nèi)容感知的圖像非等比例縮放[A];第十四屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年
5 奚惠寧;;淺談?dòng)嘘P(guān)醫(yī)學(xué)圖像的專(zhuān)利申請(qǐng)如何判斷是否是非授權(quán)客體[A];2013年中華全國(guó)專(zhuān)利代理人協(xié)會(huì)年會(huì)暨第四屆知識(shí)產(chǎn)權(quán)論壇論文匯編第二部分[C];2013年
相關(guān)博士學(xué)位論文 前10條
1 錢(qián)智明;面向圖像標(biāo)注的張量表示與語(yǔ)義建模方法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2015年
2 鄧劍勛;多示例圖像檢索算法研究及在人臉識(shí)別中的應(yīng)用[D];重慶大學(xué);2012年
3 王亮申;圖像特征提取及基于內(nèi)容圖像數(shù)據(jù)庫(kù)檢索理論和方法研究[D];大連理工大學(xué);2002年
4 魏波;點(diǎn)時(shí)空約束圖像目標(biāo)跟蹤理論與實(shí)時(shí)實(shí)現(xiàn)技術(shù)研究[D];電子科技大學(xué);2000年
5 劉俊;基于鉬靶圖像的計(jì)算機(jī)輔助乳腺癌檢測(cè)系統(tǒng)中關(guān)鍵技術(shù)研究[D];武漢科技大學(xué);2012年
6 付華柱;圖像協(xié)同關(guān)聯(lián)性約束的研究與應(yīng)用[D];天津大學(xué);2013年
7 廖宜濤;基于圖像與光譜信息的豬肉品質(zhì)在線(xiàn)無(wú)損檢測(cè)研究[D];浙江大學(xué);2011年
8 陳海林;基于判別學(xué)習(xí)的圖像目標(biāo)分類(lèi)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年
9 王洪元;圖像動(dòng)態(tài)分析中的若干智能化方法研究[D];南京理工大學(xué);2004年
10 徐麗;面向圖像標(biāo)記的條件隨機(jī)場(chǎng)模型研究[D];長(zhǎng)安大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 徐衍魯;基于改進(jìn)的K-means和層次聚類(lèi)方法的詞袋模型研究[D];上海師范大學(xué);2015年
2 甘洪涌;SAR圖像自動(dòng)目標(biāo)識(shí)別算法研究[D];哈爾濱理工大學(xué);2014年
3 張玉營(yíng);基于認(rèn)知理論的高分辨率PolSAR圖像目標(biāo)解譯算法研究[D];哈爾濱工業(yè)大學(xué);2015年
4 王帥;視頻中扇貝圖像的檢測(cè)與定位研究[D];大連海洋大學(xué);2015年
5 李偉;改進(jìn)的主顏色提取方法及自適應(yīng)權(quán)重圖像檢索算法研究[D];華中師范大學(xué);2015年
6 李星云;碼垛機(jī)器人視覺(jué)控制關(guān)鍵技術(shù)的研究[D];西南科技大學(xué);2015年
7 梁,
本文編號(hào):1518360
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1518360.html