基于改進RBF神經(jīng)網(wǎng)絡的視頻檢索算法研究
【學位單位】:北京建筑大學
【學位級別】:碩士
【學位年份】:2020
【中圖分類】:TP391.41;TP183
【部分圖文】:
第1章緒論2圖1-1視頻檢索流程圖Figure1-1Videoretrievalflowchart基于深度學習的方法是近幾年隨著計算機硬件的發(fā)展以及算法優(yōu)化性的提升而提出的,深度學習更多應用在圖像檢索領域,當前已經(jīng)取得了很大的成就,例如AlexNet[4]、VGG[5]、Faster-Rcnn[6]等;谏疃葘W習的視頻檢索方法是在圖像檢索方法上拓展而來的,由于視頻數(shù)據(jù)量龐大,深度學習方法會使得計算成本增高。本論文的研究過程首先復現(xiàn)了視頻檢索領域成熟的代碼,發(fā)現(xiàn)當前雖然檢索算法豐富,檢索效果理想,但是大多數(shù)只是停留在軟件實現(xiàn)上,導致檢索系統(tǒng)應用環(huán)境有限制并且計算能力容易遇到瓶頸,其原因主要有以下幾個方面,一視頻數(shù)據(jù)規(guī)模十分龐大,無論是基于內(nèi)容還是深度學習的檢索方法,都需要進行復雜的計算,因此在硬件化的過程中會導致耗能巨大,因此需要在檢索結果維持不變的基礎上,對算法進行簡化以便于硬件的實現(xiàn);二是因為目前市面上的神經(jīng)網(wǎng)絡芯片成本高,靈活性差,常用的CPU和GPU在計算能力上略顯不足[7]。將視頻檢索技術硬件實現(xiàn)后,可以利用硬件并行計算的能力,提升系統(tǒng)整體運行速度以及計算能力。因此,研究出一種實用性強、計算能力高的深度學習芯片成為當前的研究熱點。1.2國內(nèi)外研究現(xiàn)狀目前,國外對視頻檢索領域研究開展較早,其中比較經(jīng)典的視頻檢索系統(tǒng)有:(1)QBIC(QueryByImageContent)QBIC[8]圖像視頻檢索系統(tǒng)是第一個基于內(nèi)容的商業(yè)化圖像視頻檢索系統(tǒng),是由IBM公所于90年代研發(fā)的項目。QBIC系統(tǒng)可以提取待查詢圖像的顏色、紋理、形狀等特征,其中顏色特征有色彩分布、色彩百分比等;紋理特征結合了對比度、方向性以及粗糙度等屬性;形狀特征包含了面積、偏心度和圓形度等概念。正是由于QBIC系統(tǒng)提取的圖像特征不同,其提供了很多的查詢方式,例如?
第1章緒論5圖1-2系統(tǒng)研究路線圖Figure1-2Systemresearchroadmap論文研究方案如下:1)提取中心向量方案在進行提取中心向量之前需要對圖片進行切片操作,使用VOC數(shù)據(jù)集作為訓練集,利用多級KNN算法對切片進行中心向量的提取,將提取出的中心向量保存為中心向量集中。2)特征提取方案在視頻檢索或者圖像檢索中特征提取是關鍵步驟,特征提取需要對圖像庫中的圖像以及待檢索圖像進行切片操作,之后通過與保存在改進RBF神經(jīng)網(wǎng)絡中間層的中心向量進行距離計算,根據(jù)得到的距離值用中心向量替換,替換得到圖稱為向量構成圖,再利用標簽向量進行編碼得到標簽構成圖。3)相似度匹配方案本方案主要研究對標簽構成圖的相似度匹配內(nèi)容,通過比對兩個標簽構成圖相似概率并與閾值進行比較,通過標簽向量完成相似圖片的檢索以及中心向量集的更新。1.4論文結構全文共分為五章,每章論文內(nèi)容安排如下:第一章為緒論,主要內(nèi)容為本論文的研究背景及意義,以及國內(nèi)外在視頻檢索領域的研究現(xiàn)狀,之后對本論文的研究內(nèi)容和論文結構進行分析。第二章是對視頻檢索算法進行概述,首先說明了視頻數(shù)據(jù)的特點,并且按照結構將視頻分為四層,之后從鏡頭邊界檢測、關鍵幀提娶特征提取和相似度計算這幾個角度
第2章視頻檢索算法概述7第2章視頻檢索算法概述視頻在日常生活中被廣泛使用,視頻數(shù)據(jù)規(guī)模也隨著科學技術的發(fā)展不斷擴大,學者們對于視頻檢索技術的研究也越發(fā)深入。本章對現(xiàn)有視頻檢索技術進行綜述,總結歸納國內(nèi)外對視頻檢索技術的研究現(xiàn)狀,分析當前方法與技術存在的不足之處,并且為本論文接下來的研究打下基矗2.1視頻數(shù)據(jù)的特點視頻是一種復雜的數(shù)據(jù)流,包含文本、聲音、圖像于一體,視頻不僅有靜態(tài)信息,還包含動態(tài)信息,視頻可以表現(xiàn)出事物發(fā)生的空間和時間信息[16]。因此,由于視頻具有復雜的特性,對視頻處理比較繁瑣和費時,需要提前對視頻進行結構化處理,再進行后續(xù)操作。視頻結構可以分為四層,自上而下分別為視頻層、場景層、鏡頭層和圖像幀,如圖2-1所示。視頻層包含n組場景,每組場景包含文本、聲音和圖像信息構成了我們觀看的視頻;場景層可以看作多組相同鏡頭的組合,每一個場景包含相同的鏡頭;鏡頭指的是攝像機在不切鏡的情況下持續(xù)拍出的內(nèi)容,而鏡頭又可以被分割成一幀一幀的圖像,一個鏡頭內(nèi)的幀具有相同的特征,區(qū)別僅僅是微小的變化,若幀與下一幀特征出現(xiàn)較大的變化,則認為進行了鏡頭的切換,由于視頻數(shù)據(jù)量龐大,往往需要在眾多的幀中提取出關鍵幀來代表這一鏡頭,從而簡化對視頻操作的復雜程度。圖2-1視頻數(shù)據(jù)結構Figure2-1Videodatastructure視頻數(shù)據(jù)具有數(shù)據(jù)量大和語義信息復雜的特點,數(shù)據(jù)量大是視頻與其他數(shù)據(jù)明顯的區(qū)別,正是因為這個特點當前對于視頻數(shù)據(jù)的處理比較復雜。視頻數(shù)據(jù)具有數(shù)據(jù)規(guī)模大以及類型繁多的特點,在當前大數(shù)據(jù)背景下視頻數(shù)據(jù)起始計量單位至少是1000個T
【相似文獻】
相關期刊論文 前10條
1 沙莎,羅巍,羅三定;基于重心向量分類算法的概念特征提取方法[J];計算機工程;2005年14期
2 趙捷,華玫;心電心向量同步儀的研制[J];山東生物醫(yī)學工程;1994年01期
3 ;什么叫心向量?什么是心向量圖?[J];江蘇醫(yī)藥;1981年01期
4 李元誠;楊瑞仙;;用于短期風速預測的優(yōu)化核心向量回歸模型[J];中國電力;2012年03期
5 薛貞霞;劉三陽;齊小剛;;基于殼向量和中心向量的支持向量機[J];數(shù)據(jù)采集與處理;2009年03期
6 潘淵;李弼程;張先飛;;一種基于自適應重心向量的主題檢測方法[J];計算機工程;2009年03期
7 王偉;;基于最小距離的多中心向量的增量分類算法[J];電腦知識與技術;2015年04期
8 李元誠;劉克文;;面向大規(guī)模樣本的核心向量回歸電力負荷快速預測方法[J];中國電機工程學報;2010年28期
9 何濤;王桂芳;馬廷燦;;基于類中心向量的論文作者歸屬機構自動識別方法研究[J];情報學報;2019年07期
10 焦方惠;;心電圖與心向量聯(lián)合檢查對心肌缺血診斷的價值[J];中國實用醫(yī)藥;2011年35期
相關博士學位論文 前10條
1 曾祥萍;自適應組合RBF濾波器理論及其應用研究[D];西南交通大學;2013年
2 羅紹華;基于RBF網(wǎng)絡逼近的機器人自適應動態(tài)面控制方法研究[D];重慶大學;2013年
3 趙斌;基于RBF網(wǎng)絡的北方溫室溫濕度控制機理的研究[D];東北林業(yè)大學;2010年
4 牟洪波;基于BP和RBF神經(jīng)網(wǎng)絡的木材缺陷檢測研究[D];東北林業(yè)大學;2010年
5 顧志偉;面向結構化數(shù)據(jù)的視頻檢索研究[D];中國科學技術大學;2008年
6 郝艷賓;基于嵌入學習的近重復視頻檢索和跨域情感分類研究[D];合肥工業(yè)大學;2017年
7 肖理業(yè);基于機器學習的電磁場建模與設計研究[D];電子科技大學;2019年
8 陳涵瀛;核電站熱工水力系統(tǒng)工況預測與診斷方法研究[D];哈爾濱工程大學;2018年
9 梁智杰;聾啞人手語識別關鍵技術研究[D];華中師范大學;2019年
10 劉昂;微結構硅基光子學器件性能的研究[D];南京大學;2019年
相關碩士學位論文 前10條
1 董博晨;基于改進RBF神經(jīng)網(wǎng)絡的視頻檢索算法研究[D];北京建筑大學;2020年
2 趙新苗;基于中心向量的聚類算法在農(nóng)業(yè)信息分類中的研究與應用[D];新疆農(nóng)業(yè)大學;2016年
3 汪鑫;基于RBF神經(jīng)網(wǎng)絡的人體顱頜面多元特征信息提取技術研究[D];重慶理工大學;2013年
4 胡波;基于模糊RBF神經(jīng)網(wǎng)絡的人臉識別系統(tǒng)研究[D];長沙理工大學;2010年
5 王偉;基于最小距離的多中心向量的增量分類算法研究[D];南京財經(jīng)大學;2015年
6 方琳;基于自適應重心向量的話題檢測研究[D];東北師范大學;2013年
7 李彩玉;基于RBF神經(jīng)網(wǎng)絡的心電信號分類識別技術研究[D];云南大學;2012年
8 黃金龍;基于改進RBF神經(jīng)網(wǎng)絡的模擬電路故障診斷技術研究[D];重慶大學;2014年
9 李燕強;模糊RBF神經(jīng)網(wǎng)絡在人臉識別的應用研究[D];廣州大學;2011年
10 馬濤;基于模糊控制RBF神經(jīng)網(wǎng)絡短期負荷預測的研究[D];西安科技大學;2009年
本文編號:2888308
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2888308.html