天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于改進RBF神經(jīng)網(wǎng)絡的視頻檢索算法研究

發(fā)布時間:2020-11-18 04:05
   近年來,隨著計算機和網(wǎng)絡通信技術不斷發(fā)展,視頻作為信息傳播的媒介受到越來越多的關注。如何在海量視頻數(shù)據(jù)中快速準確地查找出人們所需要的視頻內(nèi)容成為當前的研究重點。視頻檢索技術目前主要有基于文本的方法、基于內(nèi)容的方法以及基于深度學習的方法。其中,目前檢索效果最好的是基于深度學習的方法,其最具有代表性的是VGG16和Alexnet算法。但是,基于深度學習的神經(jīng)網(wǎng)絡算法都存在以下幾種問題:參數(shù)過多,在訓練數(shù)據(jù)有限的情況下,會產(chǎn)生過擬合現(xiàn)象;網(wǎng)絡結構復雜,計算復雜度大,對于硬件需求過高;網(wǎng)絡結構越深,容易出現(xiàn)梯度彌散的問題,導致模型的優(yōu)化較為困難。針對以上問題,本論文提出一種基于圖像切片的圖像識別算法,采用多級KNN算法構建中心向量,利用中心向量代替卷積神經(jīng)網(wǎng)絡作為特征提取的主要方法,并將乘法運算替換為加法運算,可以有效減少神經(jīng)網(wǎng)絡參數(shù)過多以及結構復雜所帶來的問題;其次采用類詞袋模型的相似度比對算法進行圖片識別,本論文對中心向量進行編碼后,根據(jù)編碼構建待檢索圖像和圖像庫中圖像的標簽向量,之后通過比對兩者的標簽向量進行圖像識別的操作。本論文在特征提取部分提出了一種多級類KNN算法,算法每次從待檢索圖片特征向量中取出一條切片向量,用該向量與所保存的所有中心向量進行曼哈頓距離計算。若某一個中心向量與待檢索圖片切片向量距離接近,則可說明二者內(nèi)容相似,則用中心向量替換待檢索圖片切片。若待檢索圖片切片向量距離均大于所設定的閾值,表明當前保存的切片均不和待檢索圖片切片相似,則自動將該切片作為新的中心向量加入所保存的切片向量集中,從而增大中心向量類別的覆蓋范圍。對于得到的中心向量集,本論文與基于kmeans聚類方法得到的中心向量進行對比實驗,將得到的替換后的圖片進行復原,與原圖進行曼哈頓距離計算。經(jīng)過實驗證明,本論文提出的方法復原后與原圖比對得到的單一像素曼哈頓距離比聚類算法得到的距離絕對值少0.0002,所需要的訓練圖片數(shù)量比聚類方法節(jié)省50%左右。在相似度比對部分,本論文提出一種類似于詞袋模型的標簽向量比對算法。該算法首先遍歷所有中心向量,并以“圖像名_起始行數(shù)_起始列數(shù)_終止行數(shù)_終止列數(shù)_通道號_id”的格式進行編號,使每一個中心向量切片都有唯一的id。將圖像庫和待檢索圖像的所有圖像切片用與其曼哈頓距離最近的中心向量的id進行代替,得到圖像的標簽向量,之后利用標簽向量進行比對。若待檢索圖像的圖像切片不屬于任何中心向量,則自動將該切片保存在中心向量集中,使得系統(tǒng)具有邊訓練邊學習的能力。最后在系統(tǒng)實現(xiàn)方面,本論文將所提出的算法引入視頻檢索系統(tǒng)中,證明了算法的可行性,并與基于VGG16和Alexnet網(wǎng)絡的視頻檢索技術進行實驗比對。在相同平臺下,以本文所提出算法為基礎構建的系統(tǒng),整體運行時間相比于目前通用的基于深度學習的視頻檢索算法節(jié)省了30%,并且檢索準確率提升了1%。因此,本論文所提出的算法能夠為后期視頻檢索硬件系統(tǒng)開發(fā)打下基礎。
【學位單位】:北京建筑大學
【學位級別】:碩士
【學位年份】:2020
【中圖分類】:TP391.41;TP183
【部分圖文】:

流程圖,視頻檢索,流程圖


第1章緒論2圖1-1視頻檢索流程圖Figure1-1Videoretrievalflowchart基于深度學習的方法是近幾年隨著計算機硬件的發(fā)展以及算法優(yōu)化性的提升而提出的,深度學習更多應用在圖像檢索領域,當前已經(jīng)取得了很大的成就,例如AlexNet[4]、VGG[5]、Faster-Rcnn[6]等;谏疃葘W習的視頻檢索方法是在圖像檢索方法上拓展而來的,由于視頻數(shù)據(jù)量龐大,深度學習方法會使得計算成本增高。本論文的研究過程首先復現(xiàn)了視頻檢索領域成熟的代碼,發(fā)現(xiàn)當前雖然檢索算法豐富,檢索效果理想,但是大多數(shù)只是停留在軟件實現(xiàn)上,導致檢索系統(tǒng)應用環(huán)境有限制并且計算能力容易遇到瓶頸,其原因主要有以下幾個方面,一視頻數(shù)據(jù)規(guī)模十分龐大,無論是基于內(nèi)容還是深度學習的檢索方法,都需要進行復雜的計算,因此在硬件化的過程中會導致耗能巨大,因此需要在檢索結果維持不變的基礎上,對算法進行簡化以便于硬件的實現(xiàn);二是因為目前市面上的神經(jīng)網(wǎng)絡芯片成本高,靈活性差,常用的CPU和GPU在計算能力上略顯不足[7]。將視頻檢索技術硬件實現(xiàn)后,可以利用硬件并行計算的能力,提升系統(tǒng)整體運行速度以及計算能力。因此,研究出一種實用性強、計算能力高的深度學習芯片成為當前的研究熱點。1.2國內(nèi)外研究現(xiàn)狀目前,國外對視頻檢索領域研究開展較早,其中比較經(jīng)典的視頻檢索系統(tǒng)有:(1)QBIC(QueryByImageContent)QBIC[8]圖像視頻檢索系統(tǒng)是第一個基于內(nèi)容的商業(yè)化圖像視頻檢索系統(tǒng),是由IBM公所于90年代研發(fā)的項目。QBIC系統(tǒng)可以提取待查詢圖像的顏色、紋理、形狀等特征,其中顏色特征有色彩分布、色彩百分比等;紋理特征結合了對比度、方向性以及粗糙度等屬性;形狀特征包含了面積、偏心度和圓形度等概念。正是由于QBIC系統(tǒng)提取的圖像特征不同,其提供了很多的查詢方式,例如?

路線圖,路線圖,向量


第1章緒論5圖1-2系統(tǒng)研究路線圖Figure1-2Systemresearchroadmap論文研究方案如下:1)提取中心向量方案在進行提取中心向量之前需要對圖片進行切片操作,使用VOC數(shù)據(jù)集作為訓練集,利用多級KNN算法對切片進行中心向量的提取,將提取出的中心向量保存為中心向量集中。2)特征提取方案在視頻檢索或者圖像檢索中特征提取是關鍵步驟,特征提取需要對圖像庫中的圖像以及待檢索圖像進行切片操作,之后通過與保存在改進RBF神經(jīng)網(wǎng)絡中間層的中心向量進行距離計算,根據(jù)得到的距離值用中心向量替換,替換得到圖稱為向量構成圖,再利用標簽向量進行編碼得到標簽構成圖。3)相似度匹配方案本方案主要研究對標簽構成圖的相似度匹配內(nèi)容,通過比對兩個標簽構成圖相似概率并與閾值進行比較,通過標簽向量完成相似圖片的檢索以及中心向量集的更新。1.4論文結構全文共分為五章,每章論文內(nèi)容安排如下:第一章為緒論,主要內(nèi)容為本論文的研究背景及意義,以及國內(nèi)外在視頻檢索領域的研究現(xiàn)狀,之后對本論文的研究內(nèi)容和論文結構進行分析。第二章是對視頻檢索算法進行概述,首先說明了視頻數(shù)據(jù)的特點,并且按照結構將視頻分為四層,之后從鏡頭邊界檢測、關鍵幀提娶特征提取和相似度計算這幾個角度

數(shù)據(jù)結構圖,視頻,數(shù)據(jù)結構,鏡頭


第2章視頻檢索算法概述7第2章視頻檢索算法概述視頻在日常生活中被廣泛使用,視頻數(shù)據(jù)規(guī)模也隨著科學技術的發(fā)展不斷擴大,學者們對于視頻檢索技術的研究也越發(fā)深入。本章對現(xiàn)有視頻檢索技術進行綜述,總結歸納國內(nèi)外對視頻檢索技術的研究現(xiàn)狀,分析當前方法與技術存在的不足之處,并且為本論文接下來的研究打下基矗2.1視頻數(shù)據(jù)的特點視頻是一種復雜的數(shù)據(jù)流,包含文本、聲音、圖像于一體,視頻不僅有靜態(tài)信息,還包含動態(tài)信息,視頻可以表現(xiàn)出事物發(fā)生的空間和時間信息[16]。因此,由于視頻具有復雜的特性,對視頻處理比較繁瑣和費時,需要提前對視頻進行結構化處理,再進行后續(xù)操作。視頻結構可以分為四層,自上而下分別為視頻層、場景層、鏡頭層和圖像幀,如圖2-1所示。視頻層包含n組場景,每組場景包含文本、聲音和圖像信息構成了我們觀看的視頻;場景層可以看作多組相同鏡頭的組合,每一個場景包含相同的鏡頭;鏡頭指的是攝像機在不切鏡的情況下持續(xù)拍出的內(nèi)容,而鏡頭又可以被分割成一幀一幀的圖像,一個鏡頭內(nèi)的幀具有相同的特征,區(qū)別僅僅是微小的變化,若幀與下一幀特征出現(xiàn)較大的變化,則認為進行了鏡頭的切換,由于視頻數(shù)據(jù)量龐大,往往需要在眾多的幀中提取出關鍵幀來代表這一鏡頭,從而簡化對視頻操作的復雜程度。圖2-1視頻數(shù)據(jù)結構Figure2-1Videodatastructure視頻數(shù)據(jù)具有數(shù)據(jù)量大和語義信息復雜的特點,數(shù)據(jù)量大是視頻與其他數(shù)據(jù)明顯的區(qū)別,正是因為這個特點當前對于視頻數(shù)據(jù)的處理比較復雜。視頻數(shù)據(jù)具有數(shù)據(jù)規(guī)模大以及類型繁多的特點,在當前大數(shù)據(jù)背景下視頻數(shù)據(jù)起始計量單位至少是1000個T
【相似文獻】

相關期刊論文 前10條

1 沙莎,羅巍,羅三定;基于重心向量分類算法的概念特征提取方法[J];計算機工程;2005年14期

2 趙捷,華玫;心電心向量同步儀的研制[J];山東生物醫(yī)學工程;1994年01期

3 ;什么叫心向量?什么是心向量圖?[J];江蘇醫(yī)藥;1981年01期

4 李元誠;楊瑞仙;;用于短期風速預測的優(yōu)化核心向量回歸模型[J];中國電力;2012年03期

5 薛貞霞;劉三陽;齊小剛;;基于殼向量和中心向量的支持向量機[J];數(shù)據(jù)采集與處理;2009年03期

6 潘淵;李弼程;張先飛;;一種基于自適應重心向量的主題檢測方法[J];計算機工程;2009年03期

7 王偉;;基于最小距離的多中心向量的增量分類算法[J];電腦知識與技術;2015年04期

8 李元誠;劉克文;;面向大規(guī)模樣本的核心向量回歸電力負荷快速預測方法[J];中國電機工程學報;2010年28期

9 何濤;王桂芳;馬廷燦;;基于類中心向量的論文作者歸屬機構自動識別方法研究[J];情報學報;2019年07期

10 焦方惠;;心電圖與心向量聯(lián)合檢查對心肌缺血診斷的價值[J];中國實用醫(yī)藥;2011年35期


相關博士學位論文 前10條

1 曾祥萍;自適應組合RBF濾波器理論及其應用研究[D];西南交通大學;2013年

2 羅紹華;基于RBF網(wǎng)絡逼近的機器人自適應動態(tài)面控制方法研究[D];重慶大學;2013年

3 趙斌;基于RBF網(wǎng)絡的北方溫室溫濕度控制機理的研究[D];東北林業(yè)大學;2010年

4 牟洪波;基于BP和RBF神經(jīng)網(wǎng)絡的木材缺陷檢測研究[D];東北林業(yè)大學;2010年

5 顧志偉;面向結構化數(shù)據(jù)的視頻檢索研究[D];中國科學技術大學;2008年

6 郝艷賓;基于嵌入學習的近重復視頻檢索和跨域情感分類研究[D];合肥工業(yè)大學;2017年

7 肖理業(yè);基于機器學習的電磁場建模與設計研究[D];電子科技大學;2019年

8 陳涵瀛;核電站熱工水力系統(tǒng)工況預測與診斷方法研究[D];哈爾濱工程大學;2018年

9 梁智杰;聾啞人手語識別關鍵技術研究[D];華中師范大學;2019年

10 劉昂;微結構硅基光子學器件性能的研究[D];南京大學;2019年


相關碩士學位論文 前10條

1 董博晨;基于改進RBF神經(jīng)網(wǎng)絡的視頻檢索算法研究[D];北京建筑大學;2020年

2 趙新苗;基于中心向量的聚類算法在農(nóng)業(yè)信息分類中的研究與應用[D];新疆農(nóng)業(yè)大學;2016年

3 汪鑫;基于RBF神經(jīng)網(wǎng)絡的人體顱頜面多元特征信息提取技術研究[D];重慶理工大學;2013年

4 胡波;基于模糊RBF神經(jīng)網(wǎng)絡的人臉識別系統(tǒng)研究[D];長沙理工大學;2010年

5 王偉;基于最小距離的多中心向量的增量分類算法研究[D];南京財經(jīng)大學;2015年

6 方琳;基于自適應重心向量的話題檢測研究[D];東北師范大學;2013年

7 李彩玉;基于RBF神經(jīng)網(wǎng)絡的心電信號分類識別技術研究[D];云南大學;2012年

8 黃金龍;基于改進RBF神經(jīng)網(wǎng)絡的模擬電路故障診斷技術研究[D];重慶大學;2014年

9 李燕強;模糊RBF神經(jīng)網(wǎng)絡在人臉識別的應用研究[D];廣州大學;2011年

10 馬濤;基于模糊控制RBF神經(jīng)網(wǎng)絡短期負荷預測的研究[D];西安科技大學;2009年



本文編號:2888308

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2888308.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶3cc3b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com