用于視頻內(nèi)容標(biāo)注的知識(shí)遷移方法
本文關(guān)鍵詞:用于視頻內(nèi)容標(biāo)注的知識(shí)遷移方法,由筆耕文化傳播整理發(fā)布。
【摘要】:現(xiàn)在人們經(jīng)常拍攝視頻來(lái)記錄生活中的片段。對(duì)這些普通用戶(hù)拍攝的視頻自動(dòng)地進(jìn)行內(nèi)容標(biāo)注已成為計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要問(wèn)題。視頻內(nèi)容標(biāo)注可以讓用戶(hù)更加方便的對(duì)視頻進(jìn)行管理和檢索,也可以應(yīng)用于智能視頻監(jiān)控。用戶(hù)拍攝的視頻內(nèi)容各種各樣,而且視頻畫(huà)面中也會(huì)發(fā)生抖動(dòng)和遮擋。同一類(lèi)視頻之間會(huì)有很大的差異,這使得視頻內(nèi)容標(biāo)注成為一個(gè)非常有挑戰(zhàn)性的問(wèn)題。傳統(tǒng)的視頻標(biāo)注方法需要人工收集和標(biāo)注大量的訓(xùn)練樣本,才能取得較好的效果。然而,收集和標(biāo)注訓(xùn)練樣是一項(xiàng)非常費(fèi)時(shí)費(fèi)力的工作。當(dāng)僅有少量標(biāo)注的訓(xùn)練樣本時(shí),傳統(tǒng)的標(biāo)注方法很難取得較好的泛化能力和魯棒性。近年來(lái)出現(xiàn)的遷移學(xué)習(xí)(transfer learning)方法能夠處理這個(gè)問(wèn)題。遷移學(xué)習(xí)可以利用不同但相關(guān)數(shù)據(jù)域(domain)中的數(shù)據(jù)來(lái)學(xué)習(xí)感興趣數(shù)據(jù)域上的分類(lèi)器。本文主要探討如何利用互聯(lián)網(wǎng)上的視頻(源域,source domain)來(lái)對(duì)用戶(hù)視頻(目標(biāo)域,target domain)中的事件進(jìn)行標(biāo)注。視頻搜索引擎已經(jīng)越來(lái)越成熟,可以借助它們從互聯(lián)網(wǎng)上得到大量的與檢索關(guān)鍵字相關(guān)的視頻。但這些視頻一般都經(jīng)過(guò)壓縮,畫(huà)面質(zhì)量比用戶(hù)視頻低很多,而且檢索到的一些視頻與檢索關(guān)鍵字并不相關(guān),導(dǎo)致網(wǎng)絡(luò)視頻和用戶(hù)視頻之間存在著很大的差異。所以直接使用網(wǎng)絡(luò)視頻來(lái)訓(xùn)練并不能得到很好的用戶(hù)視頻分類(lèi)器。本文提出一種多組領(lǐng)域適應(yīng)(Multi-group Adaptation)的方法,將網(wǎng)絡(luò)視頻根據(jù)語(yǔ)義劃分成不同組,為每組設(shè)置不同的權(quán)重系數(shù),來(lái)減輕不相關(guān)的網(wǎng)絡(luò)視頻在訓(xùn)練過(guò)程中產(chǎn)生的負(fù)面影響。當(dāng)存在多個(gè)事件類(lèi)別時(shí),很多方法采用“一對(duì)其余”(one-vs-the-rest)的分類(lèi)策略,從而出現(xiàn)訓(xùn)練樣本不平衡和分類(lèi)器輸出尺度不統(tǒng)一的問(wèn)題。本文還提出了一種多類(lèi)領(lǐng)域適應(yīng)(Multi-class Domain Adaptation)方法,可以克服“一對(duì)其余”帶來(lái)的問(wèn)題。實(shí)驗(yàn)結(jié)果表明,本文提出的基于遷移學(xué)習(xí)的方法能有效地利用網(wǎng)絡(luò)視頻對(duì)用戶(hù)視頻中的事件進(jìn)行標(biāo)注,標(biāo)注模型的效果相比于相關(guān)已有模型有顯著的提高。
【關(guān)鍵詞】:事件識(shí)別 遷移學(xué)習(xí) 視頻標(biāo)注 領(lǐng)域適應(yīng)
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP391.41
【目錄】:
- 摘要5-6
- Abstract6-10
- 第1章 緒論10-14
- 1.1 研究意義10-11
- 1.2 研究?jī)?nèi)容11-12
- 1.3 論文結(jié)構(gòu)12-14
- 第2章 研究現(xiàn)狀14-24
- 2.1 引言14
- 2.2 基于內(nèi)容的視頻標(biāo)注14-18
- 2.2.1 視頻特征提取14-17
- 2.2.2 視頻事件標(biāo)注17-18
- 2.3 遷移學(xué)習(xí)18-24
- 2.3.1 特征表示的遷移19-20
- 2.3.2 分類(lèi)器的遷移20-24
- 第3章 多組領(lǐng)域適應(yīng)的視頻標(biāo)注24-38
- 3.1 引言24-25
- 3.2 相關(guān)工作25-26
- 3.3 多組領(lǐng)域適應(yīng)的視頻標(biāo)注方法26-31
- 3.3.1 問(wèn)題描述26-27
- 3.3.2 多組領(lǐng)域權(quán)重學(xué)習(xí)算法27-28
- 3.3.3 多組領(lǐng)域適應(yīng)方法28-29
- 3.3.4 模型求解方法29-31
- 3.4 實(shí)驗(yàn)31-37
- 3.4.1 數(shù)據(jù)庫(kù)31-33
- 3.4.2 實(shí)驗(yàn)設(shè)置33-34
- 3.4.3 實(shí)驗(yàn)結(jié)果34-37
- 3.5 小結(jié)37-38
- 第4章 多類(lèi)知識(shí)遷移的視頻標(biāo)注38-50
- 4.1 引言38-39
- 4.2 相關(guān)工作39
- 4.3 視頻表示39-40
- 4.4 基于多類(lèi)分類(lèi)器的知識(shí)遷移方法40-43
- 4.4.1 基于相似性的正則項(xiàng)40-43
- 4.4.2 遷移模型43
- 4.5 實(shí)驗(yàn)43-48
- 4.5.1 數(shù)據(jù)庫(kù)44
- 4.5.2 實(shí)驗(yàn)設(shè)置44-45
- 4.5.3 實(shí)驗(yàn)結(jié)果45-48
- 4.6 小結(jié)48-50
- 結(jié)論50-53
- 工作總結(jié)50-51
- 未來(lái)展望51-53
- 參考文獻(xiàn)53-59
- 攻讀學(xué)位期間發(fā)表論文與研究成果清單59-60
- 致謝60
【共引文獻(xiàn)】
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 馮杰;基于H.264壓縮域的視頻分割與特征提取方法研究[D];浙江大學(xué);2009年
2 劉瀏;基于內(nèi)容的重排列視頻檢索技術(shù)研究[D];上海交通大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 徐丹;基于內(nèi)容的視頻檢索系統(tǒng)研究[D];武漢理工大學(xué);2007年
2 蔡奕奕;基于運(yùn)動(dòng)特征的視頻檢索技術(shù)研究[D];廣西大學(xué);2008年
3 余琛;面向互聯(lián)網(wǎng)的視頻監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
4 馮自星;基于TS模型的視頻匹配方法研究與分析[D];廣西大學(xué);2012年
5 董琳娜;基于多模態(tài)特征的視頻語(yǔ)義鏡頭標(biāo)注[D];西安電子科技大學(xué);2013年
6 王萬(wàn);面向無(wú)線失真網(wǎng)絡(luò)的視頻質(zhì)量無(wú)參評(píng)估[D];石家莊鐵道大學(xué);2014年
本文關(guān)鍵詞:用于視頻內(nèi)容標(biāo)注的知識(shí)遷移方法,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):506627
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/506627.html