跨媒體語義共享子空間學(xué)習(xí)理論與方法研究
本文關(guān)鍵詞:跨媒體語義共享子空間學(xué)習(xí)理論與方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著信息技術(shù)的快速發(fā)展,現(xiàn)實(shí)世界中不斷涌現(xiàn)著大量的跨媒體數(shù)據(jù)。所謂跨媒體數(shù)據(jù)是指那些表達(dá)的內(nèi)容相似,但以不同模態(tài)、不同來源、不同背景等形式出現(xiàn)的數(shù)據(jù)。比如,一張描述花豹的網(wǎng)頁通常采用共生的圖片和文本等不同的模態(tài)刻畫花豹的外形和習(xí)性?缑襟w數(shù)據(jù)通常呈現(xiàn)出底層特征異構(gòu)、高層語義相關(guān)的特性。傳統(tǒng)的單媒體學(xué)習(xí)方法已無法適應(yīng)跨媒體數(shù)據(jù)的特征異構(gòu)性。不同于單媒體學(xué)習(xí),跨媒體學(xué)習(xí)在學(xué)習(xí)過程中能夠度量不同模態(tài)的媒體對(duì)象之間的相關(guān)性,以實(shí)現(xiàn)不同模態(tài)間的靈活跨越。因此,開展跨媒體學(xué)習(xí)相關(guān)理論與方法的研究具有重要的理論意義和應(yīng)用價(jià)值。 本文從跨媒體對(duì)象的底層特征出發(fā),對(duì)跨媒體共享子空間學(xué)習(xí)中的若干相關(guān)問題進(jìn)行了研究。研究?jī)?nèi)容包括:跨媒體數(shù)據(jù)的一致性描述、子空間的增量學(xué)習(xí)、缺失模態(tài)補(bǔ)全等。本文主要的創(chuàng)新性研究成果包括: (1)提出了一種挖掘跨媒體數(shù)據(jù)語義一致模式的通用框架。該框架首先使用一種全新的同構(gòu)相關(guān)冗余變換算法構(gòu)建不同模態(tài)間的高維同構(gòu)空間,以此捕捉更多不同模態(tài)間的互補(bǔ)信息;并提出了一種基于相關(guān)性的聯(lián)合特征學(xué)習(xí)模型,以提取特征同構(gòu)描述之間共享的高層語義子空間。在此基礎(chǔ)上所建立的跨媒體數(shù)據(jù)的一致性描述,在分類和檢索性能上能夠比現(xiàn)有的同類方法獲得將近14%的增益。 (2)提出了一種適用于多標(biāo)簽圖像分類的增量共享子空間學(xué)習(xí)方法。通過利用提出的增量無損矩陣分解算法,該方法能夠增量地執(zhí)行而無需使用原始已存在的數(shù)據(jù),避免了提取共享子空間過程中的高計(jì)算復(fù)雜度,并且沒有降低算法的分類性能。與其它非增量的共享子空間學(xué)習(xí)方法相比,該方法將計(jì)算時(shí)間降低了大約1個(gè)數(shù)量級(jí)且沒有降低預(yù)測(cè)性能。 (3)提出了一種補(bǔ)全跨媒體數(shù)據(jù)缺失模態(tài)的通用框架。該框架首先使用一種全新的同構(gòu)線性相關(guān)分析方法,將跨媒體數(shù)據(jù)線性地映射到一個(gè)特征同構(gòu)空間,以此捕捉不同模態(tài)間的語義互補(bǔ)性和等同分布;同時(shí),遵從魯棒PCA的思想,為了完成缺失模態(tài)的補(bǔ)全,提出了一種等同分布約束模型,以充分利用基于等同分布約束的大邊緣策略。在此基礎(chǔ)上所恢復(fù)的跨媒體數(shù)據(jù)缺失模態(tài)的描述,在分類性能上能夠比現(xiàn)有的同類方法獲得將近20%的增
【關(guān)鍵詞】:跨媒體 異構(gòu)數(shù)據(jù) 共享子空間 增量學(xué)習(xí) 維度縮減 數(shù)據(jù)補(bǔ)全
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
【目錄】:
- 致謝5-6
- 中文摘要6-7
- ABSTRACT7-13
- 主要符號(hào)對(duì)照表13-16
- 1 緒論16-28
- 1.1 跨媒體的基本概念與研究意義17-20
- 1.2 跨媒體學(xué)習(xí)的相關(guān)方法20-24
- 1.2.1 協(xié)同訓(xùn)練21-22
- 1.2.2 多核學(xué)習(xí)22-23
- 1.2.3 子空間學(xué)習(xí)23-24
- 1.3 論文的主要貢獻(xiàn)24-25
- 1.4 論文的符號(hào)說明25-26
- 1.5 論文的內(nèi)容安排26-28
- 2 共享子空間學(xué)習(xí)綜述28-42
- 2.1 基于投影的共享子空間學(xué)習(xí)方法28-33
- 2.1.1 典型相關(guān)分析法28-29
- 2.1.2 偏最小二乘分析法29-30
- 2.1.3 核典型相關(guān)分析法30-31
- 2.1.4 深度典型相關(guān)分析法31-33
- 2.2 基于矩陣分解的共享子空間學(xué)習(xí)方法33-35
- 2.2.1 基于非負(fù)矩陣分解的共享子空間學(xué)習(xí)33-34
- 2.2.2 基于特征分解的共享子空間學(xué)習(xí)34-35
- 2.3 基于任務(wù)的共享子空間學(xué)習(xí)方法35-38
- 2.3.1 基于多任務(wù)學(xué)習(xí)的共享子空間學(xué)習(xí)35-36
- 2.3.2 基于多標(biāo)簽學(xué)習(xí)的共享子空間學(xué)習(xí)36-37
- 2.3.3 基于多類學(xué)習(xí)的共享子空間學(xué)習(xí)37-38
- 2.4 基于度量的共享子空間學(xué)習(xí)方法38-41
- 2.4.1 基于歐式距離度量的共享子空間學(xué)習(xí)39-40
- 2.4.2 基于馬氏距離度量的共享子空間學(xué)習(xí)40-41
- 2.5 本章小結(jié)41-42
- 3 跨媒體數(shù)據(jù)語義一致模式的挖掘42-62
- 3.1 問題描述42-43
- 3.2 發(fā)現(xiàn)跨媒體數(shù)據(jù)的語義一致模式43-53
- 3.2.1 挖掘跨媒體數(shù)據(jù)語義一致模式的框架43-45
- 3.2.2 構(gòu)建不同模態(tài)間的特征同構(gòu)空間45-49
- 3.2.3 IRRT和CCA的區(qū)別49
- 3.2.4 挖掘同構(gòu)描述的語義一致性49-53
- 3.3 實(shí)驗(yàn)結(jié)果和分析53-60
- 3.3.1 數(shù)據(jù)集53-54
- 3.3.2 實(shí)驗(yàn)設(shè)置54-55
- 3.3.3 單一和整合模態(tài)的比較55
- 3.3.4 PLS,CCA,KCCA和IRRT的評(píng)估55-56
- 3.3.5 IRRT和CJFL的分析56-57
- 3.3.6 跡率算法的比較57
- 3.3.7 共享子空間學(xué)習(xí)算法的對(duì)比57-58
- 3.3.8 跨媒體檢索性能的分析58-59
- 3.3.9 IRRT和CJFL的參數(shù)敏感度59-60
- 3.4 本章小結(jié)60-62
- 4 增量共享子空間學(xué)習(xí)62-78
- 4.1 問題描述62-64
- 4.2 SSLMC算法概述64-66
- 4.3 多標(biāo)簽分類的增量共享子空間學(xué)習(xí)66-70
- 4.3.1 增量無損矩陣分解66-68
- 4.3.2 ISSLMC算法68
- 4.3.3 計(jì)算復(fù)雜度分析68-70
- 4.4 實(shí)驗(yàn)評(píng)估70-76
- 4.4.1 實(shí)驗(yàn)設(shè)置70-71
- 4.4.2 實(shí)驗(yàn)A:大樣本問題的性能評(píng)估71-73
- 4.4.3 實(shí)驗(yàn)B:小樣本問題的性能評(píng)估73-76
- 4.5 本章小結(jié)76-78
- 5 跨媒體數(shù)據(jù)缺失模態(tài)的補(bǔ)全78-98
- 5.1 問題描述78-81
- 5.2 補(bǔ)全跨媒體數(shù)據(jù)缺失模態(tài)的框架81-86
- 5.2.1 提出框架的概述81-83
- 5.2.2 同構(gòu)線性相關(guān)分析83-84
- 5.2.3 等同分布約束補(bǔ)全84-86
- 5.3 提出框架的解法86-89
- 5.3.1 問題Ψ_1解法86-87
- 5.3.2 問題Ω_2的解法87-89
- 5.4 實(shí)驗(yàn)結(jié)果和分析89-96
- 5.4.1 數(shù)據(jù)集90-92
- 5.4.2 實(shí)驗(yàn)設(shè)置92
- 5.4.3 單一和整合模態(tài)的評(píng)估92
- 5.4.4 OPLS,CCA和ILCA的比較92-93
- 5.4.5 示和隱式投影的分析93-94
- 5.4.6 補(bǔ)全算法的比較94-95
- 5.4.7 ILCA和IDPC的參數(shù)敏感度95-96
- 5.5 本章小結(jié)96-98
- 6 總結(jié)與展望98-100
- 6.1 論文總結(jié)98-99
- 6.2 工作展望99-100
- 參考文獻(xiàn)100-110
- 作者簡(jiǎn)歷及攻讀博士學(xué)位期間取得的研究成果110-114
- 學(xué)位論文數(shù)據(jù)集114
【參考文獻(xiàn)】
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 郭戈;數(shù)字視頻語義信息提取與分析[D];解放軍信息工程大學(xué);2010年
2 黃東山;特征選擇及半監(jiān)督分類方法研究[D];華中科技大學(xué);2011年
3 張博鋒;面向內(nèi)容安全的文本分類研究[D];國防科學(xué)技術(shù)大學(xué);2007年
4 溫靜;基于張量子空間學(xué)習(xí)的視覺跟蹤方法研究[D];西安電子科技大學(xué);2010年
5 曾璞;面向語義提取的圖像分類關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2009年
6 孫元;多媒體語義檢索關(guān)鍵問題研究[D];吉林大學(xué);2010年
7 漸令;基于核的學(xué)習(xí)算法與應(yīng)用[D];大連理工大學(xué);2012年
8 孫統(tǒng)風(fēng);基于多尺度與子空間的圖像融合和識(shí)別研究[D];中國礦業(yè)大學(xué);2012年
9 陳曉紅;數(shù)據(jù)降維的廣義相關(guān)分析研究[D];南京航空航天大學(xué);2011年
10 閆樂林;基于視聽信息的視頻語義分析與檢索技術(shù)研究[D];北京郵電大學(xué);2012年
本文關(guān)鍵詞:跨媒體語義共享子空間學(xué)習(xí)理論與方法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):467497
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/467497.html