基于深度典型相關(guān)分析的跨媒體語義挖掘研究
發(fā)布時間:2021-12-10 21:59
從九十年代的門戶網(wǎng)站時代,歷經(jīng)各種發(fā)展,到當(dāng)下的大數(shù)據(jù)時代,多媒體研究被賦予了越來越大的科學(xué)、社會和商業(yè)價值。如何最大化挖掘不同類型的媒體信息中所蘊含的隱藏信息,顯得尤為重要?朔煌襟w之間的語義鴻溝,完成不同媒體之間的語義挖掘,一般需要先將不同維度的媒體映射到一個公共的媒體空間中去,F(xiàn)有的基于典型相關(guān)分析、核典型相關(guān)分析、深度典型相關(guān)分析等跨媒體語義挖掘方法,僅利用了不同媒體之間的相關(guān)特征,但是忽略了媒體樣本自身所帶的語義信息,并且沒有利用數(shù)據(jù)的標(biāo)簽信息,僅僅通過無監(jiān)督學(xué)習(xí)完成語義挖掘,這不僅不利于理解媒體本身的所表達(dá)的意義,也限制了多種媒體數(shù)據(jù)之間的語義理解。為了解決上述問題,本文在深度典型相關(guān)分析的基礎(chǔ)上,提出深度語義典型相關(guān)分析算法。通過在其損失函數(shù)中引入媒體數(shù)據(jù)關(guān)于類別的語義信息,獲得同時包含相關(guān)信息和語義信息的特征。提出組合語義空間算法,利用邏輯斯蒂回歸,對各種媒體數(shù)據(jù)進(jìn)行分類,獲得類別特征,在深度語義典型相關(guān)分析算法的基礎(chǔ)上構(gòu)建組合語義空間,進(jìn)一步挖掘媒體數(shù)據(jù)所包含的語義信息。本文利用跨媒體檢索的效果來驗證算法的有效性。在兩個權(quán)威的跨媒體數(shù)據(jù)集上將本文提出的深度語義典型...
【文章來源】:武漢科技大學(xué)湖北省
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
CMDN算法流程圖
驗數(shù)據(jù)集選用兩個標(biāo)準(zhǔn)的跨媒體數(shù)據(jù)集來完成在文本、圖像數(shù)據(jù)上的語義挖 Wikipedia 數(shù)據(jù)集、Xmedia 數(shù)據(jù)集。ipedia 數(shù)據(jù)集,該數(shù)據(jù)集是從收集的 2700 篇“專題文章”中挑選出來 29 類,Wikipedia 數(shù)據(jù)集由其中最熱門的前 10 類組成。每篇文章都個來自維基百科的圖片。根據(jù)章節(jié)的標(biāo)題,每篇文章被分成幾個章料庫包含總共 2866 個文檔,并且被隨機(jī)分成 2173 個文檔的訓(xùn)練集和測試集。edia 數(shù)據(jù)集,該數(shù)據(jù)集由 5000 個文本、5000 個圖像、500 個視頻、 500 個 3D 模型組成。所有的媒體數(shù)據(jù)都是從互聯(lián)網(wǎng)網(wǎng)站上抓取的,,YouTube,自由之聲,3D 倉庫和普林斯頓 3D 模型搜索引擎等等。織成 20 個類別,每個類別有 600 個媒體數(shù)據(jù),并且隨機(jī)分成 9600訓(xùn)練集和 2400 個媒體數(shù)據(jù)的測試集。本文在實驗過程中只用到了其本數(shù)據(jù)。
XMedia數(shù)據(jù)集前10個類別
【參考文獻(xiàn)】:
期刊論文
[1]基于圖結(jié)構(gòu)的文本表示方法研究[J]. 任浩,羅森林,潘麗敏,高君豐. 信息網(wǎng)絡(luò)安全. 2017(03)
[2]采用空間詞袋模型的圖像分類方法[J]. 陳瑩,高含. 小型微型計算機(jī)系統(tǒng). 2016(09)
[3]應(yīng)用圖學(xué)習(xí)算法的跨媒體相關(guān)模型圖像語義標(biāo)注[J]. 李玲,宋瑩瑋,楊秀華,陳逸杰. 光學(xué)精密工程. 2016(01)
[4]利用深度玻爾茲曼機(jī)與典型相關(guān)分析的自動圖像標(biāo)注算法[J]. 劉凱,張立民,孫永威,林雪原. 西安交通大學(xué)學(xué)報. 2015(06)
[5]核典型相關(guān)分析算法的多特征融合情感識別[J]. 劉付民,張治斌,沈記全. 計算機(jī)工程與應(yīng)用. 2014(09)
[6]方向梯度直方圖及其擴(kuò)展[J]. 傅紅普,鄒北驥. 計算機(jī)工程. 2013(05)
[7]局部二值模式方法研究與展望[J]. 宋克臣,顏云輝,陳文輝,張旭. 自動化學(xué)報. 2013(06)
[8]一種結(jié)合詞項語義信息和TF-IDF方法的文本相似度量方法[J]. 黃承慧,印鑒,侯昉. 計算機(jī)學(xué)報. 2011(05)
[9]光照不均圖像增強方法綜述[J]. 梁琳,何衛(wèi)平,雷蕾,張維,王紅霄. 計算機(jī)應(yīng)用研究. 2010(05)
[10]基于語義的跨媒體信息檢索技術(shù)研究[J]. 蔡平,王志強,傅向華. 微電子學(xué)與計算機(jī). 2010(03)
碩士論文
[1]基于布爾模型的網(wǎng)頁查重算法研究[D]. 連浩.中國科學(xué)院研究生院(計算技術(shù)研究所) 2006
本文編號:3533465
【文章來源】:武漢科技大學(xué)湖北省
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
CMDN算法流程圖
驗數(shù)據(jù)集選用兩個標(biāo)準(zhǔn)的跨媒體數(shù)據(jù)集來完成在文本、圖像數(shù)據(jù)上的語義挖 Wikipedia 數(shù)據(jù)集、Xmedia 數(shù)據(jù)集。ipedia 數(shù)據(jù)集,該數(shù)據(jù)集是從收集的 2700 篇“專題文章”中挑選出來 29 類,Wikipedia 數(shù)據(jù)集由其中最熱門的前 10 類組成。每篇文章都個來自維基百科的圖片。根據(jù)章節(jié)的標(biāo)題,每篇文章被分成幾個章料庫包含總共 2866 個文檔,并且被隨機(jī)分成 2173 個文檔的訓(xùn)練集和測試集。edia 數(shù)據(jù)集,該數(shù)據(jù)集由 5000 個文本、5000 個圖像、500 個視頻、 500 個 3D 模型組成。所有的媒體數(shù)據(jù)都是從互聯(lián)網(wǎng)網(wǎng)站上抓取的,,YouTube,自由之聲,3D 倉庫和普林斯頓 3D 模型搜索引擎等等。織成 20 個類別,每個類別有 600 個媒體數(shù)據(jù),并且隨機(jī)分成 9600訓(xùn)練集和 2400 個媒體數(shù)據(jù)的測試集。本文在實驗過程中只用到了其本數(shù)據(jù)。
XMedia數(shù)據(jù)集前10個類別
【參考文獻(xiàn)】:
期刊論文
[1]基于圖結(jié)構(gòu)的文本表示方法研究[J]. 任浩,羅森林,潘麗敏,高君豐. 信息網(wǎng)絡(luò)安全. 2017(03)
[2]采用空間詞袋模型的圖像分類方法[J]. 陳瑩,高含. 小型微型計算機(jī)系統(tǒng). 2016(09)
[3]應(yīng)用圖學(xué)習(xí)算法的跨媒體相關(guān)模型圖像語義標(biāo)注[J]. 李玲,宋瑩瑋,楊秀華,陳逸杰. 光學(xué)精密工程. 2016(01)
[4]利用深度玻爾茲曼機(jī)與典型相關(guān)分析的自動圖像標(biāo)注算法[J]. 劉凱,張立民,孫永威,林雪原. 西安交通大學(xué)學(xué)報. 2015(06)
[5]核典型相關(guān)分析算法的多特征融合情感識別[J]. 劉付民,張治斌,沈記全. 計算機(jī)工程與應(yīng)用. 2014(09)
[6]方向梯度直方圖及其擴(kuò)展[J]. 傅紅普,鄒北驥. 計算機(jī)工程. 2013(05)
[7]局部二值模式方法研究與展望[J]. 宋克臣,顏云輝,陳文輝,張旭. 自動化學(xué)報. 2013(06)
[8]一種結(jié)合詞項語義信息和TF-IDF方法的文本相似度量方法[J]. 黃承慧,印鑒,侯昉. 計算機(jī)學(xué)報. 2011(05)
[9]光照不均圖像增強方法綜述[J]. 梁琳,何衛(wèi)平,雷蕾,張維,王紅霄. 計算機(jī)應(yīng)用研究. 2010(05)
[10]基于語義的跨媒體信息檢索技術(shù)研究[J]. 蔡平,王志強,傅向華. 微電子學(xué)與計算機(jī). 2010(03)
碩士論文
[1]基于布爾模型的網(wǎng)頁查重算法研究[D]. 連浩.中國科學(xué)院研究生院(計算技術(shù)研究所) 2006
本文編號:3533465
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3533465.html
最近更新
教材專著