天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

面向圖文混排數據的多模態(tài)信息融合標注系統(tǒng)研究與實現

發(fā)布時間:2024-04-12 04:58
  數字智能網絡時代下大量文化數字化資源被匯聚,急需新手段新方法對文化資源進行有效合理的組織與管理。目前文化領域已經積累了大量專業(yè)的圖文混排數據,即包含圖像及其關聯文本的數據,其特點是圖像文本互關聯,對圖像的自動標注具有重要意義。本文將研究內容聚焦于文化領域專業(yè)的人文藝術書籍,以紋飾圖像為研究載體,實現了對圖文混排數據的數字圖文處理與多模態(tài)標注。主要研究內容包括:(1)針對文化大數據對多模態(tài)數據的需求,提出了一種基于版面分析的自適應圖文分離算法。以文化領域專業(yè)的圖文混排書籍為數據源,結構化的提取出由圖像、標題和描述文本組成的圖文信息對,形成多模態(tài)數據標本庫。(2)提出了一種面向領域詞庫構建的新詞發(fā)現算法。算法以文化領域專業(yè)書籍文本為數據源,結合多種統(tǒng)計特征對基于信息熵和互信息的新詞發(fā)現算法進行改進,完成了領域詞庫的擴展與更新,改善了通用分詞工具對文化領域專業(yè)詞匯切分正確率較低的問題,為后續(xù)圖像標注算法奠定了基礎。(3)基于圖文分離算法、新詞發(fā)現算法和領域詞庫提出了一種多模態(tài)信息融合的圖像標注算法。算法采用基于PageRank的多模態(tài)信息決策融合的思路對圖文兩種模態(tài)的標注信息進行融合,在一定...

【文章頁數】:87 頁

【學位級別】:碩士

【部分圖文】:

圖2-1高斯差分金字塔的構建[69】??DOG算子的公式如下:??*-

圖2-1高斯差分金字塔的構建[69】??DOG算子的公式如下:??*-

?第二章圖文混排數據的多模態(tài)標注方法原理??? ̄?>^4^^??=??octave)??-,?^??Scale??octave)?__??Difference?of??Gaussian?Gaussian?(DOG)??圖2-1高斯差分金字塔的構建[69】??DOG算子的公式如下:....


圖2-2極值點檢測示意圖網??為提高特征點匹配的穩(wěn)健性和魯棒性,需要利用極值點的DOG泰勒展開式??

圖2-2極值點檢測示意圖網??為提高特征點匹配的穩(wěn)健性和魯棒性,需要利用極值點的DOG泰勒展開式??

?第二章圖文混排數據的多模態(tài)標注方法原理??? ̄?>^4^^??=??octave)??-,?^??Scale??octave)?__??Difference?of??Gaussian?Gaussian?(DOG)??圖2-1高斯差分金字塔的構建[69】??DOG算子的公式如下:....


圖2-3生成128維SIFT特征向量的示意圖??

圖2-3生成128維SIFT特征向量的示意圖??

?第二章圖文混排數據的多模態(tài)標注方法原理???梯度信息。將4x4個子區(qū)域上的梯度信息,依照子區(qū)域的位置依次排序,最終便??得到了?4x4x8=128維的STFT特征向量。此時的SIFT特征向量具備尺度不變性??和旋轉不變性,最后將這個向量進行歸一化處理,以去除光照變化的影響。生成....


圖2-4)是根據某個詞上下文的幾個詞,來計算這個詞出現??的概率;而Skip-Gram模型(如圖2-5)則相反,是根據某個詞分別計算它前后??出現的某幾個詞的各個概率,即通過目標詞推測出原始的語句

圖2-4)是根據某個詞上下文的幾個詞,來計算這個詞出現??的概率;而Skip-Gram模型(如圖2-5)則相反,是根據某個詞分別計算它前后??出現的某幾個詞的各個概率,即通過目標詞推測出原始的語句

?第二章圖文混排數據的多模態(tài)標注方法原理????Word2vec里面有兩個比較重要的模型,分別為Skip-Gram模型和CBOW??(Continuous?Bag-of-Words?Model)模型。??INPUT?PROJECTION?OUTPUT???1??w(t-2)?、'....



本文編號:3951700

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3951700.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶0ddd0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com