面向圖文混排數據的多模態(tài)信息融合標注系統(tǒng)研究與實現

發(fā)布時間：2024-04-12 04:58

　　數字智能網絡時代下大量文化數字化資源被匯聚,急需新手段新方法對文化資源進行有效合理的組織與管理。目前文化領域已經積累了大量專業(yè)的圖文混排數據,即包含圖像及其關聯文本的數據,其特點是圖像文本互關聯,對圖像的自動標注具有重要意義。本文將研究內容聚焦于文化領域專業(yè)的人文藝術書籍,以紋飾圖像為研究載體,實現了對圖文混排數據的數字圖文處理與多模態(tài)標注。主要研究內容包括:(1)針對文化大數據對多模態(tài)數據的需求,提出了一種基于版面分析的自適應圖文分離算法。以文化領域專業(yè)的圖文混排書籍為數據源,結構化的提取出由圖像、標題和描述文本組成的圖文信息對,形成多模態(tài)數據標本庫。(2)提出了一種面向領域詞庫構建的新詞發(fā)現算法。算法以文化領域專業(yè)書籍文本為數據源,結合多種統(tǒng)計特征對基于信息熵和互信息的新詞發(fā)現算法進行改進,完成了領域詞庫的擴展與更新,改善了通用分詞工具對文化領域專業(yè)詞匯切分正確率較低的問題,為后續(xù)圖像標注算法奠定了基礎。(3)基于圖文分離算法、新詞發(fā)現算法和領域詞庫提出了一種多模態(tài)信息融合的圖像標注算法。算法采用基于PageRank的多模態(tài)信息決策融合的思路對圖文兩種模態(tài)的標注信息進行融合,在一定...

【文章頁數】：87 頁

【學位級別】：碩士

【部分圖文】：

圖２－１高斯差分金字塔的構建［６９】??ＤＯＧ算子的公式如下：??＊－

?第二章圖文混排數據的多模態(tài)標注方法原理???￣?＞＾４＾＾??＝??ｏｃｔａｖｅ）??－，?＾??Ｓｃａｌｅ??ｏｃｔａｖｅ）?＿＿??Ｄｉｆｆｅｒｅｎｃｅ?ｏｆ??Ｇａｕｓｓｉａｎ?Ｇａｕｓｓｉａｎ?（ＤＯＧ）??圖２－１高斯差分金字塔的構建［６９】??ＤＯＧ算子的公式如下：....

圖２－２極值點檢測示意圖網??為提高特征點匹配的穩(wěn)健性和魯棒性，需要利用極值點的ＤＯＧ泰勒展開式??

?第二章圖文混排數據的多模態(tài)標注方法原理???￣?＞＾４＾＾??＝??ｏｃｔａｖｅ）??－，?＾??Ｓｃａｌｅ??ｏｃｔａｖｅ）?＿＿??Ｄｉｆｆｅｒｅｎｃｅ?ｏｆ??Ｇａｕｓｓｉａｎ?Ｇａｕｓｓｉａｎ?（ＤＯＧ）??圖２－１高斯差分金字塔的構建［６９】??ＤＯＧ算子的公式如下：....

圖２－３生成１２８維ＳＩＦＴ特征向量的示意圖??

?第二章圖文混排數據的多模態(tài)標注方法原理???梯度信息。將４ｘ４個子區(qū)域上的梯度信息，依照子區(qū)域的位置依次排序，最終便??得到了?４ｘ４ｘ８＝１２８維的ＳＴＦＴ特征向量。此時的ＳＩＦＴ特征向量具備尺度不變性??和旋轉不變性，最后將這個向量進行歸一化處理，以去除光照變化的影響。生成....

圖２－４）是根據某個詞上下文的幾個詞，來計算這個詞出現??的概率；而Ｓｋｉｐ－Ｇｒａｍ模型（如圖２－５）則相反，是根據某個詞分別計算它前后??出現的某幾個詞的各個概率，即通過目標詞推測出原始的語句

?第二章圖文混排數據的多模態(tài)標注方法原理????Ｗｏｒｄ２ｖｅｃ里面有兩個比較重要的模型，分別為Ｓｋｉｐ－Ｇｒａｍ模型和ＣＢＯＷ??（Ｃｏｎｔｉｎｕｏｕｓ?Ｂａｇ－ｏｆ－Ｗｏｒｄｓ?Ｍｏｄｅｌ）模型。??ＩＮＰＵＴ?ＰＲＯＪＥＣＴＩＯＮ?ＯＵＴＰＵＴ???１??ｗ（ｔ－２）?、＇....

本文編號：3951700

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/tushudanganlunwen/3951700.html

上一篇：再論學生館員與高校圖書館效率的關系
下一篇：基于信息生態(tài)位理論的公共圖書館服務創(chuàng)新研究

論文發(fā)表

·知網|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向圖文混排數據的多模態(tài)信息融合標注系統(tǒng)研究與實現