基于貝葉斯理論的社會化標(biāo)注主題聚類模型研究
發(fā)布時間:2017-05-19 08:06
本文關(guān)鍵詞:基于貝葉斯理論的社會化標(biāo)注主題聚類模型研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著Web2.0技術(shù)不斷發(fā)展和完善,社會化標(biāo)注系統(tǒng)隨之而產(chǎn)生。社會化標(biāo)注秉承了web2.0所提出的用戶自由性和主動性的特征。在社會化標(biāo)注環(huán)境下,用戶可以根據(jù)自己對相關(guān)信息資源的理解添加合適的標(biāo)簽,同時用戶可以參考其他人使用過的標(biāo)簽進(jìn)行標(biāo)注。這種標(biāo)注機(jī)制的實現(xiàn),使得信息用戶可以根據(jù)自己對資源的需求來對其進(jìn)行選擇,并根據(jù)自己對資源認(rèn)識來對其進(jìn)行組織,體現(xiàn)社會化標(biāo)注系統(tǒng)的主動性和個性化的特點(diǎn)。 由于社會化標(biāo)注本身是一種自下而上的標(biāo)注,這就使得這種“合適”的標(biāo)簽并沒有統(tǒng)一規(guī)則予以約束,明明用少數(shù)幾個詞組就可以明確的描述出資源,但由于用戶的知識背景以及理解程度的差異,往往對信息資源進(jìn)行標(biāo)注時生成的標(biāo)簽出現(xiàn)歧義、同義、同形多義等現(xiàn)象。同時,以往很少被標(biāo)注過的網(wǎng)絡(luò)資源往往被當(dāng)前瀏覽信息的用戶所忽略,這樣會導(dǎo)致大量具有重大價值的網(wǎng)絡(luò)資源被忽略掉,這些現(xiàn)象都會給新進(jìn)入的用戶搜索和獲取信息資源帶來了極大的困擾。 針對以上這些問題,本文利用貝葉斯理論并結(jié)合相關(guān)主題聚類算法對社會化標(biāo)注環(huán)境中的信息資源主題進(jìn)行有效地挖掘,將大量用戶對特定資源進(jìn)行標(biāo)注所產(chǎn)生的標(biāo)簽集進(jìn)行一定的清除和歸類,最終在特定資源下得出只含有少數(shù)具有代表性的標(biāo)簽集合。本文的主要貢獻(xiàn)有如下幾個方面: (1)根據(jù)社會化標(biāo)注所存在的一詞多義、同義詞等現(xiàn)象將文本挖掘理論中的隱含語義挖掘理論應(yīng)用到社會化標(biāo)注上來,通過構(gòu)建資源-標(biāo)簽矩陣來挖掘兩者間的語義空間,有效解決了用戶標(biāo)注過程中的詞義混亂現(xiàn)象; (2)利用三層貝葉斯網(wǎng)絡(luò),構(gòu)建基于隱狄利克雷的主題分配,并在此基礎(chǔ)上挖掘潛在的主題并對其進(jìn)行有效地分類匯總; (3)結(jié)合貝葉斯理論的先驗知識及樣本空間,并提出主題空間分類,對資源的屬性識別進(jìn)行進(jìn)一步細(xì)化,使前兩方面的工作得到進(jìn)一步改善。 以上研究不但豐富了信息組織和檢索的相關(guān)理論,而且為信息主題及用戶偏好的識別提供了有效的途徑。
【關(guān)鍵詞】:社會化標(biāo)注 主題聚類 隱含語義 層級貝葉斯
【學(xué)位授予單位】:江蘇科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:C93
【目錄】:
- 摘要5-6
- Abstract6-8
- 目錄8-10
- CONTENTS10-12
- 第1章 緒論12-22
- 1.1 研究的背景與意義12-14
- 1.2 國內(nèi)外研究現(xiàn)狀14-17
- 1.2.1 社會化標(biāo)注相關(guān)研究14-17
- 1.2.2 Web 文本主題聚類相關(guān)研究17
- 1.3 研究內(nèi)容、技術(shù)路線及組織結(jié)構(gòu)17-20
- 1.3.1 研究內(nèi)容17-18
- 1.3.2 技術(shù)路線18-20
- 1.3.3 論文的組織結(jié)構(gòu)20
- 1.4 創(chuàng)新點(diǎn)20-22
- 第2章 社會化標(biāo)注系統(tǒng)及相關(guān)貝葉斯隱含語義理論22-32
- 2.1 社會化標(biāo)注概述22-29
- 2.1.1 社會化標(biāo)注概念22-24
- 2.1.2 社會化標(biāo)注的要素24-27
- 2.1.3 社會化標(biāo)注的特性27-29
- 2.2 貝葉斯隱含語義的相關(guān)理論29-31
- 2.2.1 隱含語義分析相關(guān)理論29
- 2.2.2 概率潛在語義分析相關(guān)理論29-30
- 2.2.3 動態(tài)貝葉斯的相關(guān)理論30-31
- 2.3 本章小結(jié)31-32
- 第3章 基于貝葉斯隱含語義分析的標(biāo)注主題聚類32-44
- 3.1 基于貝葉斯隱含語義分析的標(biāo)注主題聚類34-39
- 3.1.1 構(gòu)造“資源-標(biāo)簽”矩陣37
- 3.1.2 計算潛在語義空間37-38
- 3.1.3 應(yīng)用EM 迭代算法38-39
- 3.2 模型應(yīng)用及實驗分析39-43
- 3.2.1 實驗數(shù)據(jù)獲取與處理39
- 3.2.2 實驗結(jié)果39-43
- 3.2.3 結(jié)果分析43
- 3.3 本章小結(jié)43-44
- 第4章 基于動態(tài)貝葉斯模型的標(biāo)注主題聚類44-57
- 4.1 基于隱狄利克雷分配算法的標(biāo)注主題聚類47-52
- 4.1.1 模型參數(shù)定義47-48
- 4.1.2 模型介紹48-50
- 4.1.3 參數(shù)估計50-52
- 4.2 模型應(yīng)用及實驗分析52-56
- 4.2.1 實驗數(shù)據(jù)獲取與處理52
- 4.2.2 主題數(shù)目確定52-53
- 4.2.3 實驗結(jié)果分析53-56
- 4.3 本章小結(jié)56-57
- 第5章 基于貝葉斯層級模型的標(biāo)注主題聚類57-71
- 5.1 貝葉斯層次結(jié)構(gòu)的相關(guān)理論57-59
- 5.2 基于貝葉斯層次理論的標(biāo)注主題聚類模型59-64
- 5.2.1 核心思路59-62
- 5.2.2 貝葉斯后驗推斷62-63
- 5.2.3 Gibbs 抽樣63-64
- 5.3 實驗分析及三種算法的比較64-70
- 5.3.1 數(shù)據(jù)準(zhǔn)備與處理過程64-66
- 5.3.2 性能評價指標(biāo)66-67
- 5.3.3 三種算法實驗結(jié)果對比分析67-70
- 5.4 本章小結(jié)70-71
- 總結(jié)與展望71-73
- 1 論文結(jié)論71-72
- 2 研究展望72-73
- 參考文獻(xiàn)73-79
- 附錄1 網(wǎng)絡(luò)數(shù)據(jù)獲取截圖79-80
- 附錄2 三部分圖分析數(shù)據(jù)源及中間處理結(jié)果80-85
- 攻讀碩士學(xué)位期間所發(fā)表的學(xué)術(shù)論文與參加的科研項目85-86
- 1 發(fā)表的學(xué)術(shù)論文85
- 2 參與的科研項目85-86
- 致謝86-87
- 大摘要87-92
【引證文獻(xiàn)】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 石倩;基于PLSA的無參考圖像質(zhì)量評價[D];大連海事大學(xué);2012年
本文關(guān)鍵詞:基于貝葉斯理論的社會化標(biāo)注主題聚類模型研究,,由筆耕文化傳播整理發(fā)布。
本文編號:378118
本文鏈接:http://sikaile.net/guanlilunwen/yunyingzuzhiguanlilunwen/378118.html
最近更新
教材專著