關系網(wǎng)絡數(shù)據(jù)的半監(jiān)督分類方法研究
發(fā)布時間:2022-01-20 22:36
隨著互聯(lián)網(wǎng)的發(fā)展,特別是移動互聯(lián)網(wǎng)和社會化媒體的普及,實際應用中需要處理的數(shù)據(jù)樣本,不再是單獨存在的個體,而是與其它數(shù)據(jù)樣本相互依賴。這種存在相互依賴關系的數(shù)據(jù)樣本集合,被稱為關系網(wǎng)絡數(shù)據(jù)。如在微博應用中,用戶與用戶相互關注,構成了一個以微博用戶為節(jié)點,關注關系為邊的關系網(wǎng)絡數(shù)據(jù)。對關系網(wǎng)絡數(shù)據(jù)中的樣本進行分類時,有效利用樣本間的依賴關系能提高分類精度。如相互關注的微博用戶傾向于有相似的興趣愛好,存在超鏈接關系的網(wǎng)頁傾向于有相似的主題。關系網(wǎng)絡數(shù)據(jù)的分類問題也被稱為協(xié)同分類問題。近十年來,國內(nèi)外研究人員對協(xié)同分類問題進行大量的研究并提出很多能利用關系提高分類精度的算法。然而在實際應用中,要構建大量的訓練樣本,成本非常高,會耗費大量的人力和物力。于是在訓練樣本稀少的情況下,如何利用大量測試樣本進行半監(jiān)督協(xié)同分類成為近幾年的研究熱點。本文研究了關系網(wǎng)絡數(shù)據(jù)的半監(jiān)督分類問題并提出一些解決方法。主要工作包括:(1)將關系網(wǎng)絡數(shù)據(jù)的半監(jiān)督分類問題分解成三個核心子問題:基于內(nèi)容屬性的半監(jiān)督分類問題、關系的類標傳遞能力的學習問題和內(nèi)容屬性與關系信息的結合問題。(2)提出一個強同質(zhì)關系網(wǎng)絡生成方法,在...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外相關研究工作綜述
1.2.1 關系網(wǎng)絡數(shù)據(jù)的分類方法研究現(xiàn)狀
1.2.2 關系網(wǎng)絡數(shù)據(jù)的半監(jiān)督分類方法研究現(xiàn)狀
1.2.3 關系網(wǎng)絡數(shù)據(jù)中半監(jiān)督分類的挑戰(zhàn)
1.3 本文的主要工作
1.4 本文的組織結構
第2章 相關基礎知識
2.1 問題的定義
2.2 協(xié)同分類算法
2.2.1 迭代協(xié)同分類算法
2.2.2 使用松弛標注的鄰居加權投票法
2.3 半監(jiān)督協(xié)同分類算法
2.3.1 隱含網(wǎng)絡傳遞算法
2.3.2 半監(jiān)督迭代協(xié)同分類算法
2.4 半監(jiān)督協(xié)同分類核心問題剖析
2.4.1 基于內(nèi)容屬性的半監(jiān)督分類問題
2.4.2 關系的類標傳遞能力學習問題
2.4.3 內(nèi)容屬性與關系信息的結合問題
2.5 本章小結
第3章 面向類標傳遞能力學習的強同質(zhì)網(wǎng)絡生成方法
3.1 問題的定義
3.2 強同質(zhì)關系網(wǎng)絡的生成算法
3.2.1 兩步可達路徑
3.2.2 算法描述
3.3 實驗結果與分析
3.4 本章小結
第4章 基于網(wǎng)絡正則化生成模型的半監(jiān)督分類方法
4.1 基本思想
4.2 網(wǎng)絡正則化生成模型(GMNR)
4.2.1 基于 PLSA 的生成模型
4.2.2 網(wǎng)絡正則化因子
4.2.3 全局最優(yōu)化問題
4.3 GMNR 的參數(shù)學習及類標預測
4.3.1 期望最大化
4.3.2 參數(shù)初始值
4.3.3 算法描述及分析
4.4 實驗結果與分析
4.4.1 數(shù)據(jù)集
4.4.2 對比算法
4.4.3 評估方法
4.4.4 結果與分析
4.4.5 收斂性和正則化參數(shù)λ
4.5 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
本文編號:3599648
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外相關研究工作綜述
1.2.1 關系網(wǎng)絡數(shù)據(jù)的分類方法研究現(xiàn)狀
1.2.2 關系網(wǎng)絡數(shù)據(jù)的半監(jiān)督分類方法研究現(xiàn)狀
1.2.3 關系網(wǎng)絡數(shù)據(jù)中半監(jiān)督分類的挑戰(zhàn)
1.3 本文的主要工作
1.4 本文的組織結構
第2章 相關基礎知識
2.1 問題的定義
2.2 協(xié)同分類算法
2.2.1 迭代協(xié)同分類算法
2.2.2 使用松弛標注的鄰居加權投票法
2.3 半監(jiān)督協(xié)同分類算法
2.3.1 隱含網(wǎng)絡傳遞算法
2.3.2 半監(jiān)督迭代協(xié)同分類算法
2.4 半監(jiān)督協(xié)同分類核心問題剖析
2.4.1 基于內(nèi)容屬性的半監(jiān)督分類問題
2.4.2 關系的類標傳遞能力學習問題
2.4.3 內(nèi)容屬性與關系信息的結合問題
2.5 本章小結
第3章 面向類標傳遞能力學習的強同質(zhì)網(wǎng)絡生成方法
3.1 問題的定義
3.2 強同質(zhì)關系網(wǎng)絡的生成算法
3.2.1 兩步可達路徑
3.2.2 算法描述
3.3 實驗結果與分析
3.4 本章小結
第4章 基于網(wǎng)絡正則化生成模型的半監(jiān)督分類方法
4.1 基本思想
4.2 網(wǎng)絡正則化生成模型(GMNR)
4.2.1 基于 PLSA 的生成模型
4.2.2 網(wǎng)絡正則化因子
4.2.3 全局最優(yōu)化問題
4.3 GMNR 的參數(shù)學習及類標預測
4.3.1 期望最大化
4.3.2 參數(shù)初始值
4.3.3 算法描述及分析
4.4 實驗結果與分析
4.4.1 數(shù)據(jù)集
4.4.2 對比算法
4.4.3 評估方法
4.4.4 結果與分析
4.4.5 收斂性和正則化參數(shù)λ
4.5 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
本文編號:3599648
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3599648.html
最近更新
教材專著