Hybrid-LDA:一種融合用戶文本內(nèi)容與鏈接信息的興趣挖掘技術(shù)
發(fā)布時(shí)間:2017-06-02 23:04
本文關(guān)鍵詞:Hybrid-LDA:一種融合用戶文本內(nèi)容與鏈接信息的興趣挖掘技術(shù),由筆耕文化傳播整理發(fā)布。
【摘要】:社交網(wǎng)絡(luò)的蓬勃發(fā)展為人與人之間的交互行為帶來巨大便利,隨著時(shí)間的推移,社交網(wǎng)絡(luò)積累了大量的用戶數(shù)據(jù),這些數(shù)據(jù)不僅涵蓋了用戶平時(shí)發(fā)表的言論、照片以及位置信息,同時(shí)包含了用戶間的社交關(guān)系,為研究者帶來了巨大的研究?jī)r(jià)值。其中,用戶興趣的挖掘有著重要的研究意義,這方面的深入研究可以為用戶個(gè)性化內(nèi)容推薦提供依據(jù)。目前,主題模型是挖掘用戶興趣的常用模型,而用戶所發(fā)表的言論是主要的挖掘?qū)ο;谟脩敉莆氖窃~匯上的分布,主題模型引入了主題作為隱式變量,將用戶描述為多個(gè)主題的組合,再將主題描述為不同詞匯上的分布,進(jìn)而獲得用戶在多個(gè)主題上的分布。目前,隱式狄利克雷分布(LDA)是主題模型中最經(jīng)典、有效的方法。本文以Twitter數(shù)據(jù)作為研究背景,目的在于挖掘Twitter用戶的興趣。本文認(rèn)為,分析用戶的興趣不僅需要考慮用戶自身所發(fā)布的推文內(nèi)容,并且需要考慮用戶的其他其維度的信息(比如用戶的關(guān)注信息);谏鲜鏊枷,本文提出了改進(jìn)模型Hybrid-LDA,該模型不僅考慮用戶自身的推文內(nèi)容,同時(shí)考慮用戶關(guān)注對(duì)象的推文內(nèi)容以及對(duì)不同關(guān)注對(duì)象的轉(zhuǎn)發(fā)次數(shù)的差異這些維度的信息。通過這種方法,本文能夠融合用戶推文內(nèi)容與鏈接信息。通過實(shí)驗(yàn),本文發(fā)現(xiàn)Hybrid-LDA相比LDA有一定程度的性能提升,驗(yàn)證本文所提出模型的有效性。
【關(guān)鍵詞】:社交網(wǎng)絡(luò) 興趣挖掘 主題模型 貝葉斯 LDA Twitter
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:C81
【目錄】:
- 摘要10-11
- ABSTRACT11-12
- 主要符號(hào)對(duì)照表12-13
- 第一章 引言13-20
- §1.1 研究背景與意義13-16
- §1.2 國(guó)內(nèi)外研究現(xiàn)狀16-17
- §1.3 本文的研究方法17
- §1.4 本文的研究難點(diǎn)與挑戰(zhàn)17-18
- §1.5 本文的研究?jī)?nèi)容與創(chuàng)新18-19
- §1.6 本文的組織架構(gòu)19-20
- 第二章 相關(guān)工作20-27
- §2.1 主題模型20-23
- §2.2 LDA模型23-24
- §2.3 基于社交網(wǎng)絡(luò)的主題挖掘技術(shù)24-26
- §2.3.1 基于推文內(nèi)容的主題挖掘技術(shù)25
- §2.3.2 基于非推文內(nèi)容的主題挖掘技術(shù)25-26
- §2.4 小結(jié)26-27
- 第三章 Hybrid-LDA主題模型27-39
- §3.1 Hybrid-LDA模型介紹27-39
- §3.1.1 模型描述及文檔生成過程28-29
- §3.1.2 模型推導(dǎo)及求解29-37
- §3.1.3 算法37-39
- 第四章 實(shí)驗(yàn)評(píng)估39-49
- §4.1 實(shí)驗(yàn)數(shù)據(jù)39
- §4.2 實(shí)驗(yàn)設(shè)計(jì)39-44
- §4.2.1 參數(shù)選擇40-41
- §4.2.2 聚類方法41-42
- §4.2.3 評(píng)估指標(biāo)42-43
- §4.2.4 聚類方法43
- §4.2.5 評(píng)估方法43-44
- §4.3 實(shí)驗(yàn)分析44-48
- §4.3.1 UserTweet-LDA44-45
- §4.3.2 LinkTweet-LDA45-46
- §4.3.3 MixTweet-LDA46
- §4.3.4 Hybrid-LDA46-48
- §4.4 小結(jié)48-49
- 結(jié)論49-51
- §4.5 研究工作總結(jié)49
- §4.6 未來工作展望49-51
- 參考文獻(xiàn)51-54
- 致謝54
【相似文獻(xiàn)】
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 顏曉勉;Hybrid-LDA:一種融合用戶文本內(nèi)容與鏈接信息的興趣挖掘技術(shù)[D];華東師范大學(xué);2016年
本文關(guān)鍵詞:Hybrid-LDA:一種融合用戶文本內(nèi)容與鏈接信息的興趣挖掘技術(shù),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):416709
本文鏈接:http://sikaile.net/shekelunwen/shgj/416709.html
最近更新
教材專著