基于語(yǔ)義和圖挖掘的社交網(wǎng)絡(luò)分析
發(fā)布時(shí)間:2017-04-30 19:04
本文關(guān)鍵詞:基于語(yǔ)義和圖挖掘的社交網(wǎng)絡(luò)分析,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的發(fā)展,活躍在社交網(wǎng)絡(luò)中的人與主題越來(lái)越多,而海量的用戶生成內(nèi)容對(duì)信息的獲取與檢索提出了挑戰(zhàn)。其中,社交網(wǎng)絡(luò)中突然產(chǎn)生的主題(突發(fā)主題,Bursty Topic),由于往往對(duì)應(yīng)著特殊的事件并表征社會(huì)對(duì)突發(fā)事件的輿情,對(duì)其進(jìn)行探測(cè)成為一個(gè)很有價(jià)值的研究熱點(diǎn)。近年來(lái),相關(guān)的研究工作分別從信息流、主題模型以及傳播模型等各個(gè)方面展開了研究,但是仍然存在以下問(wèn)題:1、對(duì)突發(fā)主題缺少數(shù)學(xué)上的明確定義。2、對(duì)突發(fā)主題的研究多集中在新聞和學(xué)術(shù)界,對(duì)于社交網(wǎng)絡(luò)中突發(fā)主題所具有的社交屬性考慮不足。針對(duì)此背景,本文從圖挖掘與語(yǔ)義分析的相關(guān)理論結(jié)合出發(fā),旨在進(jìn)一步探索解決突發(fā)主題檢測(cè)問(wèn)題的解決方案。 首先,針對(duì)突發(fā)主題的數(shù)學(xué)表達(dá)問(wèn)題。本文在主題模型相似性的基礎(chǔ)上,提出了一種突發(fā)主題的數(shù)學(xué)模型:基于JS距離的突發(fā)主題模型。并給出了兩種求解算法:基于隨機(jī)游走的區(qū)域探測(cè)算法,以及基于時(shí)間分布的區(qū)域切割算法。在單服務(wù)器開銷限制下,實(shí)驗(yàn)證明能有效解決大規(guī)模社交網(wǎng)絡(luò)數(shù)據(jù)的突發(fā)主題提取問(wèn)題。同時(shí),對(duì)所提算法覆蓋度、時(shí)間復(fù)雜度進(jìn)行了測(cè)試和評(píng)估。 然后,針對(duì)突發(fā)主題社交屬性研究不足的問(wèn)題。本文對(duì)前人工作中提出的基于主題模型和馬爾科夫過(guò)程的突發(fā)探測(cè)模型進(jìn)行了改進(jìn)?紤]到在社交網(wǎng)絡(luò)中文檔作者對(duì)突發(fā)主題產(chǎn)生的影響,在馬爾科夫過(guò)程的轉(zhuǎn)移概率中加入了社交影響力參數(shù),提出了基于社交影響力和主題模型的突發(fā)探測(cè)模型。在同經(jīng)典模型對(duì)比實(shí)驗(yàn)中,新的模型對(duì)于突發(fā)話題的探測(cè)具有更高的準(zhǔn)確性。
【關(guān)鍵詞】:突發(fā)主題 主題模型 社交影響力 社交網(wǎng)絡(luò)
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.09
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第一章 緒論8-18
- 1.1 主題模型相關(guān)研究9-13
- 1.1.1 LDA模型的產(chǎn)生10-11
- 1.1.1.1 潛在語(yǔ)義分析模型LSA10
- 1.1.1.2 概率潛在語(yǔ)義分析模型PLSA10
- 1.1.1.3 隱含狄利克雷分布模型LDA10-11
- 1.1.2 LDA模型的改進(jìn)研究11-12
- 1.1.3 LDA模型的應(yīng)用研究12-13
- 1.2 突發(fā)主題檢測(cè)的相關(guān)研究13-14
- 1.3 基于社交關(guān)系的主題發(fā)現(xiàn)研究14-15
- 1.4 本文的主要工作和創(chuàng)新點(diǎn)15
- 1.5 論文結(jié)構(gòu)安排15-18
- 第二章 面向突發(fā)主題檢測(cè)的動(dòng)態(tài)主題模型相關(guān)研究18-28
- 2.1 隱含狄利克雷分布模型LDA18-24
- 2.1.1 LDA模型的參數(shù)推導(dǎo)19-20
- 2.1.2 LDA模型求解20-24
- 2.2 動(dòng)態(tài)結(jié)構(gòu)的主題模型24-26
- 2.2.1 動(dòng)態(tài)主題模型DTM24-25
- 2.2.2 時(shí)變主題模型TOT25
- 2.2.3 兩種模型的對(duì)比25-26
- 2.3 主題模型評(píng)估方法26
- 2.4 主題模型與突發(fā)主題提取26-27
- 2.5 本章小結(jié)27-28
- 第三章 基于LDA生成概率矩陣的突發(fā)主題研究28-38
- 3.1 LDA在實(shí)驗(yàn)數(shù)據(jù)上的表現(xiàn)28-31
- 3.1.1 實(shí)驗(yàn)數(shù)據(jù)集28-29
- 3.1.2 實(shí)驗(yàn)數(shù)據(jù)處理流程29
- 3.1.3 LDA的主題計(jì)算結(jié)果29-31
- 3.2 LDA與突發(fā)主題提取31-32
- 3.2.1 主題模型中的相似度31-32
- 3.2.2 基于JS距離的突發(fā)主題定義32
- 3.3 突發(fā)主題提取算法32-36
- 3.3.1 基于隨機(jī)游走的區(qū)域探測(cè)算法32-34
- 3.3.2 基于時(shí)間分布的區(qū)域切割算法34-36
- 3.4 實(shí)驗(yàn)參數(shù)敏感度分析36-37
- 3.5 本章小結(jié)37-38
- 第四章 基于主題模型和圖挖掘的突發(fā)主題研究38-46
- 4.1 基于主題模型和馬爾科夫過(guò)程的突發(fā)主題探測(cè)模型38-39
- 4.2 基于社交影響力的突發(fā)主題探測(cè)模型39-44
- 4.2.1 社交網(wǎng)絡(luò)節(jié)點(diǎn)影響力的度量方法39-40
- 4.2.2 模型構(gòu)建40-41
- 4.2.3 實(shí)驗(yàn)結(jié)果41-44
- 4.3 實(shí)驗(yàn)參數(shù)敏感度分析44
- 4.4 本章小結(jié)44-46
- 第五章 總結(jié)與展望46-48
- 5.1 本文工作總結(jié)46
- 5.2 未來(lái)工作展望46-48
- 參考文獻(xiàn)48-54
- 致謝54-56
- 作者攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄56
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 陳宏;陳偉;;基于突發(fā)特征分析的事件檢測(cè)[J];計(jì)算機(jī)應(yīng)用研究;2011年01期
2 ;Online detection of bursty events and their evolution in news streams[J];Journal of Zhejiang University-Science C(Computer & Electronics);2010年05期
3 張虹;趙兵;鐘華;;基于小波多尺度的網(wǎng)絡(luò)論壇話題熱度趨勢(shì)預(yù)測(cè)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年04期
本文關(guān)鍵詞:基于語(yǔ)義和圖挖掘的社交網(wǎng)絡(luò)分析,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):337399
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/337399.html
最近更新
教材專著