天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于語(yǔ)義和圖挖掘的社交網(wǎng)絡(luò)分析

發(fā)布時(shí)間:2017-04-30 19:04

  本文關(guān)鍵詞:基于語(yǔ)義和圖挖掘的社交網(wǎng)絡(luò)分析,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著互聯(lián)網(wǎng)的發(fā)展,活躍在社交網(wǎng)絡(luò)中的人與主題越來(lái)越多,而海量的用戶生成內(nèi)容對(duì)信息的獲取與檢索提出了挑戰(zhàn)。其中,社交網(wǎng)絡(luò)中突然產(chǎn)生的主題(突發(fā)主題,Bursty Topic),由于往往對(duì)應(yīng)著特殊的事件并表征社會(huì)對(duì)突發(fā)事件的輿情,對(duì)其進(jìn)行探測(cè)成為一個(gè)很有價(jià)值的研究熱點(diǎn)。近年來(lái),相關(guān)的研究工作分別從信息流、主題模型以及傳播模型等各個(gè)方面展開了研究,但是仍然存在以下問(wèn)題:1、對(duì)突發(fā)主題缺少數(shù)學(xué)上的明確定義。2、對(duì)突發(fā)主題的研究多集中在新聞和學(xué)術(shù)界,對(duì)于社交網(wǎng)絡(luò)中突發(fā)主題所具有的社交屬性考慮不足。針對(duì)此背景,本文從圖挖掘與語(yǔ)義分析的相關(guān)理論結(jié)合出發(fā),旨在進(jìn)一步探索解決突發(fā)主題檢測(cè)問(wèn)題的解決方案。 首先,針對(duì)突發(fā)主題的數(shù)學(xué)表達(dá)問(wèn)題。本文在主題模型相似性的基礎(chǔ)上,提出了一種突發(fā)主題的數(shù)學(xué)模型:基于JS距離的突發(fā)主題模型。并給出了兩種求解算法:基于隨機(jī)游走的區(qū)域探測(cè)算法,以及基于時(shí)間分布的區(qū)域切割算法。在單服務(wù)器開銷限制下,實(shí)驗(yàn)證明能有效解決大規(guī)模社交網(wǎng)絡(luò)數(shù)據(jù)的突發(fā)主題提取問(wèn)題。同時(shí),對(duì)所提算法覆蓋度、時(shí)間復(fù)雜度進(jìn)行了測(cè)試和評(píng)估。 然后,針對(duì)突發(fā)主題社交屬性研究不足的問(wèn)題。本文對(duì)前人工作中提出的基于主題模型和馬爾科夫過(guò)程的突發(fā)探測(cè)模型進(jìn)行了改進(jìn)?紤]到在社交網(wǎng)絡(luò)中文檔作者對(duì)突發(fā)主題產(chǎn)生的影響,在馬爾科夫過(guò)程的轉(zhuǎn)移概率中加入了社交影響力參數(shù),提出了基于社交影響力和主題模型的突發(fā)探測(cè)模型。在同經(jīng)典模型對(duì)比實(shí)驗(yàn)中,新的模型對(duì)于突發(fā)話題的探測(cè)具有更高的準(zhǔn)確性。
【關(guān)鍵詞】:突發(fā)主題 主題模型 社交影響力 社交網(wǎng)絡(luò)
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.09
【目錄】:
  • 摘要4-5
  • ABSTRACT5-8
  • 第一章 緒論8-18
  • 1.1 主題模型相關(guān)研究9-13
  • 1.1.1 LDA模型的產(chǎn)生10-11
  • 1.1.1.1 潛在語(yǔ)義分析模型LSA10
  • 1.1.1.2 概率潛在語(yǔ)義分析模型PLSA10
  • 1.1.1.3 隱含狄利克雷分布模型LDA10-11
  • 1.1.2 LDA模型的改進(jìn)研究11-12
  • 1.1.3 LDA模型的應(yīng)用研究12-13
  • 1.2 突發(fā)主題檢測(cè)的相關(guān)研究13-14
  • 1.3 基于社交關(guān)系的主題發(fā)現(xiàn)研究14-15
  • 1.4 本文的主要工作和創(chuàng)新點(diǎn)15
  • 1.5 論文結(jié)構(gòu)安排15-18
  • 第二章 面向突發(fā)主題檢測(cè)的動(dòng)態(tài)主題模型相關(guān)研究18-28
  • 2.1 隱含狄利克雷分布模型LDA18-24
  • 2.1.1 LDA模型的參數(shù)推導(dǎo)19-20
  • 2.1.2 LDA模型求解20-24
  • 2.2 動(dòng)態(tài)結(jié)構(gòu)的主題模型24-26
  • 2.2.1 動(dòng)態(tài)主題模型DTM24-25
  • 2.2.2 時(shí)變主題模型TOT25
  • 2.2.3 兩種模型的對(duì)比25-26
  • 2.3 主題模型評(píng)估方法26
  • 2.4 主題模型與突發(fā)主題提取26-27
  • 2.5 本章小結(jié)27-28
  • 第三章 基于LDA生成概率矩陣的突發(fā)主題研究28-38
  • 3.1 LDA在實(shí)驗(yàn)數(shù)據(jù)上的表現(xiàn)28-31
  • 3.1.1 實(shí)驗(yàn)數(shù)據(jù)集28-29
  • 3.1.2 實(shí)驗(yàn)數(shù)據(jù)處理流程29
  • 3.1.3 LDA的主題計(jì)算結(jié)果29-31
  • 3.2 LDA與突發(fā)主題提取31-32
  • 3.2.1 主題模型中的相似度31-32
  • 3.2.2 基于JS距離的突發(fā)主題定義32
  • 3.3 突發(fā)主題提取算法32-36
  • 3.3.1 基于隨機(jī)游走的區(qū)域探測(cè)算法32-34
  • 3.3.2 基于時(shí)間分布的區(qū)域切割算法34-36
  • 3.4 實(shí)驗(yàn)參數(shù)敏感度分析36-37
  • 3.5 本章小結(jié)37-38
  • 第四章 基于主題模型和圖挖掘的突發(fā)主題研究38-46
  • 4.1 基于主題模型和馬爾科夫過(guò)程的突發(fā)主題探測(cè)模型38-39
  • 4.2 基于社交影響力的突發(fā)主題探測(cè)模型39-44
  • 4.2.1 社交網(wǎng)絡(luò)節(jié)點(diǎn)影響力的度量方法39-40
  • 4.2.2 模型構(gòu)建40-41
  • 4.2.3 實(shí)驗(yàn)結(jié)果41-44
  • 4.3 實(shí)驗(yàn)參數(shù)敏感度分析44
  • 4.4 本章小結(jié)44-46
  • 第五章 總結(jié)與展望46-48
  • 5.1 本文工作總結(jié)46
  • 5.2 未來(lái)工作展望46-48
  • 參考文獻(xiàn)48-54
  • 致謝54-56
  • 作者攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄56

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條

1 陳宏;陳偉;;基于突發(fā)特征分析的事件檢測(cè)[J];計(jì)算機(jī)應(yīng)用研究;2011年01期

2 ;Online detection of bursty events and their evolution in news streams[J];Journal of Zhejiang University-Science C(Computer & Electronics);2010年05期

3 張虹;趙兵;鐘華;;基于小波多尺度的網(wǎng)絡(luò)論壇話題熱度趨勢(shì)預(yù)測(cè)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年04期


  本文關(guān)鍵詞:基于語(yǔ)義和圖挖掘的社交網(wǎng)絡(luò)分析,,由筆耕文化傳播整理發(fā)布。



本文編號(hào):337399

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/337399.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ecab5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com