天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 社會(huì)學(xué)論文 >

復(fù)雜網(wǎng)絡(luò)聚類方法及其在輿情主題分析中的應(yīng)用研究

發(fā)布時(shí)間:2017-06-09 14:19

  本文關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò)聚類方法及其在輿情主題分析中的應(yīng)用研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:大數(shù)據(jù)時(shí)代,龐大的用戶群及用戶間的連接關(guān)系使得社交網(wǎng)絡(luò)對(duì)網(wǎng)絡(luò)輿情發(fā)展產(chǎn)生了重要的影響。微博作為web2.0的自媒體代表和網(wǎng)絡(luò)輿情信息的來源,每天用戶通過微博進(jìn)行交流產(chǎn)生的信息數(shù)以億計(jì)。為了對(duì)微博網(wǎng)絡(luò)進(jìn)行較為全面的分析,需要分別針對(duì)用戶網(wǎng)絡(luò)和文本網(wǎng)絡(luò)進(jìn)行相應(yīng)研究。因此,從用戶網(wǎng)絡(luò)中有效地劃分出交聯(lián)社團(tuán)并且在微博文本中準(zhǔn)確地識(shí)別出不同的主題對(duì)輿情分析有著重要的意義和價(jià)值。本文在現(xiàn)有復(fù)雜網(wǎng)絡(luò)聚類算法的基礎(chǔ)上,對(duì)原有的模糊聚類算法進(jìn)行了改進(jìn),實(shí)現(xiàn)對(duì)復(fù)雜網(wǎng)絡(luò)交聯(lián)社團(tuán)結(jié)構(gòu)的劃分;谖谋局黝}聚類方法,對(duì)文本主題進(jìn)行提取,以便發(fā)現(xiàn)網(wǎng)絡(luò)輿情主題信息,掌握網(wǎng)絡(luò)輿情的動(dòng)態(tài)。本文的主要研究內(nèi)容有以下幾個(gè)方面:(1)首先介紹了復(fù)雜網(wǎng)絡(luò)聚類算法和網(wǎng)絡(luò)輿情主題分析的研究現(xiàn)狀,并對(duì)復(fù)雜網(wǎng)絡(luò)的社團(tuán)結(jié)構(gòu)的基礎(chǔ)理論以及社團(tuán)劃分質(zhì)量衡量標(biāo)準(zhǔn)進(jìn)行了詳述。對(duì)復(fù)雜網(wǎng)絡(luò)社團(tuán)劃分的主流算法和交聯(lián)社團(tuán)劃分算法進(jìn)行了詳細(xì)地介紹和分析。(2)從聚類方法理論出發(fā),說明了聚類和復(fù)雜網(wǎng)絡(luò)社團(tuán)劃分的聯(lián)系。在模糊聚類算法的基礎(chǔ)上引入衡量社團(tuán)劃分質(zhì)量指標(biāo)的Q值,一定程度上緩解了FCM(Fuzzy C-Means)算法聚類數(shù)難以確定的問題,并基于改進(jìn)的FCM算法進(jìn)行復(fù)雜網(wǎng)絡(luò)交聯(lián)社團(tuán)劃分。在兩個(gè)經(jīng)典數(shù)據(jù)集上應(yīng)用改進(jìn)的FCM算法,實(shí)驗(yàn)結(jié)果表明改進(jìn)后的算法可以有效地發(fā)現(xiàn)復(fù)雜網(wǎng)絡(luò)中的交聯(lián)社團(tuán)。(3)基于對(duì)主題聚類模型詳細(xì)介紹,將利用Gibbs抽樣的狄利克雷分配模型用于文本主題分析研究上,得到文檔-主題和主題-特征詞概率矩陣,從而推理出文本的隱含主題變量。對(duì)天涯論壇文本數(shù)據(jù)進(jìn)行LDA(Latent Dirichlet Allocation)建模,實(shí)現(xiàn)了天涯論壇文本主題挖掘,并進(jìn)行了分析。(4)依照微博網(wǎng)絡(luò)利用聚類算法進(jìn)行了一定的主題分析。微博網(wǎng)絡(luò)分為用戶層和博文層兩個(gè)層級(jí)。利用真實(shí)的新浪微博數(shù)據(jù),基于改進(jìn)的FCM算法對(duì)用戶構(gòu)成的社交網(wǎng)絡(luò)層進(jìn)行了交聯(lián)社團(tuán)劃分,并且基于LDA模型對(duì)用戶發(fā)布微博構(gòu)成的博文層進(jìn)行了文本主題發(fā)現(xiàn);诮宦(lián)社團(tuán)發(fā)現(xiàn)進(jìn)行了博主關(guān)系網(wǎng)絡(luò)分析,實(shí)驗(yàn)表明:交聯(lián)社團(tuán)用戶發(fā)表博文分布符合冪律分布,用戶活躍度與社團(tuán)規(guī)模呈現(xiàn)正相關(guān),同一社團(tuán)內(nèi)用戶發(fā)表博文主題存在重疊。
【關(guān)鍵詞】:復(fù)雜網(wǎng)絡(luò) 交聯(lián)社團(tuán) 聚類算法 網(wǎng)絡(luò)輿情 主題分析
【學(xué)位授予單位】:新疆財(cái)經(jīng)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:C81
【目錄】:
  • 摘要2-3
  • 英文摘要3-7
  • 第一章 緒論7-13
  • 第一節(jié) 研究背景及意義7-8
  • 第二節(jié) 國內(nèi)外研究現(xiàn)狀8-10
  • 一、復(fù)雜網(wǎng)絡(luò)聚類方法研究綜述8-9
  • 二、網(wǎng)絡(luò)輿情主題分析研究綜述9-10
  • 第三節(jié) 本文的研究內(nèi)容10-11
  • 第四節(jié) 本文的組織結(jié)構(gòu)11-13
  • 第二章 復(fù)雜網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)方法理論基礎(chǔ)13-23
  • 第一節(jié) 復(fù)雜網(wǎng)絡(luò)與社團(tuán)結(jié)構(gòu)13-17
  • 一、復(fù)雜網(wǎng)絡(luò)相關(guān)概念13-14
  • 二、社團(tuán)結(jié)構(gòu)相關(guān)概念14-17
  • 第二節(jié) 復(fù)雜網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)主流算法17-21
  • 一、圖形分割算法17-18
  • 二、分裂方法18-19
  • 三、凝聚方法19-21
  • 第三節(jié) 復(fù)雜網(wǎng)絡(luò)交聯(lián)社團(tuán)發(fā)現(xiàn)算法21-22
  • 第四節(jié) 本章小結(jié)22-23
  • 第三章 基于FCM算法的復(fù)雜網(wǎng)絡(luò)交聯(lián)社團(tuán)發(fā)現(xiàn)23-31
  • 第一節(jié) 聚類與社團(tuán)發(fā)現(xiàn)23-24
  • 第二節(jié) FCM算法理論基礎(chǔ)24-26
  • 一、模糊聚類算法基礎(chǔ)知識(shí)24-26
  • 二、FCM聚類算法的影響參數(shù)及特點(diǎn)26
  • 第三節(jié) FCM聚類算法發(fā)現(xiàn)交聯(lián)社團(tuán)結(jié)構(gòu)26-27
  • 一、對(duì)FCM聚類算法的改進(jìn)26-27
  • 二、交聯(lián)社團(tuán)結(jié)構(gòu)發(fā)現(xiàn)的實(shí)現(xiàn)步驟27
  • 第四節(jié) 實(shí)驗(yàn)與結(jié)果分析27-30
  • 一、空手道俱樂部Zachary網(wǎng)絡(luò)27-29
  • 二、美國大學(xué)橄欖球聯(lián)盟Football網(wǎng)絡(luò)29-30
  • 第五節(jié) 本章小結(jié)30-31
  • 第四章 基于LDA模型的文本主題分析31-49
  • 第一節(jié) LDA模型基礎(chǔ)理論31-37
  • 一、概率主題模型31-32
  • 二、LDA模型32-36
  • 三、LDA模型的參數(shù)估計(jì)算法36-37
  • 第二節(jié) 基于模糊聚類方法優(yōu)化LDA模型37-41
  • 一、基于LDA模型的文本聚類37-40
  • 二、文本主題分析40-41
  • 第三節(jié) 實(shí)驗(yàn)與結(jié)果分析41-48
  • 一、實(shí)驗(yàn)流程、實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)語料41-42
  • 二、實(shí)驗(yàn)設(shè)計(jì)與結(jié)果42-48
  • 第四節(jié) 本章小結(jié)48-49
  • 第五章 網(wǎng)絡(luò)輿情主題分析及實(shí)證研究49-64
  • 第一節(jié) 基于優(yōu)化FCM算法的微博用戶網(wǎng)絡(luò)交聯(lián)社團(tuán)發(fā)現(xiàn)49-53
  • 一、微博數(shù)據(jù)的采集與處理49-50
  • 二、微博用戶網(wǎng)絡(luò)交聯(lián)社團(tuán)發(fā)現(xiàn)50-53
  • 第二節(jié) 基于優(yōu)化LDA模型的微博文本主題分析53-58
  • 一、微博文本數(shù)據(jù)的采集和處理53-54
  • 二、微博博文主題分析54-58
  • 第三節(jié) 基于交聯(lián)社團(tuán)發(fā)現(xiàn)的博主關(guān)系網(wǎng)絡(luò)分析58-63
  • 第四節(jié) 本章小結(jié)63-64
  • 第六章 總結(jié)與展望64-66
  • 第一節(jié) 本文總結(jié)64-65
  • 第二節(jié) 工作展望65-66
  • 參考文獻(xiàn)66-70
  • 致謝70-71
  • 碩士期間發(fā)表論文及參與科研項(xiàng)目71

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前9條

1 張h;田彥山;;基于減法聚類的聚類上限確定方法[J];固原師專學(xué)報(bào);2006年03期

2 王英奇;;支持向量聚類算法的研究與改進(jìn)[J];湛江師范學(xué)院學(xué)報(bào);2008年06期

3 葉苗群;;Web客戶的核聚類[J];寧波職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年02期

4 陸克中;;ABC-KHM混合聚類算法[J];池州學(xué)院學(xué)報(bào);2013年03期

5 陳映果;;改進(jìn)的F-ISODATA聚類算法在ANFIS建模中的應(yīng)用[J];荊楚理工學(xué)院學(xué)報(bào);2011年02期

6 張向鋒;王致杰;;一種基于免疫聚類算法的數(shù)據(jù)分類[J];上海電機(jī)學(xué)院學(xué)報(bào);2011年01期

7 周志平;莊金蓮;陳佳麗;;半監(jiān)督聚類在入侵檢測中的應(yīng)用研究[J];武夷學(xué)院學(xué)報(bào);2013年05期

8 付淇;;基于K-means的最佳聚類數(shù)的求解問題研究[J];南昌高專學(xué)報(bào);2011年02期

9 ;[J];;年期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前9條

1 高翠芳;吳小俊;;基于二階差分的聚類數(shù)自動(dòng)確定方法[A];江蘇省系統(tǒng)工程學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年

2 劉洋;江志綱;丁增喜;王大玲;鮑玉斌;于戈;;一種基于圖的聚類算法GB-Cluster[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

3 李浪波;傅彥;劉紅;;基于范例推理的網(wǎng)格和密度聚類算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年

4 婁冬梅;陳明;朱有娜;;一種基于密度的無參數(shù)聚類算法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年

5 魏昕路;洪志令;姜青山;;一種基于樣本縮減策略的新窗口式聚類算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年

6 程尊平;周鼎;王晨;周皓峰;汪衛(wèi);施伯樂;;SDPHC——基于密度的分割和分層的自校聚類算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年

7 張曉峰;王麗珍;陸葉;;一種基于屬性加權(quán)的不確定K-means聚類算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年

8 蔡軍;袁華鵬;陳金海;施伯樂;;一種基于相似性分析的聚類新算法:PDS算法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

9 胡仲義;郭超;王永炎;劉勝航;王宏安;;基于時(shí)間衰減和特征變量的數(shù)據(jù)流聚類算法[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 王振佳;基于基因表達(dá)數(shù)據(jù)的雙聚類算法研究[D];山東大學(xué);2016年

2 胡雅婷;可能性聚類方法研究及應(yīng)用[D];吉林大學(xué);2012年

3 王縱虎;聚類分析優(yōu)化關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2012年

4 周世兵;聚類分析中的最佳聚類數(shù)確定方法研究及應(yīng)用[D];江南大學(xué);2011年

5 楊燕;基于計(jì)算智能的聚類組合算法研究[D];西南交通大學(xué);2006年

6 馮永;基于計(jì)算智能的聚類技術(shù)及其應(yīng)用研究[D];重慶大學(xué);2006年

7 劉晨;高伸縮性聚類分析方法研究[D];哈爾濱工程大學(xué);2013年

8 王強(qiáng);局部疊加基因表達(dá)模式聚類分析方法研究[D];哈爾濱工業(yè)大學(xué);2012年

9 姜磊;混合演化聚類算法研究及其應(yīng)用[D];武漢大學(xué);2012年

10 尹學(xué)松;半監(jiān)督聚類分析策略設(shè)計(jì)及其拓展性研究[D];南京航空航天大學(xué);2009年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 魏建東;K-means初始化算法研究[D];南京理工大學(xué);2015年

2 張依;基于MapReduce的k-means聚類算法并行化研究[D];中央民族大學(xué);2015年

3 劉嬋;蟻群與K均值聚類算法融合研究及其在用戶分群中的應(yīng)用[D];西南科技大學(xué);2015年

4 朱琪;基于減法聚類的混合算法研究[D];湖南科技大學(xué);2015年

5 韓偉森;聚類集成研究與應(yīng)用[D];貴州大學(xué);2015年

6 譚浩;K-Means算法改進(jìn)及其在森林健康評(píng)價(jià)中的應(yīng)用[D];中南林業(yè)科技大學(xué);2015年

7 嚴(yán)巍;以KPCA為核心的FCM算法改進(jìn)[D];成都理工大學(xué);2015年

8 汪娟;基于權(quán)重設(shè)計(jì)的聚類集成算法研究[D];重慶大學(xué);2015年

9 牛品菽;基于圖模型的高效聚類算法研究[D];北京交通大學(xué);2016年

10 蔡洪山;大數(shù)據(jù)分析中的聚類算法研究[D];安徽理工大學(xué);2016年


  本文關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò)聚類方法及其在輿情主題分析中的應(yīng)用研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):435741

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shekelunwen/shgj/435741.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶240b0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com