基于微博主題同質(zhì)性的隱社區(qū)發(fā)現(xiàn)及演化機制探究
發(fā)布時間:2022-07-13 19:23
伴隨著信息技術(shù)的不斷更新以及互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)中的數(shù)據(jù)呈現(xiàn)出了幾何級的增長速度,其中社交網(wǎng)絡(luò)及信息傳播過程中積累的數(shù)據(jù)更是空前暴漲。微博作為使用廣泛的大型實時在線社交平臺,方便用戶對自己感興趣的事件或者話題發(fā)表意見并進行評論;與其相似的新聞網(wǎng)站作為信息傳播中極其重要的平臺,方便用戶們獲取國內(nèi)外新聞熱點。這些平臺的不斷發(fā)展都積累了海量的數(shù)據(jù),對這些海量數(shù)據(jù)進行統(tǒng)計分析并找出數(shù)據(jù)的特征,挖掘出有價值的信息對商品、信息推薦以及輿情引導(dǎo)等在實際生活中的應(yīng)用都具有深遠的意義。研究表明,社區(qū)發(fā)現(xiàn)和社區(qū)演化作為分析社交網(wǎng)絡(luò)數(shù)據(jù)的重要手段倍受青睞。在目前的相關(guān)研究中,基于文本主題同質(zhì)性的社區(qū)發(fā)現(xiàn)及演化的研究尚未得到充分的關(guān)注。本文的主要貢獻如下:1.本文提出了一種基于微博主題同質(zhì)性表示的隱社區(qū)的發(fā)現(xiàn)算法,從而實現(xiàn)對微博社交網(wǎng)絡(luò)的隱主題社區(qū)發(fā)現(xiàn)。首先,對微博語料庫進行預(yù)處理并把每個用戶發(fā)布的所有博文拼接為一個文檔,并采用主題提取模型LDA來提取用戶的主題特征用于刻畫微博用戶;接著,基于主題興趣計算兩個用戶之間的同質(zhì)性測度用于表示社交網(wǎng)絡(luò)的用戶關(guān)系;然后,通過無監(jiān)督算法構(gòu)建以主題興趣為同質(zhì)關(guān)系的社區(qū)來...
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究的背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 同質(zhì)性相關(guān)研究現(xiàn)狀
1.2.2 社區(qū)發(fā)現(xiàn)研究現(xiàn)狀
1.2.3 社區(qū)演化研究現(xiàn)狀
1.2.4 主題演化研究現(xiàn)狀
1.3 本文的研究內(nèi)容
1.4 本文的結(jié)構(gòu)安排
2 相關(guān)理論知識
2.1 同質(zhì)性度量
2.2 LDA主題模型
2.3 無監(jiān)督學(xué)習(xí)
2.4 數(shù)據(jù)降維技術(shù)
2.4.1 PCA降維技術(shù)
2.4.2 t-SNE降維技術(shù)
2.5 本章小結(jié)
3 基于微博主題同質(zhì)性的隱社區(qū)發(fā)現(xiàn)
3.1 隱社交網(wǎng)絡(luò)及隱社區(qū)的表示
3.2 微博文本主題興趣提取
3.3 基于同質(zhì)性構(gòu)建的隱社交網(wǎng)絡(luò)表示
3.4 基于主題同質(zhì)性的K-means隱社區(qū)發(fā)現(xiàn)
3.5 基于主題同質(zhì)性的Birch隱社區(qū)發(fā)現(xiàn)
3.6 實驗
3.6.1 實驗設(shè)置
3.6.2 評價方法
3.6.3 實驗結(jié)果與分析
3.7 本章小結(jié)
4 基于主題演化行為的主題社區(qū)演化探究
4.1 相關(guān)定義
4.2 主題演化模型構(gòu)建
4.2.1 時間片的劃分
4.2.2 主題模型構(gòu)建
4.2.3 社區(qū)主題間的相似性度量
4.2.4 主題強度計算
4.3 社區(qū)主題演化的計算
4.4 實驗結(jié)果與分析
4.4.1 數(shù)據(jù)統(tǒng)計分析及預(yù)處理
4.4.2 主題建模方法比較
4.4.3 社區(qū)主題演化
4.5 本章小結(jié)
5 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
攻讀碩士學(xué)位期間發(fā)表論文及科研成果
致謝
【參考文獻】:
期刊論文
[1]EWT-MFE與t-SNE結(jié)合的旋轉(zhuǎn)機械故障診斷方法[J]. 薛瑞,趙榮珍. 機械設(shè)計與研究. 2019(04)
[2]基于有金標(biāo)準(zhǔn)下的部分核實數(shù)據(jù)對疾病流行率的齊性檢驗[J]. 劉多偉,邱世芳,何杰. 重慶理工大學(xué)學(xué)報(自然科學(xué)). 2019(05)
[3]異質(zhì)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)研究進展[J]. 陽雨,郭勇,李海龍,鄧波. 計算機應(yīng)用研究. 2018(10)
[4]同質(zhì)性和社會影響對混合型社交網(wǎng)絡(luò)形成的仿真分析[J]. 何軍,劉業(yè)政. 現(xiàn)代情報. 2017(04)
[5]基于社會網(wǎng)絡(luò)的人群意見同質(zhì)性分析[J]. 張且,張穎慧,戴羅彧,戴小鵬,樊振宇. 電子商務(wù). 2016(04)
[6]基于節(jié)點聚集系數(shù)的分布式標(biāo)簽傳播算法[J]. 張素智,孫嘉彬,王威. 計算機應(yīng)用與軟件. 2016(04)
[7]基于網(wǎng)絡(luò)閉包理論的交易型社區(qū)網(wǎng)絡(luò)演化研究[J]. 黃敏學(xué),肖邦明,孫培翔. 系統(tǒng)工程理論與實踐. 2015(05)
[8]交易型社區(qū)的病毒式營銷策略:基于社會影響、同質(zhì)性和網(wǎng)絡(luò)拓撲結(jié)構(gòu)的ABMS仿真研究[J]. 肖邦明,黃敏學(xué). 營銷科學(xué)學(xué)報. 2015(01)
[9]用戶行為驅(qū)動的在線社交網(wǎng)絡(luò)建模[J]. 李倩倩,顧基發(fā). 系統(tǒng)工程學(xué)報. 2015(01)
[10]LDA及主題詞相關(guān)性的新事件檢測[J]. 黃穎. 計算機與現(xiàn)代化. 2012(01)
博士論文
[1]復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)若干問題研究[D]. 姜雅文.北京交通大學(xué) 2014
碩士論文
[1]基于結(jié)構(gòu)和引力雙內(nèi)聚的動態(tài)微博社區(qū)研究[D]. 劉佳.西華大學(xué) 2018
[2]基于LDA的主題演化研究與實現(xiàn)[D]. 崔凱.國防科學(xué)技術(shù)大學(xué) 2010
本文編號:3660624
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究的背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 同質(zhì)性相關(guān)研究現(xiàn)狀
1.2.2 社區(qū)發(fā)現(xiàn)研究現(xiàn)狀
1.2.3 社區(qū)演化研究現(xiàn)狀
1.2.4 主題演化研究現(xiàn)狀
1.3 本文的研究內(nèi)容
1.4 本文的結(jié)構(gòu)安排
2 相關(guān)理論知識
2.1 同質(zhì)性度量
2.2 LDA主題模型
2.3 無監(jiān)督學(xué)習(xí)
2.4 數(shù)據(jù)降維技術(shù)
2.4.1 PCA降維技術(shù)
2.4.2 t-SNE降維技術(shù)
2.5 本章小結(jié)
3 基于微博主題同質(zhì)性的隱社區(qū)發(fā)現(xiàn)
3.1 隱社交網(wǎng)絡(luò)及隱社區(qū)的表示
3.2 微博文本主題興趣提取
3.3 基于同質(zhì)性構(gòu)建的隱社交網(wǎng)絡(luò)表示
3.4 基于主題同質(zhì)性的K-means隱社區(qū)發(fā)現(xiàn)
3.5 基于主題同質(zhì)性的Birch隱社區(qū)發(fā)現(xiàn)
3.6 實驗
3.6.1 實驗設(shè)置
3.6.2 評價方法
3.6.3 實驗結(jié)果與分析
3.7 本章小結(jié)
4 基于主題演化行為的主題社區(qū)演化探究
4.1 相關(guān)定義
4.2 主題演化模型構(gòu)建
4.2.1 時間片的劃分
4.2.2 主題模型構(gòu)建
4.2.3 社區(qū)主題間的相似性度量
4.2.4 主題強度計算
4.3 社區(qū)主題演化的計算
4.4 實驗結(jié)果與分析
4.4.1 數(shù)據(jù)統(tǒng)計分析及預(yù)處理
4.4.2 主題建模方法比較
4.4.3 社區(qū)主題演化
4.5 本章小結(jié)
5 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
攻讀碩士學(xué)位期間發(fā)表論文及科研成果
致謝
【參考文獻】:
期刊論文
[1]EWT-MFE與t-SNE結(jié)合的旋轉(zhuǎn)機械故障診斷方法[J]. 薛瑞,趙榮珍. 機械設(shè)計與研究. 2019(04)
[2]基于有金標(biāo)準(zhǔn)下的部分核實數(shù)據(jù)對疾病流行率的齊性檢驗[J]. 劉多偉,邱世芳,何杰. 重慶理工大學(xué)學(xué)報(自然科學(xué)). 2019(05)
[3]異質(zhì)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)研究進展[J]. 陽雨,郭勇,李海龍,鄧波. 計算機應(yīng)用研究. 2018(10)
[4]同質(zhì)性和社會影響對混合型社交網(wǎng)絡(luò)形成的仿真分析[J]. 何軍,劉業(yè)政. 現(xiàn)代情報. 2017(04)
[5]基于社會網(wǎng)絡(luò)的人群意見同質(zhì)性分析[J]. 張且,張穎慧,戴羅彧,戴小鵬,樊振宇. 電子商務(wù). 2016(04)
[6]基于節(jié)點聚集系數(shù)的分布式標(biāo)簽傳播算法[J]. 張素智,孫嘉彬,王威. 計算機應(yīng)用與軟件. 2016(04)
[7]基于網(wǎng)絡(luò)閉包理論的交易型社區(qū)網(wǎng)絡(luò)演化研究[J]. 黃敏學(xué),肖邦明,孫培翔. 系統(tǒng)工程理論與實踐. 2015(05)
[8]交易型社區(qū)的病毒式營銷策略:基于社會影響、同質(zhì)性和網(wǎng)絡(luò)拓撲結(jié)構(gòu)的ABMS仿真研究[J]. 肖邦明,黃敏學(xué). 營銷科學(xué)學(xué)報. 2015(01)
[9]用戶行為驅(qū)動的在線社交網(wǎng)絡(luò)建模[J]. 李倩倩,顧基發(fā). 系統(tǒng)工程學(xué)報. 2015(01)
[10]LDA及主題詞相關(guān)性的新事件檢測[J]. 黃穎. 計算機與現(xiàn)代化. 2012(01)
博士論文
[1]復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)若干問題研究[D]. 姜雅文.北京交通大學(xué) 2014
碩士論文
[1]基于結(jié)構(gòu)和引力雙內(nèi)聚的動態(tài)微博社區(qū)研究[D]. 劉佳.西華大學(xué) 2018
[2]基于LDA的主題演化研究與實現(xiàn)[D]. 崔凱.國防科學(xué)技術(shù)大學(xué) 2010
本文編號:3660624
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3660624.html
最近更新
教材專著