基于隱性語義挖掘的社區(qū)劃分算法
發(fā)布時間:2021-08-26 21:26
Web2.0時代,社交網(wǎng)絡(luò)在世界范圍內(nèi)流行了起來。社交網(wǎng)絡(luò)中用戶結(jié)構(gòu)、信息結(jié)構(gòu)和社群結(jié)構(gòu)是社交網(wǎng)絡(luò)所研究的重點課題。近年來,中國新浪微博的發(fā)展速度很快,并且為開發(fā)者和研究者提供了便于開發(fā)與研究的數(shù)據(jù)開放平臺,成為業(yè)界和學(xué)術(shù)界研究的熱點。本文基于新浪微博開放平臺的數(shù)據(jù),對新浪微博的用戶結(jié)構(gòu)、信息結(jié)構(gòu)做了詳細的統(tǒng)計和分析。在新浪微博用戶社區(qū)結(jié)構(gòu)上,結(jié)合新浪微博社交性和媒體性特點,本文提出了將用戶的“社交”維度和“興趣”維度分開的主張。作者用適合社區(qū)檢索的LDA(隱性語義挖掘)的算法,對原本用于“詞-文本”挖掘的算法進行了改進,將“用戶-好友”和“用戶-興趣點”作為LDA的初始資料庫,進行訓(xùn)練和分群。在文章中,作者對新浪微博的用戶進行了分類,統(tǒng)計了所有類別用戶的在關(guān)系結(jié)構(gòu)上的比例特點,并對其中的統(tǒng)計特點做了詳細的解釋。同時,作者對新浪微博的微博信息進行了分類,統(tǒng)計和分析了各類信息、不同用戶的發(fā)布和轉(zhuǎn)發(fā)情況,并對各種統(tǒng)計現(xiàn)象做了詳細解釋。本文對“社交群”與“興趣群”重疊的網(wǎng)絡(luò),提出了改進的LDA模型。1.本文提出了SI-LDA算法模型。其基本假設(shè)是每一個人都是可以用他的好友來形容,同時用戶的興...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
一個用絡(luò)是重疊的,用戶d的微博其重疊部分博網(wǎng)絡(luò)的建模分是用戶d因模因為興趣而關(guān)注的大眾用戶戶u
社區(qū)劃分的過程
黃宇KaldrArt的Louvain算法社臣劃分
本文編號:3364997
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
一個用絡(luò)是重疊的,用戶d的微博其重疊部分博網(wǎng)絡(luò)的建模分是用戶d因模因為興趣而關(guān)注的大眾用戶戶u
社區(qū)劃分的過程
黃宇KaldrArt的Louvain算法社臣劃分
本文編號:3364997
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3364997.html
最近更新
教材專著