基于影響力傳播的中文微博意見領袖挖掘算法的研究與實現(xiàn)
發(fā)布時間:2021-09-28 08:58
微博客作為一種新的輿論載體和傳播途徑,在網(wǎng)絡輿情信息發(fā)起和傳播中起著越來越重要的作用。與傳統(tǒng)的博客、論壇和商品評論等載體相比,微博具有無障礙、短消息和實時性等新特點,從而導致其信息迅速傳播,影響力迅速擴散;诖,本文研究中文微博所構成的社交網(wǎng)絡中的影響力傳播模型,以及基于該模型的意見領袖挖掘算法。首先,由于微博用戶的海量性以及信息傳播的實時性,傳統(tǒng)模型已經(jīng)很難刻畫微博所構成的社交網(wǎng)絡中影響力的傳播過程,因此本文提出三個針對微博的影響力傳播模型,即基本模型、離散時間模型和連續(xù)時間模型,以及用戶之間影響力的學習算法,通過用戶所執(zhí)行的活動判斷其所發(fā)表的信息內(nèi)容對于其他用戶所影響力。在新浪微博數(shù)據(jù)集上的實驗表明,本文所提出的模型可以有效反映影響力在微博用戶間的傳播過程,并預測用戶的活動;第二,為分析用戶所發(fā)表微博內(nèi)容的相似性,深入研究其影響力傳播過程,基于上述模型和微博短消息的特點,提出了針對中文微博語法結構和語義結構的相似性判斷方法,以及基于該判斷方法的微博文本分類算法;谛吕宋⒉⿺(shù)據(jù)的實驗表明了本文所提出的方法對于短文本處理的有效性;最后,基于上述模型和方法,提出了改進的意見領袖挖掘算...
【文章來源】:東北大學遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
圖2.1女子學校餐桌伙伴關系圖??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??
用戶之間發(fā)生了某種互動就會相應的影響他們在社會中的行為。??在社會網(wǎng)絡的形式化表達中,使用一張圖來表示一個社會網(wǎng)絡結構,圖中的一個節(jié)??點表示一個用戶,一條邊表示一對社會行動者之間的關系。如圖2.1所示。???Elie???Jjem*??圖2.1女子學校餐桌伙伴關系圖??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??隨著對于社會網(wǎng)絡結構研究的不斷深入,研究者己經(jīng)對w下幾個要點達成了普遍的??共識:??(1)
微博文本和是含有情感詞或表情符號的微博文本。通過預處理,我們最終得到微博實驗??數(shù)據(jù)集M,其中包含用戶約100萬個,微博文本約200萬條。??本實驗使用ROC曲線來比較各個模型的實驗結果。圖3.9展示了靜態(tài)模型中基本??影響力模型和分配影響力模型的比較結果。??一"基本影響力?分配影響力??彿。??呈?0.6?-?^??柿?0.?4?-??Q??1?L?J?1?1??0?0.2?0.4?0.6?0.8?1???假陽率???圖3.9靜態(tài)模型ROC比較??Fig.?3.9?Comparison?of?Static?model?民OC??圖3.10展示了動態(tài)時間模型的基本影響力和分配影響力模型的比較。3.11比較了靜??態(tài)時間模型和離散時間模型W及連續(xù)時間模型的結果。由3.11圖也可1^^看出離散時間模??型、連續(xù)時間模型的準確率也要比靜態(tài)時間模型的準確率高。在做圖3.11的對比實驗中,??本文只使用了分配影響力來計算真陽率和假陽率,因為從圖3.9和圖3.10可W看出采用??分配影響為計算的準確率比較高。??圖3.12展示了離散時間概率模型和靜態(tài)時間概率模型的運行時間的比較結果。由該??圖可W看出,靜態(tài)模型和離散時間模型要比連續(xù)時間模型效率上高很多,而且離散時間??模型和連續(xù)時間模型的真陽率基本相同,所離散時間模型更加適合實際應用,因為它??不僅效率比較高而且結果的準確率也比較高。??-28-??
【參考文獻】:
期刊論文
[1]微博話語場中的意見領袖[J]. 雷海平. 現(xiàn)代交際. 2011(08)
[2]微博網(wǎng)絡輿情中的意見領袖識別及分析[J]. 劉志明,劉魯. 系統(tǒng)工程. 2011(06)
[3]微博意見領袖初探[J]. 劉銳. 新聞記者. 2011(03)
[4]微博時代“意見領袖”特點探析[J]. 宋好. 今傳媒. 2010(11)
[5]一種基于WordNet和Corpus Statistics的語義相似性計算方法[J]. 張東娜,周春光,劉彥斌,郭東偉. 吉林大學學報(理學版). 2010(05)
碩士論文
[1]社會網(wǎng)絡影響力模型及其算法研究[D]. 黎雷.北京交通大學 2010
本文編號:3411613
【文章來源】:東北大學遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
圖2.1女子學校餐桌伙伴關系圖??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??
用戶之間發(fā)生了某種互動就會相應的影響他們在社會中的行為。??在社會網(wǎng)絡的形式化表達中,使用一張圖來表示一個社會網(wǎng)絡結構,圖中的一個節(jié)??點表示一個用戶,一條邊表示一對社會行動者之間的關系。如圖2.1所示。???Elie???Jjem*??圖2.1女子學校餐桌伙伴關系圖??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??隨著對于社會網(wǎng)絡結構研究的不斷深入,研究者己經(jīng)對w下幾個要點達成了普遍的??共識:??(1)
微博文本和是含有情感詞或表情符號的微博文本。通過預處理,我們最終得到微博實驗??數(shù)據(jù)集M,其中包含用戶約100萬個,微博文本約200萬條。??本實驗使用ROC曲線來比較各個模型的實驗結果。圖3.9展示了靜態(tài)模型中基本??影響力模型和分配影響力模型的比較結果。??一"基本影響力?分配影響力??彿。??呈?0.6?-?^??柿?0.?4?-??Q??1?L?J?1?1??0?0.2?0.4?0.6?0.8?1???假陽率???圖3.9靜態(tài)模型ROC比較??Fig.?3.9?Comparison?of?Static?model?民OC??圖3.10展示了動態(tài)時間模型的基本影響力和分配影響力模型的比較。3.11比較了靜??態(tài)時間模型和離散時間模型W及連續(xù)時間模型的結果。由3.11圖也可1^^看出離散時間模??型、連續(xù)時間模型的準確率也要比靜態(tài)時間模型的準確率高。在做圖3.11的對比實驗中,??本文只使用了分配影響力來計算真陽率和假陽率,因為從圖3.9和圖3.10可W看出采用??分配影響為計算的準確率比較高。??圖3.12展示了離散時間概率模型和靜態(tài)時間概率模型的運行時間的比較結果。由該??圖可W看出,靜態(tài)模型和離散時間模型要比連續(xù)時間模型效率上高很多,而且離散時間??模型和連續(xù)時間模型的真陽率基本相同,所離散時間模型更加適合實際應用,因為它??不僅效率比較高而且結果的準確率也比較高。??-28-??
【參考文獻】:
期刊論文
[1]微博話語場中的意見領袖[J]. 雷海平. 現(xiàn)代交際. 2011(08)
[2]微博網(wǎng)絡輿情中的意見領袖識別及分析[J]. 劉志明,劉魯. 系統(tǒng)工程. 2011(06)
[3]微博意見領袖初探[J]. 劉銳. 新聞記者. 2011(03)
[4]微博時代“意見領袖”特點探析[J]. 宋好. 今傳媒. 2010(11)
[5]一種基于WordNet和Corpus Statistics的語義相似性計算方法[J]. 張東娜,周春光,劉彥斌,郭東偉. 吉林大學學報(理學版). 2010(05)
碩士論文
[1]社會網(wǎng)絡影響力模型及其算法研究[D]. 黎雷.北京交通大學 2010
本文編號:3411613
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3411613.html
最近更新
教材專著