基于影響力傳播的中文微博意見領(lǐng)袖挖掘算法的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-09-28 08:58
微博客作為一種新的輿論載體和傳播途徑,在網(wǎng)絡(luò)輿情信息發(fā)起和傳播中起著越來(lái)越重要的作用。與傳統(tǒng)的博客、論壇和商品評(píng)論等載體相比,微博具有無(wú)障礙、短消息和實(shí)時(shí)性等新特點(diǎn),從而導(dǎo)致其信息迅速傳播,影響力迅速擴(kuò)散。基于此,本文研究中文微博所構(gòu)成的社交網(wǎng)絡(luò)中的影響力傳播模型,以及基于該模型的意見領(lǐng)袖挖掘算法。首先,由于微博用戶的海量性以及信息傳播的實(shí)時(shí)性,傳統(tǒng)模型已經(jīng)很難刻畫微博所構(gòu)成的社交網(wǎng)絡(luò)中影響力的傳播過(guò)程,因此本文提出三個(gè)針對(duì)微博的影響力傳播模型,即基本模型、離散時(shí)間模型和連續(xù)時(shí)間模型,以及用戶之間影響力的學(xué)習(xí)算法,通過(guò)用戶所執(zhí)行的活動(dòng)判斷其所發(fā)表的信息內(nèi)容對(duì)于其他用戶所影響力。在新浪微博數(shù)據(jù)集上的實(shí)驗(yàn)表明,本文所提出的模型可以有效反映影響力在微博用戶間的傳播過(guò)程,并預(yù)測(cè)用戶的活動(dòng);第二,為分析用戶所發(fā)表微博內(nèi)容的相似性,深入研究其影響力傳播過(guò)程,基于上述模型和微博短消息的特點(diǎn),提出了針對(duì)中文微博語(yǔ)法結(jié)構(gòu)和語(yǔ)義結(jié)構(gòu)的相似性判斷方法,以及基于該判斷方法的微博文本分類算法;谛吕宋⒉⿺(shù)據(jù)的實(shí)驗(yàn)表明了本文所提出的方法對(duì)于短文本處理的有效性;最后,基于上述模型和方法,提出了改進(jìn)的意見領(lǐng)袖挖掘算...
【文章來(lái)源】:東北大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1女子學(xué)校餐桌伙伴關(guān)系圖??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??
用戶之間發(fā)生了某種互動(dòng)就會(huì)相應(yīng)的影響他們?cè)谏鐣?huì)中的行為。??在社會(huì)網(wǎng)絡(luò)的形式化表達(dá)中,使用一張圖來(lái)表示一個(gè)社會(huì)網(wǎng)絡(luò)結(jié)構(gòu),圖中的一個(gè)節(jié)??點(diǎn)表示一個(gè)用戶,一條邊表示一對(duì)社會(huì)行動(dòng)者之間的關(guān)系。如圖2.1所示。???Elie???Jjem*??圖2.1女子學(xué)校餐桌伙伴關(guān)系圖??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??隨著對(duì)于社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)研究的不斷深入,研究者己經(jīng)對(duì)w下幾個(gè)要點(diǎn)達(dá)成了普遍的??共識(shí):??(1)
微博文本和是含有情感詞或表情符號(hào)的微博文本。通過(guò)預(yù)處理,我們最終得到微博實(shí)驗(yàn)??數(shù)據(jù)集M,其中包含用戶約100萬(wàn)個(gè),微博文本約200萬(wàn)條。??本實(shí)驗(yàn)使用ROC曲線來(lái)比較各個(gè)模型的實(shí)驗(yàn)結(jié)果。圖3.9展示了靜態(tài)模型中基本??影響力模型和分配影響力模型的比較結(jié)果。??一"基本影響力?分配影響力??彿。??呈?0.6?-?^??柿?0.?4?-??Q??1?L?J?1?1??0?0.2?0.4?0.6?0.8?1???假陽(yáng)率???圖3.9靜態(tài)模型ROC比較??Fig.?3.9?Comparison?of?Static?model?民OC??圖3.10展示了動(dòng)態(tài)時(shí)間模型的基本影響力和分配影響力模型的比較。3.11比較了靜??態(tài)時(shí)間模型和離散時(shí)間模型W及連續(xù)時(shí)間模型的結(jié)果。由3.11圖也可1^^看出離散時(shí)間模??型、連續(xù)時(shí)間模型的準(zhǔn)確率也要比靜態(tài)時(shí)間模型的準(zhǔn)確率高。在做圖3.11的對(duì)比實(shí)驗(yàn)中,??本文只使用了分配影響力來(lái)計(jì)算真陽(yáng)率和假陽(yáng)率,因?yàn)閺膱D3.9和圖3.10可W看出采用??分配影響為計(jì)算的準(zhǔn)確率比較高。??圖3.12展示了離散時(shí)間概率模型和靜態(tài)時(shí)間概率模型的運(yùn)行時(shí)間的比較結(jié)果。由該??圖可W看出,靜態(tài)模型和離散時(shí)間模型要比連續(xù)時(shí)間模型效率上高很多,而且離散時(shí)間??模型和連續(xù)時(shí)間模型的真陽(yáng)率基本相同,所離散時(shí)間模型更加適合實(shí)際應(yīng)用,因?yàn)樗??不僅效率比較高而且結(jié)果的準(zhǔn)確率也比較高。??-28-??
【參考文獻(xiàn)】:
期刊論文
[1]微博話語(yǔ)場(chǎng)中的意見領(lǐng)袖[J]. 雷海平. 現(xiàn)代交際. 2011(08)
[2]微博網(wǎng)絡(luò)輿情中的意見領(lǐng)袖識(shí)別及分析[J]. 劉志明,劉魯. 系統(tǒng)工程. 2011(06)
[3]微博意見領(lǐng)袖初探[J]. 劉銳. 新聞?dòng)浾? 2011(03)
[4]微博時(shí)代“意見領(lǐng)袖”特點(diǎn)探析[J]. 宋好. 今傳媒. 2010(11)
[5]一種基于WordNet和Corpus Statistics的語(yǔ)義相似性計(jì)算方法[J]. 張東娜,周春光,劉彥斌,郭東偉. 吉林大學(xué)學(xué)報(bào)(理學(xué)版). 2010(05)
碩士論文
[1]社會(huì)網(wǎng)絡(luò)影響力模型及其算法研究[D]. 黎雷.北京交通大學(xué) 2010
本文編號(hào):3411613
【文章來(lái)源】:東北大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1女子學(xué)校餐桌伙伴關(guān)系圖??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??
用戶之間發(fā)生了某種互動(dòng)就會(huì)相應(yīng)的影響他們?cè)谏鐣?huì)中的行為。??在社會(huì)網(wǎng)絡(luò)的形式化表達(dá)中,使用一張圖來(lái)表示一個(gè)社會(huì)網(wǎng)絡(luò)結(jié)構(gòu),圖中的一個(gè)節(jié)??點(diǎn)表示一個(gè)用戶,一條邊表示一對(duì)社會(huì)行動(dòng)者之間的關(guān)系。如圖2.1所示。???Elie???Jjem*??圖2.1女子學(xué)校餐桌伙伴關(guān)系圖??Fig.?2.1?School?for?girls?dining?partner?relationship?graph??隨著對(duì)于社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)研究的不斷深入,研究者己經(jīng)對(duì)w下幾個(gè)要點(diǎn)達(dá)成了普遍的??共識(shí):??(1)
微博文本和是含有情感詞或表情符號(hào)的微博文本。通過(guò)預(yù)處理,我們最終得到微博實(shí)驗(yàn)??數(shù)據(jù)集M,其中包含用戶約100萬(wàn)個(gè),微博文本約200萬(wàn)條。??本實(shí)驗(yàn)使用ROC曲線來(lái)比較各個(gè)模型的實(shí)驗(yàn)結(jié)果。圖3.9展示了靜態(tài)模型中基本??影響力模型和分配影響力模型的比較結(jié)果。??一"基本影響力?分配影響力??彿。??呈?0.6?-?^??柿?0.?4?-??Q??1?L?J?1?1??0?0.2?0.4?0.6?0.8?1???假陽(yáng)率???圖3.9靜態(tài)模型ROC比較??Fig.?3.9?Comparison?of?Static?model?民OC??圖3.10展示了動(dòng)態(tài)時(shí)間模型的基本影響力和分配影響力模型的比較。3.11比較了靜??態(tài)時(shí)間模型和離散時(shí)間模型W及連續(xù)時(shí)間模型的結(jié)果。由3.11圖也可1^^看出離散時(shí)間模??型、連續(xù)時(shí)間模型的準(zhǔn)確率也要比靜態(tài)時(shí)間模型的準(zhǔn)確率高。在做圖3.11的對(duì)比實(shí)驗(yàn)中,??本文只使用了分配影響力來(lái)計(jì)算真陽(yáng)率和假陽(yáng)率,因?yàn)閺膱D3.9和圖3.10可W看出采用??分配影響為計(jì)算的準(zhǔn)確率比較高。??圖3.12展示了離散時(shí)間概率模型和靜態(tài)時(shí)間概率模型的運(yùn)行時(shí)間的比較結(jié)果。由該??圖可W看出,靜態(tài)模型和離散時(shí)間模型要比連續(xù)時(shí)間模型效率上高很多,而且離散時(shí)間??模型和連續(xù)時(shí)間模型的真陽(yáng)率基本相同,所離散時(shí)間模型更加適合實(shí)際應(yīng)用,因?yàn)樗??不僅效率比較高而且結(jié)果的準(zhǔn)確率也比較高。??-28-??
【參考文獻(xiàn)】:
期刊論文
[1]微博話語(yǔ)場(chǎng)中的意見領(lǐng)袖[J]. 雷海平. 現(xiàn)代交際. 2011(08)
[2]微博網(wǎng)絡(luò)輿情中的意見領(lǐng)袖識(shí)別及分析[J]. 劉志明,劉魯. 系統(tǒng)工程. 2011(06)
[3]微博意見領(lǐng)袖初探[J]. 劉銳. 新聞?dòng)浾? 2011(03)
[4]微博時(shí)代“意見領(lǐng)袖”特點(diǎn)探析[J]. 宋好. 今傳媒. 2010(11)
[5]一種基于WordNet和Corpus Statistics的語(yǔ)義相似性計(jì)算方法[J]. 張東娜,周春光,劉彥斌,郭東偉. 吉林大學(xué)學(xué)報(bào)(理學(xué)版). 2010(05)
碩士論文
[1]社會(huì)網(wǎng)絡(luò)影響力模型及其算法研究[D]. 黎雷.北京交通大學(xué) 2010
本文編號(hào):3411613
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3411613.html
最近更新
教材專著