天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 新聞傳播論文 >

微博用戶轉(zhuǎn)發(fā)預(yù)測(cè)特征的特征選擇研究

發(fā)布時(shí)間:2020-06-19 21:04
【摘要】:微博用戶轉(zhuǎn)發(fā)預(yù)測(cè)研究對(duì)社交網(wǎng)絡(luò)的信息傳播和推薦研究具有重要的學(xué)術(shù)價(jià)值,在公共輿論管理、個(gè)性化推薦、市場(chǎng)營(yíng)銷(xiāo)等方面具有重要的應(yīng)用價(jià)值。本文主要研究微博中普通用戶轉(zhuǎn)發(fā)一條微博的重要影響因素,目的是更好的理解用戶的轉(zhuǎn)發(fā)行為,同時(shí)提高轉(zhuǎn)發(fā)預(yù)測(cè)效果。本文通過(guò)分析微博用戶轉(zhuǎn)發(fā)行為的影響因素,綜合相關(guān)文獻(xiàn),匯總了影響用戶轉(zhuǎn)發(fā)行為的眾多特征,在規(guī)模較大的真實(shí)微博數(shù)據(jù)集上實(shí)現(xiàn)了特征提取與特征選擇,建立因子分解機(jī)預(yù)測(cè)模型,在測(cè)試集上對(duì)用戶的轉(zhuǎn)發(fā)行為做出預(yù)測(cè),通過(guò)對(duì)比研究了各種特征和特征組合在微博用戶轉(zhuǎn)發(fā)行為預(yù)測(cè)上的有效性。本文的工作主要有四個(gè)方面:(1)綜合相關(guān)文獻(xiàn),分析匯總了大量影響用戶轉(zhuǎn)發(fā)行為的特征,并在真實(shí)的新浪微博數(shù)據(jù)集上實(shí)現(xiàn)了特征提取。(2)通過(guò)每次使用一組類(lèi)型特征訓(xùn)練建立因子分解機(jī)預(yù)測(cè)模型的方式,研究了用戶特征、作者特征、微博特征、興趣特征和社交特征五種不同類(lèi)型特征對(duì)模型預(yù)測(cè)性能的影響。實(shí)驗(yàn)表明,興趣特征和微博特征對(duì)模型預(yù)測(cè)性能的影響最大。(3)對(duì)微博特征全集實(shí)現(xiàn)了Filter特征選擇和Wrapper特征選擇,研究了各種特征和特征子集對(duì)模型預(yù)測(cè)性能的影響。實(shí)驗(yàn)表明,轉(zhuǎn)發(fā)相似度特征與分類(lèi)預(yù)測(cè)的相關(guān)性最高。Wrapper方法選擇的最優(yōu)特征子集,在幾乎保證預(yù)測(cè)效果的同時(shí),大幅降低了特征維度,提高了運(yùn)行效率。(4)利用預(yù)測(cè)性能最好的最優(yōu)特征子集建立因子分解機(jī)預(yù)測(cè)模型,對(duì)用戶的轉(zhuǎn)發(fā)行為進(jìn)行預(yù)測(cè),預(yù)測(cè)精度達(dá)到了89.0%,F1度量達(dá)到了66.8%,AUC面積達(dá)到了95.0%。
【學(xué)位授予單位】:西北大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:G206;TP391.3
【圖文】:

過(guò)程圖,特征選擇,過(guò)程


圖 2 特征選擇過(guò)程圖中可以看出,特征子集搜索和子集評(píng)價(jià)是特征選擇關(guān)鍵的環(huán)節(jié),在沒(méi)有作為先驗(yàn)假設(shè)的前提下進(jìn)行特征選擇,需要遍歷所有可能的子集,這在計(jì)重的組合爆炸問(wèn)題,特征個(gè)數(shù)稍多就難以進(jìn)行,比如,含有 n 個(gè)特征的集

ROC曲線,特征預(yù)測(cè),ROC曲線,興趣類(lèi)型


圖 3 不同類(lèi)型特征預(yù)測(cè) ROC 曲線以明顯看出,興趣類(lèi)型特征預(yù)測(cè)的 ROC 曲線最靠近左上角8.5%,與信息檢索常用的評(píng)價(jià)指標(biāo)評(píng)價(jià)結(jié)果類(lèi)似,興趣特征,說(shuō)明興趣類(lèi)型特征對(duì)微博用戶轉(zhuǎn)發(fā)預(yù)測(cè)的重要性最大。其

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 鄧青;馬曄風(fēng);劉藝;張輝;;基于BP神經(jīng)網(wǎng)絡(luò)的微博轉(zhuǎn)發(fā)量的預(yù)測(cè)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年12期

2 匡沖;劉知遠(yuǎn);孫茂松;;微博轉(zhuǎn)發(fā)者的個(gè)性化排序[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2014年11期

3 齊超;陳鴻昶;于巖;;基于行為分析的微博信息傳播效果[J];計(jì)算機(jī)應(yīng)用;2014年08期

4 曹玖新;吳江林;石偉;劉波;鄭嘯;羅軍舟;;新浪微博網(wǎng)信息傳播分析與預(yù)測(cè)[J];計(jì)算機(jī)學(xué)報(bào);2014年04期

5 李英樂(lè);于洪濤;劉力雄;;基于SVM的微博轉(zhuǎn)發(fā)規(guī)模預(yù)測(cè)方法[J];計(jì)算機(jī)應(yīng)用研究;2013年09期

6 張e

本文編號(hào):2721340


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/2721340.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5c2d6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com