社交網(wǎng)絡(luò)中的用戶轉(zhuǎn)發(fā)行為預(yù)測(cè)
本文關(guān)鍵詞: 社交網(wǎng)絡(luò) 微博 轉(zhuǎn)發(fā)行為 出處:《上海交通大學(xué)學(xué)報(bào)》2013年04期 論文類型:期刊論文
【摘要】:以新浪微博為研究對(duì)象,基于微博主題及用戶特征,提出社交網(wǎng)絡(luò)中的用戶轉(zhuǎn)發(fā)行為預(yù)測(cè)算法.首先,基于互信息理論,從已發(fā)生轉(zhuǎn)發(fā)行為的用戶的微博內(nèi)容中提取特征,通過分析給定用戶的微博內(nèi)容與特征之間的相關(guān)程度,預(yù)測(cè)用戶是否會(huì)對(duì)給定主題的微博發(fā)生轉(zhuǎn)發(fā)行為;然后通過研究用戶性別、粉絲數(shù)、關(guān)注數(shù)、微博數(shù)與用戶轉(zhuǎn)發(fā)行為的關(guān)系,選取合適的用戶特征描述,并基于貝葉斯模型預(yù)測(cè)給定用戶對(duì)微博的轉(zhuǎn)發(fā)概率.最后,結(jié)合以上2種算法的預(yù)測(cè)結(jié)果,得到給定用戶對(duì)某主題微博的轉(zhuǎn)發(fā)行為預(yù)測(cè).該預(yù)測(cè)算法對(duì)研究網(wǎng)絡(luò)輿情傳播及微博營(yíng)銷具有重要意義.
[Abstract]:Taking Weibo of Sina as the research object, this paper proposes a prediction algorithm of user forwarding behavior in social networks based on the theme and user characteristics of Weibo. Firstly, based on the theory of mutual information, features are extracted from the content of the user whose forwarding behavior has taken place. By analyzing the correlation between Weibo's content and features of a given user, the author predicts whether the user will forward the user to Weibo on a given theme, and then studies the user's gender, number of followers, and number of concerns. The relationship between Weibo number and user forwarding behavior, selecting appropriate user feature description, and predicting the forwarding probability of given user to Weibo based on Bayesian model. Finally, combined with the prediction results of the above two algorithms, The prediction of the forwarding behavior of a given user to a certain subject Weibo is obtained. The prediction algorithm is of great significance to the study of network public opinion dissemination and Weibo marketing.
【作者單位】: 上海交通大學(xué)信息安全工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61171173,61272441) 國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863)項(xiàng)目(2010AA012505)
【分類號(hào)】:TP393.092
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 秦進(jìn),陳笑蓉,汪維家,陸汝占;文本分類中的特征抽取[J];計(jì)算機(jī)應(yīng)用;2003年02期
2 王潔;湯小春;;基于社區(qū)網(wǎng)絡(luò)內(nèi)容的個(gè)性化推薦算法研究[J];計(jì)算機(jī)應(yīng)用研究;2011年04期
3 蔡巍,王永成,李偉,尹中航;三種分類算法的實(shí)驗(yàn)比較[J];上海交通大學(xué)學(xué)報(bào);2004年04期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張璇;左敏;;一種改進(jìn)的樸素貝葉斯分類器在文本分類中的應(yīng)用研究[J];北京工商大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年04期
2 薛松;張鐘澍;殷知磊;;貝葉斯算法在反垃圾郵件應(yīng)用中的改進(jìn)方案[J];成都信息工程學(xué)院學(xué)報(bào);2009年04期
3 葉飛;;基于文本語(yǔ)義聯(lián)系的特征選取算法研究[J];赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年12期
4 孫鐵利;張妍;李曉微;;文本挖掘中特征降維方法比較研究[J];電腦知識(shí)與技術(shù);2008年02期
5 張晶;;關(guān)于過濾垃圾短信方法的研究[J];電腦知識(shí)與技術(shù);2008年23期
6 邱云飛;邵良杉;那寶貴;;面向合作伙伴選擇的中文Web信息獲取系統(tǒng)研究[J];電子商務(wù);2010年07期
7 陳光;;優(yōu)化K-近鄰方法及其應(yīng)用[J];福建電腦;2009年02期
8 李永健;王斌君;;垃圾短信過濾中的特征降維算法比較[J];中國(guó)人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年03期
9 姚學(xué)禮;;文本分類中的特征提取方法的研究[J];光盤技術(shù);2009年06期
10 苑俊英;袁方;劉博;;一種基于類別核心詞的概念映射方法[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
相關(guān)會(huì)議論文 前5條
1 馬春雷;;基于向量空間模型的中文文本檢索研究[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年
2 胡金柱;陳俊平;盧麗君;趙東萌;張琮;王益維;;基于本體視圖的特征項(xiàng)抽取方法研究[A];第二十二屆中國(guó)(天津)'2008IT、網(wǎng)絡(luò)、信息技術(shù)、電子、儀器儀表創(chuàng)新學(xué)術(shù)會(huì)議論文集[C];2008年
3 胡金柱;陳俊平;盧麗君;趙東萌;張琮;王益維;;基于本體視圖的特征項(xiàng)抽取方法研究[A];第二十三屆中國(guó)(天津)2009IT、網(wǎng)絡(luò)、信息技術(shù)、電子、儀器儀表創(chuàng)新學(xué)術(shù)會(huì)議論文集[C];2009年
4 張永;陳思睿;楊志勇;;一種改進(jìn)的文本分類方法的研究[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
5 李月倫;李湘;常寶寶;袁毓林;;一種基于認(rèn)知情景框架的文本分類方法[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
相關(guān)博士學(xué)位論文 前10條
1 楊抒;基于WEB的林產(chǎn)品信息資源整合方法研究[D];北京林業(yè)大學(xué);2011年
2 徐建鎖;知識(shí)管理和文本挖掘的若干問題研究[D];天津大學(xué);2004年
3 王明春;基于粗糙集的數(shù)據(jù)及文本挖掘方法研究[D];天津大學(xué);2005年
4 孫越恒;基于統(tǒng)計(jì)的NLP技術(shù)在中文信息檢索中的應(yīng)用研究[D];天津大學(xué);2005年
5 郝占剛;基于遺傳算法等技術(shù)的數(shù)據(jù)與文本聚分類研究[D];天津大學(xué);2006年
6 易明;基于Web挖掘的電子商務(wù)個(gè)性化推薦機(jī)理與方法研究[D];華中科技大學(xué);2006年
7 裴志利;數(shù)據(jù)挖掘技術(shù)在文本分類和生物信息學(xué)中的應(yīng)用[D];吉林大學(xué);2008年
8 高茂庭;文本聚類分析若干問題研究[D];天津大學(xué);2007年
9 秦玉平;基于支持向量機(jī)的文本分類算法研究[D];大連理工大學(xué);2008年
10 李輝;移動(dòng)商務(wù)導(dǎo)購(gòu)系統(tǒng)的研究[D];大連理工大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 郭明;基于文本分類技術(shù)的文本情感傾向性研究[D];鄭州大學(xué);2010年
2 左維松;規(guī)則和統(tǒng)計(jì)相結(jié)合的篇章情感傾向性分析研究[D];鄭州大學(xué);2010年
3 金璐鈺;基于框架的事件抽取關(guān)鍵技術(shù)研究[D];蘇州大學(xué);2010年
4 孫海虹;基于模糊粗糙集的Web文本分類研究[D];哈爾濱理工大學(xué);2010年
5 李慧;基于貝葉斯分類方法的中文問句分類研究[D];石家莊鐵道學(xué)院;2010年
6 曹亞輝;非結(jié)構(gòu)文本最佳近似匹配系統(tǒng)的研究與實(shí)現(xiàn)[D];東華大學(xué);2011年
7 孫吉譚;基于內(nèi)容的垃圾郵件意圖分析方法研究[D];吉林大學(xué);2011年
8 柴智;基于UIMA的數(shù)據(jù)庫(kù)監(jiān)控文檔解析[D];吉林大學(xué);2011年
9 鄧彩鳳;中文文本分類中互信息特征選擇方法研究[D];西南大學(xué);2011年
10 趙娟娟;基于特征聚類的文本分類算法研究[D];華南理工大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 刁倩,王永成,張惠惠,何驥;文本自動(dòng)分類中的詞權(quán)重與分類算法[J];中文信息學(xué)報(bào);2000年03期
2 黃萱菁,吳立德,石崎洋之,徐國(guó)偉;獨(dú)立于語(yǔ)種的文本分類方法[J];中文信息學(xué)報(bào);2000年06期
3 尹中航,王永成,蔡巍,韓客松;利用串匹配技術(shù)實(shí)現(xiàn)網(wǎng)上新聞的主題提取(英文)[J];軟件學(xué)報(bào);2002年02期
4 曾春,邢春曉,周立柱;個(gè)性化服務(wù)技術(shù)綜述[J];軟件學(xué)報(bào);2002年10期
相關(guān)碩士學(xué)位論文 前1條
1 劉耀庭;社交網(wǎng)絡(luò)結(jié)構(gòu)研究[D];浙江大學(xué);2008年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王艷;;Twitter技術(shù)及其在情景教育中的應(yīng)用[J];中國(guó)西部科技;2010年16期
2 崔爭(zhēng)艷;;基于語(yǔ)義的微博短信息分類[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2010年08期
3 王鼎云;;對(duì)微博的發(fā)展?fàn)顩r和趨勢(shì)的冷思考[J];時(shí)代教育(教育教學(xué));2011年01期
4 李士奇;;微博使用者應(yīng)具備的基本素養(yǎng)[J];科教導(dǎo)刊(上旬刊);2011年03期
5 劉穎錄;;淺析新網(wǎng)絡(luò)時(shí)代的微博傳播[J];商業(yè)文化(上半月);2011年05期
6 張來勇;;淺析移動(dòng)互聯(lián)網(wǎng)技術(shù)的教育應(yīng)用[J];中國(guó)信息技術(shù)教育;2011年Z1期
7 申詩(shī)逸;;論“微博”的傳播特點(diǎn)與推廣[J];青年文學(xué)家;2010年14期
8 揭瀟君;;淺析動(dòng)漫作品在微博平臺(tái)的傳播[J];數(shù)字技術(shù)與應(yīng)用;2010年11期
9 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計(jì)算機(jī)研究與發(fā)展;2011年10期
10 王淑敏;李軍豪;;蜜罐技術(shù)在社交網(wǎng)絡(luò)反垃圾信息中應(yīng)用[J];煤炭技術(shù);2011年07期
相關(guān)會(huì)議論文 前4條
1 郭鵬;陳s,
本文編號(hào):1529356
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1529356.html