天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

社交媒體中協(xié)作用戶檢測

發(fā)布時(shí)間:2017-06-21 15:15

  本文關(guān)鍵詞:社交媒體中協(xié)作用戶檢測,,由筆耕文化傳播整理發(fā)布。


【摘要】:社交媒體的快速發(fā)展吸引了大量用戶,從而迅速成為企業(yè)和個(gè)人進(jìn)行營銷和推廣活動(dòng)的重要場所。在這些活動(dòng)中,通過帳號(hào)的有組織協(xié)作行為,可以迅速產(chǎn)生相似信息的大量重復(fù)出現(xiàn),從而提高信息的展示次數(shù),影響普通用戶。協(xié)作行為的發(fā)現(xiàn)與過濾對于垃圾信息清理、輿情分析、精準(zhǔn)營銷都具有重要作用。然而,由于社交媒體數(shù)據(jù)量大、數(shù)據(jù)更新迅速、協(xié)同行為相對密度低,社交媒體中準(zhǔn)確、高效地協(xié)作行為發(fā)現(xiàn)具有重要的研究意義。本文研究了社交媒體中的協(xié)作行為和協(xié)作用戶發(fā)現(xiàn)問題,主要貢獻(xiàn)如下:1.對社交媒體中采用協(xié)作行為進(jìn)行營銷和推廣的手段進(jìn)行了分類,定義并描述了四種典型的協(xié)作行為用戶,對它們的協(xié)作行為特征、用戶特征、數(shù)據(jù)特征進(jìn)行了分析,并分別設(shè)計(jì)了協(xié)作行為檢測方法,為社交媒體協(xié)作行為發(fā)現(xiàn)與過濾確定了框架。2.提出了基于局部敏感哈希(Locality-sensitive Hashing, LSH)的社交媒體消息重復(fù)性檢測方法,及其高效MapReduce實(shí)現(xiàn),以發(fā)現(xiàn)協(xié)作行為用戶所產(chǎn)生的大量近似重復(fù)性消息。這一方法所檢測到的協(xié)作行為用戶與其它用戶具有明顯不同的用戶信息、社交網(wǎng)絡(luò)結(jié)構(gòu),以及行為模式。實(shí)驗(yàn)結(jié)果表明,該方法能夠有效定位隱式與顯式營銷帳號(hào)。3.利用帳號(hào)的轉(zhuǎn)發(fā)特征,提出了基于主題模型的社交媒體協(xié)作行為和協(xié)作帳號(hào)組發(fā)現(xiàn)方法。該方法首先利用帳號(hào)與消息、帳號(hào)與帳號(hào)之間的關(guān)系,確定帳號(hào)的轉(zhuǎn)發(fā)畫像(retweet profile,RP),并利用LDA方法,發(fā)現(xiàn)具有相似行為特征的帳號(hào)組。接著,我們基于少量訓(xùn)練數(shù)據(jù),利用標(biāo)簽傳遞方法,對協(xié)作行為帳號(hào)進(jìn)行分類,從而確定協(xié)作賬號(hào)組。實(shí)驗(yàn)結(jié)果表明,該方法能夠有效發(fā)現(xiàn)水軍與傀儡帳號(hào)小組。4.本文的研究基于200萬微博帳號(hào)的5年消息,整理了包含1.8萬協(xié)作帳號(hào)及其消息內(nèi)容、行為記錄的訓(xùn)練數(shù)據(jù)集。通過實(shí)驗(yàn),驗(yàn)證了所提方法的有效性,并為后續(xù)相關(guān)研究,提供了扎實(shí)的數(shù)據(jù)資源。綜上所述,本文從營銷和推廣行為檢測應(yīng)用需求、協(xié)作行為發(fā)現(xiàn)、協(xié)作帳號(hào)與帳號(hào)組的發(fā)現(xiàn)這三個(gè)方面開展了研究,在一個(gè)統(tǒng)一的框架下,提出了兩種協(xié)作行為和帳號(hào)發(fā)現(xiàn)方法,并通過海量真實(shí)數(shù)據(jù)上的實(shí)驗(yàn),驗(yàn)證了方法的有效性。
【關(guān)鍵詞】:社交媒體 協(xié)作行為發(fā)現(xiàn) 重復(fù)檢測 主題模型 垃圾消息檢測
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.092
【目錄】:
  • 摘要6-7
  • Abstract7-12
  • 第一章 緒論12-16
  • 1.1 研究背景與意義12-14
  • 1.2 本文工作14-15
  • 1.3 本文結(jié)構(gòu)15-16
  • 第二章 相關(guān)工作16-26
  • 2.1 社交媒體用戶行為分析16-18
  • 2.2 垃圾信息檢測18-20
  • 2.3 社交媒體垃圾用戶檢測20-24
  • 2.3.1 垃圾用戶檢測21-23
  • 2.3.2 垃圾用戶群體檢測23-24
  • 2.4 本章小結(jié)24-26
  • 第三章 社交媒體數(shù)據(jù)模型與問題描述26-34
  • 3.1 數(shù)據(jù)模型26-29
  • 3.1.1 用戶信息26
  • 3.1.2 社交網(wǎng)絡(luò)26-27
  • 3.1.3 時(shí)間軸與微博27-29
  • 3.2 問題描述29-32
  • 3.3 本章小結(jié)32-34
  • 第四章 基于近似重復(fù)性檢測的垃圾用戶過濾算法34-50
  • 4.1 基于內(nèi)容的檢測框架介紹34-35
  • 4.2 文本相似度計(jì)算35-37
  • 4.3 基于哈希函數(shù)的算法37-43
  • 4.3.1 最小哈希37-39
  • 4.3.2 面向最小哈希的LSH39-41
  • 4.3.3 算法優(yōu)化41-43
  • 4.4 實(shí)驗(yàn)與分析43-49
  • 4.4.1 數(shù)據(jù)集與預(yù)處理43-44
  • 4.4.2 性能測試44-45
  • 4.4.3 用戶行為分析45-49
  • 4.5 本章小結(jié)49-50
  • 第五章 協(xié)作轉(zhuǎn)發(fā)用戶過濾方法50-84
  • 5.1 協(xié)作用戶及協(xié)作用戶群體過濾框架50-52
  • 5.2 基于主題模型的社區(qū)發(fā)現(xiàn)52-57
  • 5.2.1 LDA介紹52-54
  • 5.2.2 用戶社區(qū)發(fā)現(xiàn)54-57
  • 5.3 基于賬號(hào)-消息關(guān)系的特征提取57-63
  • 5.3.1 轉(zhuǎn)發(fā)關(guān)系建模57-62
  • 5.3.2 用戶相似度計(jì)算62-63
  • 5.4 基于賬號(hào)-賬號(hào)關(guān)系的特征提取63-67
  • 5.4.1 基于轉(zhuǎn)發(fā)拓?fù)浣Y(jié)構(gòu)64
  • 5.4.2 基于轉(zhuǎn)發(fā)拓?fù)浣Y(jié)構(gòu)和內(nèi)容64-67
  • 5.5 半監(jiān)督協(xié)作轉(zhuǎn)發(fā)垃圾用戶分類方法67-71
  • 5.5.1 標(biāo)簽傳遞算法68-70
  • 5.5.2 基于RP-LDA的標(biāo)簽傳遞算法70-71
  • 5.5.3 協(xié)作垃圾用戶群體過濾71
  • 5.6 實(shí)驗(yàn)與分析71-83
  • 5.6.1 數(shù)據(jù)集71-72
  • 5.6.2 直接轉(zhuǎn)發(fā)關(guān)系構(gòu)建72-73
  • 5.6.3 實(shí)驗(yàn)結(jié)果73-81
  • 5.6.4 垃圾用戶群體分析81-83
  • 5.7 本章小結(jié)83-84
  • 第六章 總結(jié)與展望84-88
  • 6.1 總結(jié)84-85
  • 6.2 展望85-88
  • 附錄A 微博數(shù)據(jù)介紹88-94
  • 參考文獻(xiàn)94-108
  • 致謝108-110
  • 攻讀碩士學(xué)位期間發(fā)表論文和科研情況110-111

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 啟程;;社交媒體之“濕”與社會(huì)之痛[J];檢察風(fēng)云;2011年17期

2 馮巖;;人文城市發(fā)展中的社交媒體管理[J];城市發(fā)展研究;2012年03期

3 翟菁;張莉鑰;;譜寫2011年社交媒體研究“五部曲”[J];今傳媒;2012年07期

4 ;倫敦奧運(yùn),社交媒體奧運(yùn)[J];新聞?dòng)浾?2012年09期

5 ;德國“社交媒體經(jīng)理”走俏[J];青年記者;2013年10期

6 趙瑞云;;社交媒體客服,重在構(gòu)建交互方式[J];通信世界;2013年07期

7 陰衛(wèi)芝;;美國五所高校社交媒體準(zhǔn)則研究[J];新聞愛好者;2013年02期

8 顏運(yùn)梅;;澳大利亞國家圖書館社交媒體的應(yīng)用與政策解讀[J];圖書館建設(shè);2013年08期

9 趙星植;;論社交媒體對“指示符號(hào)”的過度使用[J];新聞傳播;2013年08期

10 ;調(diào)查:社交媒體讓人們的生活更美好[J];新聞?dòng)浾?2014年02期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前3條

1 袁靖華;;微博的理想與現(xiàn)實(shí)——兼論社交媒體建構(gòu)公共空間的三大困擾因素[A];數(shù)字未來與媒介社會(huì)2[C];2010年

2 洪婧茹;;社交媒體與上海大學(xué)生的環(huán)保參與:從線上關(guān)注到線下行動(dòng)[A];中華新聞傳播學(xué)術(shù)聯(lián)盟第六屆研究生學(xué)術(shù)研討會(huì)論文集[C];2014年

3 王斌;鄭滿寧;;扭轉(zhuǎn)“逆差”:社交媒體時(shí)代國人形象傳播機(jī)制及策略[A];新聞學(xué)論集(第30輯)[C];2014年

中國重要報(bào)紙全文數(shù)據(jù)庫 前10條

1 本報(bào)記者 陳曉平;社交媒體重構(gòu)商業(yè)?[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2011年

2 一鳴;出版商介入社交媒體的危險(xiǎn)[N];中國圖書商報(bào);2011年

3 Chris Nerney;社交媒體帶來的5大安全威脅[N];網(wǎng)絡(luò)世界;2011年

4 李鑫源;社交媒體影響不容小窺[N];科技日報(bào);2011年

5 陳曉平;社交媒體的“葫蘆論”[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2011年

6 肖明超(新生代市場監(jiān)測機(jī)構(gòu)副總經(jīng)理);社交媒體引發(fā)營銷裂變[N];中國圖書商報(bào);2011年

7 朱永磊 貝恩大中華區(qū)電信、媒體與高科技業(yè)務(wù)主管;如何成為社交媒體的長期贏家[N];通信產(chǎn)業(yè)報(bào);2012年

8 洪琳;2012年全球社交媒體收入將達(dá)到169億美元[N];人民郵電;2012年

9 商報(bào)記者 曉雪;如何用社交媒體賺錢[N];中國圖書商報(bào);2012年

10 本報(bào)首席記者 王磊;社交媒體權(quán)力不能“無需負(fù)責(zé)”[N];文匯報(bào);2013年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 李雪絮;社交媒體廣告的表現(xiàn)策略研究[D];浙江理工大學(xué);2013年

2 呂蒙;網(wǎng)絡(luò)社交媒體關(guān)系網(wǎng)絡(luò)與品牌傳播[D];遼寧大學(xué);2013年

3 吳祖宏;大學(xué)生手機(jī)社交媒體依賴的問卷編制及特點(diǎn)研究[D];西南大學(xué);2014年

4 張茜茹;大學(xué)生社交媒體依賴的測量及其與主觀幸福感的關(guān)系[D];山西師范大學(xué);2015年

5 趙潔;論社交媒體[D];武漢理工大學(xué);2010年

6 龐勝楠;電視媒體與社交媒體互動(dòng)研究[D];山東師范大學(xué);2013年

7 楊玲;中國社交媒體內(nèi)容與功能分析[D];武漢理工大學(xué);2013年

8 周春平;奔馳(中國)汽車公司社交媒體營銷策略研究[D];上海外國語大學(xué);2014年

9 任慶軍;社交媒體對大學(xué)生流行文化的影響研究[D];天津師范大學(xué);2014年

10 劉熙熒;中國社交媒體社交模式研究[D];湖南大學(xué);2014年


  本文關(guān)鍵詞:社交媒體中協(xié)作用戶檢測,由筆耕文化傳播整理發(fā)布。



本文編號(hào):469088

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/469088.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b72f6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com