天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 社科論文 > 新聞傳播論文 >

基于用戶與消息特征的微博轉(zhuǎn)發(fā)預(yù)測(cè)模型研究

發(fā)布時(shí)間:2020-10-21 23:18
   隨著互聯(lián)網(wǎng)的迅猛發(fā)展,社會(huì)化媒體技術(shù)日新月異,微博已成為傳播信息的主要網(wǎng)絡(luò)平臺(tái)。作為一種新的媒體工具,微博已經(jīng)融入到人們的學(xué)習(xí)、工作、生活中來(lái),不僅改變了社會(huì)大眾的舊有的社交方式,而且徹底顛覆了傳統(tǒng)的信息傳播模式。新浪微博是成立于2009年的微博平臺(tái),它是一個(gè)基于粉絲-關(guān)注網(wǎng)絡(luò)結(jié)構(gòu)的信息發(fā)布、分享、傳播、獲取平臺(tái),允許超過(guò)2億用戶分享微博消息:任何一條微博的字符數(shù)都被限定在140個(gè)之內(nèi)。微博用戶可以關(guān)注其他用戶,通過(guò)這種方式來(lái)獲取他們發(fā)布的微博消息。如果一個(gè)用戶覺得一條微博很有趣并且值得分享,他就可以把這條微博傳遞給自己的粉絲,這種行為被稱為轉(zhuǎn)發(fā)。通常用戶會(huì)轉(zhuǎn)發(fā)那些有趣的或與他們粉絲有關(guān)的內(nèi)容。按照慣例,轉(zhuǎn)發(fā)會(huì)用特殊的關(guān)鍵字來(lái)表示,例如(轉(zhuǎn))。進(jìn)行轉(zhuǎn)發(fā)通常是為了向自己的粉絲傳播信息。研究微博用戶轉(zhuǎn)發(fā)行為,預(yù)測(cè)微博轉(zhuǎn)發(fā)概率,確定影響微博轉(zhuǎn)發(fā)概率的因素,在熱點(diǎn)挖掘、產(chǎn)品營(yíng)銷、輿情監(jiān)控、謠言控制等方面有重要的現(xiàn)實(shí)意義。相比傳統(tǒng)的社交網(wǎng)絡(luò)和媒體網(wǎng)絡(luò),微博社區(qū)中的用戶關(guān)系更加多樣,消息傳播機(jī)制更加復(fù)雜,因此,影響用戶轉(zhuǎn)發(fā)行為的因素也就更多,研究難度相應(yīng)的也會(huì)加大。本文利用新浪微博平臺(tái)數(shù)據(jù),分析了影響微博轉(zhuǎn)發(fā)的屬性特征,包括用戶特征,例如用戶影響力、粉絲活躍度等,以及微博消息本身的內(nèi)容特征,并挑選出對(duì)微博轉(zhuǎn)發(fā)影響較大的一些屬性作為參數(shù),以此來(lái)構(gòu)建一種基于用戶和消息特征的微博轉(zhuǎn)發(fā)概率預(yù)測(cè)模型。本文主要研究?jī)?nèi)容如下:一、本文分析了新浪微博平臺(tái)的數(shù)據(jù)獲取方法。在研究初期,將從新浪微博平臺(tái)抓取大量用戶數(shù)據(jù)及消息數(shù)據(jù),因此,本文詳細(xì)介紹了兩種常用的數(shù)據(jù)獲取方法:微博開放平臺(tái)API和網(wǎng)絡(luò)爬蟲,并比較了這兩種方法的優(yōu)劣。本文采用新浪微博開放平臺(tái)API獲取原始數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,將預(yù)處理后的數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫(kù)當(dāng)中。為了解決新浪開放平臺(tái)中API調(diào)用次數(shù)限制的問(wèn)題,采用多賬戶多應(yīng)用輪換的方法來(lái)提高請(qǐng)求頻率。同時(shí),通過(guò)程序延時(shí)請(qǐng)求來(lái)避免數(shù)據(jù)中斷的問(wèn)題。在數(shù)據(jù)預(yù)處理階段,使用中文分詞詞典和停用詞表來(lái)平滑數(shù)據(jù)和去除數(shù)據(jù)噪聲。這部分?jǐn)?shù)據(jù)是本工作的基礎(chǔ)數(shù)據(jù),也可作為其他研究的基礎(chǔ)數(shù)據(jù)。二、本文介紹了影響微博轉(zhuǎn)發(fā)的用戶特征和消息特征,并從中挑選出對(duì)用戶微博轉(zhuǎn)發(fā)貢獻(xiàn)較大的15個(gè)屬性特征,將其添加到我們的模型中,構(gòu)成了模型的15個(gè)維度。其中比較典型的有用戶影響力、粉絲活躍度、內(nèi)容特征以及情感特征等,將這些指標(biāo)轉(zhuǎn)化為二元屬性因子,用1表示是,用0表示否,這樣所有的屬性都被轉(zhuǎn)化為數(shù)值型,便于我們建立模型。對(duì)于用戶特征,通過(guò)粉絲數(shù)-關(guān)注數(shù)算法、用戶標(biāo)簽數(shù)算法等分析了它們與微博轉(zhuǎn)發(fā)之間的關(guān)聯(lián)關(guān)系,并確定各個(gè)屬性的閾值,這些閾值對(duì)微博轉(zhuǎn)發(fā)預(yù)測(cè)起到了至關(guān)重要的作用。對(duì)于消息特征,在前人研究的基礎(chǔ)上提出了內(nèi)容特征、情感特征及時(shí)間特征,另外,利用LDA文檔主題生成模型挖掘了微博中隱含的潛在主題,以此來(lái)作為模型的一個(gè)重要特征屬性。三、本文提出了一種基于用戶和消息特征的微博轉(zhuǎn)發(fā)預(yù)測(cè)分析方法。綜合分析了各種影響微博轉(zhuǎn)發(fā)的因素之后,將預(yù)測(cè)問(wèn)題轉(zhuǎn)化為分類問(wèn)題,提出了一種二分類邏輯回歸預(yù)測(cè)模型。該模型的實(shí)現(xiàn)需要兩個(gè)過(guò)程:訓(xùn)練過(guò)程和預(yù)測(cè)過(guò)程。在一個(gè)大的訓(xùn)練集上學(xué)習(xí)了所有屬性的權(quán)重,對(duì)于主題特征,由于微博涵蓋的主題太多,因此需要單獨(dú)進(jìn)行訓(xùn)練。在預(yù)測(cè)階段,對(duì)于每一條新的微博,為其建立一個(gè)特征空間向量,并對(duì)每個(gè)特征判斷其0、1值,將其輸入到模型中后,便可以得到一個(gè)分類的輸出。證明了預(yù)測(cè)哪些微博會(huì)被轉(zhuǎn)發(fā)是可行的。通過(guò)分析預(yù)測(cè)模型學(xué)習(xí)到的參數(shù),確定出那些對(duì)微博的轉(zhuǎn)發(fā)有較強(qiáng)貢獻(xiàn)的特征,這使我們可以進(jìn)一步研究在微博社區(qū)中,哪些內(nèi)容是有趣的。
【學(xué)位單位】:南華大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2016
【中圖分類】:G206;TP391.1
【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景與意義
        1.1.1 研究背景
        1.1.2 研究意義
    1.2 研究現(xiàn)狀
    1.3 本文的結(jié)構(gòu)與內(nèi)容
第2章 數(shù)據(jù)獲取技術(shù)
    2.1 網(wǎng)絡(luò)爬蟲技術(shù)
    2.2 新浪微博開放平臺(tái)
    2.3 兩種數(shù)據(jù)獲取方法的對(duì)比
    2.4 數(shù)據(jù)預(yù)處理
    2.5 本章小結(jié)
第3章 微博轉(zhuǎn)發(fā)的用戶特征影響因素
    3.1 用戶影響力對(duì)微博轉(zhuǎn)發(fā)的預(yù)測(cè)
        3.1.1 基本思想
        3.1.2 算法實(shí)現(xiàn)
        3.1.3 實(shí)驗(yàn)分析
    3.2 粉絲平均標(biāo)簽數(shù)對(duì)微博轉(zhuǎn)發(fā)的預(yù)測(cè)
        3.2.1 基本思想
        3.2.2 算法實(shí)現(xiàn)
        3.2.3 實(shí)驗(yàn)分析
    3.3 粉絲活躍度對(duì)微博轉(zhuǎn)發(fā)的預(yù)測(cè)
        3.3.1 基本思想
        3.3.2 實(shí)驗(yàn)分析
    3.4 本章小結(jié)
第4章 微博轉(zhuǎn)發(fā)的消息特征影響因素
    4.1 內(nèi)容特征
        4.1.1 基本特征
        4.1.2 情感特征
    4.2 時(shí)間戳
    4.3 LDA文檔主題生成模型
        4.3.1 定義
        4.3.2 LDA核心公式
        4.3.3 LDA學(xué)習(xí)過(guò)程
        4.3.4 LDA模型訓(xùn)練及預(yù)測(cè)實(shí)驗(yàn)分析
    4.4 本章小結(jié)
第5章 基于用戶與消息特征的邏輯回歸預(yù)測(cè)模型
    5.1 分類模型介紹
    5.2 模型分析
    5.3 結(jié)果分析
        5.3.1 權(quán)重訓(xùn)練
        5.3.2 權(quán)重分析
        5.3.3 轉(zhuǎn)發(fā)預(yù)測(cè)
    5.4 評(píng)價(jià)標(biāo)準(zhǔn)
    5.5 本章小結(jié)
第6章 總結(jié)與展望
    6.1 論文總結(jié)
    6.2 未來(lái)展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文
致謝

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 沈暉;短消息的新武器[J];中國(guó)計(jì)算機(jī)用戶;2002年28期

2 空中來(lái)客;老機(jī)也瘋狂──短消息與電話本[J];數(shù)字通信;2001年03期

3 FF;;不讓QQ顯示發(fā)送消息時(shí)間[J];電腦迷;2005年11期

4 張漫,李冰,梁吉?jiǎng)?王永安;基于Delphi中消息的處理及應(yīng)用[J];煤礦機(jī)械;2005年04期

5 何騰蛟;吳躍;;基于JavaScript的消息管理機(jī)制[J];計(jì)算機(jī)應(yīng)用;2009年S1期

6 JOSH NOSSITER ,宋艷萍;快速發(fā)送消息的靈活性[J];今日電子;1996年06期

7 錢少先;Windows下消息循環(huán)及運(yùn)行機(jī)制[J];安慶師范學(xué)院學(xué)報(bào)(自然科學(xué)版);1997年02期

8 ;Sms(短消息)網(wǎng)上發(fā)[J];數(shù)字生活;2001年03期

9 ;通過(guò)Internet網(wǎng)發(fā)送移動(dòng)短消息[J];郵電商情;2001年07期

10 竹子蘭;;“甜似蜜”蜂房小技巧(之網(wǎng)絡(luò)秘技篇)[J];電腦應(yīng)用文萃;2002年12期


相關(guān)博士學(xué)位論文 前4條

1 張小明;基于分布對(duì)象的異步消息的研究與實(shí)現(xiàn)[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2001年

2 王樂(lè);短語(yǔ)消息聚類相關(guān)技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年

3 王紅;移動(dòng)agent關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2002年

4 華東明;安全協(xié)議的形式化方法及其應(yīng)用的研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年


相關(guān)碩士學(xué)位論文 前10條

1 劉偉唯;消息群發(fā)及反饋系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2015年

2 成海霞;基于發(fā)布訂閱模式的醫(yī)療消息推送系統(tǒng)[D];浙江大學(xué);2015年

3 羅達(dá)詩(shī);面向演化的程序設(shè)計(jì)語(yǔ)言[D];蘭州大學(xué);2015年

4 劉麗華;基于VoIP/IM技術(shù)的通信系統(tǒng)及其漫游方法的設(shè)計(jì)與實(shí)現(xiàn)[D];西南交通大學(xué);2015年

5 許作亮;應(yīng)急廣播消息采編軟件的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年

6 王默涵;面向移動(dòng)互聯(lián)網(wǎng)的Presence/IM機(jī)制的設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(沈陽(yáng)計(jì)算技術(shù)研究所);2015年

7 劉松;基于HornetQ與Restful service的異步消息平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];南京大學(xué);2013年

8 邱繼東;手機(jī)快訊系統(tǒng)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2013年

9 宋曉宇;DSRC/WAVE自適應(yīng)消息調(diào)整器及應(yīng)用研究[D];大連理工大學(xué);2015年

10 徐婷婷;基于HL7的HIS與PACS網(wǎng)關(guān)設(shè)計(jì)和實(shí)現(xiàn)[D];南方醫(yī)科大學(xué);2015年



本文編號(hào):2850734

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/2850734.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c5b8d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com