天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于主動學習的微博流行度預測方法

發(fā)布時間:2020-04-14 08:52
【摘要】:微博的出現(xiàn)進一步推動了社交網(wǎng)絡的發(fā)展。微博擁有大量的用戶,這些用戶通過微博進行信息共享,與其他用戶溝通交流,使其成為信息傳播的重要途經(jīng)之一。微博平臺每天產(chǎn)生大量的信息,通過微博進行消息的傳播與共享,給人們帶來便利的同時也有很多挑戰(zhàn)。因此,微博等社交網(wǎng)絡流行度預測也備受廣大學者關注。能夠及時準確的預測微博流行度,對于個性化的消息推薦,突發(fā)新聞檢測和輿情分析等有重要意義。首先,針對傳統(tǒng)的基于SVM的主動學習方法選擇距離超平面最近的那些樣本點,僅考慮了樣本的不確定性,致使查詢出的未標注樣本集存在冗余性和異常值問題,本文提出一種基于SVM的主動學習方法。該方法不僅僅考慮那些不確定的未標注樣本,還考慮多樣性和代表性,并通過實驗驗證其在收斂速度、數(shù)據(jù)標注量以及準確率曲線穩(wěn)定性等性能優(yōu)勢。其次,針對以往在研究影響微博流行度的相關因素中,忽略了部分對微博發(fā)布一小時內(nèi)的轉(zhuǎn)發(fā)結(jié)構相關特征和時間特征。本文新增加了基于一小時轉(zhuǎn)發(fā)用戶建立結(jié)構圖中的弱關系用戶的比例、平均深度、Wiener指數(shù)、Randi′c指數(shù)及時間特征對微博流行度預測的影響。通過微博數(shù)據(jù)集進行實驗,驗證了通過綜合考慮這些特征,有效提高了微博流行度的預測性能。最后,針對傳統(tǒng)的基于機器學習的微博流行度預測方法中,存在需要大量標注數(shù)據(jù)作為訓練集,在實際應用往往獲得大量標注數(shù)據(jù)成本高,而獲取大量未標注數(shù)據(jù)容易的問題,本文提出基于主動學習的微博流行度預測方法。該方法在少量標注數(shù)據(jù)和大量未標注數(shù)據(jù)的前提下,結(jié)合發(fā)布者的用戶特征、微博內(nèi)容特征、一小時內(nèi)的轉(zhuǎn)發(fā)結(jié)構特征以及時間特征,利用提出的一種基于SVM的主動學習方法進行模型訓練,預測微博的流行度。通過實驗驗證了該方法不僅減少標注成本,也提高模型預測效果,表現(xiàn)出良好的性能。
【圖文】:

示意圖,線性,示意圖,特征向量


圖 2.3 簡單的線性 SVM 示意圖{( ) ( ) ( ) ( )}1 1 2 2 3 3=, , , , , ,... ,N N x y x y x y x y ,特征向量,,第 i 個特征向量用 ( =1, 2,3ix i 量機假設輸入空間和特征空間一一對應要使用核技巧,將其轉(zhuǎn)換為向量進行 )被定義為:f ( x ) = w x +b 重向量和偏置。能夠找到很多個將樣本只有一個,就是與分類超平面距離最近間隔邊界的法向量被定義為*= ∈nw w R 能夠正確分離兩類樣本的最優(yōu)分類邊界的間隔最遠。針對線性可分的數(shù)據(jù),能夠的卻只有一個,可以通過最大間隔法,表示為:

樣本,核函數(shù),樣本圖


核函數(shù)使用 RBF 核函數(shù)。具體的實驗結(jié)果如圖3.2、圖 3.3 及圖 3.4 所示。圖 3.2 每次選擇 100 個樣本圖 3.3 每次選擇 150 個樣本
【學位授予單位】:哈爾濱工程大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP393.092;TP18

【相似文獻】

相關期刊論文 前10條

1 禾木;;宅男“女神”[J];小溪流(成長校園);2016年12期

2 朱琛剛;程光;;基于收視行為的互聯(lián)網(wǎng)電視節(jié)目流行度預測模型[J];電子與信息學報;2017年10期

3 熊小兵;周剛;黃永忠;馬俊;;新浪微博話題流行度預測技術研究[J];信息工程大學學報;2012年04期

4 萬圣賢;郭嘉豐;蘭艷艷;程學旗;;基于傳播模擬的消息流行度預測[J];中文信息學報;2014年03期

5 鮑鵬;徐昊;;基于圖注意力時空神經(jīng)網(wǎng)絡的在線內(nèi)容流行度預測[J];模式識別與人工智能;2019年11期

6 高金華;沈華偉;程學旗;劉悅;;基于相似消息的流行度預測方法[J];中文信息學報;2018年11期

7 米樂;;鏈接流行度和鏈接分析[J];互聯(lián)網(wǎng)天地;2007年03期

8 余江;楊宗凱;杜旭;王泰;;基于兩點流行度的流媒體緩存算法[J];華中科技大學學報(自然科學版);2006年10期

9 王景欣;王鉞;李一鵬;袁堅;山秀明;馮振明;任勇;;基于資源流行度的對等網(wǎng)絡統(tǒng)計特征分析[J];物理學報;2011年11期

10 孔慶超;毛文吉;;基于動態(tài)演化的討論帖流行度預測[J];軟件學報;2014年12期

相關會議論文 前1條

1 石磊;衛(wèi)琳;古志民;石云;;Web對象流行度模型研究[A];第一屆全國Web信息系統(tǒng)及其應用會議(WISA2004)論文集[C];2004年

相關重要報紙文章 前3條

1 本報記者 史曉菲;健身神器流行度高[N];消費日報;2014年

2 記者 王秀蘭;杜邦發(fā)布汽車顏色流行度報告[N];中國化工報;2011年

3 ;太陽鏡點燃眉梢[N];重慶商報;2005年

相關博士學位論文 前4條

1 胡穎;社交網(wǎng)絡中流行度演化分析與預測問題研究[D];北京科技大學;2019年

2 高帥;在線社會網(wǎng)絡中影響力度量和流行度預測問題研究[D];山東大學;2015年

3 張果;面向可共享內(nèi)容的網(wǎng)內(nèi)緩存機制研究[D];解放軍信息工程大學;2017年

4 付志鵬;結(jié)構化P2P網(wǎng)絡抖動的應對策略研究[D];國防科學技術大學;2013年

相關碩士學位論文 前10條

1 徐美婷;基于主動學習的微博流行度預測方法[D];哈爾濱工程大學;2019年

2 張超;基于流行度預測的密集異構網(wǎng)絡在線熱點視頻緩存更新策略[D];西南交通大學;2019年

3 謝小秋;面向社交網(wǎng)絡的信息流行度預測研究[D];重慶郵電大學;2019年

4 鄒晟;邊緣計算平臺中計算卸載與鏡像緩存方法研究與實現(xiàn)[D];北京郵電大學;2019年

5 韓鳳娟;基于多任務學習和深度學習的微博預測流行度[D];河南大學;2018年

6 趙命燕;基于流行度的視頻發(fā)布系統(tǒng)設計與實現(xiàn)[D];貴州大學;2018年

7 馬妙麗;霧無線接入網(wǎng)內(nèi)容流行度預測與邊緣緩存方法研究[D];東南大學;2018年

8 李美京;手機APP的口碑影響機制—考慮類別和流行度的實證研究[D];中國科學技術大學;2017年

9 張志偉;基站環(huán)境下媒體流行度預測與緩存策略研究[D];中國科學技術大學;2016年

10 董美姣;基于流行度預測的內(nèi)容中心網(wǎng)絡緩存技術研究[D];北京郵電大學;2015年



本文編號:2627124

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2627124.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶91dd0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com