基于多任務(wù)學(xué)習(xí)和深度學(xué)習(xí)的微博預(yù)測(cè)流行度
發(fā)布時(shí)間:2021-12-11 12:50
隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展及廣泛應(yīng)用,使得在線社交網(wǎng)絡(luò)成為了社會(huì)信息的主要載體。人們的獲取和傳播信息的方式已經(jīng)被微博、微信、博客、論壇、社交網(wǎng)站等社交媒體徹底改變。其中微博因信息傳播的隨意性和實(shí)效性深受用戶的喜歡,已經(jīng)成為人們發(fā)布和傳播社會(huì)信息的主要平臺(tái)。在輿情監(jiān)控、企業(yè)營銷、熱點(diǎn)推送等方面對(duì)信息傳播的研究有重大的意義,因此,微博流行度預(yù)測(cè)已經(jīng)成為了現(xiàn)在研究的熱門方向。近幾年,深度學(xué)習(xí)在語音識(shí)別、機(jī)器翻譯、圖像識(shí)別等領(lǐng)域取得了令人矚目的成績,受到了學(xué)者們廣泛關(guān)注。當(dāng)前對(duì)微博流行度預(yù)測(cè)的研究大多基于淺層模型,鮮有采用深度學(xué)習(xí)方法。本文嘗試將深度學(xué)習(xí)技術(shù)應(yīng)用到微博流行度預(yù)測(cè),同時(shí)本文也改進(jìn)了淺層模型,對(duì)比深度學(xué)習(xí)和改進(jìn)的淺層模型的性能,分析哪種方法能得到更好的預(yù)測(cè)結(jié)果。本文的主要工作如下:(1)改進(jìn)淺層模型當(dāng)前對(duì)微博流行度預(yù)測(cè)的研究主要是在所有用戶的微博數(shù)據(jù)上建立統(tǒng)一模型,未考慮不同影響力用戶的差異。然而標(biāo)簽、提及以及微博長度等對(duì)不同影響力用戶在流行度預(yù)測(cè)的影響呈現(xiàn)出明顯的差異,在研究中充分考慮這些差異,可以得到更好的預(yù)測(cè)結(jié)果。如果針對(duì)不同的影響力的用戶建立多個(gè)獨(dú)立的模型,不僅降低了...
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:47 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
SVM模型示意圖
圖 3-4 WMD 應(yīng)用圖解知,針對(duì) F 值相對(duì)較低的三種模型 Na ve Bayes、SVM 和 Logis相似性特征時(shí),可以明顯提高預(yù)測(cè)性能,例如對(duì)于 Na veBayes 和容相似性特征的使用可以將 F 值提高 4%左右。對(duì)于 F 值相對(duì)較L 模型,微博內(nèi)容相似性特征也可以進(jìn)一步提高預(yù)測(cè)性能?傊,容相似性特征時(shí) F 值都有一定的提高。這說明內(nèi)容相似性特征與相關(guān)性,可以提高流行度預(yù)測(cè)的性能。章小結(jié)構(gòu)建了基于多任務(wù)學(xué)習(xí)的 SVM 模型:SVM+MTL。這一模型將,將每個(gè)用戶組的流行度預(yù)測(cè)問題作為一個(gè)任務(wù),對(duì)這些任務(wù)進(jìn)中同時(shí)考慮所有用戶的共同特性和不同用戶組的獨(dú)有特征,從而一步提高準(zhǔn)確率,除了預(yù)測(cè)常用的用戶屬性和微博發(fā)布行為等基
本章的主要工作是采用深度學(xué)習(xí)方法對(duì)微博流行度進(jìn)行預(yù)測(cè)。首先簡單地介紹了經(jīng)網(wǎng)絡(luò)模型;然后描述了基于深度神經(jīng)網(wǎng)絡(luò)模型的流行度研究,主要說明了在深網(wǎng)絡(luò)訓(xùn)練過程中容易出現(xiàn)的問題,并采用 Dropout 方法和小批量梯度下降法解決題;最后進(jìn)行微博流行度預(yù)測(cè)實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。4.1 深度神經(jīng)網(wǎng)絡(luò)模型4.1.1 人工神經(jīng)元模型人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANNs)是受生物體神經(jīng)元的啟發(fā),由很似生物神經(jīng)細(xì)胞的神經(jīng)元相互連接組成的網(wǎng)絡(luò)結(jié)構(gòu),因其有大量的神經(jīng)元而有很據(jù)存儲(chǔ)和數(shù)據(jù)計(jì)算能力。同時(shí)因?yàn)樯窠?jīng)網(wǎng)絡(luò)是對(duì)動(dòng)物神經(jīng)系統(tǒng)的模擬和抽象,其自組織、自學(xué)習(xí)和非線性的特點(diǎn),適合處理大量復(fù)雜的非線性數(shù)據(jù)的問題。人工絡(luò)中最小的單元是神經(jīng)元,其模型如圖 4-1 所示。
【參考文獻(xiàn)】:
期刊論文
[1]微博個(gè)性化轉(zhuǎn)發(fā)行為預(yù)測(cè)新算法[J]. 唐興,權(quán)義寧,宋建鋒,鄧凱,朱海,苗啟廣. 西安電子科技大學(xué)學(xué)報(bào). 2016(04)
[2]基于轉(zhuǎn)發(fā)層次分析的新浪微博熱度預(yù)測(cè)研究[J]. 翟曉芳,劉全明,程耀東,胡慶寶,李海波. 計(jì)算機(jī)工程. 2015(07)
[3]基于動(dòng)態(tài)演化的討論帖流行度預(yù)測(cè)[J]. 孔慶超,毛文吉. 軟件學(xué)報(bào). 2014(12)
[4]新浪微博網(wǎng)信息傳播分析與預(yù)測(cè)[J]. 曹玖新,吳江林,石偉,劉波,鄭嘯,羅軍舟. 計(jì)算機(jī)學(xué)報(bào). 2014(04)
[5]面向多媒體社交網(wǎng)絡(luò)的訪問控制模型[J]. 陳慶麗,張志勇,向菲,王劍. 西安電子科技大學(xué)學(xué)報(bào). 2014(06)
[6]在線社會(huì)網(wǎng)絡(luò)中信息擴(kuò)散[J]. 李棟,徐志明,李生,劉挺,王秀文. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[7]社交網(wǎng)絡(luò)中的用戶轉(zhuǎn)發(fā)行為預(yù)測(cè)[J]. 謝婧,劉功申,蘇波,孟魁. 上海交通大學(xué)學(xué)報(bào). 2013(04)
[8]基于行為預(yù)測(cè)的微博網(wǎng)絡(luò)信息傳播建模[J]. 吳凱,季新生,劉彩霞. 計(jì)算機(jī)應(yīng)用研究. 2013(06)
[9]微博客中轉(zhuǎn)發(fā)行為的預(yù)測(cè)研究[J]. 張旸,路榮,楊青. 中文信息學(xué)報(bào). 2012(04)
博士論文
[1]基于排序?qū)W習(xí)的信息檢索模型研究[D]. 程凡.中國科學(xué)技術(shù)大學(xué) 2012
碩士論文
[1]社交網(wǎng)絡(luò)中轉(zhuǎn)發(fā)預(yù)測(cè)的研究[D]. 任天功.哈爾濱理工大學(xué) 2015
本文編號(hào):3534711
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:47 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
SVM模型示意圖
圖 3-4 WMD 應(yīng)用圖解知,針對(duì) F 值相對(duì)較低的三種模型 Na ve Bayes、SVM 和 Logis相似性特征時(shí),可以明顯提高預(yù)測(cè)性能,例如對(duì)于 Na veBayes 和容相似性特征的使用可以將 F 值提高 4%左右。對(duì)于 F 值相對(duì)較L 模型,微博內(nèi)容相似性特征也可以進(jìn)一步提高預(yù)測(cè)性能?傊,容相似性特征時(shí) F 值都有一定的提高。這說明內(nèi)容相似性特征與相關(guān)性,可以提高流行度預(yù)測(cè)的性能。章小結(jié)構(gòu)建了基于多任務(wù)學(xué)習(xí)的 SVM 模型:SVM+MTL。這一模型將,將每個(gè)用戶組的流行度預(yù)測(cè)問題作為一個(gè)任務(wù),對(duì)這些任務(wù)進(jìn)中同時(shí)考慮所有用戶的共同特性和不同用戶組的獨(dú)有特征,從而一步提高準(zhǔn)確率,除了預(yù)測(cè)常用的用戶屬性和微博發(fā)布行為等基
本章的主要工作是采用深度學(xué)習(xí)方法對(duì)微博流行度進(jìn)行預(yù)測(cè)。首先簡單地介紹了經(jīng)網(wǎng)絡(luò)模型;然后描述了基于深度神經(jīng)網(wǎng)絡(luò)模型的流行度研究,主要說明了在深網(wǎng)絡(luò)訓(xùn)練過程中容易出現(xiàn)的問題,并采用 Dropout 方法和小批量梯度下降法解決題;最后進(jìn)行微博流行度預(yù)測(cè)實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。4.1 深度神經(jīng)網(wǎng)絡(luò)模型4.1.1 人工神經(jīng)元模型人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANNs)是受生物體神經(jīng)元的啟發(fā),由很似生物神經(jīng)細(xì)胞的神經(jīng)元相互連接組成的網(wǎng)絡(luò)結(jié)構(gòu),因其有大量的神經(jīng)元而有很據(jù)存儲(chǔ)和數(shù)據(jù)計(jì)算能力。同時(shí)因?yàn)樯窠?jīng)網(wǎng)絡(luò)是對(duì)動(dòng)物神經(jīng)系統(tǒng)的模擬和抽象,其自組織、自學(xué)習(xí)和非線性的特點(diǎn),適合處理大量復(fù)雜的非線性數(shù)據(jù)的問題。人工絡(luò)中最小的單元是神經(jīng)元,其模型如圖 4-1 所示。
【參考文獻(xiàn)】:
期刊論文
[1]微博個(gè)性化轉(zhuǎn)發(fā)行為預(yù)測(cè)新算法[J]. 唐興,權(quán)義寧,宋建鋒,鄧凱,朱海,苗啟廣. 西安電子科技大學(xué)學(xué)報(bào). 2016(04)
[2]基于轉(zhuǎn)發(fā)層次分析的新浪微博熱度預(yù)測(cè)研究[J]. 翟曉芳,劉全明,程耀東,胡慶寶,李海波. 計(jì)算機(jī)工程. 2015(07)
[3]基于動(dòng)態(tài)演化的討論帖流行度預(yù)測(cè)[J]. 孔慶超,毛文吉. 軟件學(xué)報(bào). 2014(12)
[4]新浪微博網(wǎng)信息傳播分析與預(yù)測(cè)[J]. 曹玖新,吳江林,石偉,劉波,鄭嘯,羅軍舟. 計(jì)算機(jī)學(xué)報(bào). 2014(04)
[5]面向多媒體社交網(wǎng)絡(luò)的訪問控制模型[J]. 陳慶麗,張志勇,向菲,王劍. 西安電子科技大學(xué)學(xué)報(bào). 2014(06)
[6]在線社會(huì)網(wǎng)絡(luò)中信息擴(kuò)散[J]. 李棟,徐志明,李生,劉挺,王秀文. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[7]社交網(wǎng)絡(luò)中的用戶轉(zhuǎn)發(fā)行為預(yù)測(cè)[J]. 謝婧,劉功申,蘇波,孟魁. 上海交通大學(xué)學(xué)報(bào). 2013(04)
[8]基于行為預(yù)測(cè)的微博網(wǎng)絡(luò)信息傳播建模[J]. 吳凱,季新生,劉彩霞. 計(jì)算機(jī)應(yīng)用研究. 2013(06)
[9]微博客中轉(zhuǎn)發(fā)行為的預(yù)測(cè)研究[J]. 張旸,路榮,楊青. 中文信息學(xué)報(bào). 2012(04)
博士論文
[1]基于排序?qū)W習(xí)的信息檢索模型研究[D]. 程凡.中國科學(xué)技術(shù)大學(xué) 2012
碩士論文
[1]社交網(wǎng)絡(luò)中轉(zhuǎn)發(fā)預(yù)測(cè)的研究[D]. 任天功.哈爾濱理工大學(xué) 2015
本文編號(hào):3534711
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3534711.html
最近更新
教材專著