基于微博挖掘的流行趨勢預(yù)測
本文關(guān)鍵詞:基于微博挖掘的流行趨勢預(yù)測
更多相關(guān)文章: 微博 流行趨勢預(yù)測 特征融合 相似度 粒子群優(yōu)化
【摘要】:近年來,隨著Web 2.0和移動互聯(lián)網(wǎng)的飛速發(fā)展,互聯(lián)網(wǎng)上涌現(xiàn)了大量的社交網(wǎng)絡(luò)平臺。微博作為其中一種社交網(wǎng)絡(luò)平臺,以其高便捷性、高原創(chuàng)性、強(qiáng)交互性和強(qiáng)草根性的特點吸引了大量用戶,成為人們生活中獲取與分享信息的重要平臺。研究如何及時準(zhǔn)確地預(yù)測微博未來的流行趨勢,對內(nèi)容推薦、廣告營銷以及輿情監(jiān)控等領(lǐng)域都具有重要意義。本文以新浪微博為研究對象,對微博流行趨勢預(yù)測進(jìn)行了研究,具體工作如下:1.分別分析了內(nèi)容、時序和網(wǎng)絡(luò)這三類因素對微博轉(zhuǎn)發(fā)過程的影響。實驗結(jié)果表明,不包含鏈接的微博更容易被轉(zhuǎn)發(fā);微博中提及的人數(shù)越多,其最終轉(zhuǎn)發(fā)數(shù)的分布范圍越小,且轉(zhuǎn)發(fā)數(shù)都比較少;不同時間段發(fā)布的微博,其最終轉(zhuǎn)發(fā)數(shù)差別較大;微博最終轉(zhuǎn)發(fā)數(shù)與其最小轉(zhuǎn)發(fā)時間間隔之間存在一定的負(fù)相關(guān)性;初期曝光量較小的微博,其最終轉(zhuǎn)發(fā)數(shù)的分布范圍也較小,且大部分的轉(zhuǎn)發(fā)數(shù)都較少;微博最終轉(zhuǎn)發(fā)數(shù)與其早期轉(zhuǎn)發(fā)網(wǎng)絡(luò)的鏈接密度之間近似呈現(xiàn)負(fù)線性相關(guān)。2.分析了現(xiàn)有研究中常用微博特征存在的不足,然后在此基礎(chǔ)上從微博的內(nèi)容、時序和網(wǎng)絡(luò)三個方面提取了一系列新特征,將新特征與常用特征相結(jié)合,對邏輯斯蒂回歸、樸素貝葉斯、支持向量機(jī)和隨機(jī)森林等分類模型進(jìn)行訓(xùn)練并對目標(biāo)微博的流行度范圍進(jìn)行預(yù)測。實驗結(jié)果顯示,在加入本文提取的新特征后,這四種模型的預(yù)測正確率分別提高了1.91%,14.80%,2.92%和6.92%。3.將提取的微博特征應(yīng)用到基于相似度的微博流行趨勢預(yù)測方法中,給出了基于加權(quán)馬氏距離的微博相似度計算方法,根據(jù)提取的微博特征選取與目標(biāo)微博最相似的6)條歷史微博,將其加權(quán)平均流行度作為目標(biāo)微博的最終流行度。在此基礎(chǔ)上,還利用粒子群算法對選取的歷史微博數(shù)量和特征權(quán)重進(jìn)行了優(yōu)化。實驗結(jié)果顯示,與僅使用常用特征時的最優(yōu)結(jié)果相比,相對絕對誤差降低了0.0801,正確率提高了9.00%;與未經(jīng)過粒子群算法優(yōu)化的方法相比,相對絕對誤差降低了0.0640,正確率提高了6.00%。
【關(guān)鍵詞】:微博 流行趨勢預(yù)測 特征融合 相似度 粒子群優(yōu)化
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:G206;TP393.092
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 緒論11-22
- 1.1 研究背景與意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-20
- 1.2.1 Web內(nèi)容流行趨勢預(yù)測12-15
- 1.2.2 基于相似度的微博流行趨勢預(yù)測15-16
- 1.2.3 基于機(jī)器學(xué)習(xí)的微博流行趨勢預(yù)測16-19
- 1.2.4 基于轉(zhuǎn)發(fā)模擬的微博流行趨勢預(yù)測19-20
- 1.3 論文主要工作20-21
- 1.4 論文組織結(jié)構(gòu)21-22
- 第二章 相關(guān)技術(shù)介紹22-30
- 2.1 常用的分類模型22-26
- 2.1.1 邏輯斯蒂回歸模型22-23
- 2.1.2 樸素貝葉斯模型23-24
- 2.1.3 支持向量機(jī)模型24-25
- 2.1.4 隨機(jī)森林模型25-26
- 2.2 常用的鄰近性度量指標(biāo)26-28
- 2.3 粒子群優(yōu)化算法28-29
- 2.4 本章小結(jié)29-30
- 第三章 微博轉(zhuǎn)發(fā)過程實證分析30-40
- 3.1 問題的提出和相關(guān)工作30-31
- 3.2 實驗設(shè)計31-33
- 3.2.1 數(shù)據(jù)介紹31
- 3.2.2 實驗方法及過程31-33
- 3.3 實驗結(jié)果及分析33-39
- 3.3.1 微博轉(zhuǎn)發(fā)數(shù)變化曲線及分布33-35
- 3.3.2 微博用戶粉絲數(shù)與朋友數(shù)分布35
- 3.3.3 內(nèi)容因素對微博轉(zhuǎn)發(fā)的影響35-36
- 3.3.4 時序因素對微博轉(zhuǎn)發(fā)的影響36
- 3.3.5 網(wǎng)絡(luò)因素對微博轉(zhuǎn)發(fā)的影響36-39
- 3.4 本章小結(jié)39-40
- 第四章 基于特征融合的微博流行趨勢預(yù)測40-58
- 4.1 問題的提出和相關(guān)工作40-41
- 4.2 基于特征融合的微博流行趨勢預(yù)測41-47
- 4.2.1 算法步驟41-42
- 4.2.2 轉(zhuǎn)發(fā)鏈和網(wǎng)絡(luò)構(gòu)造42
- 4.2.3 微博內(nèi)容特征42-43
- 4.2.4 微博時序特征43-44
- 4.2.5 微博網(wǎng)絡(luò)特征44-47
- 4.3 實驗設(shè)計47-50
- 4.3.1 數(shù)據(jù)介紹47-48
- 4.3.2 評價指標(biāo)48-49
- 4.3.3 實驗方法及過程49-50
- 4.4 實驗結(jié)果及分析50-57
- 4.4.1 特征重要性51-52
- 4.4.2 分類模型預(yù)測效果對比52-53
- 4.4.3 不同類別特征的有效性53
- 4.4.4 全部特征與常用特征預(yù)測效果對比53
- 4.4.5 預(yù)測時刻對預(yù)測效果的影響53-55
- 4.4.6 流行度閾值對預(yù)測效果的影響55-56
- 4.4.7 模型時間性能對比56-57
- 4.5 本章小結(jié)57-58
- 第五章 基于相似度的微博流行趨勢預(yù)測58-72
- 5.1 問題的提出和相關(guān)工作58-59
- 5.2 基于相似度的微博流行趨勢預(yù)測59-62
- 5.2.1 算法步驟59-60
- 5.2.2 微博特征提取60
- 5.2.3 微博相似度60-61
- 5.2.4 目標(biāo)微博流行度61
- 5.2.5 方法參數(shù)選擇61-62
- 5.2.6 方法時間復(fù)雜度62
- 5.3 實驗設(shè)計62-64
- 5.3.1 實驗數(shù)據(jù)62
- 5.3.2 評價指標(biāo)62-63
- 5.3.3 實驗方法及過程63-64
- 5.4 實驗結(jié)果及分析64-71
- 5.4.1 預(yù)測效果對比64-65
- 5.4.2 不同類別特征的有效性65-66
- 5.4.3 相似微博數(shù)量對預(yù)測效果的影響66-68
- 5.4.4 全部特征與常用特征預(yù)測效果對比68-69
- 5.4.5 預(yù)測時刻對預(yù)測效果的影響69-71
- 5.4.6 方法時間性能對比71
- 5.5 本章小結(jié)71-72
- 第六章 總結(jié)與展望72-74
- 6.1 工作總結(jié)72-73
- 6.2 工作展望73-74
- 致謝74-75
- 參考文獻(xiàn)75-80
- 攻讀碩士學(xué)位期間取得的成果80-81
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張鴻鳴,劉鐵軍,薛赤,程耀華;微機(jī)預(yù)測人體乙腦流行趨勢[J];計算機(jī)應(yīng)用研究;1992年05期
2 ;電腦流行趨勢[J];技術(shù)與市場;1997年02期
3 張磊;;自然之風(fēng),吹動2010流行趨勢 航嘉2010流行趨勢[J];電腦愛好者;2010年15期
4 胡豆豆;一籃子雞蛋或一籃子理想 2005年手機(jī)流行趨勢預(yù)測[J];數(shù)字通信;2004年20期
5 ;編者的話 流行趨勢[J];今日電子;1994年03期
6 ;孤獨的“手機(jī)”是可恥的——手機(jī)聯(lián)網(wǎng)娛樂流行趨勢[J];數(shù)字通信;2004年03期
7 ;飛越激情,奏響時尚樂章——寶鳥2005高級職業(yè)裝流行趨勢專場發(fā)布會[J];通信企業(yè)管理;2005年08期
8 ;’93—’94秋冬服裝流行趨勢[J];中國郵政;1994年02期
9 潘會洋,史長俊,馬秀貞,邱耀文,張豐厚,李志誠,何振華,梁居正,陳明遠(yuǎn),王保童;甘肅省1949—1990年麻風(fēng)病流行趨勢與防治對策的探討[J];蘭州科技情報;1995年02期
10 羅平;轉(zhuǎn)頁扇流行趨勢漫談[J];家庭電子;1999年08期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 陳萬青;;中國癌癥負(fù)擔(dān)現(xiàn)狀和流行趨勢[A];第十三屆中國科協(xié)年會第18分會場-癌癥流行趨勢和防控策略研究研討會論文集(補(bǔ)充)[C];2011年
2 趙樂修;陳恭信;唐焱;張斌;解靜榮;李毅;沈彬華;王春蘭;鄧洪斌;呂月玲;杜錦堂;;新疆克拉瑪依市癌癥流行趨勢調(diào)查研究[A];第十三屆中國科協(xié)年會第18分會場-癌癥流行病趨勢和防控策略研討會論文集[C];2011年
3 婁玉生;王國明;張萬祥;趙文仙;張臘萍;;溫縣狂犬病暴發(fā)流行趨勢淺析[A];中華醫(yī)學(xué)會第一屆全國公共衛(wèi)生學(xué)術(shù)會議暨第四屆中國現(xiàn)場流行病學(xué)培訓(xùn)項目匯編[C];2009年
4 曹玉廣;許芬;吳森林;段紀(jì)俊;;武漢市肺癌流行趨勢及對策[A];2002年湖北省減輕自然災(zāi)害白皮書——湖北省2002年重大自然災(zāi)害合趨勢分析會商會論文集[C];2002年
5 侯浚;;河北省常見惡性腫瘤的流行趨勢及防治對策[A];第四屆中國腫瘤學(xué)術(shù)大會暨第五屆海峽兩岸腫瘤學(xué)術(shù)會議論文集[C];2006年
6 吳建林;熊國屏;;四川省結(jié)核病流行趨勢及新世紀(jì)控制策略探討[A];中國防癆協(xié)會全國學(xué)術(shù)會議大會學(xué)術(shù)報告[C];2001年
7 ;未來之重新定義:2012/2013秋冬針織品流行趨勢[A];第十七屆全國花式紗線及其織物技術(shù)進(jìn)步研討會論文集[C];2011年
8 顧晏如;徐曉霞;錢興才;;無錫地區(qū)1989~1998年性病流行趨勢的分析[A];江蘇省性學(xué)會第三次學(xué)術(shù)會議論文集[C];2000年
9 梁金星;;癌癥流行趨勢和防控策略研究[A];第十三屆中國科協(xié)年會第18分會場-癌癥流行病趨勢和防控策略研討會論文集[C];2011年
10 約翰C.彼得;;全球肥胖癥的流行趨勢:挑戰(zhàn)和機(jī)遇[A];兒童營養(yǎng)與健康學(xué)術(shù)研討會論文匯編[C];2005年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 中法時裝培訓(xùn)中心法國設(shè)計師DELOR;流行趨勢與設(shè)計靈感[N];中國紡織報;2002年
2 梁勇;流行趨勢不是皇帝的新裝[N];中國紡織報;2007年
3 上海新聞中心 劉征;上海發(fā)布旅游紀(jì)念(禮)品流行趨勢[N];華東旅游報;2009年
4 中國紡織工業(yè)協(xié)會副會長、中國家用紡織品行業(yè)協(xié)會名譽(yù)會長 楊東輝;流行趨勢從“經(jīng)院”走向民間[N];中國紡織報;2010年
5 汝乃爾;上海發(fā)布旅游紀(jì)念品流行趨勢預(yù)測[N];中國旅游報;2011年
6 本報記者 沈則瑾;2011年旅游紀(jì)念品(禮品)流行趨勢發(fā)布[N];經(jīng)濟(jì)日報;2011年
7 本報記者 賈榕;轉(zhuǎn)型求變漸成流行趨勢[N];中國紡織報;2014年
8 蘇州大學(xué)藝術(shù)學(xué)院副院長、教授 李超德;中國服裝的流行趨勢與話語權(quán)[N];中國紡織報;2006年
9 ;09/10秋冬流行趨勢同期發(fā)布[N];中國服飾報;2009年
10 記者 楊江;借助流行趨勢發(fā)布打響“品牌戰(zhàn)”[N];石獅日報;2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 汝海洋;流行趨勢在產(chǎn)品設(shè)計上的運(yùn)用研究[D];東華大學(xué);2015年
2 陳鄂;基于大數(shù)據(jù)的家紡流行趨勢預(yù)測研究[D];武漢紡織大學(xué);2016年
3 李鍇;基于微博挖掘的流行趨勢預(yù)測[D];電子科技大學(xué);2016年
4 胡晨曦;論流行趨勢報告中說服效果的實現(xiàn)—基于評價理論中態(tài)度資源選擇的研究[D];廣東外語外貿(mào)大學(xué);2009年
5 戴航;服裝流行趨勢設(shè)計手稿的研究[D];東華大學(xué);2007年
6 路曉丹;20世紀(jì)歐洲女裙造型設(shè)計流行趨勢研究[D];武漢紡織大學(xué);2014年
7 宋先璐;廣州市惡性腫瘤流行趨勢,1997-2006[D];南方醫(yī)科大學(xué);2007年
8 羅s,
本文編號:1121631
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1121631.html