天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于微博挖掘的流行趨勢預(yù)測

發(fā)布時間:2017-10-31 08:41

  本文關(guān)鍵詞:基于微博挖掘的流行趨勢預(yù)測


  更多相關(guān)文章: 微博 流行趨勢預(yù)測 特征融合 相似度 粒子群優(yōu)化


【摘要】:近年來,隨著Web 2.0和移動互聯(lián)網(wǎng)的飛速發(fā)展,互聯(lián)網(wǎng)上涌現(xiàn)了大量的社交網(wǎng)絡(luò)平臺。微博作為其中一種社交網(wǎng)絡(luò)平臺,以其高便捷性、高原創(chuàng)性、強(qiáng)交互性和強(qiáng)草根性的特點吸引了大量用戶,成為人們生活中獲取與分享信息的重要平臺。研究如何及時準(zhǔn)確地預(yù)測微博未來的流行趨勢,對內(nèi)容推薦、廣告營銷以及輿情監(jiān)控等領(lǐng)域都具有重要意義。本文以新浪微博為研究對象,對微博流行趨勢預(yù)測進(jìn)行了研究,具體工作如下:1.分別分析了內(nèi)容、時序和網(wǎng)絡(luò)這三類因素對微博轉(zhuǎn)發(fā)過程的影響。實驗結(jié)果表明,不包含鏈接的微博更容易被轉(zhuǎn)發(fā);微博中提及的人數(shù)越多,其最終轉(zhuǎn)發(fā)數(shù)的分布范圍越小,且轉(zhuǎn)發(fā)數(shù)都比較少;不同時間段發(fā)布的微博,其最終轉(zhuǎn)發(fā)數(shù)差別較大;微博最終轉(zhuǎn)發(fā)數(shù)與其最小轉(zhuǎn)發(fā)時間間隔之間存在一定的負(fù)相關(guān)性;初期曝光量較小的微博,其最終轉(zhuǎn)發(fā)數(shù)的分布范圍也較小,且大部分的轉(zhuǎn)發(fā)數(shù)都較少;微博最終轉(zhuǎn)發(fā)數(shù)與其早期轉(zhuǎn)發(fā)網(wǎng)絡(luò)的鏈接密度之間近似呈現(xiàn)負(fù)線性相關(guān)。2.分析了現(xiàn)有研究中常用微博特征存在的不足,然后在此基礎(chǔ)上從微博的內(nèi)容、時序和網(wǎng)絡(luò)三個方面提取了一系列新特征,將新特征與常用特征相結(jié)合,對邏輯斯蒂回歸、樸素貝葉斯、支持向量機(jī)和隨機(jī)森林等分類模型進(jìn)行訓(xùn)練并對目標(biāo)微博的流行度范圍進(jìn)行預(yù)測。實驗結(jié)果顯示,在加入本文提取的新特征后,這四種模型的預(yù)測正確率分別提高了1.91%,14.80%,2.92%和6.92%。3.將提取的微博特征應(yīng)用到基于相似度的微博流行趨勢預(yù)測方法中,給出了基于加權(quán)馬氏距離的微博相似度計算方法,根據(jù)提取的微博特征選取與目標(biāo)微博最相似的6)條歷史微博,將其加權(quán)平均流行度作為目標(biāo)微博的最終流行度。在此基礎(chǔ)上,還利用粒子群算法對選取的歷史微博數(shù)量和特征權(quán)重進(jìn)行了優(yōu)化。實驗結(jié)果顯示,與僅使用常用特征時的最優(yōu)結(jié)果相比,相對絕對誤差降低了0.0801,正確率提高了9.00%;與未經(jīng)過粒子群算法優(yōu)化的方法相比,相對絕對誤差降低了0.0640,正確率提高了6.00%。
【關(guān)鍵詞】:微博 流行趨勢預(yù)測 特征融合 相似度 粒子群優(yōu)化
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:G206;TP393.092
【目錄】:
  • 摘要5-6
  • ABSTRACT6-11
  • 第一章 緒論11-22
  • 1.1 研究背景與意義11-12
  • 1.2 國內(nèi)外研究現(xiàn)狀12-20
  • 1.2.1 Web內(nèi)容流行趨勢預(yù)測12-15
  • 1.2.2 基于相似度的微博流行趨勢預(yù)測15-16
  • 1.2.3 基于機(jī)器學(xué)習(xí)的微博流行趨勢預(yù)測16-19
  • 1.2.4 基于轉(zhuǎn)發(fā)模擬的微博流行趨勢預(yù)測19-20
  • 1.3 論文主要工作20-21
  • 1.4 論文組織結(jié)構(gòu)21-22
  • 第二章 相關(guān)技術(shù)介紹22-30
  • 2.1 常用的分類模型22-26
  • 2.1.1 邏輯斯蒂回歸模型22-23
  • 2.1.2 樸素貝葉斯模型23-24
  • 2.1.3 支持向量機(jī)模型24-25
  • 2.1.4 隨機(jī)森林模型25-26
  • 2.2 常用的鄰近性度量指標(biāo)26-28
  • 2.3 粒子群優(yōu)化算法28-29
  • 2.4 本章小結(jié)29-30
  • 第三章 微博轉(zhuǎn)發(fā)過程實證分析30-40
  • 3.1 問題的提出和相關(guān)工作30-31
  • 3.2 實驗設(shè)計31-33
  • 3.2.1 數(shù)據(jù)介紹31
  • 3.2.2 實驗方法及過程31-33
  • 3.3 實驗結(jié)果及分析33-39
  • 3.3.1 微博轉(zhuǎn)發(fā)數(shù)變化曲線及分布33-35
  • 3.3.2 微博用戶粉絲數(shù)與朋友數(shù)分布35
  • 3.3.3 內(nèi)容因素對微博轉(zhuǎn)發(fā)的影響35-36
  • 3.3.4 時序因素對微博轉(zhuǎn)發(fā)的影響36
  • 3.3.5 網(wǎng)絡(luò)因素對微博轉(zhuǎn)發(fā)的影響36-39
  • 3.4 本章小結(jié)39-40
  • 第四章 基于特征融合的微博流行趨勢預(yù)測40-58
  • 4.1 問題的提出和相關(guān)工作40-41
  • 4.2 基于特征融合的微博流行趨勢預(yù)測41-47
  • 4.2.1 算法步驟41-42
  • 4.2.2 轉(zhuǎn)發(fā)鏈和網(wǎng)絡(luò)構(gòu)造42
  • 4.2.3 微博內(nèi)容特征42-43
  • 4.2.4 微博時序特征43-44
  • 4.2.5 微博網(wǎng)絡(luò)特征44-47
  • 4.3 實驗設(shè)計47-50
  • 4.3.1 數(shù)據(jù)介紹47-48
  • 4.3.2 評價指標(biāo)48-49
  • 4.3.3 實驗方法及過程49-50
  • 4.4 實驗結(jié)果及分析50-57
  • 4.4.1 特征重要性51-52
  • 4.4.2 分類模型預(yù)測效果對比52-53
  • 4.4.3 不同類別特征的有效性53
  • 4.4.4 全部特征與常用特征預(yù)測效果對比53
  • 4.4.5 預(yù)測時刻對預(yù)測效果的影響53-55
  • 4.4.6 流行度閾值對預(yù)測效果的影響55-56
  • 4.4.7 模型時間性能對比56-57
  • 4.5 本章小結(jié)57-58
  • 第五章 基于相似度的微博流行趨勢預(yù)測58-72
  • 5.1 問題的提出和相關(guān)工作58-59
  • 5.2 基于相似度的微博流行趨勢預(yù)測59-62
  • 5.2.1 算法步驟59-60
  • 5.2.2 微博特征提取60
  • 5.2.3 微博相似度60-61
  • 5.2.4 目標(biāo)微博流行度61
  • 5.2.5 方法參數(shù)選擇61-62
  • 5.2.6 方法時間復(fù)雜度62
  • 5.3 實驗設(shè)計62-64
  • 5.3.1 實驗數(shù)據(jù)62
  • 5.3.2 評價指標(biāo)62-63
  • 5.3.3 實驗方法及過程63-64
  • 5.4 實驗結(jié)果及分析64-71
  • 5.4.1 預(yù)測效果對比64-65
  • 5.4.2 不同類別特征的有效性65-66
  • 5.4.3 相似微博數(shù)量對預(yù)測效果的影響66-68
  • 5.4.4 全部特征與常用特征預(yù)測效果對比68-69
  • 5.4.5 預(yù)測時刻對預(yù)測效果的影響69-71
  • 5.4.6 方法時間性能對比71
  • 5.5 本章小結(jié)71-72
  • 第六章 總結(jié)與展望72-74
  • 6.1 工作總結(jié)72-73
  • 6.2 工作展望73-74
  • 致謝74-75
  • 參考文獻(xiàn)75-80
  • 攻讀碩士學(xué)位期間取得的成果80-81

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 張鴻鳴,劉鐵軍,薛赤,程耀華;微機(jī)預(yù)測人體乙腦流行趨勢[J];計算機(jī)應(yīng)用研究;1992年05期

2 ;電腦流行趨勢[J];技術(shù)與市場;1997年02期

3 張磊;;自然之風(fēng),吹動2010流行趨勢 航嘉2010流行趨勢[J];電腦愛好者;2010年15期

4 胡豆豆;一籃子雞蛋或一籃子理想 2005年手機(jī)流行趨勢預(yù)測[J];數(shù)字通信;2004年20期

5 ;編者的話 流行趨勢[J];今日電子;1994年03期

6 ;孤獨的“手機(jī)”是可恥的——手機(jī)聯(lián)網(wǎng)娛樂流行趨勢[J];數(shù)字通信;2004年03期

7 ;飛越激情,奏響時尚樂章——寶鳥2005高級職業(yè)裝流行趨勢專場發(fā)布會[J];通信企業(yè)管理;2005年08期

8 ;’93—’94秋冬服裝流行趨勢[J];中國郵政;1994年02期

9 潘會洋,史長俊,馬秀貞,邱耀文,張豐厚,李志誠,何振華,梁居正,陳明遠(yuǎn),王保童;甘肅省1949—1990年麻風(fēng)病流行趨勢與防治對策的探討[J];蘭州科技情報;1995年02期

10 羅平;轉(zhuǎn)頁扇流行趨勢漫談[J];家庭電子;1999年08期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 陳萬青;;中國癌癥負(fù)擔(dān)現(xiàn)狀和流行趨勢[A];第十三屆中國科協(xié)年會第18分會場-癌癥流行趨勢和防控策略研究研討會論文集(補(bǔ)充)[C];2011年

2 趙樂修;陳恭信;唐焱;張斌;解靜榮;李毅;沈彬華;王春蘭;鄧洪斌;呂月玲;杜錦堂;;新疆克拉瑪依市癌癥流行趨勢調(diào)查研究[A];第十三屆中國科協(xié)年會第18分會場-癌癥流行病趨勢和防控策略研討會論文集[C];2011年

3 婁玉生;王國明;張萬祥;趙文仙;張臘萍;;溫縣狂犬病暴發(fā)流行趨勢淺析[A];中華醫(yī)學(xué)會第一屆全國公共衛(wèi)生學(xué)術(shù)會議暨第四屆中國現(xiàn)場流行病學(xué)培訓(xùn)項目匯編[C];2009年

4 曹玉廣;許芬;吳森林;段紀(jì)俊;;武漢市肺癌流行趨勢及對策[A];2002年湖北省減輕自然災(zāi)害白皮書——湖北省2002年重大自然災(zāi)害合趨勢分析會商會論文集[C];2002年

5 侯浚;;河北省常見惡性腫瘤的流行趨勢及防治對策[A];第四屆中國腫瘤學(xué)術(shù)大會暨第五屆海峽兩岸腫瘤學(xué)術(shù)會議論文集[C];2006年

6 吳建林;熊國屏;;四川省結(jié)核病流行趨勢及新世紀(jì)控制策略探討[A];中國防癆協(xié)會全國學(xué)術(shù)會議大會學(xué)術(shù)報告[C];2001年

7 ;未來之重新定義:2012/2013秋冬針織品流行趨勢[A];第十七屆全國花式紗線及其織物技術(shù)進(jìn)步研討會論文集[C];2011年

8 顧晏如;徐曉霞;錢興才;;無錫地區(qū)1989~1998年性病流行趨勢的分析[A];江蘇省性學(xué)會第三次學(xué)術(shù)會議論文集[C];2000年

9 梁金星;;癌癥流行趨勢和防控策略研究[A];第十三屆中國科協(xié)年會第18分會場-癌癥流行病趨勢和防控策略研討會論文集[C];2011年

10 約翰C.彼得;;全球肥胖癥的流行趨勢:挑戰(zhàn)和機(jī)遇[A];兒童營養(yǎng)與健康學(xué)術(shù)研討會論文匯編[C];2005年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 中法時裝培訓(xùn)中心法國設(shè)計師DELOR;流行趨勢與設(shè)計靈感[N];中國紡織報;2002年

2 梁勇;流行趨勢不是皇帝的新裝[N];中國紡織報;2007年

3 上海新聞中心 劉征;上海發(fā)布旅游紀(jì)念(禮)品流行趨勢[N];華東旅游報;2009年

4 中國紡織工業(yè)協(xié)會副會長、中國家用紡織品行業(yè)協(xié)會名譽(yù)會長 楊東輝;流行趨勢從“經(jīng)院”走向民間[N];中國紡織報;2010年

5 汝乃爾;上海發(fā)布旅游紀(jì)念品流行趨勢預(yù)測[N];中國旅游報;2011年

6 本報記者 沈則瑾;2011年旅游紀(jì)念品(禮品)流行趨勢發(fā)布[N];經(jīng)濟(jì)日報;2011年

7 本報記者 賈榕;轉(zhuǎn)型求變漸成流行趨勢[N];中國紡織報;2014年

8 蘇州大學(xué)藝術(shù)學(xué)院副院長、教授 李超德;中國服裝的流行趨勢與話語權(quán)[N];中國紡織報;2006年

9 ;09/10秋冬流行趨勢同期發(fā)布[N];中國服飾報;2009年

10 記者 楊江;借助流行趨勢發(fā)布打響“品牌戰(zhàn)”[N];石獅日報;2010年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條

1 汝海洋;流行趨勢在產(chǎn)品設(shè)計上的運(yùn)用研究[D];東華大學(xué);2015年

2 陳鄂;基于大數(shù)據(jù)的家紡流行趨勢預(yù)測研究[D];武漢紡織大學(xué);2016年

3 李鍇;基于微博挖掘的流行趨勢預(yù)測[D];電子科技大學(xué);2016年

4 胡晨曦;論流行趨勢報告中說服效果的實現(xiàn)—基于評價理論中態(tài)度資源選擇的研究[D];廣東外語外貿(mào)大學(xué);2009年

5 戴航;服裝流行趨勢設(shè)計手稿的研究[D];東華大學(xué);2007年

6 路曉丹;20世紀(jì)歐洲女裙造型設(shè)計流行趨勢研究[D];武漢紡織大學(xué);2014年

7 宋先璐;廣州市惡性腫瘤流行趨勢,1997-2006[D];南方醫(yī)科大學(xué);2007年

8 羅s,

本文編號:1121631


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1121631.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶92829***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com