在線社交網(wǎng)絡(luò)上的高效事件檢測模型
本文關(guān)鍵詞:在線社交網(wǎng)絡(luò)上的高效事件檢測模型,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著計算機(jī)技術(shù)的不斷發(fā)展和互聯(lián)網(wǎng)Web 2.0時代的來臨,社交網(wǎng)絡(luò)(如:Twitter、Facebook、微博)逐漸成為當(dāng)今國內(nèi)外社會化媒體的重要平臺。微博服務(wù)平臺作為社交網(wǎng)絡(luò)的一種,也吸引了越來越多的人通過他們與其他用戶之間建立的社交網(wǎng)絡(luò)來分享他們的日常生活或當(dāng)前熱點(diǎn)事件的看法與觀點(diǎn)。憑借其簡便快捷的信息生成機(jī)制和傳播機(jī)制,社交網(wǎng)絡(luò)上每天都會產(chǎn)生大量反映當(dāng)前社會熱點(diǎn)事件的數(shù)據(jù)信息。社交網(wǎng)絡(luò)上大規(guī)模用戶以及海量實時數(shù)據(jù),使得熱點(diǎn)事件檢測成為研究熱點(diǎn),讓社會輿情分析、謠言檢測或信息推薦都變得可能。社交網(wǎng)絡(luò)信息的短文本特征和不規(guī)范語言給重大焦點(diǎn)事件的檢測帶來新的挑戰(zhàn)。首先,海量的社交網(wǎng)絡(luò)文本信息流中含有很多與當(dāng)前熱點(diǎn)事件毫無關(guān)系的噪音文本信息。其次,大規(guī)模的文本數(shù)據(jù)集合要求熱點(diǎn)事件檢測方法必須更加高效、準(zhǔn)確。社交網(wǎng)絡(luò)平臺中除了文本信息還有大量其他相關(guān)信息,現(xiàn)有的事件檢測方法沒有有效利用此類相關(guān)信息,而且對噪音文本數(shù)據(jù)的處理還不夠高效。此外,基于主題模型的事件檢測方法最后的檢測結(jié)果為主題,但不是所有主題都能形成真實事件,需要進(jìn)一步的識別與判斷,F(xiàn)有的事件檢測方法對事件的檢測結(jié)果都需要人工標(biāo)識,不夠智能化。針對以上問題,本文提出了一種新穎的基于PLSA(Probabilistic Latent Semantic Analysis)的熱點(diǎn)事件檢測模型EVE(Efficient e Vent d Etection),通過分析微博平臺上的文本數(shù)據(jù)流來聚類內(nèi)容相似的微博帖子從而實現(xiàn)熱點(diǎn)事件的檢測。本論文的主要研究內(nèi)容和創(chuàng)新點(diǎn)如下:1.經(jīng)過對社交網(wǎng)絡(luò)平臺相關(guān)信息的研究,EVE事件檢測模型充分利用微博與用戶之間相互增強(qiáng)的關(guān)系,提出并采用了關(guān)系評價算法來篩選出高質(zhì)量的微博和高影響力的用戶,減小噪音文本的影響和降低數(shù)據(jù)集合的規(guī)模,從而達(dá)到高效率、高精度地檢測熱點(diǎn)事件的目的。2.為了進(jìn)一步提高事件檢測的效率,通過對參數(shù)估計算法的深刻理解和研究,提出并使用一種基于微博權(quán)威值賦值初始化方法來對EM參數(shù)估計算法中的目標(biāo)參數(shù)進(jìn)行初始化賦值,加快EM算法的收斂速度,從而提高事件檢測的效率和準(zhǔn)確率。3.為了讓事件檢測更加智能化,通過對相似度算法的研究,提出了基于余弦距離的智能識別真實事件的方法,較高效、較準(zhǔn)確地自動判斷主題是否形成事件和確定事件的關(guān)鍵微博。實驗表明,在時間開銷和準(zhǔn)確率方面,EVE事件檢測模型都優(yōu)于基準(zhǔn)模型,能夠高效率、高精度地進(jìn)行事件檢測,且智能識別方法能夠準(zhǔn)確、智能地判斷和顯示事件的相關(guān)關(guān)鍵微博和關(guān)鍵詞等信息。
【關(guān)鍵詞】:事件檢測 社交網(wǎng)絡(luò) HITS 主題模型 微博
【學(xué)位授予單位】:江蘇大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP393.092;TP391.1
【目錄】:
- 摘要4-6
- Abstract6-10
- 第一章 緒論10-19
- 1.1 研究背景及意義10-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-15
- 1.2.1 以事件類型來分類12-13
- 1.2.2 以實現(xiàn)技術(shù)來分類13-15
- 1.2.3 研究現(xiàn)狀總結(jié)分析15
- 1.3 研究目標(biāo)和內(nèi)容15-17
- 1.4 論文的組織結(jié)構(gòu)17-19
- 第二章 事件檢測相關(guān)技術(shù)研究19-32
- 2.1 主題模型19-26
- 2.1.1 隱性語義分析(LSA)和奇異值分解(SVD)19-20
- 2.1.2 概率潛在語義分析(PLSA)20-26
- 2.2 HITS算法26-30
- 2.2.1 Hub頁面和Authority頁面26-27
- 2.2.2 核心思想27
- 2.2.3 HITS算法在搜索領(lǐng)域應(yīng)用27-29
- 2.2.4 HITS算法的優(yōu)缺點(diǎn)分析29-30
- 2.3 余弦相似度30-31
- 2.4 本章小節(jié)31-32
- 第三章 社交網(wǎng)絡(luò)事件檢測數(shù)據(jù)處理與分析模型32-51
- 3.1 事件檢測關(guān)鍵問題分析及改進(jìn)方法32-33
- 3.2 EVE事件檢測模型33-39
- 3.2.1 數(shù)據(jù)處理模塊34-36
- 3.2.2 數(shù)據(jù)分析模塊36-39
- 3.3 實驗與結(jié)果分析39-49
- 3.3.1 實驗?zāi)康?/span>39
- 3.3.2 實驗數(shù)據(jù)39
- 3.3.3 基礎(chǔ)參數(shù)設(shè)置39-40
- 3.3.4 實驗對比模型40-41
- 3.3.5 實驗結(jié)果對比分析41-49
- 3.4 本章小節(jié)49-51
- 第四章 智能識別檢測事件研究51-57
- 4.1 關(guān)鍵問題分析及改進(jìn)方法51-52
- 4.2 智能識別模塊52-54
- 4.2.1 設(shè)定基準(zhǔn)微博53
- 4.2.2 計算余弦距離53-54
- 4.2.3 定義臨界值--λ_P和η_054
- 4.3 實驗結(jié)果分析54-56
- 4.5 本章小節(jié)56-57
- 第五章 總結(jié)與展望57-60
- 5.1 總結(jié)57-58
- 5.2 展望58-60
- 參考文獻(xiàn)60-63
- 致謝63-64
- 在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文64
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊清;;電網(wǎng)異常檢測模型方法設(shè)計[J];電測與儀表;2009年S2期
2 紀(jì)祥敏;陳秋妹;景林;;面向下一代互聯(lián)網(wǎng)的異常檢測模型研究[J];福建電腦;2013年01期
3 崔艷娜;;一種網(wǎng)絡(luò)流量異常檢測模型[J];計算機(jī)與現(xiàn)代化;2013年08期
4 涂旭平;金海;何麗莉;楊志玲;陶智飛;;一種新的網(wǎng)絡(luò)異常流量檢測模型[J];計算機(jī)科學(xué);2005年08期
5 呂洪柱;張建平;鄧文新;;基于數(shù)據(jù)挖掘技術(shù)的異常檢測模型設(shè)計[J];高師理科學(xué)刊;2007年06期
6 馬琳;蘇一丹;莫錦萍;;協(xié)同推薦系統(tǒng)檢測模型的一種優(yōu)化方法[J];微計算機(jī)信息;2010年03期
7 楊清;;基于模糊序列電網(wǎng)異常檢測建模方法與研究[J];山西電子技術(shù);2009年05期
8 李雪琴;;基于模糊C均值的異常流量檢測模型[J];贛南師范學(xué)院學(xué)報;2009年06期
9 唐彰國;李煥洲;鐘明全;張健;;改進(jìn)的進(jìn)程行為檢測模型及實現(xiàn)[J];計算機(jī)應(yīng)用;2010年01期
10 申利民;李峰;孫鵬飛;牛景春;;開放企業(yè)計算環(huán)境下基于信任的行為檢測模型[J];計算機(jī)集成制造系統(tǒng);2013年01期
中國重要會議論文全文數(shù)據(jù)庫 前7條
1 劉俊榮;王文槿;劉寶旭;;一種基于網(wǎng)絡(luò)行為分析的木馬檢測模型[A];第十六屆全國核電子學(xué)與核探測技術(shù)學(xué)術(shù)年會論文集(下冊)[C];2012年
2 馬文忠;郭江艷;陳科成;楊珊;王艷麗;;基于神經(jīng)網(wǎng)絡(luò)的供熱燃燒系統(tǒng)檢測模型的研究[A];2011中國電工技術(shù)學(xué)會學(xué)術(shù)年會論文集[C];2011年
3 張廣軍;賀俊吉;;基于圓結(jié)構(gòu)光的內(nèi)表面三維視覺檢測模型[A];中國儀器儀表學(xué)會學(xué)術(shù)論文集[C];2004年
4 王建平;張自立;魏華;;戰(zhàn)術(shù)空域沖突檢測模型研究[A];Proceedings of 14th Chinese Conference on System Simulation Technology & Application(CCSSTA’2012)[C];2012年
5 武照東;劉英凱;劉春;吳秀峰;;Overlay網(wǎng)絡(luò)的鏈路故障檢測模型[A];2008通信理論與技術(shù)新發(fā)展——第十三屆全國青年通信學(xué)術(shù)會議論文集(下)[C];2008年
6 李京鵬;楊林;劉世棟;;防火墻狀態(tài)檢測模型研究[A];第十八次全國計算機(jī)安全學(xué)術(shù)交流會論文集[C];2003年
7 周雙娥;熊國平;;基于Petri網(wǎng)的故障檢測模型的設(shè)計與分析[A];第六屆中國測試學(xué)術(shù)會議論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 蔣鵬;圖像內(nèi)容顯著性檢測的理論和方法研究[D];山東大學(xué);2016年
2 趙靜;網(wǎng)絡(luò)協(xié)議異常檢測模型的研究與應(yīng)用[D];北京交通大學(xué);2010年
3 趙斌;基于圖模型的微博數(shù)據(jù)分析與管理[D];華東師范大學(xué);2012年
4 牛清寧;基于信息融合的疲勞駕駛檢測方法研究[D];吉林大學(xué);2014年
5 劉鵬飛;鋁合金點(diǎn)焊質(zhì)量的逆過程檢測方法研究[D];天津大學(xué);2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 朱遠(yuǎn)文;前端啟發(fā)式滲透檢測模型研究[D];天津理工大學(xué);2015年
2 劉嬌;基于高光譜技術(shù)的不同品種豬肉品質(zhì)檢測模型傳遞方法研究[D];華中農(nóng)業(yè)大學(xué);2015年
3 軒照光;ITS系統(tǒng)防碰撞技術(shù)研究[D];電子科技大學(xué);2015年
4 祝e,
本文編號:332743
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/332743.html