天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于主題模型的Twitter事件檢測(cè)

發(fā)布時(shí)間:2020-03-01 11:43
【摘要】:隨著Twitter等社交網(wǎng)絡(luò)應(yīng)用的迅速發(fā)展,越來(lái)越多的用戶在上面發(fā)布實(shí)時(shí)信息、更新個(gè)人狀態(tài)、表達(dá)自己的觀點(diǎn)想法等。Twitter上的事件檢測(cè)逐漸成為一個(gè)熱門的研究話題,吸引了越來(lái)越多學(xué)者的關(guān)注。雖然Twitter上的數(shù)據(jù)相對(duì)于傳統(tǒng)的新聞媒體、網(wǎng)絡(luò)博客等數(shù)據(jù)有更新實(shí)時(shí)、覆蓋范圍廣、用戶參與度高等優(yōu)點(diǎn),但是Tweets數(shù)據(jù)的單條信息量少、噪音大、更新頻繁、總數(shù)據(jù)量大等特點(diǎn)也給事件檢測(cè)帶來(lái)了很大的挑戰(zhàn)。 本文提出一種基于主題模型的Twitter事件檢測(cè)算法GEAM(General and Event-related Aspects Model),該模型通過(guò)模擬一條與現(xiàn)實(shí)事件相關(guān)的Tweet的生成過(guò)程將Tweet中描述事件相關(guān)方面的詞項(xiàng)(Event-related Aspects words)和與事件無(wú)關(guān)的常用詞項(xiàng)(General words)區(qū)分開來(lái)。同時(shí),我們也提出CollapsedGibbsSampling算法對(duì)GEAM模型進(jìn)行估計(jì)和推理,以得到描述不同事件的詞項(xiàng)分布。此外,我們還提出了GEAM模型的在線式變形算法,實(shí)時(shí)檢測(cè)連續(xù)的Tweets數(shù)據(jù)流中產(chǎn)生的事件并且追蹤該事件的演化過(guò)程。 本文設(shè)計(jì)了一系列的實(shí)驗(yàn)用以評(píng)估GEAM模型的有效性。大規(guī)模真實(shí)Tweets數(shù)據(jù)集(超過(guò)6百萬(wàn)條Tweets)上的實(shí)驗(yàn)表明,GEAM模型在查準(zhǔn)率(Precision),查全率(Recall)和重復(fù)事件檢測(cè)率(DERate)都優(yōu)于傳統(tǒng)LDA主題模型。GEAM模型采用(時(shí)間,地點(diǎn),實(shí)體,關(guān)鍵詞)四元組的形式表示事件的細(xì)粒度信息,使得事件檢測(cè)結(jié)果的語(yǔ)義更為清晰。此外,,實(shí)驗(yàn)部分還展示了在線式GEAM模型追蹤事件演變過(guò)程的能力。
【圖文】:

貝葉斯網(wǎng)絡(luò),多項(xiàng)式,節(jié)點(diǎn),證據(jù)


-1 狄利克雷—多項(xiàng)式一元模型的貝葉斯網(wǎng)絡(luò)圖yesian networks of Dirichlet-multinomial unigram個(gè)可觀察的證據(jù)節(jié)點(diǎn),節(jié)點(diǎn)外的 plate 觀察變量 和 分別是隱含變量和多項(xiàng)

貝葉斯網(wǎng)絡(luò),可交換性,性質(zhì)


圖 2-2 貝葉斯網(wǎng)絡(luò)中節(jié)點(diǎn)的馬爾科夫毯Fig. 2-2 Markove blanket of node in Bayesian network性計(jì)中另一個(gè)比較重要的性質(zhì)是可交換性(exchangeab
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP393.09

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 龔書;瞿有利;田盛豐;;基于語(yǔ)義的自動(dòng)文摘研究綜述[J];北京交通大學(xué)學(xué)報(bào);2009年05期

2 張小平;周雪忠;黃厚寬;馮奇;陳世波;焦宏官;;一種改進(jìn)的LDA主題模型[J];北京交通大學(xué)學(xué)報(bào);2010年02期

3 陶超;譚毅華;彭碧發(fā);田金文;;一種基于概率潛在語(yǔ)義模型的高分辨率遙感影像分類方法[J];測(cè)繪學(xué)報(bào);2011年02期

4 于芳;陳冬玲;王大玲;于戈;鮑玉斌;;基于PLSA的面向用戶的網(wǎng)絡(luò)搜索(英文)[J];Journal of Southeast University(English Edition);2007年03期

5 何友松;吳煒;陳默;楊曉敏;羅代升;;基于Bag of Features算法的車輛圖像識(shí)別研究[J];電視技術(shù);2009年12期

6 劉碩研;須德;馮松鶴;劉鏑;裘正定;;一種基于上下文語(yǔ)義信息的圖像塊視覺(jué)單詞生成算法[J];電子學(xué)報(bào);2010年05期

7 孫顯;王宏琦;楊志峰;;基于形狀統(tǒng)計(jì)模型的多類目標(biāo)自動(dòng)識(shí)別方法[J];電子與信息學(xué)報(bào);2009年11期

8 孫顯;付琨;王宏琦;;基于空間語(yǔ)義對(duì)象混合學(xué)習(xí)的復(fù)雜圖像場(chǎng)景自動(dòng)分類方法研究[J];電子與信息學(xué)報(bào);2011年02期

9 陳琳;盧湖川;;基于ML-pLSA模型的目標(biāo)識(shí)別算法[J];電子與信息學(xué)報(bào);2011年12期

10 胡正平;戎怡;;基于EILBP視覺(jué)描述子結(jié)合PLSA的場(chǎng)景分類算法[J];光電工程;2010年11期

相關(guān)會(huì)議論文 前8條

1 莊連生;唐克坦;馬啟榮;俞能海;;基于注意力模型的PLSA目標(biāo)學(xué)習(xí)算法[A];第十四屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年

2 梁莘q

本文編號(hào):2584032


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2584032.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶59fde***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com