基于圖的中文微博災(zāi)難事件檢測(cè)
本文關(guān)鍵詞:基于圖的中文微博災(zāi)難事件檢測(cè)
更多相關(guān)文章: 社交媒體 網(wǎng)絡(luò)輿情 事件模型 事件檢測(cè) 實(shí)時(shí)計(jì)算 基于圖的事件相關(guān)度計(jì)算
【摘要】:近幾年來(lái),災(zāi)難事件越來(lái)越多地引起公眾關(guān)注,由于信息社會(huì)消息的傳播速度大大提升,災(zāi)難事件的輿論影響越來(lái)越突出。因此,對(duì)災(zāi)難事件進(jìn)行實(shí)時(shí)監(jiān)控和社會(huì)性分析有了越來(lái)越廣泛的應(yīng)用需求。在網(wǎng)絡(luò)環(huán)境下,真實(shí)世界和虛擬世界具有相互映射的便利性,用戶可以持續(xù)并大量地將匯集到網(wǎng)絡(luò)社交平臺(tái)。由于傳統(tǒng)基于詞匯向量的文本分析方式在短文本上的表現(xiàn)不足,本文提出以災(zāi)難關(guān)鍵詞為中心,上下文敏感的基于圖的短文本災(zāi)難事件建模方法(HCCG)。HCCG模型通過(guò)定義實(shí)體關(guān)系生成規(guī)則,構(gòu)建了適用于短文本的上下文實(shí)體關(guān)系圖模型,有效地刻畫(huà)了災(zāi)難事件的屬性。模型充分挖掘消息級(jí)別(message-level)和流級(jí)別(stream-level)的上下文,能有效地過(guò)濾短文本常見(jiàn)的噪音,匯聚分散的社交媒體信息,直觀地用實(shí)體關(guān)系模型展示中間和最終的事件探測(cè)結(jié)果。在圖模型的基礎(chǔ)上,本文設(shè)計(jì)并實(shí)現(xiàn)了用最大公共子圖和最小公共超圖的信息量之比的計(jì)算方案來(lái)刻畫(huà)兩個(gè)事件之間的相似度。在相似度計(jì)算的基礎(chǔ)上,本文設(shè)計(jì)并實(shí)現(xiàn)了微博事件的實(shí)時(shí)聚類,在聚類過(guò)程中逐漸突出事件的新聞要素。在系統(tǒng)架構(gòu)的設(shè)計(jì)上,本文采用聚類和分類二階段框架,實(shí)現(xiàn)了一階段事件聚類,二階段災(zāi)難事件分類的事件識(shí)別系統(tǒng)?紤]社交網(wǎng)絡(luò)的實(shí)時(shí)性本質(zhì),我們將上述流程部署在Storm流式計(jì)算平臺(tái)上。為增加社交媒體信息使用效率,本文進(jìn)一步將短文本情感分析整合在我們的災(zāi)難管理系統(tǒng)中,判別識(shí)別出的災(zāi)難事件類是客觀描述類還是公眾主觀情感類,并為主觀情感類量化評(píng)分。我們的方法在新浪微博平臺(tái)上有良好的測(cè)試結(jié)果。
【關(guān)鍵詞】:社交媒體 網(wǎng)絡(luò)輿情 事件模型 事件檢測(cè) 實(shí)時(shí)計(jì)算 基于圖的事件相關(guān)度計(jì)算
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:G206
【目錄】:
- 摘要5-6
- Abstract6-11
- 第1章 緒論11-16
- 1.1 課題背景11-12
- 1.2 研究目的及內(nèi)容12-15
- 1.3 本章小結(jié)15-16
- 第2章 國(guó)內(nèi)外研究現(xiàn)狀16-29
- 2.1 文檔建模16-18
- 2.2 事件建模18-19
- 2.3 事件檢測(cè)19-21
- 2.3.1 基于波動(dòng)分析的事件檢測(cè)20
- 2.3.2 基于相似性聚類的事件檢測(cè)20-21
- 2.4 情感分析21-23
- 2.4.1 基于詞典和語(yǔ)義規(guī)則的方法22
- 2.4.2 基于機(jī)器學(xué)習(xí)的方法22-23
- 2.5 分布式實(shí)時(shí)計(jì)算23-28
- 2.5.1 主流分布式計(jì)算平臺(tái)23-24
- 2.5.2 Storm流計(jì)算平臺(tái)24-28
- 2.6 本章小結(jié)28-29
- 第3章 微博數(shù)據(jù)實(shí)時(shí)抓取與預(yù)處理29-39
- 3.1 針對(duì)災(zāi)難事件的微博主題爬蟲(chóng)29-32
- 3.2 數(shù)據(jù)預(yù)處理32-38
- 3.2.1 數(shù)據(jù)的解析與存儲(chǔ)32-35
- 3.2.2 中文分詞與詞性標(biāo)注35-38
- 3.3 本章小結(jié)38-39
- 第4章 HCCG事件建模與在線聚類39-57
- 4.1 微博事件抽取任務(wù)框架39-42
- 4.2 HCCG事件建模及相似度計(jì)算42-50
- 4.2.1 HCCG事件建模43-48
- 4.2.2 基于圖的相似度計(jì)算48-50
- 4.3 微博主客觀判斷及情感分析50-52
- 4.4 面向分布式系統(tǒng)的微博事件聚類分類算法52-56
- 4.4.1 分布式部署和實(shí)現(xiàn)52-54
- 4.4.2 HCCG的增量式聚類54-55
- 4.4.3 災(zāi)難事件分類55-56
- 4.5 本章小結(jié)56-57
- 第5章 實(shí)驗(yàn)結(jié)果及分析57-63
- 5.1 實(shí)驗(yàn)環(huán)境和數(shù)據(jù)集介紹57-58
- 5.2 聚類性能實(shí)驗(yàn)58-60
- 5.3 分類性能實(shí)驗(yàn)60-62
- 5.4 本章小結(jié)62-63
- 第6章 總結(jié)與展望63-65
- 6.1 全文總結(jié)63-64
- 6.2 未來(lái)研究方向64-65
- 參考文獻(xiàn)65-69
- 攻讀碩士學(xué)位期間主要的研究成果69-70
- 致謝70
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 洪宇;張宇;范基禮;劉挺;李生;;基于子話題分治匹配的新事件檢測(cè)[J];計(jì)算機(jī)學(xué)報(bào);2008年04期
2 史新宏,蔡伯根;高速公路自動(dòng)事件檢測(cè)算法[J];交通運(yùn)輸系統(tǒng)工程與信息;2001年04期
3 周林英;朱斌;趙忠杰;;基于支持向量機(jī)的高速公路事件檢測(cè)算法[J];系統(tǒng)仿真技術(shù);2010年03期
4 陳艷艷;田啟華;;公交調(diào)度系統(tǒng)事件檢測(cè)算法研究[J];北京工業(yè)大學(xué)學(xué)報(bào);2011年12期
5 郝艷哲;;京秦高速公路視頻事件檢測(cè)系統(tǒng)應(yīng)用[J];中國(guó)交通信息化;2013年04期
6 王闖舟;;提升事件檢測(cè)的商業(yè)價(jià)值[J];軟件世界;2007年20期
7 王彩琴;;基于智能分析的高速公路事件檢測(cè)系統(tǒng)的研究與開(kāi)發(fā)[J];浙江統(tǒng)計(jì);2007年11期
8 王穎穎;張峗;胡乃靜;;在線新事件檢測(cè)系統(tǒng)中的性能提升策略[J];計(jì)算機(jī)工程;2008年15期
9 倉(cāng)玉;洪宇;姚建民;朱巧明;;基于時(shí)序話題模型的新事件檢測(cè)[J];智能計(jì)算機(jī)與應(yīng)用;2011年03期
10 樓曉俊;鮑必賽;劉海濤;;分布式信息融合的物聯(lián)網(wǎng)事件檢測(cè)方法[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 洪宇;張宇;范基禮;劉挺;李生;;基于子話題分治匹配的新事件檢測(cè)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
2 劉霄;邵健;莊越挺;;基于主題模型的網(wǎng)絡(luò)突發(fā)熱點(diǎn)事件檢測(cè)[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【poster】[C];2011年
3 胡佳鋒;金蓓弘;陳海彪;;空間事件檢測(cè)的加速策略研究[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【oral】[C];2011年
4 萬(wàn)濤;陳學(xué)武;王川久;;高速公路事件自動(dòng)檢測(cè)算法研究綜述[A];第一屆中國(guó)智能交通年會(huì)論文集[C];2005年
5 張闊;李涓子;吳剛;;基于關(guān)鍵詞元的話題內(nèi)事件檢測(cè)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
6 覃頻頻;許登元;姚起宏;黃大明;;基于表決融合的高速公路事件檢測(cè)算法融合[A];'2006系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2006年
7 陳俊;李國(guó)輝;;擁擠視頻監(jiān)控中的事件檢測(cè)[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【poster】[C];2011年
8 張永忠;趙靜;;基于事件檢測(cè)算法的交通數(shù)據(jù)分析系統(tǒng)[A];中國(guó)計(jì)量協(xié)會(huì)冶金分會(huì)2008年會(huì)論文集[C];2008年
9 劉海龍;李戰(zhàn)懷;陳群;;RFID供應(yīng)鏈系統(tǒng)中的在線復(fù)雜事件檢測(cè)方法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年
10 周春姐;孟小峰;文潔;;Flickr中的復(fù)合事件檢測(cè)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條
1 王闖舟;事件檢測(cè)提升服務(wù)的商業(yè)價(jià)值[N];計(jì)算機(jī)世界;2006年
2 杭州?低晹(shù)字技術(shù)股份有限公司 浦世亮;IVS技術(shù)在城市安防系統(tǒng)中的應(yīng)用[N];計(jì)算機(jī)世界;2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 劉昌余;多媒體事件檢測(cè)中的關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2015年
2 覃頻頻;基于信息融合的高速公路事件檢測(cè)建模與仿真[D];西南交通大學(xué);2007年
3 余柳;基于移動(dòng)源數(shù)據(jù)的城市快速交通事件檢測(cè)W-CUSUM算法與評(píng)價(jià)[D];北京交通大學(xué);2010年
4 柯佳;基于語(yǔ)義的視頻事件檢測(cè)分析方法研究[D];江蘇大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 裴孝中;行車噪聲環(huán)境下的快速聲學(xué)事件檢測(cè)方法研究[D];哈爾濱工業(yè)大學(xué);2015年
2 熊偉晴;基于位置信息的事件檢測(cè)[D];哈爾濱工業(yè)大學(xué);2015年
3 李旭;面向多來(lái)源新聞的領(lǐng)域事件分析[D];浙江大學(xué);2015年
4 陳斌;基于云的復(fù)雜事件檢測(cè)服務(wù)[D];浙江大學(xué);2015年
5 肖軍;基于車檢器數(shù)據(jù)的高速公路事件檢測(cè)可靠性提升技術(shù)研究[D];重慶大學(xué);2015年
6 孫方園;基于圖的中文微博災(zāi)難事件檢測(cè)[D];浙江大學(xué);2016年
7 周林英;基于支持向量機(jī)的高速公路事件檢測(cè)算法[D];長(zhǎng)安大學(xué);2009年
8 龍睿;針對(duì)微博數(shù)據(jù)的事件檢測(cè)、跟蹤及摘要生成[D];上海交通大學(xué);2012年
9 趙曉芳;高速公路事件檢測(cè)算法研究[D];五邑大學(xué);2008年
10 馬海芳;面向長(zhǎng)過(guò)程的復(fù)雜事件檢測(cè)技術(shù)的研究[D];東北大學(xué);2010年
,本文編號(hào):795117
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/795117.html