基于社交媒體的突發(fā)話題檢測(cè)與演化分析方法研究
發(fā)布時(shí)間:2023-01-09 13:01
隨著網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,社交媒體成為網(wǎng)民彼此交流和獲取信息的主要工具和渠道。微博是當(dāng)前最受歡迎的社交媒體之一,擁有龐大的網(wǎng)絡(luò)用戶,微博信息發(fā)布迅速、便捷且實(shí)時(shí),往往成為突發(fā)話題的第一發(fā)布現(xiàn)場(chǎng)。因此如何從海量的微博數(shù)據(jù)流中快速而準(zhǔn)確地檢測(cè)到突發(fā)話題并對(duì)其進(jìn)行演化分析具有重要的意義,不僅可以幫助用戶把握突發(fā)話題的發(fā)展態(tài)勢(shì),而且可以為相關(guān)部門提供應(yīng)急措施,為輿情分析提供理論支撐。本文以微博文本流為研究對(duì)象,旨在構(gòu)建微博突發(fā)話題檢測(cè)與演化分析框架,針對(duì)該框架所涉及的突發(fā)話題檢測(cè)、突發(fā)話題演化分析的相關(guān)算法進(jìn)行了系統(tǒng)的研究。本文的主要研究工作如下:(1)突發(fā)話題檢測(cè)與演化問(wèn)題分析。首先介紹了相關(guān)概念;然后提出目前微博突發(fā)話題檢測(cè)與演化分析方法面臨的挑戰(zhàn),并構(gòu)建了微博突發(fā)話題檢測(cè)與演化分析框架;最后分析了微博數(shù)據(jù)的特點(diǎn),并對(duì)數(shù)據(jù)的預(yù)處理進(jìn)行了介紹。(2)提出了一種基于動(dòng)態(tài)窗口的微博突發(fā)話題檢測(cè)方法。該方法將詞對(duì)加速度作為突發(fā)特征,根據(jù)微博文本流中突發(fā)詞對(duì)出現(xiàn)的速度自適應(yīng)地確定突發(fā)話題窗口范圍,并利用改進(jìn)的非負(fù)矩陣分解聚類方法獲取突發(fā)話題窗口中微博的主題結(jié)構(gòu)。實(shí)驗(yàn)結(jié)果表明,該方法不但可以降低突發(fā)話題...
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 突發(fā)話題檢測(cè)研究
1.2.2 突發(fā)話題演化分析研究
1.3 主要研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)
第二章 問(wèn)題分析及數(shù)據(jù)集
2.1 突發(fā)話題檢測(cè)與演化問(wèn)題分析
2.1.1 相關(guān)概念
2.1.2 突發(fā)話題檢測(cè)問(wèn)題分析
2.1.3 突發(fā)話題演化問(wèn)題分析
2.1.4 本文研究方法框架
2.2 微博數(shù)據(jù)特點(diǎn)
2.3 微博數(shù)據(jù)預(yù)處理
2.3.1 無(wú)用信息過(guò)濾
2.3.2 分詞及詞性過(guò)濾
2.4 問(wèn)題的形式化定義
2.5 本章小結(jié)
第三章 基于動(dòng)態(tài)窗口的微博突發(fā)話題檢測(cè)方法
3.1 突發(fā)特征和突發(fā)話題窗口
3.2 突發(fā)話題檢測(cè)
3.2.1 突發(fā)話題檢測(cè)框架
3.2.2 詞對(duì)速度表
3.2.3 突發(fā)話題檢測(cè)算法
3.3 實(shí)驗(yàn)結(jié)果與分析
3.3.1 測(cè)試環(huán)境與實(shí)驗(yàn)數(shù)據(jù)
3.3.2 P、R和 F1 值對(duì)比實(shí)驗(yàn)
3.3.3 DW-BTD算法的實(shí)時(shí)性
3.3.4 動(dòng)態(tài)窗口的性能評(píng)價(jià)
3.3.5 突發(fā)話題的主題結(jié)構(gòu)
3.3.6 參數(shù)對(duì)突發(fā)話題檢測(cè)P、R和 F1 的影響
3.4 本章小結(jié)
第四章 基于極值點(diǎn)的微博突發(fā)話題演化分析方法
4.1 突發(fā)話題速度和加速度
4.2 演化時(shí)間窗口劃分
4.3 突發(fā)話題演化分析
4.3.1 突發(fā)話題演化分析框架
4.3.2 突發(fā)話題演化分析算法
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 實(shí)驗(yàn)數(shù)據(jù)及參數(shù)設(shè)置
4.4.2 P、R和 F1 值對(duì)比實(shí)驗(yàn)
4.4.3 突發(fā)話題演化分析結(jié)果
4.4.4時(shí)間窗口對(duì)比實(shí)驗(yàn)
4.5 本章小結(jié)
第五章 結(jié)論與展望
5.1 結(jié)論
5.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
【參考文獻(xiàn)】:
期刊論文
[1]中文微博數(shù)據(jù)預(yù)處理常用方法研究[J]. 李楚貞,余育文. 科技經(jīng)濟(jì)導(dǎo)刊. 2019(33)
[2]基于熵理論的突發(fā)事件輿情演化研究[J]. 曾子明,方正東. 情報(bào)科學(xué). 2019(09)
[3]基于增量式魯棒非負(fù)矩陣分解的短文本在線聚類[J]. 賀超波,湯庸,張瓊,劉雙印,劉海. 電子學(xué)報(bào). 2019(05)
[4]基于詞向量和BTM的短文本話題演化分析[J]. 張佩瑤,劉東蘇. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(03)
[5]基于話題詞共現(xiàn)網(wǎng)的話題演化方法[J]. 朱波,張洋. 遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2017(06)
[6]面向時(shí)間序列的微博話題演化模型研究[J]. 王振飛,劉凱莉,鄭志蘊(yùn),王飛. 計(jì)算機(jī)科學(xué). 2017(08)
[7]基于用戶行為影響的微博突發(fā)話題檢測(cè)方法[J]. 萬(wàn)越,隋杰. 中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào). 2017(04)
[8]中文微博文本采集與預(yù)處理綜述[J]. 孔雪娜,孫紅. 軟件導(dǎo)刊. 2017(02)
[9]網(wǎng)絡(luò)輿情事件的話題演化分析——以成都女司機(jī)為例[J]. 陳福集,馬梅蘭. 情報(bào)雜志. 2016(05)
[10]基于時(shí)間序列分析的微博突發(fā)話題檢測(cè)方法[J]. 賀敏,徐杰,杜攀,程學(xué)旗,王麗宏. 通信學(xué)報(bào). 2016(03)
博士論文
[1]以事件為中心的網(wǎng)絡(luò)輿情演化研究[D]. 翟羽佳.南開(kāi)大學(xué) 2017
碩士論文
[1]面向輿情監(jiān)控的微博熱點(diǎn)話題發(fā)現(xiàn)及演化分析研究[D]. 黨燕.內(nèi)蒙古工業(yè)大學(xué) 2018
[2]基于高效用模式挖掘的微博文本突發(fā)話題檢測(cè)方法研究[D]. 歐陽(yáng)雙.武漢大學(xué) 2018
[3]基于多特征融合的微博突發(fā)事件檢測(cè)方法研究[D]. 王建.北京信息科技大學(xué) 2018
[4]基于話題模型的微博熱點(diǎn)話題演化分析[D]. 顏月明.西安電子科技大學(xué) 2017
[5]基于維基語(yǔ)義聚類的微博輿情主題演化模型研究[D]. 王中勤.武漢大學(xué) 2017
[6]微博話題檢測(cè)與跟蹤方法研究[D]. 劉均峰.華中科技大學(xué) 2016
[7]突發(fā)事件微博新話題檢測(cè)與跟蹤系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 葛高飛.北京郵電大學(xué) 2014
本文編號(hào):3729229
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 突發(fā)話題檢測(cè)研究
1.2.2 突發(fā)話題演化分析研究
1.3 主要研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)
第二章 問(wèn)題分析及數(shù)據(jù)集
2.1 突發(fā)話題檢測(cè)與演化問(wèn)題分析
2.1.1 相關(guān)概念
2.1.2 突發(fā)話題檢測(cè)問(wèn)題分析
2.1.3 突發(fā)話題演化問(wèn)題分析
2.1.4 本文研究方法框架
2.2 微博數(shù)據(jù)特點(diǎn)
2.3 微博數(shù)據(jù)預(yù)處理
2.3.1 無(wú)用信息過(guò)濾
2.3.2 分詞及詞性過(guò)濾
2.4 問(wèn)題的形式化定義
2.5 本章小結(jié)
第三章 基于動(dòng)態(tài)窗口的微博突發(fā)話題檢測(cè)方法
3.1 突發(fā)特征和突發(fā)話題窗口
3.2 突發(fā)話題檢測(cè)
3.2.1 突發(fā)話題檢測(cè)框架
3.2.2 詞對(duì)速度表
3.2.3 突發(fā)話題檢測(cè)算法
3.3 實(shí)驗(yàn)結(jié)果與分析
3.3.1 測(cè)試環(huán)境與實(shí)驗(yàn)數(shù)據(jù)
3.3.2 P、R和 F1 值對(duì)比實(shí)驗(yàn)
3.3.3 DW-BTD算法的實(shí)時(shí)性
3.3.4 動(dòng)態(tài)窗口的性能評(píng)價(jià)
3.3.5 突發(fā)話題的主題結(jié)構(gòu)
3.3.6 參數(shù)對(duì)突發(fā)話題檢測(cè)P、R和 F1 的影響
3.4 本章小結(jié)
第四章 基于極值點(diǎn)的微博突發(fā)話題演化分析方法
4.1 突發(fā)話題速度和加速度
4.2 演化時(shí)間窗口劃分
4.3 突發(fā)話題演化分析
4.3.1 突發(fā)話題演化分析框架
4.3.2 突發(fā)話題演化分析算法
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 實(shí)驗(yàn)數(shù)據(jù)及參數(shù)設(shè)置
4.4.2 P、R和 F1 值對(duì)比實(shí)驗(yàn)
4.4.3 突發(fā)話題演化分析結(jié)果
4.4.4時(shí)間窗口對(duì)比實(shí)驗(yàn)
4.5 本章小結(jié)
第五章 結(jié)論與展望
5.1 結(jié)論
5.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
【參考文獻(xiàn)】:
期刊論文
[1]中文微博數(shù)據(jù)預(yù)處理常用方法研究[J]. 李楚貞,余育文. 科技經(jīng)濟(jì)導(dǎo)刊. 2019(33)
[2]基于熵理論的突發(fā)事件輿情演化研究[J]. 曾子明,方正東. 情報(bào)科學(xué). 2019(09)
[3]基于增量式魯棒非負(fù)矩陣分解的短文本在線聚類[J]. 賀超波,湯庸,張瓊,劉雙印,劉海. 電子學(xué)報(bào). 2019(05)
[4]基于詞向量和BTM的短文本話題演化分析[J]. 張佩瑤,劉東蘇. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(03)
[5]基于話題詞共現(xiàn)網(wǎng)的話題演化方法[J]. 朱波,張洋. 遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2017(06)
[6]面向時(shí)間序列的微博話題演化模型研究[J]. 王振飛,劉凱莉,鄭志蘊(yùn),王飛. 計(jì)算機(jī)科學(xué). 2017(08)
[7]基于用戶行為影響的微博突發(fā)話題檢測(cè)方法[J]. 萬(wàn)越,隋杰. 中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào). 2017(04)
[8]中文微博文本采集與預(yù)處理綜述[J]. 孔雪娜,孫紅. 軟件導(dǎo)刊. 2017(02)
[9]網(wǎng)絡(luò)輿情事件的話題演化分析——以成都女司機(jī)為例[J]. 陳福集,馬梅蘭. 情報(bào)雜志. 2016(05)
[10]基于時(shí)間序列分析的微博突發(fā)話題檢測(cè)方法[J]. 賀敏,徐杰,杜攀,程學(xué)旗,王麗宏. 通信學(xué)報(bào). 2016(03)
博士論文
[1]以事件為中心的網(wǎng)絡(luò)輿情演化研究[D]. 翟羽佳.南開(kāi)大學(xué) 2017
碩士論文
[1]面向輿情監(jiān)控的微博熱點(diǎn)話題發(fā)現(xiàn)及演化分析研究[D]. 黨燕.內(nèi)蒙古工業(yè)大學(xué) 2018
[2]基于高效用模式挖掘的微博文本突發(fā)話題檢測(cè)方法研究[D]. 歐陽(yáng)雙.武漢大學(xué) 2018
[3]基于多特征融合的微博突發(fā)事件檢測(cè)方法研究[D]. 王建.北京信息科技大學(xué) 2018
[4]基于話題模型的微博熱點(diǎn)話題演化分析[D]. 顏月明.西安電子科技大學(xué) 2017
[5]基于維基語(yǔ)義聚類的微博輿情主題演化模型研究[D]. 王中勤.武漢大學(xué) 2017
[6]微博話題檢測(cè)與跟蹤方法研究[D]. 劉均峰.華中科技大學(xué) 2016
[7]突發(fā)事件微博新話題檢測(cè)與跟蹤系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 葛高飛.北京郵電大學(xué) 2014
本文編號(hào):3729229
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3729229.html
最近更新
教材專著