網(wǎng)絡(luò)輿情中熱點(diǎn)發(fā)現(xiàn)與跟蹤系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2022-12-11 17:36
網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,使得人們越來越多的通過網(wǎng)絡(luò)媒體發(fā)表言論和獲取信息,網(wǎng)絡(luò)輿情也就越來越受到人們的重視。由于網(wǎng)絡(luò)輿情是通過互聯(lián)網(wǎng)傳播,所以它繼承了互聯(lián)網(wǎng)隱蔽、開放和滲透的特點(diǎn),同時通過互聯(lián)網(wǎng)傳播網(wǎng)絡(luò)輿情也使它包含的信息非常豐富,信息量非常大。正是由于這些原因,使得人工收集網(wǎng)絡(luò)輿情信息非常困難,所以人們就開始研制網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)了。網(wǎng)絡(luò)輿情系統(tǒng)實時的在互聯(lián)網(wǎng)上采集信息,對信息進(jìn)行處理與分析,并將最終結(jié)果以一種容易理解的形式展示給用戶,有利的輔助用戶正確的處理輿情危機(jī)。本文首先總結(jié)了目前存在的網(wǎng)絡(luò)輿情熱點(diǎn)發(fā)現(xiàn)與追蹤的實現(xiàn)方法,對其中一些關(guān)鍵技術(shù),如話題發(fā)現(xiàn)與追蹤技術(shù)進(jìn)行了研究。通過了解這些技術(shù),掌握開發(fā)熱點(diǎn)發(fā)現(xiàn)與追蹤系統(tǒng)的關(guān)鍵知識。接下來研究了網(wǎng)頁內(nèi)容解析技術(shù),根據(jù)不同新聞網(wǎng)絡(luò)博客的特點(diǎn)進(jìn)行定制,利用這些特點(diǎn)提取下一步工作中需要利用到的信息并將這些信息保存以便以后使用。最后詳細(xì)說明了話題發(fā)現(xiàn)、話題熱度評估以及話題追蹤技術(shù)。在信息文本表示中使用了空間向量模型(VSM),包括設(shè)置特征項,改進(jìn)權(quán)重計算公式以及確定特征維數(shù)等,在進(jìn)行聚類時,使用改進(jìn)后的Single-Pass算法,這樣得到的聚類結(jié)果...
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文研究內(nèi)容與結(jié)構(gòu)安排
2 關(guān)鍵技術(shù)及其理論
2.1 信息預(yù)處理技術(shù)
2.1.1 網(wǎng)頁正文抽取
2.1.2 中文分詞技術(shù)
2.2 話題發(fā)現(xiàn)與追蹤技術(shù)
2.2.1 文本表示模型
2.2.2 文本相似度
2.2.3 文本聚類算法
2.2.4 話題追蹤技術(shù)
2.3 本章小結(jié)
3 需求分析
3.1 設(shè)計目標(biāo)
3.1.1 功能需求
3.1.2 性能需求
3.1.3 運(yùn)行環(huán)境
3.2 數(shù)據(jù)流圖
3.2.1 預(yù)處理
3.2.2 文本特征向量化
3.2.3 話題發(fā)現(xiàn)
3.2.4 話題熱度計算
3.2.5 話題追蹤
3.2.6 主題搜索
3.3 數(shù)據(jù)需求
3.3.1 數(shù)據(jù)庫分析
4 系統(tǒng)設(shè)計
4.1 系統(tǒng)體系結(jié)構(gòu)
4.2 模塊設(shè)計
4.2.1 規(guī)格化與預(yù)處理模塊
4.2.2 話題發(fā)現(xiàn)與熱度計算模塊
4.2.3 話題追蹤與主題搜索模塊
4.3 數(shù)據(jù)設(shè)計
5 系統(tǒng)實現(xiàn)
5.1 開發(fā)技術(shù)與環(huán)境
5.1.1 開發(fā)技術(shù)
5.1.2 開發(fā)環(huán)境
5.2 規(guī)格化實現(xiàn)
5.3 預(yù)處理實現(xiàn)
5.4 文本特征向量化實現(xiàn)
5.5 話題發(fā)現(xiàn)實現(xiàn)
6 系統(tǒng)測試
6.1 規(guī)格化測試
6.2 預(yù)處理測試
6.3 特征向量測試
6.4 話題發(fā)現(xiàn)及熱度計算測試
6.5 話題追蹤
7 總結(jié)與展望
7.1 總結(jié)
7.2 展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)LDA主題模型的社會網(wǎng)絡(luò)話題發(fā)現(xiàn)算法iMLDA[J]. 仇麗青,陳卓艷,丁長青,劉海燕. 情報科學(xué). 2016(09)
[2]面向LDA和VSM模型的微博熱點(diǎn)話題發(fā)現(xiàn)研究[J]. 李勇,張克亮. 自動化技術(shù)與應(yīng)用. 2016(08)
[3]基于動態(tài)LDA主題模型的內(nèi)容主題挖掘與演化[J]. 胡吉明,陳果. 圖書情報工作. 2014(02)
[4]向量空間模型的信息檢索技術(shù)[J]. 姚玉開,王燁,盧翠榮. 價值工程. 2013(13)
[5]淺議社會輿情及其社會價值[J]. 孟崴,張冬梅. 黑河學(xué)刊. 2013(04)
[6]基于主題情感混合模型的無監(jiān)督文本情感分析[J]. 孫艷,周學(xué)廣,付偉. 北京大學(xué)學(xué)報(自然科學(xué)版). 2013(01)
[7]微博突發(fā)話題檢測方法研究[J]. 邱云飛,程亮. 計算機(jī)工程. 2012(09)
[8]國內(nèi)外輿情研究述略[J]. 艾新革. 圖書館學(xué)刊. 2011(09)
[9]一種面向網(wǎng)絡(luò)話題發(fā)現(xiàn)的增量文本聚類算法[J]. 殷風(fēng)景,肖衛(wèi)東,葛斌,李芳芳. 計算機(jī)應(yīng)用研究. 2011(01)
[10]中文分詞技術(shù)研究[J]. 于洪波. 東莞理工學(xué)院學(xué)報. 2010(05)
碩士論文
[1]面向網(wǎng)絡(luò)新聞的輿情檢測與分析系統(tǒng)設(shè)計與實現(xiàn)[D]. 李雪.山東師范大學(xué) 2014
[2]網(wǎng)絡(luò)輿情信息的話題發(fā)現(xiàn)和追蹤技術(shù)的研究與應(yīng)用[D]. 衣波.廣東工業(yè)大學(xué) 2013
[3]基于向量空間模型的文本分類技術(shù)研究[D]. 蘇力華.西安電子科技大學(xué) 2006
本文編號:3719208
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文研究內(nèi)容與結(jié)構(gòu)安排
2 關(guān)鍵技術(shù)及其理論
2.1 信息預(yù)處理技術(shù)
2.1.1 網(wǎng)頁正文抽取
2.1.2 中文分詞技術(shù)
2.2 話題發(fā)現(xiàn)與追蹤技術(shù)
2.2.1 文本表示模型
2.2.2 文本相似度
2.2.3 文本聚類算法
2.2.4 話題追蹤技術(shù)
2.3 本章小結(jié)
3 需求分析
3.1 設(shè)計目標(biāo)
3.1.1 功能需求
3.1.2 性能需求
3.1.3 運(yùn)行環(huán)境
3.2 數(shù)據(jù)流圖
3.2.1 預(yù)處理
3.2.2 文本特征向量化
3.2.3 話題發(fā)現(xiàn)
3.2.4 話題熱度計算
3.2.5 話題追蹤
3.2.6 主題搜索
3.3 數(shù)據(jù)需求
3.3.1 數(shù)據(jù)庫分析
4 系統(tǒng)設(shè)計
4.1 系統(tǒng)體系結(jié)構(gòu)
4.2 模塊設(shè)計
4.2.1 規(guī)格化與預(yù)處理模塊
4.2.2 話題發(fā)現(xiàn)與熱度計算模塊
4.2.3 話題追蹤與主題搜索模塊
4.3 數(shù)據(jù)設(shè)計
5 系統(tǒng)實現(xiàn)
5.1 開發(fā)技術(shù)與環(huán)境
5.1.1 開發(fā)技術(shù)
5.1.2 開發(fā)環(huán)境
5.2 規(guī)格化實現(xiàn)
5.3 預(yù)處理實現(xiàn)
5.4 文本特征向量化實現(xiàn)
5.5 話題發(fā)現(xiàn)實現(xiàn)
6 系統(tǒng)測試
6.1 規(guī)格化測試
6.2 預(yù)處理測試
6.3 特征向量測試
6.4 話題發(fā)現(xiàn)及熱度計算測試
6.5 話題追蹤
7 總結(jié)與展望
7.1 總結(jié)
7.2 展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)LDA主題模型的社會網(wǎng)絡(luò)話題發(fā)現(xiàn)算法iMLDA[J]. 仇麗青,陳卓艷,丁長青,劉海燕. 情報科學(xué). 2016(09)
[2]面向LDA和VSM模型的微博熱點(diǎn)話題發(fā)現(xiàn)研究[J]. 李勇,張克亮. 自動化技術(shù)與應(yīng)用. 2016(08)
[3]基于動態(tài)LDA主題模型的內(nèi)容主題挖掘與演化[J]. 胡吉明,陳果. 圖書情報工作. 2014(02)
[4]向量空間模型的信息檢索技術(shù)[J]. 姚玉開,王燁,盧翠榮. 價值工程. 2013(13)
[5]淺議社會輿情及其社會價值[J]. 孟崴,張冬梅. 黑河學(xué)刊. 2013(04)
[6]基于主題情感混合模型的無監(jiān)督文本情感分析[J]. 孫艷,周學(xué)廣,付偉. 北京大學(xué)學(xué)報(自然科學(xué)版). 2013(01)
[7]微博突發(fā)話題檢測方法研究[J]. 邱云飛,程亮. 計算機(jī)工程. 2012(09)
[8]國內(nèi)外輿情研究述略[J]. 艾新革. 圖書館學(xué)刊. 2011(09)
[9]一種面向網(wǎng)絡(luò)話題發(fā)現(xiàn)的增量文本聚類算法[J]. 殷風(fēng)景,肖衛(wèi)東,葛斌,李芳芳. 計算機(jī)應(yīng)用研究. 2011(01)
[10]中文分詞技術(shù)研究[J]. 于洪波. 東莞理工學(xué)院學(xué)報. 2010(05)
碩士論文
[1]面向網(wǎng)絡(luò)新聞的輿情檢測與分析系統(tǒng)設(shè)計與實現(xiàn)[D]. 李雪.山東師范大學(xué) 2014
[2]網(wǎng)絡(luò)輿情信息的話題發(fā)現(xiàn)和追蹤技術(shù)的研究與應(yīng)用[D]. 衣波.廣東工業(yè)大學(xué) 2013
[3]基于向量空間模型的文本分類技術(shù)研究[D]. 蘇力華.西安電子科技大學(xué) 2006
本文編號:3719208
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3719208.html
最近更新
教材專著