實時網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)的設(shè)計與實現(xiàn)
本文關(guān)鍵詞:實時網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)的設(shè)計與實現(xiàn)
更多相關(guān)文章: 網(wǎng)絡(luò)輿情 輿情監(jiān)測 輿情采集 輿情分析
【摘要】:網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)目前已經(jīng)受到了越來越多人的關(guān)注。隨著互聯(lián)網(wǎng)的普及,大多數(shù)社會新聞、輿情都是通過網(wǎng)絡(luò)進行傳播的。近些年來,社會上出現(xiàn)了許許多多的輿情,比如三聚氰胺、地溝油、白酒塑化劑等等,網(wǎng)絡(luò)對這些輿情的擴散提供了很大的幫助。針對這種情況,網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)的作用就是及時發(fā)現(xiàn)相關(guān)的輿情,幫助政府部門和企業(yè)公司在輿情發(fā)展初期的時候,能夠完善地應(yīng)對和處理好輿情事件。另一方面,輿情從紙質(zhì)的新聞變成了網(wǎng)絡(luò)中的文本數(shù)據(jù),從而系統(tǒng)可以獲取并且分析這些新聞內(nèi)容,使得網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)具有了很好的可行性。本文實現(xiàn)了一款網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng),系統(tǒng)實現(xiàn)了對網(wǎng)絡(luò)中的新聞、論壇、博客和微博的獲取和分析,智能地提取出用戶所關(guān)心的輿情內(nèi)容。本文將輿情系統(tǒng)分成了4個階段。第一階段是信息爬蟲,獲取網(wǎng)頁中的新聞數(shù)據(jù)。第二階段是信息抽取,提取網(wǎng)頁中的標題、發(fā)布時間和正文內(nèi)容。然而,不同的網(wǎng)頁的格式是不一樣的,沒有一個具體的標準,這是輿情系統(tǒng)的一大難點,本文設(shè)計了一種算法,適用于大多數(shù)頁面的信息抽取。第三階段是相關(guān)性分析,這個階段過濾了絕大多數(shù)的新聞,只保留用戶所關(guān)心的輿情內(nèi)容。第四階段是輿情展現(xiàn),本文通過圖示、列表和輿情分類等種種方式,改善了用戶對輿情系統(tǒng)的使用體驗。本文在系統(tǒng)的實時性、準確性、可擴展性上做了許多的努力。目前本文的輿情系統(tǒng)已經(jīng)完全實現(xiàn),并且已經(jīng)通過實際的輿情項目要求的檢驗,即將正式上線運行。
【關(guān)鍵詞】:網(wǎng)絡(luò)輿情 輿情監(jiān)測 輿情采集 輿情分析
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP274
【目錄】:
- 摘要4-5
- Abstract5-10
- 第1章 緒論10-16
- 1.1 課題背景10-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-13
- 1.3 本文研究目的13-14
- 1.4 論文結(jié)構(gòu)14-16
- 第2章 網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)的相關(guān)技術(shù)16-20
- 2.1 網(wǎng)絡(luò)爬蟲鏈接去重技術(shù)16-17
- 2.2 信息抽取的相關(guān)技術(shù)17-18
- 2.3 相關(guān)性分析的技術(shù)18-19
- 2.4 數(shù)據(jù)存儲引擎19
- 2.5 本章小結(jié)19-20
- 第3章 系統(tǒng)模塊分析20-37
- 3.1 需求分析20
- 3.2 信息爬蟲分析20-26
- 3.2.1 網(wǎng)絡(luò)爬蟲框架分析20-23
- 3.2.2 單個網(wǎng)站爬蟲分析23-26
- 3.3 信息抽取分析26-32
- 3.3.1 發(fā)布時間抽取分析27-28
- 3.3.2 瀏覽量和評論數(shù)分析28-29
- 3.3.3 頁面分類29-31
- 3.3.4 正文內(nèi)容解析31-32
- 3.4 相關(guān)性分析32-35
- 3.4.1 相關(guān)性分析的元數(shù)據(jù)33-34
- 3.4.2 相關(guān)性分析的過程34-35
- 3.5 輿情展現(xiàn)分析35-36
- 3.6 本章小結(jié)36-37
- 第4章 輿情系統(tǒng)的設(shè)計與實現(xiàn)37-53
- 4.1 系統(tǒng)整體架構(gòu)37-39
- 4.2 數(shù)據(jù)模型設(shè)計39-43
- 4.2.1 用戶數(shù)據(jù)模型39-40
- 4.2.2 輿情數(shù)據(jù)模型40-41
- 4.2.3 交互配置數(shù)據(jù)模型41-42
- 4.2.4 采集配置數(shù)據(jù)模型42-43
- 4.3 信息爬蟲模塊設(shè)計43-46
- 4.3.1 信息爬蟲起點43-45
- 4.3.2 信息爬蟲過程45-46
- 4.4 信息抽取模塊設(shè)計46-48
- 4.4.1 新聞內(nèi)容頁47-48
- 4.5 相關(guān)性模塊設(shè)計48-49
- 4.6 微博輿情采集設(shè)計49-52
- 4.7 本章小結(jié)52-53
- 第5章 系統(tǒng)測試與優(yōu)化53-61
- 5.1 信息抽取測試53-57
- 5.1.1 發(fā)布時間抽取測試53-55
- 5.1.2 正文內(nèi)容抽取測試55-57
- 5.2 采集效率測試57-58
- 5.3 成果展示58-60
- 5.4 本章小結(jié)60-61
- 第6章 總結(jié)和展望61-63
- 6.1 工作回顧61-62
- 6.2 未來展望和改進62-63
- 參考文獻63-66
- 致謝66
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 陶建杰;;網(wǎng)絡(luò)輿情聯(lián)動應(yīng)急機制初探[J];青年記者;2007年15期
2 胡圣方;楊文德;;網(wǎng)絡(luò)輿情管理的問題及對策[J];甘肅政法成人教育學院學報;2007年04期
3 吳明友;;校園網(wǎng)絡(luò)輿情的應(yīng)對策略分析[J];中國教育信息化;2008年24期
4 張麗紅;;試論網(wǎng)絡(luò)輿情傳播對文化的影響[J];前沿;2008年04期
5 姜勝洪;;網(wǎng)絡(luò)輿情熱點的形成與發(fā)展、現(xiàn)狀及輿論引導[J];理論月刊;2008年04期
6 李子德;;論和諧社會視野中不良網(wǎng)絡(luò)輿情的預警[J];中國石油大學學報(社會科學版);2008年04期
7 劉軍;;互聯(lián)網(wǎng)時代網(wǎng)絡(luò)輿情的應(yīng)急處理[J];理論學習;2009年01期
8 周志強;;網(wǎng)絡(luò)輿情與“口香糖思想”[J];人民論壇;2009年04期
9 許鑫;章成志;李雯靜;;國內(nèi)網(wǎng)絡(luò)輿情研究的回顧與展望[J];情報理論與實踐;2009年03期
10 陳嬰虹;;論網(wǎng)絡(luò)輿情對司法的影響[J];中共浙江省委黨校學報;2009年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 任銘;陳俊鑫;;我國網(wǎng)絡(luò)輿情及管理策略研究[A];2011年全國通信安全學術(shù)會議論文集[C];2011年
2 潘崇霞;;網(wǎng)絡(luò)輿情演化的階段分析[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計算機模擬與信息技術(shù)學術(shù)會議論文集[C];2011年
3 潘慶芳;周萍;;涉路網(wǎng)絡(luò)輿情的現(xiàn)狀及應(yīng)對建議[A];中國公路學會高速公路運營管理分會2011年度年會暨第十八次全國高速公路運營管理工作研討會論文集[C];2011年
4 李大鵬;;加強新形勢下檢察機關(guān)網(wǎng)絡(luò)輿情體系建設(shè)[A];第27次全國計算機安全學術(shù)交流會論文集[C];2012年
5 曹俊喜;劉云;徐希源;;電力行業(yè)網(wǎng)絡(luò)輿情監(jiān)測分析技術(shù)研究與系統(tǒng)設(shè)計[A];2012年電力通信管理暨智能電網(wǎng)通信技術(shù)論壇論文集[C];2013年
6 冉治平;;提高網(wǎng)絡(luò)輿情應(yīng)對能力的幾點思考[A];浙江煙草(2012年第3期總第122期)[C];2012年
7 疏學明;鄭魁;張輝;袁宏永;;突發(fā)事件中網(wǎng)絡(luò)輿情信息管理方式探討[A];中國突發(fā)事件防范與快速處置優(yōu)秀成果選編[C];2009年
8 耿騫;劉穎;;網(wǎng)絡(luò)輿情的形成、傳播及監(jiān)測方法[A];科學發(fā)展:文化軟實力與民族復興——紀念中華人民共和國成立60周年論文集(下卷)[C];2009年
9 韓偉;張洪濤;;網(wǎng)絡(luò)輿情與青少年媒介認知能力構(gòu)建[A];網(wǎng)絡(luò)時代的青少年和青少年工作研究報告——第六屆中國青少年發(fā)展論壇暨中國青少年研究會優(yōu)秀論文集(2010)[C];2010年
10 曾華藝;;網(wǎng)絡(luò)輿情危機事件指標體系探討[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計算機模擬與信息技術(shù)學術(shù)會議論文集[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 記者 劉自賢 通訊員 吳濤;網(wǎng)絡(luò)輿情助推漢江中院司法為民[N];湖北日報;2010年
2 通訊員 王宏杰;注重網(wǎng)絡(luò)輿情監(jiān)督 網(wǎng)上網(wǎng)下良性互動[N];檢察日報;2010年
3 四川省地稅局直屬分局 韋一新 胡曉馳;正確應(yīng)對征納糾紛引發(fā)的網(wǎng)絡(luò)輿情危機[N];中國稅務(wù)報;2010年
4 唐莉 記者 郭樹仁;梅河口檢察院加強涉檢網(wǎng)絡(luò)輿情研判與應(yīng)對工作[N];北方法制報;2010年
5 記者 盧志堅 通訊員 胡連芳;江蘇大豐:征聘百名“網(wǎng)絡(luò)輿情監(jiān)督員”[N];檢察日報;2009年
6 見習記者 施燕燕;應(yīng)對網(wǎng)絡(luò)輿情與三項重點工作息息相關(guān)[N];檢察日報;2010年
7 記者 吳漢松;提升引導網(wǎng)絡(luò)輿情能力[N];石獅日報;2010年
8 四川省內(nèi)江市工商局 吳明顯 楊曉彬;建議加強網(wǎng)絡(luò)輿情收集分析及引導工作(下)[N];中國工商報;2010年
9 吳明顯;內(nèi)江積極加強網(wǎng)絡(luò)輿情監(jiān)測[N];中國工商報;2010年
10 本報記者 白真智;探秘網(wǎng)絡(luò)輿情市場[N];人民日報;2010年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 張玉強;網(wǎng)絡(luò)輿情危機的政府適度反應(yīng)研究[D];中央民族大學;2011年
2 何健;高校大學生網(wǎng)絡(luò)輿情特征與管理對策研究[D];西南大學;2015年
3 石新宇;當代大學生網(wǎng)絡(luò)輿情分析及對策研究[D];遼寧大學;2015年
4 曹學艷;突發(fā)事件動態(tài)網(wǎng)絡(luò)輿情挖掘與應(yīng)對研究[D];電子科技大學;2013年
5 方付建;突發(fā)事件網(wǎng)絡(luò)輿情演變研究[D];華中科技大學;2011年
6 張偉;基于復雜社會網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情演化模型研究[D];哈爾濱工業(yè)大學;2014年
7 陳t熀,
本文編號:1070780
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1070780.html