基于語義網的輿情監(jiān)控系統(tǒng)的設計與實現(xiàn)
本文關鍵詞:基于語義網的輿情監(jiān)控系統(tǒng)的設計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著網絡信息技術的快速發(fā)展,特別是社交網絡的活躍,給言論自由開辟了一條便捷的途徑,但有人卻利用網絡故意造謠和歪曲事實誤導民眾,給社會和企業(yè)造成了嚴重的不良影響,為積極應對突發(fā)的網絡輿情,迫切需要運用信息化手段實現(xiàn)網絡輿情的自動監(jiān)控。大部分輿情監(jiān)控所采取的機制是對網絡信息進行關鍵詞全文檢索,將匹配到一個或多個輿情關鍵詞的信息確定為相關輿情信息,導致出現(xiàn)很多與輿情無關的內容,準確率較低。本文根據(jù)蘭州石化公司輿情監(jiān)控的實際需要,設計并實現(xiàn)了一個基于語義網的輿情監(jiān)控系統(tǒng)。該系統(tǒng)將語義網技術引入輿情監(jiān)控當中,收集與輿情相關的領域知識,建立了輿情本體和情感本體,利用本體可推理的特性對信息進行輿情推理分析。通過在情感本體中設置情感強度和級性,判斷信息中的主觀傾向,從而實現(xiàn)輿情工作的高效準確。輿情監(jiān)控的主要工作有信息采集和輿情研判,該系統(tǒng)設計為兩層結構:信息采集層和輿情處理層。信息采集層具有“網絡爬蟲”模塊、“網頁凈化處理”模塊和“中文分詞”模塊,功能分別是廣泛采集網絡信息,對采集的網頁做主題內容提取,再將提取出的純文本信息進行分詞處理。輿情處理層的功能是將采集的信息與輿情本體匹配,對匹配到的本體進行輿情抽取及輿情推理,最后生成輿情信息報告。論文主要完成了基于語義網的輿情監(jiān)控系統(tǒng)的需求分析、詳細設計和系統(tǒng)實現(xiàn)。目前該系統(tǒng)已投入運行,能有效輻射主流輿論站點,準確率達到輿情監(jiān)控的需求,為蘭州石化公司的維穩(wěn)工作做出了積極的貢獻。
【關鍵詞】:網絡輿情 網絡信息采集 網頁凈化 中文分詞 語義網 本體 輿情抽取 輿情推理
【學位授予單位】:蘭州大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1;TP277
【目錄】:
- 中文摘要3-4
- Abstract4-9
- 第一章 緒論9-14
- 1.1 論文研究背景9-10
- 1.2 研究現(xiàn)狀10-11
- 1.3 論文主要工作11-12
- 1.4 論文的組織結構12-14
- 第二章 系統(tǒng)需求分析及總體設計方案14-19
- 2.1 系統(tǒng)總體需求描述14-15
- 2.2 系統(tǒng)框架設計15
- 2.3 系統(tǒng)體系結構設計15-17
- 2.3.1 輿情信息采集功能模塊16
- 2.3.2 輿情信息分析功能模塊16-17
- 2.3.3 系統(tǒng)架構設計17
- 2.4 系統(tǒng)開發(fā)環(huán)境和采用的軟件17-18
- 2.5 本章小結18-19
- 第三章 信息采集功能的設計與實現(xiàn)19-34
- 3.1 信息采集19-25
- 3.1.1 信息采集的范圍19
- 3.1.2 網絡爬蟲19-20
- 3.1.3 PageRank網頁排序技術算法20-21
- 3.1.4 深度優(yōu)先策略21-22
- 3.1.5 廣度優(yōu)先策略22
- 3.1.6 最佳優(yōu)先策略22-23
- 3.1.7 搜索引擎輔助采集23
- 3.1.8 應用效果及主要技術指標23-24
- 3.1.9 采集信息數(shù)據(jù)庫表結構24-25
- 3.2 網頁凈化處理25-29
- 3.2.1 網頁內容結構分析26-27
- 3.2.2 網頁內容塊類型的判斷27
- 3.2.3 主題內容塊的判斷算法及頁面凈化過程27-29
- 3.3 中文分詞技術29-33
- 3.3.1 中文分詞的算法29
- 3.3.2 基于詞庫匹配的算法29-30
- 3.3.3 基于統(tǒng)計的分詞算法30-31
- 3.3.4 基于規(guī)則的分詞算法31
- 3.3.5 中文分詞的設計及實現(xiàn)31-33
- 3.4 本章小結33-34
- 第四章 輿情處理功能的設計與實現(xiàn)34-57
- 4.1 語義網35-38
- 4.1.1 語義網的概念35
- 4.1.2 語義網體系結構35-38
- 4.2 本體的概念、特點和構建依據(jù)38-39
- 4.2.1 本體的概念38
- 4.2.2 本體的功能特點38-39
- 4.2.3 本體的構建規(guī)則39
- 4.3 本體語言39-42
- 4.3.1 本體建模語言選擇39-40
- 4.3.2 OWL的三個子語言的描述40-41
- 4.3.3 OWL-Lite語言描述41
- 4.3.4 本體開發(fā)工具41-42
- 4.4 輿情本體構建的流程及方法42-43
- 4.4.1 輿情本體的構建流程42-43
- 4.4.2 輿情本體循環(huán)獲取構建方法43
- 4.5 輿情本體的構建43-48
- 4.5.1 收集整理輿情主題詞并建立主題詞表43-45
- 4.5.2 輿情本體的構建45-48
- 4.5.3 本體數(shù)據(jù)庫ER圖48
- 4.6 基于語義的輿情分析48-55
- 4.6.1 基于本體的輿情匹配49-50
- 4.6.2 計算權重值判斷輿情50-51
- 4.6.3 本體規(guī)則描述及推理51-53
- 4.6.4 基于情感詞的主觀傾向判斷53-55
- 4.7 系統(tǒng)應用測試55-56
- 4.8 小結56-57
- 第五章 總結57-59
- 5.1 論文的主要工作57-58
- 5.2 工作展望58-59
- 參考文獻59-61
- 致謝61
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 胡文江;高永兵;李偉杰;;語義網中幾種描述語言的比較研究[J];計算機技術與發(fā)展;2007年08期
2 徐涵;;頂級專家Frank van Harmelen揭秘語義網[J];程序員;2007年11期
3 馮永;李華;吳中福;鐘將;葉春曉;;基于擴展語義網的知識資源組織技術研究[J];計算機科學;2008年03期
4 崔亞輝;;語義網的起源與發(fā)展[J];機械管理開發(fā);2009年05期
5 劉一寧;;語義網主要技術發(fā)展分析[J];情報探索;2011年09期
6 孔邵穎;;語義網起源與發(fā)展研究[J];電腦編程技巧與維護;2011年22期
7 孔邵穎;;語義網中關鍵技術發(fā)展形勢的探討[J];科技傳播;2012年01期
8 ;語義網:釋放互聯(lián)網的潛能[J];互聯(lián)網周刊;2002年41期
9 王曉蓉;知識管理中的語義網方法[J];情報雜志;2004年05期
10 杜文華;語義網描述語言比較研究[J];情報雜志;2004年09期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 朱江;張國寧;沈壽林;;語義網本體云影模型[A];第五屆全國復雜網絡學術會議論文(摘要)匯集[C];2009年
2 虞為;曹加恒;陳俊鵬;;一種對語義網上本體查詢和檢索的新方法(英文)[A];全國語域web與本體能研討會論文集[C];2006年
3 朱江;白海濤;沈慶國;;基于語義的內容適配框架[A];第一屆建立和諧人機環(huán)境聯(lián)合學術會議(HHME2005)論文集[C];2005年
4 劉朔;喬彥友;溫慶可;;基于語義網的GIS[A];第六屆全國信息獲取與處理學術會議論文集(1)[C];2008年
5 劉開瑛;;漢語框架語義網(CFN)構建現(xiàn)狀[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
6 林培光;劉弘;樊孝忠;王濤;;一種新的語義網信息檢索方法(英文)[A];全國語域web與本體能研討會論文集[C];2006年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 陳穎健;語義網:能理解人類語言的智能網絡[N];學習時報;2004年
2 王翔;大規(guī)模業(yè)務語義發(fā)掘為時尚早[N];網絡世界;2008年
3 小林子;語義網:讓網絡學會思考[N];電腦報;2004年
4 蕭國政 姬東鴻 國家社科基金重大項目“基于本體演化和事件結構的語義網模型研究”首席專家、武漢大學教授;智能性新一代語義網模型:語言科學與計算機科學的深度聯(lián)姻[N];中國社會科學報;2012年
5 李sノ,
本文編號:299994
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/299994.html