頂創(chuàng)科技輿情監(jiān)測系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2017-05-17 18:11
本文關(guān)鍵詞:頂創(chuàng)科技輿情監(jiān)測系統(tǒng)的設(shè)計與實現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:頂創(chuàng)科技為西安頂創(chuàng)電子科技有限公司的簡稱,是一家以研發(fā)和經(jīng)營手機配件及手機智能周邊產(chǎn)品為核心業(yè)務(wù)的創(chuàng)業(yè)公司。對于以科技智能創(chuàng)新為起點的創(chuàng)業(yè)公司來說,善于發(fā)現(xiàn)新事物和新需求成為是否能快速盈利的關(guān)鍵,所以對智能手機和新奇配件等方面的輿情監(jiān)測工作就特別的重要。本文的輿情系統(tǒng)基于MySQL數(shù)據(jù)庫管理系統(tǒng),使用Python語言開發(fā)。整個系統(tǒng)由用戶配置模塊、數(shù)據(jù)抓取模塊、數(shù)據(jù)提取模塊、數(shù)據(jù)分析模塊和數(shù)據(jù)存儲模塊構(gòu)成。用戶配置模塊主要用于進(jìn)行關(guān)鍵詞管理、類目管理和預(yù)警管理,其中的關(guān)鍵詞管理包含了主詞、或詞、過濾詞和預(yù)警詞四大詞類;數(shù)據(jù)抓取模塊是指驅(qū)動主題爬蟲抓取有針對性的信息,在數(shù)據(jù)抓取這一階段需要注意的是一方面要保證數(shù)據(jù)的及時性和全面性,另一方面要嚴(yán)格遵守網(wǎng)站對網(wǎng)頁的訪問限制;數(shù)據(jù)提取模塊是從網(wǎng)頁中獲取用戶關(guān)注信息的關(guān)鍵,包括網(wǎng)頁的標(biāo)題、正文、發(fā)布時間、作者、文章來源、閱讀量和回復(fù)量等,對標(biāo)題和正文的提取采用概率的學(xué)習(xí)方式對網(wǎng)頁結(jié)構(gòu)進(jìn)行解析,對發(fā)布時間、作者、來源等信息的提取上采用了傳統(tǒng)的正則表達(dá)式;數(shù)據(jù)分析模塊即對信息與用戶的匹配性進(jìn)行分析;數(shù)據(jù)存儲模塊是整個系統(tǒng)的核心模塊,基本所有的模塊都需要和數(shù)據(jù)存儲交互以實現(xiàn)其自身模塊的功能,所以數(shù)據(jù)存儲模塊并發(fā)性和穩(wěn)定性有很高的要求。該輿情系統(tǒng)結(jié)合頂創(chuàng)科技的實際需求進(jìn)行了相關(guān)測試,測試結(jié)果表明系統(tǒng)在獲取信息的時效性和內(nèi)容全面性上能夠滿足用戶對輿情信息的監(jiān)控需求,具有一定的使用價值。
【關(guān)鍵詞】:網(wǎng)絡(luò)輿情 數(shù)據(jù)庫 網(wǎng)絡(luò)爬蟲
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.08
【目錄】:
- 摘要4-5
- Abstract5-8
- 1 緒論8-15
- 1.1 頂創(chuàng)科技進(jìn)行輿情系統(tǒng)設(shè)計的背景與意義8-10
- 1.2 對網(wǎng)絡(luò)輿情進(jìn)行監(jiān)測的必要性10-13
- 1.2.1 數(shù)據(jù)庫的產(chǎn)生10-11
- 1.2.2 web 2.0時代11-12
- 1.2.3 大數(shù)據(jù)時代12-13
- 1.3 本文的工作內(nèi)容13-15
- 2 相關(guān)技術(shù)介紹15-18
- 2.1 主題爬蟲技術(shù)15
- 2.2 文本挖掘技術(shù)15-16
- 2.2.1 文檔分類15
- 2.2.2 文檔聚類15
- 2.2.3 自動摘文15-16
- 2.3 自然語言處理技術(shù)16-18
- 2.3.1 詞法分析16
- 2.3.2 句法分析16
- 2.3.3 語義分析16
- 2.3.4 語用分析16-17
- 2.3.5 語境分析17-18
- 3 需求分析18-23
- 3.1 輿情監(jiān)測系統(tǒng)概述18-19
- 3.2 輿情監(jiān)測系統(tǒng)的功能需求分析19-22
- 3.2.1 系統(tǒng)配置功能模塊19-20
- 3.2.2 輿情瀏覽功能模塊20-21
- 3.2.3 輿情過濾功能模塊21
- 3.2.4 輿情分析與統(tǒng)計功能模塊21-22
- 3.3 互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng)的非功能性需求22-23
- 3.3.1 及時響應(yīng)22
- 3.3.2 數(shù)據(jù)可用性22
- 3.3.3 并發(fā)性需求22-23
- 4 系統(tǒng)設(shè)計23-33
- 4.1 用戶配置模塊設(shè)計23-28
- 4.1.1 關(guān)鍵詞管理24-25
- 4.1.2 類目管理25-27
- 4.1.3 預(yù)警管理27-28
- 4.2 數(shù)據(jù)抓取模塊設(shè)計28-29
- 4.3 數(shù)據(jù)提取模塊設(shè)計29-30
- 4.4 數(shù)據(jù)分析模塊設(shè)計30-32
- 4.5 數(shù)據(jù)存儲模塊設(shè)計32-33
- 5 系統(tǒng)實現(xiàn)與測試33-55
- 5.1 用戶配置模塊實現(xiàn)33-37
- 5.1.1 關(guān)鍵詞管理33-35
- 5.1.2 類目管理35-36
- 5.1.3 預(yù)警管理36-37
- 5.2 數(shù)據(jù)抓取模塊實現(xiàn)37-40
- 5.3 數(shù)據(jù)提取模塊實現(xiàn)40-44
- 5.4 數(shù)據(jù)分析模塊實現(xiàn)44-48
- 5.5 頂創(chuàng)科技的輿情系統(tǒng)測試48-55
- 5.5.1 類目和關(guān)鍵詞的設(shè)置48-51
- 5.5.2 信息的抓取與統(tǒng)計51-55
- 結(jié)論55-56
- 參考文獻(xiàn)56-57
- 致謝57-58
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 謝天保;張曉雯;仵凱博;;微博社會網(wǎng)絡(luò)重要用戶節(jié)點篩選及輿情引導(dǎo)[J];計算機科學(xué);2014年S1期
2 曾潤喜;;網(wǎng)絡(luò)輿情管控工作機制研究[J];圖書情報工作;2009年18期
本文關(guān)鍵詞:頂創(chuàng)科技輿情監(jiān)測系統(tǒng)的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號:374131
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/374131.html
最近更新
教材專著