天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

頂創(chuàng)科技輿情監(jiān)測系統(tǒng)的設(shè)計與實現(xiàn)

發(fā)布時間:2017-05-17 18:11

  本文關(guān)鍵詞:頂創(chuàng)科技輿情監(jiān)測系統(tǒng)的設(shè)計與實現(xiàn),,由筆耕文化傳播整理發(fā)布。


【摘要】:頂創(chuàng)科技為西安頂創(chuàng)電子科技有限公司的簡稱,是一家以研發(fā)和經(jīng)營手機配件及手機智能周邊產(chǎn)品為核心業(yè)務(wù)的創(chuàng)業(yè)公司。對于以科技智能創(chuàng)新為起點的創(chuàng)業(yè)公司來說,善于發(fā)現(xiàn)新事物和新需求成為是否能快速盈利的關(guān)鍵,所以對智能手機和新奇配件等方面的輿情監(jiān)測工作就特別的重要。本文的輿情系統(tǒng)基于MySQL數(shù)據(jù)庫管理系統(tǒng),使用Python語言開發(fā)。整個系統(tǒng)由用戶配置模塊、數(shù)據(jù)抓取模塊、數(shù)據(jù)提取模塊、數(shù)據(jù)分析模塊和數(shù)據(jù)存儲模塊構(gòu)成。用戶配置模塊主要用于進(jìn)行關(guān)鍵詞管理、類目管理和預(yù)警管理,其中的關(guān)鍵詞管理包含了主詞、或詞、過濾詞和預(yù)警詞四大詞類;數(shù)據(jù)抓取模塊是指驅(qū)動主題爬蟲抓取有針對性的信息,在數(shù)據(jù)抓取這一階段需要注意的是一方面要保證數(shù)據(jù)的及時性和全面性,另一方面要嚴(yán)格遵守網(wǎng)站對網(wǎng)頁的訪問限制;數(shù)據(jù)提取模塊是從網(wǎng)頁中獲取用戶關(guān)注信息的關(guān)鍵,包括網(wǎng)頁的標(biāo)題、正文、發(fā)布時間、作者、文章來源、閱讀量和回復(fù)量等,對標(biāo)題和正文的提取采用概率的學(xué)習(xí)方式對網(wǎng)頁結(jié)構(gòu)進(jìn)行解析,對發(fā)布時間、作者、來源等信息的提取上采用了傳統(tǒng)的正則表達(dá)式;數(shù)據(jù)分析模塊即對信息與用戶的匹配性進(jìn)行分析;數(shù)據(jù)存儲模塊是整個系統(tǒng)的核心模塊,基本所有的模塊都需要和數(shù)據(jù)存儲交互以實現(xiàn)其自身模塊的功能,所以數(shù)據(jù)存儲模塊并發(fā)性和穩(wěn)定性有很高的要求。該輿情系統(tǒng)結(jié)合頂創(chuàng)科技的實際需求進(jìn)行了相關(guān)測試,測試結(jié)果表明系統(tǒng)在獲取信息的時效性和內(nèi)容全面性上能夠滿足用戶對輿情信息的監(jiān)控需求,具有一定的使用價值。
【關(guān)鍵詞】:網(wǎng)絡(luò)輿情 數(shù)據(jù)庫 網(wǎng)絡(luò)爬蟲
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.08
【目錄】:
  • 摘要4-5
  • Abstract5-8
  • 1 緒論8-15
  • 1.1 頂創(chuàng)科技進(jìn)行輿情系統(tǒng)設(shè)計的背景與意義8-10
  • 1.2 對網(wǎng)絡(luò)輿情進(jìn)行監(jiān)測的必要性10-13
  • 1.2.1 數(shù)據(jù)庫的產(chǎn)生10-11
  • 1.2.2 web 2.0時代11-12
  • 1.2.3 大數(shù)據(jù)時代12-13
  • 1.3 本文的工作內(nèi)容13-15
  • 2 相關(guān)技術(shù)介紹15-18
  • 2.1 主題爬蟲技術(shù)15
  • 2.2 文本挖掘技術(shù)15-16
  • 2.2.1 文檔分類15
  • 2.2.2 文檔聚類15
  • 2.2.3 自動摘文15-16
  • 2.3 自然語言處理技術(shù)16-18
  • 2.3.1 詞法分析16
  • 2.3.2 句法分析16
  • 2.3.3 語義分析16
  • 2.3.4 語用分析16-17
  • 2.3.5 語境分析17-18
  • 3 需求分析18-23
  • 3.1 輿情監(jiān)測系統(tǒng)概述18-19
  • 3.2 輿情監(jiān)測系統(tǒng)的功能需求分析19-22
  • 3.2.1 系統(tǒng)配置功能模塊19-20
  • 3.2.2 輿情瀏覽功能模塊20-21
  • 3.2.3 輿情過濾功能模塊21
  • 3.2.4 輿情分析與統(tǒng)計功能模塊21-22
  • 3.3 互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng)的非功能性需求22-23
  • 3.3.1 及時響應(yīng)22
  • 3.3.2 數(shù)據(jù)可用性22
  • 3.3.3 并發(fā)性需求22-23
  • 4 系統(tǒng)設(shè)計23-33
  • 4.1 用戶配置模塊設(shè)計23-28
  • 4.1.1 關(guān)鍵詞管理24-25
  • 4.1.2 類目管理25-27
  • 4.1.3 預(yù)警管理27-28
  • 4.2 數(shù)據(jù)抓取模塊設(shè)計28-29
  • 4.3 數(shù)據(jù)提取模塊設(shè)計29-30
  • 4.4 數(shù)據(jù)分析模塊設(shè)計30-32
  • 4.5 數(shù)據(jù)存儲模塊設(shè)計32-33
  • 5 系統(tǒng)實現(xiàn)與測試33-55
  • 5.1 用戶配置模塊實現(xiàn)33-37
  • 5.1.1 關(guān)鍵詞管理33-35
  • 5.1.2 類目管理35-36
  • 5.1.3 預(yù)警管理36-37
  • 5.2 數(shù)據(jù)抓取模塊實現(xiàn)37-40
  • 5.3 數(shù)據(jù)提取模塊實現(xiàn)40-44
  • 5.4 數(shù)據(jù)分析模塊實現(xiàn)44-48
  • 5.5 頂創(chuàng)科技的輿情系統(tǒng)測試48-55
  • 5.5.1 類目和關(guān)鍵詞的設(shè)置48-51
  • 5.5.2 信息的抓取與統(tǒng)計51-55
  • 結(jié)論55-56
  • 參考文獻(xiàn)56-57
  • 致謝57-58

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前2條

1 謝天保;張曉雯;仵凱博;;微博社會網(wǎng)絡(luò)重要用戶節(jié)點篩選及輿情引導(dǎo)[J];計算機科學(xué);2014年S1期

2 曾潤喜;;網(wǎng)絡(luò)輿情管控工作機制研究[J];圖書情報工作;2009年18期


  本文關(guān)鍵詞:頂創(chuàng)科技輿情監(jiān)測系統(tǒng)的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。



本文編號:374131

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/374131.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8743f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com