天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于高校BBS的輿情監(jiān)測系統(tǒng)的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-07-20 06:55
  本文在分析和掌握了輿情監(jiān)測系統(tǒng)的構(gòu)成和運(yùn)行流程的基礎(chǔ)之上,研究并實(shí)現(xiàn)了一套針對高校BBS論壇的輿情監(jiān)測系統(tǒng)。本系統(tǒng)分為四個(gè)部分,按照工作流程順序?yàn)椋孩倬W(wǎng)頁抓取,使用網(wǎng)絡(luò)爬蟲抓取指定站點(diǎn)的WEB網(wǎng)頁,獲得第一手資料;②信息預(yù)處理,對抓取下來的網(wǎng)頁進(jìn)行信息抽取、中文分詞、詞性標(biāo)注、入庫等操作,為輿情分析準(zhǔn)備數(shù)據(jù);③輿情分析,對數(shù)據(jù)庫中的各種信息加以綜合實(shí)現(xiàn):熱點(diǎn)主題發(fā)現(xiàn)、每鈤統(tǒng)計(jì)、情感傾向性分析、發(fā)展趨勢預(yù)測、話題檢測與跟蹤等;④系統(tǒng)展示,將輿情分析的結(jié)果呈獻(xiàn)給用戶,為用戶的決策提供必要的支持。本文的研究成果如下:(1)使用開源工具構(gòu)建了一個(gè)具有針對性的網(wǎng)絡(luò)爬蟲。(2)提出一個(gè)集時(shí)間、帖子數(shù)量、查看數(shù)量以及參與人數(shù)的熱點(diǎn)主題發(fā)現(xiàn)算法。實(shí)驗(yàn)表明,該算法比單一指標(biāo)具有更準(zhǔn)確更有效。(3)提出一個(gè)基于情感詞詞典、否定詞和程度詞的情感傾向值計(jì)算方法,該算法逆向依次對情感詞的傾向值累加求和,并對傾向值進(jìn)行平均處理,降低累加的影響。實(shí)驗(yàn)表明,該算法具有較好的效果。(4)本文使用層次聚類和1NN分類算法實(shí)現(xiàn)話題的檢測與跟蹤。通過實(shí)驗(yàn)獲得相關(guān)的閾值,并對層次聚類算法增加“絕對相似度閾值”這一限制條件,縮減... 

【文章來源】:石家莊鐵道大學(xué)河北省

【文章頁數(shù)】:72 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 課題研究背景
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 論文內(nèi)容及組織
第二章 網(wǎng)絡(luò)輿情研究相關(guān)技術(shù)分析
    2.1 網(wǎng)絡(luò)爬蟲
    2.2 網(wǎng)頁解析
    2.3 話題檢測與跟蹤技術(shù)
    2.4 話題情感傾向性分析
    2.5 話題發(fā)展趨勢預(yù)測
    2.6 檢索服務(wù)和多線程優(yōu)化
    2.7 本章小結(jié)
第三章 BBS輿情監(jiān)測系統(tǒng)分析
    3.1 系統(tǒng)功能分析
        3.1.1 系統(tǒng)體系結(jié)構(gòu)分析
        3.1.2 網(wǎng)頁抓取及預(yù)處理功能分析
        3.1.3 信息預(yù)處理功能分析
        3.1.4 輿情分析功能
        3.1.5 系統(tǒng)展示功能分析
    3.2 系統(tǒng)流程分析
    3.3 系統(tǒng)使用各類詞典分析
    3.4 系統(tǒng)數(shù)據(jù)庫分析與設(shè)計(jì)
    3.5 系統(tǒng)性能分析
    3.6 本章小結(jié)
第四章 網(wǎng)頁抓取和信息預(yù)處理
    4.1 網(wǎng)頁抓取
        4.1.1 BBS網(wǎng)站分析
        4.1.2 構(gòu)建網(wǎng)絡(luò)爬蟲
        4.1.3 優(yōu)化網(wǎng)絡(luò)爬蟲
        4.1.4 網(wǎng)絡(luò)爬蟲性能比較
    4.2 信息預(yù)處理
        4.2.1 HTMLPaser解析頁面
        4.2.2 合并同主題文檔
        4.2.3 存入數(shù)據(jù)庫和存入索引庫
        4.2.4 中文分詞
    4.3 本章小結(jié)
第五章 輿情分析
    5.1 熱點(diǎn)主題發(fā)現(xiàn)
    5.2 情感傾向性分析
    5.3 每日統(tǒng)計(jì)
    5.4 話題分析
        5.4.1 權(quán)重計(jì)算
        5.4.2 相似度計(jì)算
        5.4.3 話題檢測
        5.4.4 話題跟蹤
    5.5 趨勢預(yù)測
    5.6 實(shí)驗(yàn)分析
        5.6.1 熱點(diǎn)主題發(fā)現(xiàn)實(shí)驗(yàn)分析
        5.6.2 情感傾向性實(shí)驗(yàn)分析
        5.6.3 話題檢測實(shí)驗(yàn)
        5.6.4 話題跟蹤實(shí)驗(yàn)
        5.6.5 發(fā)展趨勢分析實(shí)驗(yàn)
    5.7 本章小結(jié)
第六章 高校BBS輿情監(jiān)測系統(tǒng)實(shí)現(xiàn)
    6.1 系統(tǒng)首頁
    6.2 立即抓取
    6.3 每日統(tǒng)計(jì)
    6.4 檢索服務(wù)
    6.5 情感分析
    6.6 話題分析
    6.7 本章小結(jié)
第七章 總結(jié)與展望
    7.1 總結(jié)
    7.2 展望
參考文獻(xiàn)
致謝
個(gè)人簡歷、攻讀碩士學(xué)位期間發(fā)表的論文


【參考文獻(xiàn)】:
期刊論文
[1]基于Larbin的網(wǎng)絡(luò)爬蟲體系結(jié)構(gòu)的研究與改進(jìn)[J]. 李躍健,朱程榮.  計(jì)算機(jī)技術(shù)與發(fā)展. 2012(07)
[2]基于Nutch的圖情博客搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J]. 趙蓉英,陳必坤.  情報(bào)科學(xué). 2012(04)
[3]高校BBS輿情監(jiān)測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 陳立章,李斌,陳曉鵬.  微處理機(jī). 2012(01)
[4]基于Single-Pass的網(wǎng)絡(luò)話題在線聚類方法研究[J]. 朱恒民,朱衛(wèi)未.  現(xiàn)代圖書情報(bào)技術(shù). 2011(12)
[5]中文文本情感分析綜述[J]. 魏韡,向陽,陳千.  計(jì)算機(jī)應(yīng)用. 2011(12)
[6]Gompertz曲線參數(shù)估計(jì)新方法(英文)[J]. 胡曉華,虞敏,吉承儒.  數(shù)學(xué)理論與應(yīng)用. 2011(02)
[7]基于HTMLParser的Web文獻(xiàn)信息提取[J]. 龔真平.  軟件導(dǎo)刊. 2011(02)
[8]面向Web論壇的網(wǎng)絡(luò)信息獲取技術(shù)及系統(tǒng)實(shí)現(xiàn)[J]. 彭冬,蔡皖東.  計(jì)算機(jī)工程與科學(xué). 2011(01)
[9]文本傾向性分析綜述[J]. 厲小軍,戴霖,施寒瀟,黃琦.  浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2011(07)
[10]基于Web的實(shí)驗(yàn)室互聯(lián)網(wǎng)輿情分析處理系統(tǒng)的研究與實(shí)現(xiàn)[J]. 許峰.  科技情報(bào)開發(fā)與經(jīng)濟(jì). 2011(01)

碩士論文
[1]基于KNN算法的中文Web文本分類技術(shù)研究[D]. 劉輝.遼寧工程技術(shù)大學(xué) 2010
[2]樸素貝葉斯分類器的研究與應(yīng)用[D]. 王國才.重慶交通大學(xué) 2010
[3]校園BBS輿情分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 李婷.華中科技大學(xué) 2009
[4]互聯(lián)網(wǎng)輿情監(jiān)測分析系統(tǒng)實(shí)現(xiàn)[D]. 高洪杰.復(fù)旦大學(xué) 2009
[5]基于用戶瀏覽行為的網(wǎng)絡(luò)熱點(diǎn)話題發(fā)現(xiàn)模型研究[D]. 羅亞平.北京郵電大學(xué) 2008



本文編號:3292366

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3292366.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶383a2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com