天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向微博的新詞發(fā)現(xiàn)和情感詞典構(gòu)建方法研究

發(fā)布時(shí)間:2023-04-02 14:44
  隨著科學(xué)技術(shù)的迅猛發(fā)展,越來越多的人使用微博平臺,從而產(chǎn)生了大量的微博,而且大部分微博都包含發(fā)表人的情感傾向;谇楦性~典的微博情感分析方法是目前判斷微博情感極性的一種重要方法,但因?yàn)槲⒉┳陨淼奶攸c(diǎn),隨意、口語化且不正規(guī),產(chǎn)生了許多的網(wǎng)絡(luò)新詞,減少了現(xiàn)有的基礎(chǔ)情感詞典對微博傾向分析的作用和意義;大量微博的產(chǎn)生導(dǎo)致手動(dòng)建立情感詞典費(fèi)時(shí)費(fèi)力且效果不佳,所以如何識別新詞和自動(dòng)構(gòu)建情感詞典成為當(dāng)前微博情感分析中亟待解決的問題。針對上述問題,本文做了三方面的工作:(1)提出了基于互信息和鄰接熵的新詞發(fā)現(xiàn)算法如何快速高效的識別新詞是自然語言處理中一項(xiàng)非常重要的任務(wù),針對目前新詞發(fā)現(xiàn)存在的問題,提出了一種從左至右逐字在未切詞的微博語料中發(fā)現(xiàn)新詞的方法。通過計(jì)算候選詞語與右鄰接字的互信息來逐步擴(kuò)展候選詞語,獲得候選新詞集;通過計(jì)算鄰接熵、刪除候選新詞的首尾停用詞和過濾舊詞語等方法來篩選新詞,完成新詞詞典的構(gòu)建。實(shí)驗(yàn)結(jié)果表明,本文提出的新詞發(fā)現(xiàn)方法可以有效的識別新詞。(2)提出了基于Word2Vec和句子內(nèi)部關(guān)系的自動(dòng)構(gòu)建情感詞典的方法自動(dòng)構(gòu)建情感詞典是情感分析中一項(xiàng)基礎(chǔ)且重要的任務(wù),針對當(dāng)前構(gòu)建情感詞...

【文章頁數(shù)】:44 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景和研究意義
    1.2 研究現(xiàn)狀及分析
        1.2.1 新詞識別
        1.2.2 情感詞典構(gòu)建
        1.2.3 研究現(xiàn)狀的小結(jié)
    1.3 研究內(nèi)容
    1.4 論文組織結(jié)構(gòu)
    1.5 本章小結(jié)
第二章 基于互信息和鄰接熵的新詞發(fā)現(xiàn)算法
    2.1 主要技術(shù)
        2.1.1 互信息
        2.1.2 鄰接熵
    2.2 基于互信息和鄰接熵的新詞發(fā)現(xiàn)算法
        2.2.1 本章的改進(jìn)思路
        2.2.2 算法流程
    2.3 實(shí)驗(yàn)
        2.3.1 數(shù)據(jù)集
        2.3.2 評價(jià)指標(biāo)
        2.3.3 實(shí)驗(yàn)結(jié)果
    2.4 本章小結(jié)
第三章 基于Word2Vec和句子內(nèi)部關(guān)系的自動(dòng)構(gòu)建情感詞典的方法
    3.1 相關(guān)知識
        3.1.1 AF-IDF方法
        3.1.2 Word2Vec模型
    3.2 自動(dòng)構(gòu)建情感詞典的方法
        3.2.1 算法流程
        3.2.2 實(shí)驗(yàn)語料的預(yù)處理
        3.2.3 種子詞的獲取
        3.2.4 候選情感詞的提取
        3.2.5 基于Word2Vec的TwoSim方法
        3.2.6 基于句子內(nèi)部關(guān)系的方法
        3.2.7 情感詞典的構(gòu)建
    3.3 實(shí)驗(yàn)
        3.3.1 數(shù)據(jù)集
        3.3.2 評價(jià)指標(biāo)
        3.3.3 實(shí)驗(yàn)結(jié)果
    3.4 本章小結(jié)
第四章 基于情感詞典的微博情感分析方法
    4.1 相關(guān)詞典的構(gòu)建
        4.1.1 新詞詞典和情感詞典
        4.1.2 修飾詞典
        4.1.3 連詞詞典
    4.2 基于情感詞典的微博傾向性分析方法
        4.2.1 包含情感詞語的句子的情感分析
        4.2.2 不包含情感詞語的句子的情感分析
    4.3 實(shí)驗(yàn)
        4.3.1 數(shù)據(jù)集
        4.3.2 評價(jià)指標(biāo)
        4.3.3 實(shí)驗(yàn)結(jié)果
    4.4 本章小結(jié)
第五章 總結(jié)與展望
    5.1 工作總結(jié)
    5.2 研究展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的主要成果
致謝



本文編號:3779407

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3779407.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶06aab***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com