天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

短文本情感傾向性分析算法研究

發(fā)布時(shí)間:2023-12-25 12:16
  隨著互聯(lián)網(wǎng)技術(shù)日新月異的更迭與發(fā)展,越來越多的網(wǎng)絡(luò)社交平臺(tái)開始在普通民眾的生活中占據(jù)重要的分量。網(wǎng)絡(luò)的發(fā)展為人們生活帶來便利,拓寬了人們的視野,也構(gòu)建出一個(gè)新型的社交空間和社交模式,F(xiàn)在,人們通過新浪微博等平臺(tái)積極參與互動(dòng),發(fā)表見解。對(duì)時(shí)事的討論,新浪微博已經(jīng)發(fā)展眾多網(wǎng)民網(wǎng)絡(luò)生活的重要陣地。在進(jìn)行網(wǎng)絡(luò)活動(dòng)的過程中,人們發(fā)布的微博,回復(fù)的內(nèi)容,轉(zhuǎn)發(fā)的評(píng)論等文字載體都是人們情感傾向的具象化表現(xiàn),對(duì)這些文本進(jìn)行情感傾向性分析對(duì)政府部門把控當(dāng)前輿論主流,制定相關(guān)政策有很大幫助,企業(yè)也可以通過相關(guān)評(píng)論調(diào)整經(jīng)營(yíng)策略。本文即是面向新浪微博熱點(diǎn)事件進(jìn)行情感傾向性分析研究。傳統(tǒng)的情感傾向性分析一般利用情感詞典或是通過機(jī)器學(xué)習(xí)對(duì)文本進(jìn)行情感傾向性的分類判別,在情感分類精度上存在不足,缺陷很明顯。本文對(duì)這兩種方法進(jìn)行相應(yīng)的改進(jìn),并綜合二者進(jìn)行新浪微博熱點(diǎn)事件的情感傾向性分析,相關(guān)的改進(jìn)內(nèi)容如下:1)數(shù)據(jù)獲取方式。新浪微博在其開發(fā)者平臺(tái)提供了 API接口,但考慮到API接口數(shù)據(jù)獲取速度太慢,并且對(duì)數(shù)據(jù)獲取量有限制,本文增加了爬蟲方式進(jìn)行新浪微博文本的獲取渠道。2)基于詞典的情感傾向性分析。本文首先選取了目前主...

【文章頁數(shù)】:72 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 課題背景與意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 國(guó)外發(fā)展及現(xiàn)狀
        1.2.2 國(guó)內(nèi)發(fā)展及現(xiàn)狀
    1.3 論文研究?jī)?nèi)容
    1.4 論文組織結(jié)構(gòu)
    1.5 本章小結(jié)
第二章 相關(guān)技術(shù)研究
    2.1 情感傾向性分析的總體流程
    2.2 微博文本數(shù)據(jù)
    2.3 文本預(yù)處理
        2.3.1 文本的初篩選
        2.3.2 中文分詞
        2.3.3 去停用詞
    2.4 語料庫
    2.5 情感傾向性分析方法
        2.5.1 基于詞典的情感傾向性分析方法
        2.5.2 基于機(jī)器學(xué)習(xí)的情感傾向性分析方法
    2.6 本章小結(jié)
第三章 基于擴(kuò)充詞典集的情感傾向性分析
    3.1 情感詞典
    3.2 詞典集構(gòu)建
        3.2.1 基礎(chǔ)情感詞典的構(gòu)建
        3.2.2 網(wǎng)絡(luò)新詞情感詞典構(gòu)建
        3.2.3 程度副詞詞典構(gòu)建
        3.2.4 否定詞典構(gòu)建
    3.3 詞的表達(dá)
        3.3.1 詞的表示方式
        3.3.2 詞向量模型
        3.3.3 Word2vec模型
    3.4 基于Word2vec與點(diǎn)互信息結(jié)合的詞典擴(kuò)充方法
        3.4.1 SO-PMI算法
        3.4.2 情感詞典的擴(kuò)充
    3.5 分類性能評(píng)價(jià)指標(biāo)
    3.6 本章小結(jié)
第四章 基于FastText與分類結(jié)合的情感傾向性分析
    4.1 FastText模型
    4.2 分類器
        4.2.1 最近鄰算法
        4.2.2 支持向量機(jī)
        4.2.3 GBDT
        4.2.4 IDBKnn算法
        4.2.5 分類器效能驗(yàn)證
    4.3 基于FastText與IDBKnn結(jié)合的情感傾向性分析
    4.4 本章小結(jié)
第五章 實(shí)驗(yàn)結(jié)果與分析
    5.1 實(shí)驗(yàn)數(shù)據(jù)
    5.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
    5.3 基于情感詞典的情感傾向性分析
    5.4 基于機(jī)器學(xué)習(xí)的情感傾向性分析
    5.5 基于情感詞典與機(jī)器學(xué)習(xí)結(jié)合的情感傾向性分析
    5.6 本章小結(jié)
第六章 總結(jié)與展望
    6.1 總結(jié)
    6.2 展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果



本文編號(hào):3875221

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3875221.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ccaae***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com