天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于電子產(chǎn)品領(lǐng)域商品評論的情感分析方法研究和實(shí)現(xiàn)

發(fā)布時(shí)間:2023-07-25 04:08
  在產(chǎn)品評論中,現(xiàn)有的情感分類是根據(jù)用戶評論時(shí)自主設(shè)置的星級數(shù)來分為好評差評。但是每個(gè)用戶對于星級的把控不同,造成產(chǎn)品評論情感分類存在較大的誤差。產(chǎn)品評論是潛在消費(fèi)者在進(jìn)行購買產(chǎn)品時(shí),進(jìn)行決策的一個(gè)重要參考內(nèi)容。當(dāng)分類與評論星級不匹配時(shí),常常會(huì)引起潛在消費(fèi)者對產(chǎn)品本身的質(zhì)疑。除此之外,產(chǎn)品評論是商家制定銷售戰(zhàn)略,提升產(chǎn)品性能和服務(wù)質(zhì)量不可缺少的信息來源。但是一個(gè)產(chǎn)品的評論可能達(dá)到上萬條,人工去分析將耗費(fèi)大量的人力物力,因此通過計(jì)算機(jī)對其進(jìn)行分析就顯得至關(guān)重要。本文以從京東商城爬取的12000條手機(jī)評論作為電子產(chǎn)品的代表來對產(chǎn)品評論進(jìn)行情感分類,并針對短文本中關(guān)鍵詞提取的準(zhǔn)確率較低和Tri-Train算法中初始分類器的差異性不穩(wěn)定以及隱性置信度篩選引入噪聲影響分類器性能的問題,對現(xiàn)有的關(guān)鍵詞提取技術(shù)和Tri-Train算法進(jìn)行改進(jìn)。主要工作如下:(1)電子產(chǎn)品文本評論內(nèi)容偏向口語化和網(wǎng)絡(luò)化,新詞使用比較頻繁。但是結(jié)巴分詞識(shí)別新詞的能力有限,使結(jié)巴分詞的結(jié)果不是很準(zhǔn)確。針對這一問題,本文在從京東爬取的語料數(shù)據(jù)上,使用互信息和左右熵,獲取新詞語,并將這些新詞加入結(jié)巴詞庫,再用新的結(jié)巴詞庫進(jìn)行分...

【文章頁數(shù)】:63 頁

【學(xué)位級別】:碩士

【文章目錄】:
致謝
摘要
ABSTRACT
1 引言
    1.1 背景及意義
    1.2 研究現(xiàn)狀
    1.3 研究內(nèi)容
    1.4 論文結(jié)構(gòu)
2 情感分析方法
    2.1 文本處理技術(shù)
        2.1.1 數(shù)據(jù)獲取
        2.1.2 文本預(yù)處理
        2.1.3 文本關(guān)鍵詞提取
        2.1.4 文本向量表示
        2.1.5 文本相似度
    2.2 基于情感詞典的情感分類
        2.2.1 情感詞典的創(chuàng)建
        2.2.2 基于情感詞典的情感分析
    2.3 基于機(jī)器學(xué)習(xí)的情感分析
        2.3.1 有監(jiān)督的機(jī)器學(xué)習(xí)情感分類
        2.3.2 無監(jiān)督的機(jī)器學(xué)習(xí)情感分類
        2.3.3 半監(jiān)督的機(jī)器學(xué)習(xí)情感分類
        2.3.4 集成學(xué)習(xí)
    2.4 評估方法和指標(biāo)
        2.4.1 評估方法
        2.4.2 評估指標(biāo)
    2.5 本章小結(jié)
3 基于情感詞典和TF-IDF的特征選擇方案設(shè)計(jì)
    3.1 基于情感詞典和TF-IDF的情感特征詞選取方法
    3.2 電子產(chǎn)品領(lǐng)域情感詞典的創(chuàng)建
        3.2.1 領(lǐng)域情感詞典的發(fā)現(xiàn)
        3.2.2 領(lǐng)域新詞的發(fā)現(xiàn)
        3.2.3 搭配詞典的構(gòu)建
        3.2.4 程度副詞和否定詞
        3.2.5 電子產(chǎn)品領(lǐng)域情感詞典的構(gòu)建
    3.3 本章小結(jié)
4 基于改進(jìn)的Tri-Train的情感分類
    4.1 基于協(xié)同訓(xùn)練的半監(jiān)督文本分類方法
    4.2 基于Tri-Train的半監(jiān)督文本分類方法
    4.3 改進(jìn)Tri-Train的半監(jiān)督分類器設(shè)計(jì)
    4.4 本章小結(jié)
5 數(shù)值結(jié)果及分析
    5.1 情感分類器的總體框架
    5.2 方案驗(yàn)證及分析
        5.2.1 基于情感詞典和TF-IDF的關(guān)鍵詞選擇的試驗(yàn)設(shè)計(jì)及驗(yàn)證
        5.2.2 基于改進(jìn)協(xié)同訓(xùn)練的分類器的試驗(yàn)設(shè)計(jì)及驗(yàn)證
    5.3 本章小結(jié)
6 結(jié)論
參考文獻(xiàn)
作者簡歷及攻讀碩士/博士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集



本文編號(hào):3837132

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3837132.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4edfd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com