天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于關鍵詞加權的情感分類特征研究

發(fā)布時間:2021-05-22 23:56
  近年來,隨著互聯(lián)網(wǎng)金融和電子商務的快速發(fā)展,各種網(wǎng)絡商城已經(jīng)處在一個信息爆炸式增長的環(huán)境下,越來越多的人喜歡在網(wǎng)上購物時對商品和商家的服務提出自已的觀點,這使得互聯(lián)網(wǎng)商城的商品評論信息數(shù)量呈幾何級數(shù)增長。顧客對商品的評論代表對商家的產(chǎn)品和服務的態(tài)度,所以,將這些商品的評論進行文本挖掘和情感分析對研究商品在客戶們之間的口碑,進行商品推薦,垃圾信息過濾,了解用戶心態(tài),掌握市場第一動態(tài)以及對商家服務的改善有著極大的幫助。一般傳統(tǒng)的文本情感分類主要的方法是對文本進行預處理后,建造詞向量,然后提取特征,最后用分類或聚類的方法對這些數(shù)據(jù)進行情感分類。在傳統(tǒng)的情感分類方法里,特征工程是最重要的一個環(huán)節(jié),對分類的結(jié)果影響最大。但是,傳統(tǒng)的TF-IDF和Word2vec方法提取的文本特征內(nèi)容有限,表達能力弱,對短文本中詞向量與上下文的關系和詞向量的詞頻權重難以兼顧,這些方法提取的特征詞對整個短文本的代表性不強,影響分類效果。為了解決這個問題,本文做了以下幾個工作:第一,使用Word2vec的skip-gram模型,計算出每個詞推導出整句話的概率,其中概率最大的幾個詞匯是這個短文本中的關鍵詞;然后以概率遞... 

【文章來源】:廈門大學福建省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:70 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 研究背景與意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 本文研究內(nèi)容
    1.4 本文結(jié)構
第二章 文本分類相關技術
    2.1 文本預處理
    2.2 文本表示模型
    2.3 分類器
    2.4 分類性能
    2.5 本章小結(jié)
第三章 TF-IDF詞向量表示法和Word2vec模型
    3.1 TF-IDF
    3.2 Word2vec
    3.3 設計新特征的考慮因素
    3.4 本章小結(jié)
第四章 改進的T-Word2vec分類特征
    4.1 T-Word2vec的優(yōu)點
    4.2 算法流程
    4.3 提取關鍵詞
    4.4 T-Word2vec構建
    4.5 本章小結(jié)
第五章 實驗設計與結(jié)果
    5.1 實驗環(huán)境設置
    5.2 各種詞向量對實驗的影響
    5.3 Word2vec各參數(shù)對實驗的影響
    5.4 不同種類的數(shù)據(jù)集對實驗的影響
    5.5 T-Word2vec和Word2vec的實驗時間對比
    5.6 本章小結(jié)
第六章 總結(jié)與展望
    6.1 總結(jié)
    6.2 后續(xù)工作
參考文獻
致謝


【參考文獻】:
期刊論文
[1]基于機器學習LightGBM和異質(zhì)集成學習方法的新聞分類[J]. 李安.  電子制作. 2019(04)
[2]基于深度學習的文本表示方法[J]. 李楓林,柯佳.  情報科學. 2019(01)
[3]集成Vissim和Python的車聯(lián)網(wǎng)仿真平臺研究[J]. 姚志洪,蔣陽升.  計算機仿真. 2018(12)
[4]基于Python的數(shù)據(jù)分析概述[J]. 翟高粵.  甘肅科技縱橫. 2018(11)
[5]基于歸一化文檔頻率的文本分類特征選擇方法[J]. 趙鴻山,范貴生,虞慧群.  華東理工大學學報(自然科學版). 2019(05)
[6]文本分類TF-IDF算法的改進研究[J]. 葉雪梅,毛雪岷,夏錦春,王波.  計算機工程與應用. 2019(02)
[7]基于word2vec詞模型的中文短文本分類方法[J]. 高明霞,李經(jīng)緯.  山東大學學報(工學版). 2019(02)
[8]基于詞向量特征擴展的中文短文本分類研究[J]. 雷朔,劉旭敏,徐維祥.  計算機應用與軟件. 2018(08)
[9]基于Doc2Vec與SVM的聊天內(nèi)容過濾[J]. 岳文應.  計算機系統(tǒng)應用. 2018(07)
[10]基于TF-IDF向量空間模型文本相似度算法的分析[J]. 甘秋云.  池州學院學報. 2018(03)

博士論文
[1]移動社交網(wǎng)絡微信用戶信息共享行為研究[D]. 王飛飛.北京郵電大學 2018

碩士論文
[1]基于Word2Vec的中文短文本聚類算法研究與應用[D]. 馬存.中國科學院大學(中國科學院沈陽計算技術研究所) 2018
[2]基于物聯(lián)網(wǎng)與大數(shù)據(jù)分析的設備健康狀況監(jiān)測系統(tǒng)設計與實現(xiàn)[D]. 謝添.北京交通大學 2018
[3]基于word2vec詞向量的文本分類研究[D]. 朱磊.西南大學 2017
[4]基于doc2vec和SVM的輿情情感分析系統(tǒng)的研究與設計[D]. 甘如飴.北京郵電大學 2017
[5]基于詞向量的文本分類算法研究與改進[D]. 王明亞.華東師范大學 2016
[6]商家標簽管理系統(tǒng)的設計與實現(xiàn)[D]. 陸相氾.南京大學 2016
[7]基于短文本的分類算法研究[D]. 徐易.上海交通大學 2010
[8]基于中文信息檢索的文本預處理研究[D]. 何金鳳.電子科技大學 2008



本文編號:3201886

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3201886.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶8c46b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com