基于主題模型的半監(jiān)督網(wǎng)絡(luò)文本情感分類研究
發(fā)布時間:2017-08-29 03:08
本文關(guān)鍵詞:基于主題模型的半監(jiān)督網(wǎng)絡(luò)文本情感分類研究
更多相關(guān)文章: 情感分類 不平衡數(shù)據(jù) 半監(jiān)督學習 主題模型
【摘要】:針對網(wǎng)絡(luò)評論文本的情感分類問題中存在的數(shù)據(jù)的不平衡性、無標記性和不規(guī)范性問題,提出一種基于主題的閩值調(diào)整的半監(jiān)督學習模型,通過從非結(jié)構(gòu)化文本中提取主題特征,對少量標注情感的文本訓練分類器并優(yōu)化指標調(diào)整閩值,達到識別用戶評論的情感傾向的目的。仿真研究證明閾值調(diào)整的半監(jiān)督模型對數(shù)據(jù)非平衡性和無標記性具有較強的適應(yīng)能力。在實證研究中,對酒店評論文本數(shù)據(jù)構(gòu)建的文本情感分類器顯示該模型可以有效預測少數(shù)類評論樣本的情感極性,證實了基于主題模型的閩值調(diào)整半監(jiān)督網(wǎng)絡(luò)評論文本情感分類模型在實際問題中的適用性與可行性。
【作者單位】: 中國人民大學應(yīng)用統(tǒng)計科學研究中心;中國人民大學統(tǒng)計學院;中國人民大學統(tǒng)計咨詢研究中心;臺北醫(yī)學大學大數(shù)據(jù)研究中心;
【關(guān)鍵詞】: 情感分類 不平衡數(shù)據(jù) 半監(jiān)督學習 主題模型
【基金】:中國人民大學科學研究基金(中央高校基本科研業(yè)務(wù)費專項資金資助)項目(15XNI011)的階段性成果
【分類號】:TP391.1
【正文快照】: 0引言 隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和網(wǎng)絡(luò)文本信息的急劇膨脹,人們對從冗雜的網(wǎng)絡(luò)信息中準確獲取所需信息的需求日益增長。網(wǎng)絡(luò)文本的情感分析技術(shù)通過自動分析產(chǎn)品、人物或事件 等的網(wǎng)絡(luò)評論文本,發(fā)現(xiàn)消費者對其褒貶態(tài)度,已成為商務(wù)智能領(lǐng)域研究的新熱點,F(xiàn)有研究表明,網(wǎng)絡(luò),
本文編號:750972
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/750972.html
最近更新
教材專著