中文多類別情感分類模型中特征選擇方法
本文關鍵詞:中文多類別情感分類模型中特征選擇方法
更多相關文章: 特征選擇 多類別情感分析 中文商品評論 自然語言處理 文本分類
【摘要】:商品評論信息的情感分析,可作為人們推薦商品和選擇商品的一個重要手段。特征選擇在情感分類中能夠刪除一些不必要的候選特征,從而提高分類效率、減小誤差。為了考察中文語言和多類別情感分類環(huán)境下特征選擇方法的效果,為情感分析多分類研究選取合適的特征選擇方法,對特征選擇進行了對比研究。在樸素貝葉斯多類分類器中,對中文描述的關于手機的五種星級評論數(shù)據(jù)集進行情感分類,選取文檔頻率、信息增益、互信息和卡方統(tǒng)計四種常用特征選擇方式進行了對比實驗和分析。實驗結果表明,信息增益能夠在特征維數(shù)特別小的情況下獲得很好的性能,卡方統(tǒng)計能夠獲得普遍較好的性能,文檔頻率因為計算簡單也能成為一種不錯的選擇,而互信息通常情況下不是一個好的選擇。
【作者單位】: 中國電子科技集團公司第二十八研究所;東南大學計算機科學與工程學院;
【關鍵詞】: 特征選擇 多類別情感分析 中文商品評論 自然語言處理 文本分類
【分類號】:TP391.1
【正文快照】: 0引言隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡購物已經成為一種潮流。購物者在購買商品或服務后會分享經驗和感受,商品評論已成為人們選擇商品和推薦商品時的重要依據(jù)之一。消費者作決策的過程容易受大眾的影響,當人們想要在網(wǎng)上購買商品時,由于無法真正觀察、感受到商品的質量,所以他們往往會
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 孫霞;鄭慶華;;一種面向非平衡數(shù)據(jù)的鄰居詞特征選擇方法[J];小型微型計算機系統(tǒng);2008年12期
2 蔣盛益;鄭琪;張倩生;;基于聚類的特征選擇方法[J];電子學報;2008年S1期
3 王加龍;朱顥東;;結合類別相關性和辨識集的特征選擇方法[J];微型機與應用;2009年23期
4 朱顥東;周姝;鐘勇;;結合差別對象對集的綜合性特征選擇方法[J];計算機工程與設計;2010年03期
5 姜慧研;柴天佑;;基于可信間隔的特征選擇方法研究[J];控制與決策;2011年08期
6 姚旭;王曉丹;張玉璽;權文;;特征選擇方法綜述[J];控制與決策;2012年02期
7 王志昊;王中卿;李壽山;李培峰;;不平衡情感分類中的特征選擇方法研究[J];中文信息學報;2013年04期
8 張玉紅;周全;胡學鋼;;面向跨領域情感分類的特征選擇方法[J];模式識別與人工智能;2013年11期
9 李敏;卡米力·木依丁;;特征選擇方法與算法的研究[J];計算機技術與發(fā)展;2013年12期
10 申清明;閆利軍;高建民;趙靜;;基于混沌搜索的特征選擇方法[J];兵工學報;2013年12期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 徐燕;王斌;李錦濤;孫春明;;知識增益:文本分類中一種新的特征選擇方法[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年
2 肖婷;唐雁;;文本分類中特征選擇方法及應用[A];2008年計算機應用技術交流會論文集[C];2008年
3 徐燕;孫春明;王斌;李錦濤;;基于詞條頻率的特征選擇算法研究[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術會議論文集[C];2006年
4 陳慶軒;鄭德權;鄭博文;趙鐵軍;李生;;中文文本分類中基于文檔頻度分布的特征選擇方法[A];黑龍江省計算機學會2009年學術交流年會論文集[C];2010年
5 顧成杰;張順頤;劉凱;黃河;;基于粗糙集和禁忌搜索的特征選擇方法[A];江蘇省電子學會2010年學術年會論文集[C];2010年
6 王秀娟;郭軍;鄭康鋒;;基于互信息可信度的特征選擇方法[A];2006通信理論與技術新進展——第十一屆全國青年通信學術會議論文集[C];2006年
中國博士學位論文全文數(shù)據(jù)庫 前4條
1 劉明霞;屬性學習若干重要問題的研究及應用[D];南京航空航天大學;2015年
2 毛勇;基于支持向量機的特征選擇方法的研究與應用[D];浙江大學;2006年
3 尹留志;關于非平衡數(shù)據(jù)特征問題的研究[D];中國科學技術大學;2014年
4 裴志利;數(shù)據(jù)挖掘技術在文本分類和生物信息學中的應用[D];吉林大學;2008年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 曹晉;基于SVDD的特征選擇方法研究及其應用[D];蘇州大學;2015年
2 張強;靜態(tài)圖像上的行人檢測方法研究[D];中國科學技術大學;2015年
3 張曉梅;基于融合特征的微博主客觀分類方法研究[D];山西大學;2014年
4 王君;基于SVM-RFE的特征選擇方法研究[D];大連理工大學;2015年
5 于海珠;面向文本聚類的特征選擇方法及應用研究[D];大連理工大學;2015年
6 趙世琛;文本分類中特征選擇方法研究[D];山西大學;2014年
7 王丹;特征選擇算法研究及其在異常檢測中的應用[D];電子科技大學;2014年
8 林艷峰;中文文本分類特征選擇方法的研究與實現(xiàn)[D];西安電子科技大學;2014年
9 盧志浩;基于GEP的kNN算法改進研究[D];廣西師范學院;2015年
10 王立鵬;面向圖數(shù)據(jù)的特征選擇方法及其應用研究[D];南京航空航天大學;2015年
,本文編號:713429
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/713429.html