天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于三支決策的多粒度文本情感分類模型

發(fā)布時(shí)間:2018-06-03 09:11

  本文選題:情感分類 + 三支決策。 參考:《計(jì)算機(jī)科學(xué)》2017年12期


【摘要】:文本情感分類是一項(xiàng)重要的自然語(yǔ)言處理任務(wù),具有廣泛的應(yīng)用場(chǎng)景。以往的情感分類方法過(guò)于注重分類準(zhǔn)確率,忽略了訓(xùn)練和分類過(guò)程的時(shí)間代價(jià),而且使用的特征大多為詞袋特征,存在維度高、可解釋性差的缺點(diǎn)。針對(duì)這些問(wèn)題,將粒計(jì)算的思想運(yùn)用于文本數(shù)據(jù)的三層粒度結(jié)構(gòu)(詞-句-篇章),提出一種具有強(qiáng)可解釋性的文本情感分類特征——SSS(Sentence-level Sentiment Strength)特征,SSS特征每一維度代表文章中每個(gè)句子的情感強(qiáng)度值;同時(shí),在分類過(guò)程中,利用三支決策方法將待分類對(duì)象劃分為3個(gè)區(qū)域,位于正域和負(fù)域的對(duì)象直接劃分至正類和負(fù)類中,使用SVM(Support Vector Machine)+SSS特征對(duì)位于邊界域的對(duì)象做進(jìn)一步分類。實(shí)驗(yàn)結(jié)果顯示,SSS特征由于自身的低維特性,能夠大大降低特征提取和模型訓(xùn)練過(guò)程所耗費(fèi)的時(shí)間成本,結(jié)合了三支決策方法的SVM能夠進(jìn)一步提高分類準(zhǔn)確率,而且三支決策方法可以減少分類過(guò)程所耗費(fèi)的時(shí)間。
[Abstract]:The text emotion classification is an important natural language processing task , and has a wide application scene . The past emotion classification method focuses on the classification accuracy , ignores the time cost of the training and classification process , and puts forward a three - layer granularity structure ( word - sentence - text ) with strong explanatory character . The result shows that the SSS feature can greatly reduce the time cost consumed in the feature extraction and the model training process . The SVM can further improve the classification accuracy by using the SVM ( Support Vector Machine ) + SSS feature .
【作者單位】: 同濟(jì)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系;同濟(jì)大學(xué)嵌入式與服務(wù)計(jì)算教育部重點(diǎn)實(shí)驗(yàn)室;同濟(jì)大學(xué)大數(shù)據(jù)與網(wǎng)絡(luò)安全研究中心;
【基金】:國(guó)家自然科學(xué)基金(61273304,61673301) 高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金(20130072130004)資助
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 彭玉兵,吳根秀,張亮;近似決策規(guī)則的形成及其應(yīng)用[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年01期

2 李小霞,陳綿云;決策規(guī)則的簡(jiǎn)化[J];計(jì)算機(jī)工程與應(yīng)用;2003年11期

3 劉麗艷,王海涌,鄭麗英;基于粗集理論的決策規(guī)則約簡(jiǎn)算法的研究與應(yīng)用[J];蘭州交通大學(xué)學(xué)報(bào);2004年06期

4 瞿華;;一種基于過(guò)程挖掘的業(yè)務(wù)過(guò)程決策規(guī)則發(fā)現(xiàn)算法[J];計(jì)算機(jī)應(yīng)用研究;2012年06期

5 陳敏,湯曉安;在Microsoft Access中引入文本文件[J];微型電腦應(yīng)用;1995年02期

6 李盛瑜;何文;;一種對(duì)聊天文本進(jìn)行特征選取的方法研究[J];計(jì)算機(jī)科學(xué);2007年05期

7 蔣志方;祝翠玲;吳強(qiáng);;一個(gè)對(duì)不帶類別標(biāo)記文本進(jìn)行分類的方法[J];計(jì)算機(jī)工程;2007年12期

8 趙鋼;;從復(fù)雜文本中導(dǎo)入數(shù)據(jù)的方法[J];中國(guó)審計(jì);2007年18期

9 易樹鴻;張為群;;一種基于粗集的文本數(shù)據(jù)特征信息的挖掘方法[J];計(jì)算機(jī)科學(xué);2002年08期

10 李建中,楊艷,張艷秋;并行文本管理原型系統(tǒng)PDoc的功能與總體框架[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2004年09期

相關(guān)會(huì)議論文 前10條

1 許君;王朝坤;劉立超;王建民;劉璋;;云環(huán)境中的近似復(fù)制文本檢測(cè)[A];第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年

2 易天元;葉春生;;工業(yè)鍋爐圖紙輸入的文本數(shù)據(jù)處理[A];1997中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];1997年

3 胡蓉;唐常杰;陳敏敏;欒江;;關(guān)聯(lián)規(guī)則制導(dǎo)的遺傳算法在文本分類中的應(yīng)用[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年

4 李文波;孫樂(lè);黃瑞紅;馮元勇;張大鯤;;基于Labeled-LDA模型的文本分類新算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

5 黃云平;孫樂(lè);李文波;;基于上下文圖模型文本表示的文本分類研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

6 蔣勇;陳曉靜;;一種多方向手寫文本行提取方法[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年

7 劉希玉;徐志敏;段會(huì)川;;基于支持向量機(jī)的創(chuàng)新分類器[A];山東省計(jì)算機(jī)學(xué)會(huì)2005年信息技術(shù)與信息化研討會(huì)論文集(一)[C];2005年

8 李瑞;王朝坤;鄭偉;王建民;王偉平;;基于MapReduce框架的近似復(fù)制文本檢測(cè)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

9 張曉濱;尹英順;趙培坤;馬秀蘭;;基于漸進(jìn)直推支持向量機(jī)的半對(duì)半多類文本分類[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

10 晏慶華;;支持向量機(jī)算法綜述[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年

相關(guān)重要報(bào)紙文章 前1條

1 戴洪玲;向Excel中快速輸入相同文本[N];中國(guó)電腦教育報(bào);2004年

相關(guān)博士學(xué)位論文 前10條

1 宋歌;基于聚類森林的文本流分類方法研究[D];哈爾濱工業(yè)大學(xué);2014年

2 韓開(kāi)旭;基于支持向量機(jī)的文本情感分析研究[D];東北石油大學(xué);2014年

3 鄭立洲;短文本信息抽取若干技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年

4 韓磊;漢語(yǔ)句義結(jié)構(gòu)模型分析及其文本表示方法研究[D];北京理工大學(xué);2016年

5 張博宇;基于局部特征的場(chǎng)景文本分析方法研究[D];哈爾濱工業(yè)大學(xué);2015年

6 胡卉芪;空間文本數(shù)據(jù)的量質(zhì)融合與推送[D];清華大學(xué);2016年

7 胡明涵;面向領(lǐng)域的文本分類與挖掘關(guān)鍵技術(shù)研究[D];東北大學(xué) ;2009年

8 孫曉華;基于聚類的文本機(jī)會(huì)發(fā)現(xiàn)關(guān)鍵問(wèn)題研究[D];哈爾濱工程大學(xué);2010年

9 尚文倩;文本分類及其相關(guān)技術(shù)研究[D];北京交通大學(xué);2007年

10 霍躍紅;典籍英譯譯者文體分析與文本的譯者識(shí)別[D];大連理工大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 唐遷;基于局部感知的決策規(guī)則提取及其應(yīng)用研究[D];電子科技大學(xué);2014年

2 胡凌超;基于增量聚類器的三支聚類集成方法研究[D];重慶郵電大學(xué);2016年

3 吳昊;基于多維度的事件日志決策規(guī)則挖掘優(yōu)化研究[D];武漢科技大學(xué);2016年

4 金傳鑫;氣象文本分類特征選擇方法及其在MapReduce上的實(shí)現(xiàn)[D];南京信息工程大學(xué);2015年

5 李少卿;不良文本及其變體信息的檢測(cè)過(guò)濾技術(shù)研究[D];復(fù)旦大學(xué);2014年

6 董秦濤;基于文本的個(gè)人情感狀態(tài)分析研究[D];蘭州大學(xué);2015年

7 鐘文波;搜索引擎中關(guān)鍵詞分類方法評(píng)估及推薦應(yīng)用[D];華南理工大學(xué);2015年

8 黃晨;基于新詞識(shí)別和時(shí)間跨度的微博熱點(diǎn)研究[D];上海交通大學(xué);2015年

9 陳紅陽(yáng);中文微博話題發(fā)現(xiàn)技術(shù)研究[D];重慶理工大學(xué);2015年

10 王s,

本文編號(hào):1972244


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1972244.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9cedb***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com