基于復(fù)雜網(wǎng)絡(luò)的在線評論情感傾向性分類
本文關(guān)鍵詞:基于復(fù)雜網(wǎng)絡(luò)的在線評論情感傾向性分類
更多相關(guān)文章: 復(fù)雜網(wǎng)絡(luò) 情感分類 情感詞典 特征選擇
【摘要】:隨著WEB技術(shù)和電子商務(wù)平臺的迅速發(fā)展,網(wǎng)絡(luò)購物逐漸成為消費者購物的潮流,消費者以在線評論的方式分享自己的購物經(jīng)歷,表達對產(chǎn)品或服務(wù)的偏好和體驗。這些評論包含了消費者對產(chǎn)品、賣家、廠家、物流等網(wǎng)購環(huán)節(jié)的情感傾向,對于商家改進產(chǎn)品,提高服務(wù)質(zhì)量,提升客戶滿意度具有重要的意義,同時對于消費者做出正確的購物決策也有很大的幫助。因此近年來,在線評論情感分析逐漸成為在線評論研究的熱點問題,而其中的情感傾向性分類作為情感分析的主要任務(wù)逐漸受到關(guān)注。本文以在線評論情感傾向性分類的研究為主線,結(jié)合復(fù)雜網(wǎng)絡(luò)理論提出新的情感傾向性分類算法。主要從以下三個方面開展本文的研究:首先,針對公共領(lǐng)域情感詞典對專業(yè)領(lǐng)域詞語、網(wǎng)絡(luò)用語和新興詞語收錄不全的問題,提出了將公共情感詞典作為種子情感詞典,以評論預(yù)料庫中的形容詞且未出現(xiàn)公共情感詞典中作為候選情感詞,利用信息論中的點互信息理論計算候選情感詞和種子情感詞的相關(guān)度來擴展公共領(lǐng)域情感詞典,從而構(gòu)建專業(yè)領(lǐng)域情感詞典的算法。其次,針對傳統(tǒng)情感分類算法中忽略文檔詞語語序和缺乏文檔句法分析的問題提出了基于有向網(wǎng)絡(luò)的情感分類模型。該模型根據(jù)消費者在線評論,構(gòu)建評論有向網(wǎng)絡(luò),從評論網(wǎng)絡(luò)的拓撲性質(zhì)和評論文檔的語義內(nèi)容出發(fā)建立在線評論情感傾向性分類模型。首先以詞語共現(xiàn)理論為基礎(chǔ)構(gòu)建評論的有向網(wǎng)絡(luò),然后挖掘網(wǎng)絡(luò)中具有情感信息的子網(wǎng)絡(luò),將子網(wǎng)絡(luò)中由程度詞和否定詞導(dǎo)致的情感偏移引入到韋伯-費希納定律中,提出了一種新的在線評論情感相似性計算方法DNSA(Directed network and syntactic analysis),利用該方法計算測試評論和訓(xùn)練中評論的相似度,選取相似度最大的前K條評論的多數(shù)類作為該評論的情感類別。再次,針對傳統(tǒng)的基于詞袋模型的情感分類算法中忽略文檔特征的語義相關(guān)性信息和文檔結(jié)構(gòu)信息,造成評論情感資源遺漏的問題,提出了基于復(fù)雜網(wǎng)絡(luò)特征選擇的情感傾向性分類模型。首先利用復(fù)雜網(wǎng)絡(luò)理論提出了一種新的情感分類特征選擇算法NTFS(Complex network feature selection),該算法通過構(gòu)建候選情感特征關(guān)系網(wǎng)絡(luò),利用復(fù)雜網(wǎng)絡(luò)中節(jié)點重要性評估理論,考慮節(jié)點的局部和全局重要性,提出了利用網(wǎng)絡(luò)節(jié)點的度中心性、接近中心性和介數(shù)中心性綜合衡量節(jié)點重要性來選擇情感分類特征的算法,然后結(jié)合經(jīng)典機器學(xué)習(xí)算法SVM、NB、NNET實現(xiàn)在線評論的情感傾向性分類。最后,為了測試算法,以酒店評論和手機評論為實驗數(shù)據(jù)。通過結(jié)果分析,發(fā)現(xiàn)這兩種情感分類算法可以有效的實現(xiàn)在線評論的情感分類,顯著提高情感分類的性能。
【關(guān)鍵詞】:復(fù)雜網(wǎng)絡(luò) 情感分類 情感詞典 特征選擇
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F724.6;F713.55
【目錄】:
- 摘要4-5
- Abstract5-9
- 1 緒論9-17
- 1.1 研究背景及意義9-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-14
- 1.3 論文組織結(jié)構(gòu)14-17
- 2 相關(guān)概念介紹17-30
- 2.1 復(fù)雜網(wǎng)絡(luò)理論17-20
- 2.1.1 復(fù)雜網(wǎng)絡(luò)基礎(chǔ)概念17-18
- 2.1.2 節(jié)點重要性評估理論18-20
- 2.2 文本情感分類關(guān)鍵技術(shù)20-29
- 2.2.1 特征選擇20-23
- 2.2.2 文本表示23-24
- 2.2.3 常用分類器24-28
- 2.2.4 分類性能評價28-29
- 2.3 本章小結(jié)29-30
- 3 專業(yè)領(lǐng)域情感詞典構(gòu)建30-35
- 3.1 情感詞典介紹30-31
- 3.2 專業(yè)領(lǐng)域情感詞典構(gòu)建31-34
- 3.3 本章小結(jié)34-35
- 4 基于有向網(wǎng)絡(luò)的情感傾向性分類35-43
- 4.1 在線評論詞語共現(xiàn)關(guān)系及有向網(wǎng)絡(luò)構(gòu)建35-37
- 4.2 評論情感相似度計算及情感分類37-39
- 4.3 算例分析39-42
- 4.4 本章小結(jié)42-43
- 5 基于復(fù)雜網(wǎng)絡(luò)特征選擇的情感傾向性分類43-52
- 5.1 基于復(fù)雜網(wǎng)絡(luò)的情感分類特征選擇43-46
- 5.1.1 復(fù)雜網(wǎng)絡(luò)模型構(gòu)建43-44
- 5.1.2 情感分類特征選擇算法44-46
- 5.2 算例分析46-49
- 5.3 兩種情感分類算法比較49-51
- 5.4 本章小結(jié)51-52
- 結(jié)論52-54
- 參考文獻54-57
- 攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況57-58
- 致謝58-59
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 林書亮;;聯(lián)合L_(2,1)范數(shù)正則約束的特征選擇方法[J];科技與企業(yè);2013年24期
2 李曉艷;周興弛;殷海娜;;特征選擇在協(xié)同過濾推薦算法中的應(yīng)用研究[J];價值工程;2012年17期
3 朱林婷;丁榮濤;;基于內(nèi)容的圖像檢索在電子商務(wù)中應(yīng)用初探[J];商場現(xiàn)代化;2007年33期
4 李曉艷;張子剛;張逸石;;集成k-means聚類和有監(jiān)督特征選擇的混合式協(xié)同過濾推薦[J];管理學(xué)報;2013年09期
5 吳桂玲;;基于歐氏距離和余弦相似度特征選擇的入侵檢測模型[J];中小企業(yè)管理與科技(上旬刊);2010年02期
6 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 靖紅芳;王斌;楊雅輝;;基于類別分布的特征選擇框架[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
2 李長升;盧漢清;;排序?qū)W習(xí)模型中的特征選擇[A];第六屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會議(NCMT2010)、第6屆全國人機交互學(xué)術(shù)會議(CHCI2010)、第5屆全國普適計算學(xué)術(shù)會議(PCC2010)論文集[C];2010年
3 劉功申;李建華;李生紅;;基于類信息的特征選擇和加權(quán)方法[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
4 倪友平;王思臣;馬桂珍;陳曾平;;分支界定算法在低分辨雷達飛機架次判別中的應(yīng)用[A];第十三屆全國信號處理學(xué)術(shù)年會(CCSP-2007)論文集[C];2007年
5 李澤輝;聶生東;陳兆學(xué);;應(yīng)用多類SVM分割MR腦圖像特征選擇與優(yōu)化的實驗研究[A];中國儀器儀表學(xué)會第九屆青年學(xué)術(shù)會議論文集[C];2007年
6 蒙新泛;王厚峰;;主客觀識別中的上下文因素的研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年
7 萬京;王建東;;一種基于新的差異性度量的ReliefF方法[A];2009年研究生學(xué)術(shù)交流會通信與信息技術(shù)論文集[C];2009年
8 范麗;許潔萍;;基于GMM的音樂信號音色模型研究[A];第四屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議論文集[C];2008年
9 陳友;戴磊;程學(xué)旗;;基于MRMHC-C4.5的IP流分類[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
10 申f;楊宏暉;袁帥;;用于水聲目標識別的互信息無監(jiān)督特征選擇[A];第三屆上!靼猜晫W(xué)學(xué)會學(xué)術(shù)會議論文集[C];2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李靜;高維數(shù)據(jù)交互特征選擇和分類研究[D];燕山大學(xué);2015年
2 劉風(fēng);基于磁共振成像的多變量模式分析方法學(xué)與應(yīng)用研究[D];電子科技大學(xué);2014年
3 王石平;粗糙擬陣及其在高維數(shù)據(jù)降維中的應(yīng)用研究[D];電子科技大學(xué);2014年
4 代琨;基于支持向量機的網(wǎng)絡(luò)數(shù)據(jù)特征選擇技術(shù)研究[D];解放軍信息工程大學(xué);2013年
5 王愛國;微陣列基因表達數(shù)據(jù)的特征分析方法研究[D];合肥工業(yè)大學(xué);2015年
6 王博;文本分類中特征選擇技術(shù)的研究[D];國防科學(xué)技術(shù)大學(xué);2009年
7 張明錦;基于特征選擇的多變量數(shù)據(jù)分析方法及其在譜學(xué)研究中的應(yīng)用[D];華東理工大學(xué);2011年
8 高青斌;蛋白質(zhì)亞細胞定位預(yù)測相關(guān)問題研究[D];國防科學(xué)技術(shù)大學(xué);2006年
9 馮國忠;文本分類中的貝葉斯特征選擇[D];東北師范大學(xué);2011年
10 張麗新;高維數(shù)據(jù)的特征選擇及基于特征選擇的集成學(xué)習(xí)研究[D];清華大學(xué);2004年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張金蕾;蛋白質(zhì)SUMO化修飾位點預(yù)測的數(shù)據(jù)挖掘技術(shù)研究[D];西北農(nóng)林科技大學(xué);2015年
2 史德飛;自適應(yīng)特征選擇在線瓷磚分類系統(tǒng)[D];南京大學(xué);2014年
3 馬錚;網(wǎng)絡(luò)流量特征分析與特征選擇[D];北京郵電大學(xué);2013年
4 徐冬;基于特征選擇的入侵檢測方法研究[D];吉林大學(xué);2016年
5 鄭芳泉;稀有數(shù)據(jù)的集成特征選擇與入侵檢測[D];福州大學(xué);2013年
6 徐子偉;基于分步特征選擇和組合分類器的電信客戶流失預(yù)測模型[D];中國科學(xué)技術(shù)大學(xué);2016年
7 肖麗莎;半監(jiān)督特征選擇關(guān)鍵技術(shù)研究[D];西南交通大學(xué);2016年
8 李昌;概率特征選擇分類向量機[D];中國科學(xué)技術(shù)大學(xué);2016年
9 黃春虎;基于ReliefF-FCBF組合的入侵特征選擇算法研究[D];新疆大學(xué);2016年
10 譚蘊琨;面向稀疏數(shù)據(jù)的在線學(xué)習(xí)特征選擇方法研究[D];華南理工大學(xué);2016年
本文關(guān)鍵詞:基于復(fù)雜網(wǎng)絡(luò)的在線評論情感傾向性分類
更多相關(guān)文章: 復(fù)雜網(wǎng)絡(luò) 情感分類 情感詞典 特征選擇
,
本文編號:512111
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/512111.html