基于遷移學(xué)習(xí)的方面級文本情感分析算法研究與應(yīng)用
發(fā)布時間:2021-02-10 06:27
日常生活中,人們會將海量的評論信息通過多種手段發(fā)布到各個社交網(wǎng)站和購物網(wǎng)站中,表達(dá)個人積極或者消極,支持或者反對的情緒。情感分析(Sentiment Analysis,SA)運(yùn)用計算機(jī)技術(shù),幫助用戶以更快的速度挖掘、整理以及分析這類評論信息。方面級情感分析(Aspect-Based Sentiment Analysis,ABSA)是情感分析的一種,其提取針對實(shí)體的各個方面發(fā)表的意見,是一種細(xì)化的情感分析模型,方面級情感分析的重要步驟之一是方面提取。本文基于產(chǎn)品評論數(shù)據(jù),研究了基于遷移學(xué)習(xí)的方面提取算法。主要研究內(nèi)容包括以下幾點(diǎn):(1)提出一種方面提取的遷移學(xué)習(xí)算法(Transfer Learning Algorithms for Aspect Extraction,TLAE)。此算法將標(biāo)簽傳播算法(Label Propagation Algorithm,LPA)思想與遷移學(xué)習(xí)框架相結(jié)合。第一步,句法分析。對原始評論數(shù)據(jù)進(jìn)行句法分析,提取出所有領(lǐng)域文本評論數(shù)據(jù)的語言特征,實(shí)現(xiàn)原始特征空間從高維降到低維;第二步,構(gòu)建跨域數(shù)據(jù)表示圖。圖節(jié)點(diǎn)包括源領(lǐng)域數(shù)據(jù)的方面標(biāo)簽、目標(biāo)域數(shù)據(jù)的方面候選標(biāo)簽和...
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同算法對英文數(shù)據(jù)的F1值描述
西北師范大學(xué)碩士學(xué)位論文28圖3-6不同算法對英文數(shù)據(jù)的F1值描述圖3-7不同算法對中文數(shù)據(jù)的F1值描述圖3-7列出了各類算法在6組中文數(shù)據(jù)集上的F1值,從圖中可以看出,當(dāng)目標(biāo)域數(shù)據(jù)集為“相機(jī)1”和“相機(jī)2”時,算法TCBHN取得了最好的分類效果,TLAE算法分類效果居中;當(dāng)目標(biāo)域數(shù)據(jù)集為“手機(jī)”和“平板”時,算法MLP取得了最好的分類效果,TLAE算法相比于其他算法,也具有競爭力;當(dāng)目標(biāo)域數(shù)據(jù)集為“水果”和“衣服”時,TLAE算法取得了最佳分類性能。2.值對分類精度的影響將領(lǐng)域相關(guān)性分為高、低、中三個等級,圖3-8表示了在不同算法中領(lǐng)域相關(guān)性對英文數(shù)據(jù)分類精度的影響,圖3-9表示了在不同算法中領(lǐng)域相關(guān)性對中文數(shù)
第3章基于LPA的方面提取遷移學(xué)習(xí)算法29據(jù)分類精度的影響,從兩圖看出,當(dāng)>70%,即領(lǐng)域相關(guān)性為“高”時,TLAE算法的分類精確度較低;當(dāng)30%<70%,即領(lǐng)域相關(guān)性為“中”時,TLAE算法的分類精確度逐漸增高;當(dāng)30%,即領(lǐng)域相關(guān)性為“低”時,TLAE算法的分類精確度最高。且從圖中TLAE算法的線性趨勢來看,隨著領(lǐng)域相關(guān)性的下降,TLAE算法的分類效果逐漸優(yōu)越,證明了TLAE算法在跨域遷移中的有效性。圖3-8值對英文數(shù)據(jù)分類精度的影響圖3-9值對中文數(shù)據(jù)分類精度的影響3.不同算法分類時間比較TLAE算法在計算時間上也是有利的,表3-7記錄了不同算法在6組英文數(shù)據(jù)上的運(yùn)行時間,表3-8記錄了不同算法在6組中文數(shù)據(jù)上的運(yùn)行時間,單位為秒。從兩表可以看出,即使與NB等簡單方法相比,TLAE算法在方面提取任務(wù)中的
【參考文獻(xiàn)】:
期刊論文
[1]情感分析中的方面提取綜述[J]. 陳蘋,馮林. 計算機(jī)應(yīng)用. 2018(S2)
[2]遷移學(xué)習(xí)研究綜述[J]. 王惠. 電腦知識與技術(shù). 2017(32)
[3]面向汽車評論的細(xì)粒度情感分析方法研究[J]. 陳炳豐,郝志峰,蔡瑞初,溫雯,王麗娟,黃浩,蔡曉鳳. 廣東工業(yè)大學(xué)學(xué)報. 2017(03)
[4]基于語義約束LDA的商品特征和情感詞提取[J]. 彭云,萬常選,江騰蛟,劉德喜,劉喜平,廖國瓊. 軟件學(xué)報. 2017(03)
[5]基于半監(jiān)督的SVM遷移學(xué)習(xí)文本分類算法[J]. 譚建平,劉波,肖燕珊. 無線互聯(lián)科技. 2016(04)
[6]基于情感分析的企業(yè)產(chǎn)品級競爭對手識別研究——以用戶評論為數(shù)據(jù)源[J]. 肖璐,陳果,劉繼云. 圖書情報工作. 2016(01)
[7]主題網(wǎng)絡(luò)爬蟲研究綜述[J]. 劉金紅,陸余良. 計算機(jī)應(yīng)用研究. 2007(10)
博士論文
[1]觀點(diǎn)挖掘中評價對象抽取方法的研究[D]. 劉倩.東南大學(xué) 2016
碩士論文
[1]基于遷移學(xué)習(xí)的情感分類研究與應(yīng)用[D]. 段秀玉.北京郵電大學(xué) 2019
[2]基于半監(jiān)督學(xué)習(xí)的觀點(diǎn)挖掘算法的研究與實(shí)現(xiàn)[D]. 吳春葉.北京郵電大學(xué) 2019
[3]基于主題模型的無監(jiān)督方面級觀點(diǎn)挖掘算法研究[D]. 馮晉田.華中科技大學(xué) 2019
[4]一種實(shí)例遷移學(xué)習(xí)算法的改進(jìn)研究[D]. 李毅.西北師范大學(xué) 2018
[5]基于SVM的文本情感分類研究及應(yīng)用[D]. 陳志珍.大連海事大學(xué) 2017
[6]搜索引擎中通用爬蟲系統(tǒng)的研究與設(shè)計[D]. 高龍.吉林大學(xué) 2013
[7]基于遷移學(xué)習(xí)的中文評論情感分類方法研究[D]. 馬鳳閘.大連理工大學(xué) 2012
[8]中文情感詞匯本體的構(gòu)建及其應(yīng)用[D]. 陳建美.大連理工大學(xué) 2009
[9]基于實(shí)例和特征的遷移學(xué)習(xí)算法研究[D]. 戴文淵.上海交通大學(xué) 2009
本文編號:3026938
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同算法對英文數(shù)據(jù)的F1值描述
西北師范大學(xué)碩士學(xué)位論文28圖3-6不同算法對英文數(shù)據(jù)的F1值描述圖3-7不同算法對中文數(shù)據(jù)的F1值描述圖3-7列出了各類算法在6組中文數(shù)據(jù)集上的F1值,從圖中可以看出,當(dāng)目標(biāo)域數(shù)據(jù)集為“相機(jī)1”和“相機(jī)2”時,算法TCBHN取得了最好的分類效果,TLAE算法分類效果居中;當(dāng)目標(biāo)域數(shù)據(jù)集為“手機(jī)”和“平板”時,算法MLP取得了最好的分類效果,TLAE算法相比于其他算法,也具有競爭力;當(dāng)目標(biāo)域數(shù)據(jù)集為“水果”和“衣服”時,TLAE算法取得了最佳分類性能。2.值對分類精度的影響將領(lǐng)域相關(guān)性分為高、低、中三個等級,圖3-8表示了在不同算法中領(lǐng)域相關(guān)性對英文數(shù)據(jù)分類精度的影響,圖3-9表示了在不同算法中領(lǐng)域相關(guān)性對中文數(shù)
第3章基于LPA的方面提取遷移學(xué)習(xí)算法29據(jù)分類精度的影響,從兩圖看出,當(dāng)>70%,即領(lǐng)域相關(guān)性為“高”時,TLAE算法的分類精確度較低;當(dāng)30%<70%,即領(lǐng)域相關(guān)性為“中”時,TLAE算法的分類精確度逐漸增高;當(dāng)30%,即領(lǐng)域相關(guān)性為“低”時,TLAE算法的分類精確度最高。且從圖中TLAE算法的線性趨勢來看,隨著領(lǐng)域相關(guān)性的下降,TLAE算法的分類效果逐漸優(yōu)越,證明了TLAE算法在跨域遷移中的有效性。圖3-8值對英文數(shù)據(jù)分類精度的影響圖3-9值對中文數(shù)據(jù)分類精度的影響3.不同算法分類時間比較TLAE算法在計算時間上也是有利的,表3-7記錄了不同算法在6組英文數(shù)據(jù)上的運(yùn)行時間,表3-8記錄了不同算法在6組中文數(shù)據(jù)上的運(yùn)行時間,單位為秒。從兩表可以看出,即使與NB等簡單方法相比,TLAE算法在方面提取任務(wù)中的
【參考文獻(xiàn)】:
期刊論文
[1]情感分析中的方面提取綜述[J]. 陳蘋,馮林. 計算機(jī)應(yīng)用. 2018(S2)
[2]遷移學(xué)習(xí)研究綜述[J]. 王惠. 電腦知識與技術(shù). 2017(32)
[3]面向汽車評論的細(xì)粒度情感分析方法研究[J]. 陳炳豐,郝志峰,蔡瑞初,溫雯,王麗娟,黃浩,蔡曉鳳. 廣東工業(yè)大學(xué)學(xué)報. 2017(03)
[4]基于語義約束LDA的商品特征和情感詞提取[J]. 彭云,萬常選,江騰蛟,劉德喜,劉喜平,廖國瓊. 軟件學(xué)報. 2017(03)
[5]基于半監(jiān)督的SVM遷移學(xué)習(xí)文本分類算法[J]. 譚建平,劉波,肖燕珊. 無線互聯(lián)科技. 2016(04)
[6]基于情感分析的企業(yè)產(chǎn)品級競爭對手識別研究——以用戶評論為數(shù)據(jù)源[J]. 肖璐,陳果,劉繼云. 圖書情報工作. 2016(01)
[7]主題網(wǎng)絡(luò)爬蟲研究綜述[J]. 劉金紅,陸余良. 計算機(jī)應(yīng)用研究. 2007(10)
博士論文
[1]觀點(diǎn)挖掘中評價對象抽取方法的研究[D]. 劉倩.東南大學(xué) 2016
碩士論文
[1]基于遷移學(xué)習(xí)的情感分類研究與應(yīng)用[D]. 段秀玉.北京郵電大學(xué) 2019
[2]基于半監(jiān)督學(xué)習(xí)的觀點(diǎn)挖掘算法的研究與實(shí)現(xiàn)[D]. 吳春葉.北京郵電大學(xué) 2019
[3]基于主題模型的無監(jiān)督方面級觀點(diǎn)挖掘算法研究[D]. 馮晉田.華中科技大學(xué) 2019
[4]一種實(shí)例遷移學(xué)習(xí)算法的改進(jìn)研究[D]. 李毅.西北師范大學(xué) 2018
[5]基于SVM的文本情感分類研究及應(yīng)用[D]. 陳志珍.大連海事大學(xué) 2017
[6]搜索引擎中通用爬蟲系統(tǒng)的研究與設(shè)計[D]. 高龍.吉林大學(xué) 2013
[7]基于遷移學(xué)習(xí)的中文評論情感分類方法研究[D]. 馬鳳閘.大連理工大學(xué) 2012
[8]中文情感詞匯本體的構(gòu)建及其應(yīng)用[D]. 陳建美.大連理工大學(xué) 2009
[9]基于實(shí)例和特征的遷移學(xué)習(xí)算法研究[D]. 戴文淵.上海交通大學(xué) 2009
本文編號:3026938
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3026938.html
最近更新
教材專著