天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

融合知識的情感分析研究

發(fā)布時間:2017-10-16 10:27

  本文關(guān)鍵詞:融合知識的情感分析研究


  更多相關(guān)文章: 情感分析 觀點挖掘 知識 弱監(jiān)督學(xué)習(xí)


【摘要】:情感分析是自然語言處理領(lǐng)域重要的研究方向之一,主要挖掘互聯(lián)網(wǎng)用戶對于事件、產(chǎn)品或者服務(wù)等所表達的情感傾向,其在輿情監(jiān)控、市場決策等方面具有重要的應(yīng)用價值。對情感分析的問題來說,人或多或少有一些常識性的知識。例如,我們知道“口味-不錯”在餐館的評論中頻繁出現(xiàn);“價格”和“性價比”在語義上都和價格相關(guān)等。如何在情感分析中引入這些顯然的、易于獲取的知識,從而促進和提高情感分析的性能至關(guān)重要。引入知識能夠簡化模型構(gòu)建,一定程度上減少對標(biāo)注數(shù)據(jù)的依賴,從而使得模型的泛化能力更強。因此,本文從融合知識的角度,對情感分析的若干問題深入分析研究,論文研究的主要內(nèi)容有:?情感抽取,主要指評價詞和評價對象的抽取。本文基于大量的評論數(shù)據(jù),通過少量的“評價詞-評價對象”搭配引入語法知識來實現(xiàn)情感抽取。其中,語法知識為有效的“評價詞-評價對象”間頻率較高的語法關(guān)系,這些語法關(guān)系是在大量數(shù)據(jù)中的統(tǒng)計得來,而不需要人工定義或標(biāo)注數(shù)據(jù)。本文提出的方法充分利用了海量評論數(shù)據(jù)中豐富的語法關(guān)系,相比于現(xiàn)有的情感抽取方法具有明顯的優(yōu)勢。?情感和維度分類,主要指評論篇章的情感傾向分類和評論中句子的維度分類。本文將句子級別維度的分類和篇章級別的情感分類形式化成一個有結(jié)構(gòu)學(xué)習(xí)的問題,并且在模型的結(jié)構(gòu)中引入少量的維度指示詞。正是因為引入維度詞匯知識,使得句子的維度分類不需要人工標(biāo)注數(shù)據(jù)。而且,通過對句子維度和篇章情感同時建模,使得情感和維度分類的性能得到顯著提高。?針對單篇評論的情感摘要,本文研究了單篇評論中句子內(nèi)容重要性排序問題。由于評論中的每句話并不具有相同的重要性,本文提出從句子的文本內(nèi)容和情感傾向兩個方面對其重要性進行排序。其中,句子文本內(nèi)容排序通過引入若干人工準(zhǔn)則作為知識訓(xùn)練排序模型,不需要對句子重要性進行標(biāo)注。?針對多篇評論的情感摘要,本文從用戶需求和興趣角度,研究個性化、定制化的評論摘要生成。本文提出在話題模型中引入情感和維度等語義知識,使得在不增加模型復(fù)雜度的同時對評論的情感和維度建模。本文的方法簡單有效,并且在評論摘要生成時考慮用戶的需求和興趣,具有一定的應(yīng)用前景。
【關(guān)鍵詞】:情感分析 觀點挖掘 知識 弱監(jiān)督學(xué)習(xí)
【學(xué)位授予單位】:清華大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.1
【目錄】:
  • 摘要3-4
  • Abstract4-9
  • 第1章 引言9-25
  • 1.1 研究背景9-10
  • 1.2 研究現(xiàn)狀10-22
  • 1.2.1 情感抽取10-15
  • 1.2.2 情感和維度分類15-19
  • 1.2.3 情感摘要19-22
  • 1.3 知識22-23
  • 1.4 本文的研究重點23-25
  • 第2章 融合語法知識的情感抽取25-43
  • 2.1 概述25-26
  • 2.2 情感抽取的框架26-27
  • 2.3 符號表示27-28
  • 2.4 評價對象-評價詞表示28-29
  • 2.5 弱監(jiān)督學(xué)習(xí)29-34
  • 2.5.1 廣義期望準(zhǔn)則29-30
  • 2.5.2 正面標(biāo)注特征(語法知識)30-31
  • 2.5.3 類別稀疏正則項(Label Sparsity Regularization)31
  • 2.5.4 訓(xùn)練二分類器31-33
  • 2.5.5 Bootstrapping抽取框架33-34
  • 2.6 實驗34-42
  • 2.6.1 數(shù)據(jù)集34-36
  • 2.6.2 知識的引入36
  • 2.6.3 評價方式36-37
  • 2.6.4 參數(shù)設(shè)置37
  • 2.6.5 評價對象評價詞抽取案例研究37-38
  • 2.6.6 評價詞評價對象抽取的性能對比38-39
  • 2.6.7 語法知識的敏感性評價39-40
  • 2.6.8 參考分布的敏感性評價40
  • 2.6.9 對最低可信分?jǐn)?shù)閾值的敏感性評價40-41
  • 2.6.10 實驗小結(jié)41-42
  • 2.7 本章小結(jié)42
  • 附件42-43
  • 第3章 融合詞匯知識的情感和維度分類43-64
  • 3.1 概述43-46
  • 3.2 維度和情感解釋的定義46
  • 3.3 優(yōu)化問題形式化定義46-47
  • 3.4 通過損失函數(shù)引入維度詞匯知識47-48
  • 3.4.1 句子級別的損失函數(shù)(Sentence-level loss ,SL)47
  • 3.4.2 篇章級別的損失函數(shù)(Document-level loss ,,DL)47-48
  • 3.5 維度分類和篇章情感分類的聯(lián)合建模48-49
  • 3.5.1 評論篇章的情感傾向預(yù)測49
  • 3.5.2 情感解釋的維度劃分49
  • 3.6 模型訓(xùn)練49-51
  • 3.6.1 優(yōu)化問題49-51
  • 3.6.2 模型和隱變量的初始化51
  • 3.7 實驗51-63
  • 3.7.1 數(shù)據(jù)集51-53
  • 3.7.2 評論篇章的情感傾向預(yù)測53-56
  • 3.7.3 維度分析的案例研究56-57
  • 3.7.4 量化分析57-63
  • 3.8 本章小結(jié)63
  • 附件63-64
  • 第4章 融合規(guī)則知識的評論內(nèi)容重要性分析64-77
  • 4.1 概述64-65
  • 4.2 排序與情感分析聯(lián)合建模65-68
  • 4.2.1 句子信息含量排序65-67
  • 4.2.2 句子的情感分析67-68
  • 4.3 聯(lián)合優(yōu)化68-71
  • 4.3.1 對偶分解簡介69-70
  • 4.3.2 對偶分解求解聯(lián)合優(yōu)化問題70-71
  • 4.3.3 句子重要程度排序71
  • 4.4 實驗71-76
  • 4.4.1 數(shù)據(jù)71-72
  • 4.4.2 評價指標(biāo)72
  • 4.4.3 對比方法72-73
  • 4.4.4 總體排序?qū)Ρ?/span>73
  • 4.4.5 重要句子排序性能評價73-76
  • 4.5 本章小結(jié)76
  • 附件76-77
  • 第5章 融合語義知識的評論分析和摘要77-94
  • 5.1 概述77-78
  • 5.2 話題模型簡介78-80
  • 5.2.1 符號表示78-79
  • 5.2.2 LDA訓(xùn)練與參數(shù)估計79-80
  • 5.3 基于話題模型的評論建模80-84
  • 5.3.1 融合語義知識的LDA模型81-82
  • 5.3.2 引入維度、情感等語義知識82-83
  • 5.3.3 引入評論的打分83-84
  • 5.4 基于話題模型的用戶興趣建模84
  • 5.5 基于話題模型的個性化摘要生成84-85
  • 5.5.1 摘要的個性化84-85
  • 5.5.2 摘要的結(jié)構(gòu)化85
  • 5.6 實驗85-92
  • 5.6.1 數(shù)據(jù)集和參數(shù)設(shè)置85-87
  • 5.6.2 話題的解釋性分析87-88
  • 5.6.3 話題的質(zhì)量分析88-89
  • 5.6.4 個性化摘要生成分析89-92
  • 5.7 本章小結(jié)92-94
  • 第6章 總結(jié)與展望94-96
  • 6.1 本文總結(jié)94-95
  • 6.2 工作展望95-96
  • 參考文獻96-104
  • 致謝104-106
  • 個人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果106-107

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 呂國防;;注意新聞表述中的情感傾向[J];新聞實踐;2011年06期

2 傅向華;劉國;郭巖巖;郭武彪;;中文博客多方面話題情感分析研究[J];中文信息學(xué)報;2013年01期

3 魏晶晶;吳曉吟;;電子商務(wù)產(chǎn)品評論多級情感分析的研究與實現(xiàn)[J];軟件;2013年09期

4 于瀟;萬軍;何翔;左尾歡;;校園微博情感分析系統(tǒng)的設(shè)計與實現(xiàn)[J];河北工業(yè)大學(xué)學(xué)報;2013年06期

5 封二英;龐靈;;基于弱監(jiān)督迭代法的情感傾向分析[J];無線互聯(lián)科技;2014年03期

6 龐磊;李壽山;張慧;周國棟;;基于微博的股票投資者未來情感傾向識別研究[J];計算機科學(xué);2012年S1期

7 徐鵬;;基于直覺模糊推理的網(wǎng)頁在線評論情感傾向分類[J];計算機應(yīng)用與軟件;2013年06期

8 楊偉杰;馬博淵;劉雯;;基于意見目標(biāo)句抽取的中文股評情感分析方法[J];計算機仿真;2014年03期

9 楊江;彭石玉;侯敏;;基于主題情感句的漢語評論文傾向性分析[J];計算機應(yīng)用研究;2011年02期

10 張素智;樊得強;李寶燕;;基于網(wǎng)絡(luò)評論語言學(xué)結(jié)構(gòu)的情感傾向識別模型[J];鄭州大學(xué)學(xué)報(理學(xué)版);2011年01期

中國重要會議論文全文數(shù)據(jù)庫 前4條

1 楊江;侯敏;王寧;;基于主題情感句的漢語評論文傾向性分析[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年

2 林慧恩;林世平;;中文情感傾向分析中主觀句子抽取方法的研究[A];全國第20屆計算機技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集(上冊)[C];2009年

3 王素格;楊安娜;;一種混合語言信息的詞語搭配傾向判別方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

4 宋曉雷;王素格;李紅霞;;基于概率潛在語義分析的詞匯情感傾向判別[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年

中國重要報紙全文數(shù)據(jù)庫 前3條

1 唐楠;新聞應(yīng)避免情感傾向[N];中國新聞出版報;2005年

2 魯東;不盡鄉(xiāng)情入畫來[N];中國文化報;2001年

3 楊勇濤;讓攝影喚起心靈的本真[N];中國攝影報;2005年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前6條

1 房磊;融合知識的情感分析研究[D];清華大學(xué);2015年

2 張奇;細顆粒度情感傾向分析若干關(guān)鍵問題研究[D];復(fù)旦大學(xué);2008年

3 王素格;基于Web的評論文本情感分類問題研究[D];上海大學(xué);2008年

4 楊卉;Web文本觀點挖掘及隱含情感傾向的研究[D];吉林大學(xué);2011年

5 李思;WEB觀點挖掘中關(guān)鍵問題的研究[D];北京郵電大學(xué);2012年

6 李方濤;基于產(chǎn)品評論的情感分析研究[D];清華大學(xué);2011年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 王帥;情感分析的特征提取算法與觀點的聚類算法研究[D];昆明理工大學(xué);2015年

2 馮金剛;網(wǎng)絡(luò)輿情中文信息情感傾向分析研究[D];華北電力大學(xué);2015年

3 魏從源;網(wǎng)絡(luò)信息的情感傾向分類技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年

4 周冬衛(wèi);中文微博評論的情感傾向分析[D];華東交通大學(xué);2015年

5 吳斐;跨領(lǐng)域條件下詞匯情感傾向判別方法研究[D];合肥工業(yè)大學(xué);2015年

6 徐凱;基于產(chǎn)品特征的用戶評論情感傾向分析研究[D];合肥工業(yè)大學(xué);2015年

7 王格;網(wǎng)絡(luò)評論的情感傾向分析[D];武漢工程大學(xué);2015年

8 劉其;基于用戶評論的群體情緒識別與演化研究[D];東華大學(xué);2015年

9 張佳明;微博話題的公眾情感分析技術(shù)研究[D];解放軍信息工程大學(xué);2015年

10 楊國峰;基于支持向量機的篇章情感傾向分析系統(tǒng)研究與實現(xiàn)[D];中山大學(xué);2011年



本文編號:1042184

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1042184.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0a426***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com