弱標注文本的情感分類技術研究
本文關鍵詞:弱標注文本的情感分類技術研究 出處:《南京大學》2016年碩士論文 論文類型:學位論文
更多相關文章: 情感分類 半監(jiān)督學習 詞向量 神經(jīng)網(wǎng)絡
【摘要】:伴隨著Web技術的蓬勃發(fā)展,以及各類社會媒體的發(fā)展。隨之而產(chǎn)生的用戶評論信息也與日俱增。然而,面對海量的互聯(lián)網(wǎng)評論信息,傳統(tǒng)的社會學分析方法很難從中快速提取出準確的情感信息。文本情感分類(sentiment classification)技術就是利用計算機的強大計算能力,從海量評論文本信息中快速獲取有價值的情感信息。在文本情感分類中,為了提高分類準確度,往往需要學習大量的標注樣本來獲取分類模型。但是,實際中我們通常只能獲得各種未標注樣本。本文首先基于文本內容利用啟發(fā)式算法生成文本弱標注,從而得到有價值的弱標注文本。再利用半監(jiān)督學習方法和深度學習方法訓練分類模型。本文的主要貢獻總結如下:1.綜述了目前文本情感分析的研究現(xiàn)狀。本文首先介紹了文本情感分類的基本概念和研究進展,然后詳細介紹了基于文本特征的情感分類和基于神經(jīng)網(wǎng)絡的情感分類。2.提出了一種基于最大情感置信度的self-training方法,并對該方法進行了實證研究。一種半監(jiān)督的情感分類方法,通過引入情感語義值和情感分類值,并根據(jù)二者計算情感置信度。利用self-training方法,以情感置信度為選擇標準,挑選出的情感置信度高的未標注樣本進行學習,從而得到準確度更高的分類器。實驗結果表明,基于最大情感置信度的self-training方法有效利用了未標注的樣本,在分類效果上遠遠優(yōu)于傳統(tǒng)的半監(jiān)督學習方法。3.提出了一種基于文本弱標注的詞嵌入訓練方法LAWE (Label Leveraged Word Embedding),并對該方法進行了實證研究。一種深度學習的情感分類方法,首先在經(jīng)典的無監(jiān)督神經(jīng)網(wǎng)絡模型的基礎上,引入情感領域的弱標注,通過對大量未標注樣本的學習,使得模型訓練出的詞嵌入包含情感領域信息;然后基于訓練出的詞嵌入獲取文本的特征表示;最后,利用分類器在驗證集上驗證,并根據(jù)驗證結果控制LAWE網(wǎng)絡的訓練周期,從而確定最優(yōu)的詞嵌入訓練結果。實驗結果驗證了LAWE方法的有效性,在同類型方法比較中,該方法獲得了較好的分類效果。4.分析并總結了基于最大情感置信度的self-training方法和基于文本弱標注的詞嵌入訓練方法LAWE的關聯(lián)與區(qū)別。相同之處在于二者都是基于文本內容利用啟發(fā)式算法生成文本弱標注。不同之處在于,基于最大情感置信度的self-training方法具有速度快、效率高的特點,但較多地依賴于提取的文本特征;而基于文本弱標注的詞嵌入訓練方法LAWE能夠實現(xiàn)自動化地提取文本的特征,但有著運行速度慢、效率低的特點。
[Abstract]:......
【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1
【相似文獻】
相關期刊論文 前10條
1 云中客;新的神經(jīng)網(wǎng)絡來自于仿生學[J];物理;2001年10期
2 唐春明,高協(xié)平;進化神經(jīng)網(wǎng)絡的研究進展[J];系統(tǒng)工程與電子技術;2001年10期
3 李智;一種基于神經(jīng)網(wǎng)絡的煤炭調運優(yōu)化方法[J];長沙鐵道學院學報;2003年02期
4 程科,王士同,楊靜宇;新型模糊形態(tài)神經(jīng)網(wǎng)絡及其應用研究[J];計算機工程與應用;2004年21期
5 王凡,孟立凡;關于使用神經(jīng)網(wǎng)絡推定操作者疲勞的研究[J];人類工效學;2004年03期
6 周麗暉;從統(tǒng)計角度看神經(jīng)網(wǎng)絡[J];統(tǒng)計教育;2005年06期
7 趙奇 ,劉開第 ,龐彥軍;灰色補償神經(jīng)網(wǎng)絡及其應用研究[J];微計算機信息;2005年14期
8 袁婷;;神經(jīng)網(wǎng)絡在股票市場預測中的應用[J];軟件導刊;2006年05期
9 尚晉;楊有;;從神經(jīng)網(wǎng)絡的過去談科學發(fā)展觀[J];重慶三峽學院學報;2006年03期
10 楊鐘瑾;;神經(jīng)網(wǎng)絡的過去、現(xiàn)在和將來[J];青年探索;2006年04期
相關會議論文 前10條
1 徐春玉;;基于泛集的神經(jīng)網(wǎng)絡的混沌性[A];1996中國控制與決策學術年會論文集[C];1996年
2 周樹德;王巖;孫增圻;孫富春;;量子神經(jīng)網(wǎng)絡[A];2003年中國智能自動化會議論文集(上冊)[C];2003年
3 羅山;張琳;范文新;;基于神經(jīng)網(wǎng)絡和簡單規(guī)劃的識別融合算法[A];2009系統(tǒng)仿真技術及其應用學術會議論文集[C];2009年
4 郭愛克;馬盡文;丁康;;序言(二)[A];1999年中國神經(jīng)網(wǎng)絡與信號處理學術會議論文集[C];1999年
5 鐘義信;;知識論:神經(jīng)網(wǎng)絡的新機遇——紀念中國神經(jīng)網(wǎng)絡10周年[A];1999年中國神經(jīng)網(wǎng)絡與信號處理學術會議論文集[C];1999年
6 許進;保錚;;神經(jīng)網(wǎng)絡與圖論[A];1999年中國神經(jīng)網(wǎng)絡與信號處理學術會議論文集[C];1999年
7 金龍;朱詩武;趙成志;陳寧;;數(shù)值預報產(chǎn)品的神經(jīng)網(wǎng)絡釋用預報應用[A];1999年中國神經(jīng)網(wǎng)絡與信號處理學術會議論文集[C];1999年
8 田金亭;;神經(jīng)網(wǎng)絡在中學生創(chuàng)造力評估中的應用[A];第十二屆全國心理學學術大會論文摘要集[C];2009年
9 唐墨;王科俊;;自發(fā)展神經(jīng)網(wǎng)絡的混沌特性研究[A];2009年中國智能自動化會議論文集(第七分冊)[南京理工大學學報(增刊)][C];2009年
10 張廣遠;萬強;曹海源;田方濤;;基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡的故障診斷方法研究[A];第十二屆全國設備故障診斷學術會議論文集[C];2010年
相關重要報紙文章 前10條
1 美國明尼蘇達大學社會學博士 密西西比州立大學國家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員 陳心想;維護好創(chuàng)新的“神經(jīng)網(wǎng)絡硬件”[N];中國教師報;2014年
2 盧業(yè)忠;腦控電腦 驚世駭俗[N];計算機世界;2001年
3 葛一鳴 路邊文;人工神經(jīng)網(wǎng)絡將大顯身手[N];中國紡織報;2003年
4 中國科技大學計算機系 邢方亮;神經(jīng)網(wǎng)絡挑戰(zhàn)人類大腦[N];計算機世界;2003年
5 記者 孫剛;“神經(jīng)網(wǎng)絡”:打開復雜工藝“黑箱”[N];解放日報;2007年
6 本報記者 劉霞;美用DNA制造出首個人造神經(jīng)網(wǎng)絡[N];科技日報;2011年
7 健康時報特約記者 張獻懷;干細胞移植:修復受損的神經(jīng)網(wǎng)絡[N];健康時報;2006年
8 劉力;我半導體神經(jīng)網(wǎng)絡技術及應用研究達國際先進水平[N];中國電子報;2001年
9 ;神經(jīng)網(wǎng)絡和模糊邏輯[N];世界金屬導報;2002年
10 鄒麗梅 陳耀群;江蘇科大神經(jīng)網(wǎng)絡應用研究通過鑒定[N];中國船舶報;2006年
相關博士學位論文 前10條
1 楊旭華;神經(jīng)網(wǎng)絡及其在控制中的應用研究[D];浙江大學;2004年
2 李素芳;基于神經(jīng)網(wǎng)絡的無線通信算法研究[D];山東大學;2015年
3 石艷超;憶阻神經(jīng)網(wǎng)絡的混沌性及幾類時滯神經(jīng)網(wǎng)絡的同步研究[D];電子科技大學;2014年
4 王新迎;基于隨機映射神經(jīng)網(wǎng)絡的多元時間序列預測方法研究[D];大連理工大學;2015年
5 付愛民;極速學習機的訓練殘差、穩(wěn)定性及泛化能力研究[D];中國農業(yè)大學;2015年
6 李輝;基于粒計算的神經(jīng)網(wǎng)絡及集成方法研究[D];中國礦業(yè)大學;2015年
7 王衛(wèi)蘋;復雜網(wǎng)絡幾類同步控制策略研究及穩(wěn)定性分析[D];北京郵電大學;2015年
8 張海軍;基于云計算的神經(jīng)網(wǎng)絡并行實現(xiàn)及其學習方法研究[D];華南理工大學;2015年
9 李艷晴;風速時間序列預測算法研究[D];北京科技大學;2016年
10 陳輝;多維超精密定位系統(tǒng)建模與控制關鍵技術研究[D];東南大學;2015年
相關碩士學位論文 前10條
1 章穎;混合不確定性模塊化神經(jīng)網(wǎng)絡與高校效益預測的研究[D];華南理工大學;2015年
2 賈文靜;基于改進型神經(jīng)網(wǎng)絡的風力發(fā)電系統(tǒng)預測及控制研究[D];燕山大學;2015年
3 李慧芳;基于憶阻器的渦卷混沌系統(tǒng)及其電路仿真[D];西南大學;2015年
4 陳彥至;神經(jīng)網(wǎng)絡降維算法研究與應用[D];華南理工大學;2015年
5 董哲康;基于憶阻器的組合電路及神經(jīng)網(wǎng)絡研究[D];西南大學;2015年
6 武創(chuàng)舉;基于神經(jīng)網(wǎng)絡的遙感圖像分類研究[D];昆明理工大學;2015年
7 李志杰;基于神經(jīng)網(wǎng)絡的上證指數(shù)預測研究[D];華南理工大學;2015年
8 陳少吉;基于神經(jīng)網(wǎng)絡血壓預測研究與系統(tǒng)實現(xiàn)[D];華南理工大學;2015年
9 張韜;幾類時滯神經(jīng)網(wǎng)絡穩(wěn)定性分析[D];渤海大學;2015年
10 邵雪瑩;幾類時滯不確定神經(jīng)網(wǎng)絡的穩(wěn)定性分析[D];渤海大學;2015年
,本文編號:1349269
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1349269.html