基于神經網絡的文本向量表示與建模研究
本文關鍵詞:基于神經網絡的文本向量表示與建模研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:文本表示與建模是自然語言處理領域中的基礎任務。傳統(tǒng)的文本表示方法主要是基于詞袋模型,好處在于簡單高效,容易擴展,但同時也面臨眾多嚴重的問題,如維度災難、數(shù)據(jù)稀疏表示、缺失語義表達能力等。近年來隨著大數(shù)據(jù)和深度學習技術在語音、圖像、生物信息等領域取得重大的成果,研究者們也開始將深度神經網絡技術應用到自然語言處理領域。特別地,隨著2008年Collobert和Weston將基于深度神經網絡的詞向量表示應用到各類自然語言處理任務以及2013年谷歌研究員基于神經網絡語言模型來學習分布式詞向量表示,越來越多基于神經網絡模型來學習文本向量表示的方法出現(xiàn)。本文集中對基于神經網絡語言模型的文本向量表示和主題建模問題進行了研究。首先簡單介紹傳統(tǒng)N-Gram統(tǒng)計語言模型和基于神經網絡的語言模型,并且回顧傳統(tǒng)詞向量表示方法以及學習分布式詞向量表示模型Word2Vec。隨后基于這些基礎模型與方法,本文進行了多方面的擴展:1.潛在狄利克雷分布(LDA)挖掘文檔中的主題結構,在自然語言處理和機器學習領域扮演重要的角色。然而,LDA中的概率分布表示僅僅描述語料中的共現(xiàn)統(tǒng)計關系,概率分布并不是特征表示的最好選擇。近來,基于向量表示的方法被提出來學習詞和文檔的概念和表示,例如Word2Vec向量表示方法已經在眾多任務中相比類LDA的方法表現(xiàn)更好。Doc2Vec。因此,本文提出模型可以學習和詞向量表示在同一個語義空間的Topic2Vec主題向量表示,作為概率分布的替換。實驗表明可以更好的建模Topic2Vec主題。2.分布式詞向量表示已經在自然語言處理領域取得了重大的成果。然而,大多數(shù)模型只關注局部上下文屬性并且獨自地學習特定任務的表示,缺失融合多個屬性聯(lián)合學習的能力。因此,本文提出一個統(tǒng)一的框架可以聯(lián)合學習詞和詞的屬性的分布式表示。在模型中,我們考慮了三類屬性:主題、詞元和文檔。在學習屬性的分布式向量表示的同時,我們發(fā)現(xiàn)利用附加的屬性對于提升詞的表示也是有益的。實驗部分從多個方面分別評價了主題向量表示、文檔向量表示和提升的詞向量表示,結果表明我們的模型效果更好。3.感知任務例如視覺對象識別和文本理解在人類智能中起著重要的作用,后續(xù)任務則包括推斷、推理和決策制定等都要求更高層次的智能。過去幾年中,感知任務的主要進展均采用了深度學習模型。而對于更高層次的推斷,帶有貝葉斯屬性的概率圖模型則更加強大和靈活。為了實現(xiàn)整合感知任務以及高層次推斷的智能,自然地希望將深度學習和貝葉斯模型緊密聯(lián)合起來。本文考慮融合基于神經網絡的詞向量表示和潛在狄利克雷分布(LDA)。特別地,將詞向量表示應用到LDA中來提升原有主題模型的效果,分別提出詞向量聚類先驗LDA、上下文感知LDA和詞向量加強LDA等模型。實驗表明利用詞向量表示的LDA表現(xiàn)更好。
【關鍵詞】:自然語言處理 文本表示 深度學習 神經網絡 文本建模 主題模型 詞向量 主題 文檔 框架 潛在狄利克雷分布
【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1;TP183
【目錄】:
- 摘要4-6
- Abstract6-8
- 前言8-15
- 1 緒論15-19
- 1.1 研究背景15-16
- 1.2 研究內容16-18
- 1.3 論文結構18-19
- 2 語言模型與詞向量表示19-28
- 2.1 統(tǒng)計語言模型19-20
- 2.2 神經網絡語言模型20-23
- 2.3 分布式詞向量表示23-27
- 2.4 本章小結27-28
- 3 學習主題的向量表示28-36
- 3.1 背景介紹28-29
- 3.1.1 潛在狄利克雷分布28
- 3.1.2 研究背景28-29
- 3.2 學習主題向量表示29-31
- 3.2.1 Topic2Vec模型29-31
- 3.3 實驗及分析31-34
- 3.3.1 數(shù)據(jù)集31-32
- 3.3.2 評價方法32-33
- 3.3.3 實驗結果分析33-34
- 3.4 本章小結34-36
- 4 聯(lián)合學習詞及其屬性的向量表示36-52
- 4.1 背景介紹36-38
- 4.2 框架與模型38-42
- 4.2.1 聯(lián)合學習詞和屬性向量表示的統(tǒng)一框架38-39
- 4.2.2 TW模型:學習主題向量表示39
- 4.2.3 DW模型:學習文檔向量表示39-40
- 4.2.4 提升詞向量表示的模型40-42
- 4.2.5 優(yōu)化和學習過程42
- 4.3 實驗及分析42-49
- 4.3.1 數(shù)據(jù)集42-43
- 4.3.2 評估主題向量表示43-46
- 4.3.3 評估文檔向量表示46-47
- 4.3.4 評估提升的詞向量表示47-49
- 4.4 本章小結49-52
- 5 詞向量加強的主題模型52-68
- 5.1 背景介紹52-53
- 5.2 詞向量聚類先驗潛在狄利克雷分布53-56
- 5.2.1 狄利克雷先驗分布53-55
- 5.2.2 詞向量聚類先驗潛在狄利克雷分布55-56
- 5.3 詞向量聚類先驗實驗與分析56-61
- 5.3.1 數(shù)據(jù)集與實驗設置56
- 5.3.2 主題詞評估56-57
- 5.3.3 主題一致性評估57-61
- 5.3.4 實驗與分析61
- 5.4 詞向量加強的潛在狄利克雷分布61-66
- 5.4.1 上下文感知的潛在狄利克雷分布62-64
- 5.4.2 詞向量加強的潛在狄利克雷分布64-66
- 5.5 本章小結66-68
- 6 總結與展望68-70
- 致謝70-72
- 參考文獻72-79
- 簡歷與科研成果79-80
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 云中客;新的神經網絡來自于仿生學[J];物理;2001年10期
2 唐春明,高協(xié)平;進化神經網絡的研究進展[J];系統(tǒng)工程與電子技術;2001年10期
3 李智;一種基于神經網絡的煤炭調運優(yōu)化方法[J];長沙鐵道學院學報;2003年02期
4 程科,王士同,楊靜宇;新型模糊形態(tài)神經網絡及其應用研究[J];計算機工程與應用;2004年21期
5 王凡,孟立凡;關于使用神經網絡推定操作者疲勞的研究[J];人類工效學;2004年03期
6 周麗暉;從統(tǒng)計角度看神經網絡[J];統(tǒng)計教育;2005年06期
7 趙奇 ,劉開第 ,龐彥軍;灰色補償神經網絡及其應用研究[J];微計算機信息;2005年14期
8 袁婷;;神經網絡在股票市場預測中的應用[J];軟件導刊;2006年05期
9 尚晉;楊有;;從神經網絡的過去談科學發(fā)展觀[J];重慶三峽學院學報;2006年03期
10 楊鐘瑾;;神經網絡的過去、現(xiàn)在和將來[J];青年探索;2006年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 徐春玉;;基于泛集的神經網絡的混沌性[A];1996中國控制與決策學術年會論文集[C];1996年
2 周樹德;王巖;孫增圻;孫富春;;量子神經網絡[A];2003年中國智能自動化會議論文集(上冊)[C];2003年
3 羅山;張琳;范文新;;基于神經網絡和簡單規(guī)劃的識別融合算法[A];2009系統(tǒng)仿真技術及其應用學術會議論文集[C];2009年
4 郭愛克;馬盡文;丁康;;序言(二)[A];1999年中國神經網絡與信號處理學術會議論文集[C];1999年
5 鐘義信;;知識論:神經網絡的新機遇——紀念中國神經網絡10周年[A];1999年中國神經網絡與信號處理學術會議論文集[C];1999年
6 許進;保錚;;神經網絡與圖論[A];1999年中國神經網絡與信號處理學術會議論文集[C];1999年
7 金龍;朱詩武;趙成志;陳寧;;數(shù)值預報產品的神經網絡釋用預報應用[A];1999年中國神經網絡與信號處理學術會議論文集[C];1999年
8 田金亭;;神經網絡在中學生創(chuàng)造力評估中的應用[A];第十二屆全國心理學學術大會論文摘要集[C];2009年
9 唐墨;王科俊;;自發(fā)展神經網絡的混沌特性研究[A];2009年中國智能自動化會議論文集(第七分冊)[南京理工大學學報(增刊)][C];2009年
10 張廣遠;萬強;曹海源;田方濤;;基于遺傳算法優(yōu)化神經網絡的故障診斷方法研究[A];第十二屆全國設備故障診斷學術會議論文集[C];2010年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 美國明尼蘇達大學社會學博士 密西西比州立大學國家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員 陳心想;維護好創(chuàng)新的“神經網絡硬件”[N];中國教師報;2014年
2 盧業(yè)忠;腦控電腦 驚世駭俗[N];計算機世界;2001年
3 葛一鳴 路邊文;人工神經網絡將大顯身手[N];中國紡織報;2003年
4 中國科技大學計算機系 邢方亮;神經網絡挑戰(zhàn)人類大腦[N];計算機世界;2003年
5 記者 孫剛;“神經網絡”:打開復雜工藝“黑箱”[N];解放日報;2007年
6 本報記者 劉霞;美用DNA制造出首個人造神經網絡[N];科技日報;2011年
7 健康時報特約記者 張獻懷;干細胞移植:修復受損的神經網絡[N];健康時報;2006年
8 劉力;我半導體神經網絡技術及應用研究達國際先進水平[N];中國電子報;2001年
9 ;神經網絡和模糊邏輯[N];世界金屬導報;2002年
10 鄒麗梅 陳耀群;江蘇科大神經網絡應用研究通過鑒定[N];中國船舶報;2006年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 楊旭華;神經網絡及其在控制中的應用研究[D];浙江大學;2004年
2 李素芳;基于神經網絡的無線通信算法研究[D];山東大學;2015年
3 石艷超;憶阻神經網絡的混沌性及幾類時滯神經網絡的同步研究[D];電子科技大學;2014年
4 王新迎;基于隨機映射神經網絡的多元時間序列預測方法研究[D];大連理工大學;2015年
5 付愛民;極速學習機的訓練殘差、穩(wěn)定性及泛化能力研究[D];中國農業(yè)大學;2015年
6 李輝;基于粒計算的神經網絡及集成方法研究[D];中國礦業(yè)大學;2015年
7 王衛(wèi)蘋;復雜網絡幾類同步控制策略研究及穩(wěn)定性分析[D];北京郵電大學;2015年
8 張海軍;基于云計算的神經網絡并行實現(xiàn)及其學習方法研究[D];華南理工大學;2015年
9 李艷晴;風速時間序列預測算法研究[D];北京科技大學;2016年
10 陳輝;多維超精密定位系統(tǒng)建模與控制關鍵技術研究[D];東南大學;2015年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 章穎;混合不確定性模塊化神經網絡與高校效益預測的研究[D];華南理工大學;2015年
2 賈文靜;基于改進型神經網絡的風力發(fā)電系統(tǒng)預測及控制研究[D];燕山大學;2015年
3 李慧芳;基于憶阻器的渦卷混沌系統(tǒng)及其電路仿真[D];西南大學;2015年
4 陳彥至;神經網絡降維算法研究與應用[D];華南理工大學;2015年
5 董哲康;基于憶阻器的組合電路及神經網絡研究[D];西南大學;2015年
6 武創(chuàng)舉;基于神經網絡的遙感圖像分類研究[D];昆明理工大學;2015年
7 李志杰;基于神經網絡的上證指數(shù)預測研究[D];華南理工大學;2015年
8 陳少吉;基于神經網絡血壓預測研究與系統(tǒng)實現(xiàn)[D];華南理工大學;2015年
9 張韜;幾類時滯神經網絡穩(wěn)定性分析[D];渤海大學;2015年
10 邵雪瑩;幾類時滯不確定神經網絡的穩(wěn)定性分析[D];渤海大學;2015年
本文關鍵詞:基于神經網絡的文本向量表示與建模研究,由筆耕文化傳播整理發(fā)布。
本文編號:446150
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/446150.html