基于深度學(xué)習(xí)的短文本相似度分析與實現(xiàn)
發(fā)布時間:2024-01-20 12:19
隨著互聯(lián)網(wǎng)和人工智能技術(shù)的發(fā)展,產(chǎn)生了越來越多的短文本數(shù)據(jù),人們對文本處理技術(shù)有著迫切需求,如在智能問答、信息檢索等領(lǐng)域。而短文本相似度作為文本處理的基礎(chǔ)技術(shù),在整個自然語言處理領(lǐng)域有著十分廣闊的應(yīng)用前景和研究價值。由于短文本自身有著句子較短、語義豐富等特點,目前還沒有一種能夠適用所有應(yīng)用場景的短文本相似度算法。傳統(tǒng)的文本相似度計算方式存在語義缺失、數(shù)據(jù)稀疏等缺點,已經(jīng)不能很好地滿足目前人們的實際需要。深度學(xué)習(xí)技術(shù)目前已在圖像領(lǐng)域、語音領(lǐng)域取得了很好的效果,給自然語言處理同樣帶來了新的進步,其中在翻譯、自動摘要、閱讀理解等任務(wù)上,更是接近于人類的處理結(jié)果。因此,越來越多的科研機構(gòu)將深度學(xué)習(xí)用在處理更復(fù)雜、更抽象的自然語言理解任務(wù)中。本文針對目前基于深度學(xué)習(xí)的短文本相似度計算中存在的文本對輸入交互問題、文本交互匹配特征提取不充分問題、多特征融合問題,在基于Siamese模型基礎(chǔ)之上,提出了基于CNN的對稱字粒度交互序列改進算法,嘗試解決上述問題。(1)針對相似度計算中的短文本對(句子對)交互輸入問題,本論文提出一種以單字為最小粒度的對稱交互序列來優(yōu)化解決神經(jīng)網(wǎng)絡(luò)輸入層的文本對輸入問題;(...
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及研究意義
1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢
1.3 論文研究內(nèi)容及結(jié)構(gòu)安排
第二章 相關(guān)理論介紹
2.1 短文本相似度計算概念
2.1.1 短文本概述
2.1.2 文本向量化模型
2.2 中文分詞
2.3 深度學(xué)習(xí)
2.3.1 深度學(xué)習(xí)概述
2.3.2 深度學(xué)習(xí)模型
2.3.3 激活函數(shù)
2.3.4 優(yōu)化算法
2.3.5 Dropout
2.3.6 深度學(xué)習(xí)框架
2.4 依存句法分析以及向量化
2.5 本章小結(jié)
第三章 基于CNN的對稱字粒度交互序列算法
3.1 基于單字粒度對稱交互序列的建立
3.2 基于CNN的雙通道交互匹配特征提取
3.2.1 Siamese網(wǎng)絡(luò)模型和交互匹配模型
3.2.2 基于CNN的雙通道交互匹配特征提取
3.3 基于CNN的雙通道特征融合
3.4 本章小結(jié)
第四章 基于CNN的對稱字粒度交互序列算法的模型設(shè)計
4.1 輸入層設(shè)計
4.2 卷積層設(shè)計
4.3 雙通道特征提取層設(shè)計
4.4 輸出層設(shè)計
4.5 本章小結(jié)
第五章 實驗設(shè)計與結(jié)果分析
5.1 實驗相關(guān)模型設(shè)計
5.2 數(shù)據(jù)集
5.3 實驗設(shè)計及實驗結(jié)果分析
5.3.1 基于斯坦福推理數(shù)據(jù)集(2分類)的實驗設(shè)計及結(jié)果分析
5.3.2 基于Quora數(shù)據(jù)集的實驗設(shè)計及結(jié)果分析
5.3.3 BWIS-CNNs模型在不同學(xué)習(xí)率下的實驗結(jié)果分析
5.4 基于依存關(guān)系的模型設(shè)計與實驗結(jié)果分析
5.4.1 基于斯坦福推理數(shù)據(jù)集(2分類)的實驗結(jié)果分析
5.4.2 基于Quora數(shù)據(jù)集的實驗結(jié)果分析
5.5 綜合實驗結(jié)果及分析
5.6 實驗結(jié)論
5.7 本章小結(jié)
第六章 結(jié)論與展望
6.1 主要結(jié)論
6.2 研究展望
參考文獻
在學(xué)期間的研究成果
致謝
本文編號:3880830
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及研究意義
1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢
1.3 論文研究內(nèi)容及結(jié)構(gòu)安排
第二章 相關(guān)理論介紹
2.1 短文本相似度計算概念
2.1.1 短文本概述
2.1.2 文本向量化模型
2.2 中文分詞
2.3 深度學(xué)習(xí)
2.3.1 深度學(xué)習(xí)概述
2.3.2 深度學(xué)習(xí)模型
2.3.3 激活函數(shù)
2.3.4 優(yōu)化算法
2.3.5 Dropout
2.3.6 深度學(xué)習(xí)框架
2.4 依存句法分析以及向量化
2.5 本章小結(jié)
第三章 基于CNN的對稱字粒度交互序列算法
3.1 基于單字粒度對稱交互序列的建立
3.2 基于CNN的雙通道交互匹配特征提取
3.2.1 Siamese網(wǎng)絡(luò)模型和交互匹配模型
3.2.2 基于CNN的雙通道交互匹配特征提取
3.3 基于CNN的雙通道特征融合
3.4 本章小結(jié)
第四章 基于CNN的對稱字粒度交互序列算法的模型設(shè)計
4.1 輸入層設(shè)計
4.2 卷積層設(shè)計
4.3 雙通道特征提取層設(shè)計
4.4 輸出層設(shè)計
4.5 本章小結(jié)
第五章 實驗設(shè)計與結(jié)果分析
5.1 實驗相關(guān)模型設(shè)計
5.2 數(shù)據(jù)集
5.3 實驗設(shè)計及實驗結(jié)果分析
5.3.1 基于斯坦福推理數(shù)據(jù)集(2分類)的實驗設(shè)計及結(jié)果分析
5.3.2 基于Quora數(shù)據(jù)集的實驗設(shè)計及結(jié)果分析
5.3.3 BWIS-CNNs模型在不同學(xué)習(xí)率下的實驗結(jié)果分析
5.4 基于依存關(guān)系的模型設(shè)計與實驗結(jié)果分析
5.4.1 基于斯坦福推理數(shù)據(jù)集(2分類)的實驗結(jié)果分析
5.4.2 基于Quora數(shù)據(jù)集的實驗結(jié)果分析
5.5 綜合實驗結(jié)果及分析
5.6 實驗結(jié)論
5.7 本章小結(jié)
第六章 結(jié)論與展望
6.1 主要結(jié)論
6.2 研究展望
參考文獻
在學(xué)期間的研究成果
致謝
本文編號:3880830
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3880830.html
最近更新
教材專著