基于深度學習的句子相似度計算方法研究
發(fā)布時間:2024-07-08 18:56
隨著計算機的普及,人們習慣于使用互聯(lián)網來獲取所需要的信息,但是由于數(shù)字信息是以指數(shù)形式逐年遞增。人們在使用搜索引擎時,搜索引擎只能返回相關信息的鏈接或者包含答案內容的大段文本資料,用戶想要獲取有用的信息還要進行二次篩選,搜索引擎已經無法滿足大多數(shù)人的需求。但問答系統(tǒng)反饋給用戶的答案不是一大堆相關的文檔或者是相關的鏈接,而是更加精確的答案,這樣更加符合用戶的需求。問答系統(tǒng)的關鍵技術就是問句相似度處理,傳統(tǒng)的相似度研究方法無法有效捕獲句子的語義信息,而且匹配的準確度不高。深度學習中的卷積神經網絡可以對句子特征進行有效提取,循環(huán)神經網絡可以捕獲句子的上下文信息,兩種方法都可以很好的捕獲句子的語義信息,并且使用深度學習的句子相似度準確度更高。本文對深度學習中卷積神經網絡(CNN)和循環(huán)神經網絡(RNN)在文本處理上的優(yōu)缺點做了對比。結合深度學習的相關知識著重研究了深度匹配語義模型,并對基于卷積神經網絡的語義匹配模型展開研究,在池化層使用k-max均值采樣,提出了基于k-max均值采樣技術的句子相似度算法,通過與原模型進行實驗對比,得出本文所用方法的精確度更高。在實驗研究的過程中發(fā)現(xiàn)該方式存在無...
【文章頁數(shù)】:55 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4003726
【文章頁數(shù)】:55 頁
【學位級別】:碩士
【部分圖文】:
圖2.1二維空間余弦距離
被稱為歐氏距離),指在m維空間中兩個的距離。假設x,y是空間中的兩個點,2(,)()iidistxyxyx,y的坐標值。當使用歐氏距離表示相1(,)1(,)distxysimxy向量的常用方法[36],主要是通過計算兩向量之間的相似度,當余弦值越接近1....
圖2.3神經元其中、、……、是輸入項,、、……、代表權重,為偏置項,f(z)為
圖2.3神經元、、……、是輸入項,、、……、代表權重,為偏置神經元輸出如式(2.5)。(......)11220yfwxwxwxwnn所有的神經元連接組合在一起便是一個神經網絡。神經網絡紀60年代,Hubei等人在研究視覺皮層時,發(fā)現(xiàn)視覺信息從視網多....
圖2.4池化操作中的最大池化和平均池化
并且成功證明了神經網絡深度的提升也對提升分類絡的核心思想是局部感知與權值共享,典型的卷積神經網絡池化層、全連接層和輸出層五部分組成。作比較簡單,就是對原始的數(shù)據(jù)進行預處理,并將處理好的積神經網絡中最關鍵的一層,卷積層的運行原理就是將輸入的神經元相連。積層提取到不同的特征之后進入池....
圖2.5循環(huán)神經網絡結構圖
即隱藏層的輸入不僅包含當前的輸入內容還包含上一層隱藏層的內容,循環(huán)神經網絡如圖2.5。圖2.5循環(huán)神經網絡結構圖算式(2.6)是輸出層的計算公式,輸出層是一個全連接層,意味著它的每個節(jié)點與隱藏層的每個節(jié)點都是相互連接的,輸出層的權重矩陣用V表示,激活函數(shù)用g表示。算式....
本文編號:4003726
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4003726.html
上一篇:單源SimRank計算優(yōu)化及其在協(xié)同過濾中的應用
下一篇:沒有了
下一篇:沒有了
最近更新
教材專著