基于文本檢索的深度關(guān)聯(lián)匹配模型算法的研究與改進(jìn)
發(fā)布時(shí)間:2023-05-06 23:12
隨著網(wǎng)絡(luò)通信以及電子商務(wù)的高速發(fā)展,互聯(lián)網(wǎng)已成為人們生活與工作獲取信息的重要途徑。對(duì)于互聯(lián)網(wǎng)這個(gè)巨大的資源庫,若缺乏有效的檢索工具,人們很難從其中檢索出自身所需的信息。為了提升檢索有效信息的速度,減少人們檢索信息的難度,信息檢索系統(tǒng)由此而生。文本匹配在信息檢索系統(tǒng)中占領(lǐng)著重要地位。在文本匹配過程中,存在“匹配失誤”問題,“匹配失誤”即兩段文本由不同詞表示同一意義時(shí),模型不能判斷其相似意義而導(dǎo)致的匹配錯(cuò)誤。針對(duì)這個(gè)問題,目前大部分的研究工作均是通過增加查詢?cè)~或文檔詞的近義詞拓展文本,用于增加查詢?cè)~與文檔的匹配概率,以此緩解“匹配失誤”問題,該方法能夠在一定程度上解決匹配失誤問題,但計(jì)算量大且需要耗費(fèi)巨大的資源庫;在深度學(xué)習(xí)中,研究學(xué)者利用詞嵌入對(duì)近義詞的相似度進(jìn)行計(jì)算,但詞與詞的相似度仍存在偏差,因此也不能夠很好地緩解“匹配失誤”問題。針對(duì)文本匹配中的匹配失誤問題,本文提出以下兩個(gè)模型:(1)A Deep Top-K Relevance Matching Model(DTMM)模型,該模型的貢獻(xiàn)是將文檔詞權(quán)重加入模型,以此緩解“匹配失誤”問題。由于并非所有信號(hào)量都利于文本檢索,模型將著重...
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.1.1 文本檢索的廣泛運(yùn)用
1.1.2 文本檢索挑戰(zhàn)
1.1.3 選題意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)文本匹配模型
1.2.2 深度學(xué)習(xí)文本匹配模型
1.3 現(xiàn)有模型存在的問題
1.4 創(chuàng)新點(diǎn)和技術(shù)路線
1.4.1 模型創(chuàng)新點(diǎn)
1.4.2 技術(shù)路線
1.5 本章小結(jié)
2 深度學(xué)習(xí)文本檢索模型進(jìn)展
2.1 深度學(xué)習(xí)文本索模型概述
2.2 文本檢索模型的模型分析
2.2.1 基于全連接神經(jīng)網(wǎng)絡(luò)的模型
2.2.2 基于卷積神經(jīng)網(wǎng)絡(luò)
2.2.3 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的模型
2.2.4 基于多語義文檔表達(dá)的深度學(xué)習(xí)模型
2.3 文本檢索模型的性能分析
2.4 本章小結(jié)
3 基于文本檢索的深度關(guān)聯(lián)匹配模型算法(DTMM)的研究
3.1 概述
3.2 模型介紹
3.3 模型相關(guān)工作
3.4 模型結(jié)構(gòu)
3.4.1 交互矩陣層
3.4.2 K-MAX池化層
3.4.3 多層神經(jīng)網(wǎng)絡(luò)
3.4.4 損失函數(shù)
3.5 DTMM模型實(shí)驗(yàn)與性能分析
3.5.1 數(shù)據(jù)集
3.5.2 基準(zhǔn)方法
3.5.3 實(shí)施細(xì)節(jié)
3.5.4 評(píng)估結(jié)果
3.5.5 DTMM不同版本的比較
3.5.6 DTMM在不同K-MAX池化層上的性能
3.6 本章小結(jié)
4 基于知識(shí)圖譜檢索模型的性能研究
4.1 概述
4.2 知識(shí)圖譜研究與實(shí)體詞向量的生成
4.2.1 知識(shí)圖譜定義
4.2.2 Deepwalk介紹
4.2.3 結(jié)合知識(shí)圖譜與Deepwalk模型構(gòu)造實(shí)體詞向量
4.2.4 運(yùn)用SkipGram構(gòu)造實(shí)體詞向量
4.3 知識(shí)圖譜檢索模型
4.3.1 利用實(shí)體向量拓展文本信息
4.4 模型實(shí)驗(yàn)與性能分析
4.4.1 數(shù)據(jù)集
4.4.2 參數(shù)設(shè)置
4.4.3 模型性能對(duì)比
4.5 本章小結(jié)
5 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
個(gè)人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文及取得的研究成果
本文編號(hào):3809780
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.1.1 文本檢索的廣泛運(yùn)用
1.1.2 文本檢索挑戰(zhàn)
1.1.3 選題意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)文本匹配模型
1.2.2 深度學(xué)習(xí)文本匹配模型
1.3 現(xiàn)有模型存在的問題
1.4 創(chuàng)新點(diǎn)和技術(shù)路線
1.4.1 模型創(chuàng)新點(diǎn)
1.4.2 技術(shù)路線
1.5 本章小結(jié)
2 深度學(xué)習(xí)文本檢索模型進(jìn)展
2.1 深度學(xué)習(xí)文本索模型概述
2.2 文本檢索模型的模型分析
2.2.1 基于全連接神經(jīng)網(wǎng)絡(luò)的模型
2.2.2 基于卷積神經(jīng)網(wǎng)絡(luò)
2.2.3 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的模型
2.2.4 基于多語義文檔表達(dá)的深度學(xué)習(xí)模型
2.3 文本檢索模型的性能分析
2.4 本章小結(jié)
3 基于文本檢索的深度關(guān)聯(lián)匹配模型算法(DTMM)的研究
3.1 概述
3.2 模型介紹
3.3 模型相關(guān)工作
3.4 模型結(jié)構(gòu)
3.4.1 交互矩陣層
3.4.2 K-MAX池化層
3.4.3 多層神經(jīng)網(wǎng)絡(luò)
3.4.4 損失函數(shù)
3.5 DTMM模型實(shí)驗(yàn)與性能分析
3.5.1 數(shù)據(jù)集
3.5.2 基準(zhǔn)方法
3.5.3 實(shí)施細(xì)節(jié)
3.5.4 評(píng)估結(jié)果
3.5.5 DTMM不同版本的比較
3.5.6 DTMM在不同K-MAX池化層上的性能
3.6 本章小結(jié)
4 基于知識(shí)圖譜檢索模型的性能研究
4.1 概述
4.2 知識(shí)圖譜研究與實(shí)體詞向量的生成
4.2.1 知識(shí)圖譜定義
4.2.2 Deepwalk介紹
4.2.3 結(jié)合知識(shí)圖譜與Deepwalk模型構(gòu)造實(shí)體詞向量
4.2.4 運(yùn)用SkipGram構(gòu)造實(shí)體詞向量
4.3 知識(shí)圖譜檢索模型
4.3.1 利用實(shí)體向量拓展文本信息
4.4 模型實(shí)驗(yàn)與性能分析
4.4.1 數(shù)據(jù)集
4.4.2 參數(shù)設(shè)置
4.4.3 模型性能對(duì)比
4.5 本章小結(jié)
5 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
個(gè)人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文及取得的研究成果
本文編號(hào):3809780
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3809780.html
最近更新
教材專著