基于注意力機(jī)制的重復(fù)性問題檢測模型
發(fā)布時(shí)間:2024-03-24 01:08
近年來,隨著社區(qū)問答(Community Question Answering,CQA)網(wǎng)站的快速發(fā)展,CQA系統(tǒng)中積累了大量問題,這些問題中有很多是重復(fù)性問題,即有著相同的回答。在實(shí)際應(yīng)用中,如果能從CQA問題數(shù)據(jù)庫中快速檢測出與用戶所提問題相同的問題,那么這些問題的答案便可快速返回給用戶,滿足用戶對問答系統(tǒng)及時(shí)性等的需求。因此,如何檢測出CQA系統(tǒng)中的重復(fù)性問題是影響CQA發(fā)展的一個(gè)關(guān)鍵問題。本文針對CQA中的重復(fù)性問題檢測任務(wù),做了如下工作:1)大多已有的研究往往直接利用預(yù)訓(xùn)練的詞向量作為模型輸入,并沒有考慮到預(yù)訓(xùn)練詞向量沒有包含上下文信息的缺點(diǎn)。本文提出利用句子信息過濾詞向量中語義信息的方法,該方法可將詞向量中與上下文相關(guān)的信息提取出來,以增強(qiáng)詞向量中上下文相關(guān)的語義信息。2)本文提出一種基于孿生網(wǎng)絡(luò)的模型,在詞匹配過程中可以充分利用問題中詞與詞之間的相關(guān)信息。同時(shí),在句子表示過程中,本文基于結(jié)構(gòu)化注意力將傳統(tǒng)模型中僅僅由單一向量表示句子信息的方法轉(zhuǎn)化為多個(gè)向量表示,使得本文模型可以捕捉更多的句子信息。此外,本文提出了不同于原有模型中將句子單獨(dú)轉(zhuǎn)化為向量再匹配的方法,而是嘗試將...
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 選題背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 相關(guān)研究任務(wù)
1.2.2 相似性問題檢索研究現(xiàn)狀
1.2.3 可解釋性深度模型研究現(xiàn)狀
1.3 本文主要研究內(nèi)容
1.4 本文內(nèi)容安排
1.5 本章小結(jié)
第二章 預(yù)備知識(shí)和基礎(chǔ)理論
2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.1.1 循環(huán)神經(jīng)網(wǎng)絡(luò)基本原理
2.1.2 RNN的基本應(yīng)用
2.1.3 梯度消失與梯度爆炸
2.2 RNN的變體
2.2.1 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.2 長短期記憶網(wǎng)絡(luò)
2.2.3 Gated Recurrent Unit
2.3 注意力機(jī)制
2.4 孿生網(wǎng)絡(luò)
2.5 本章小結(jié)
第三章 基于注意力機(jī)制的重復(fù)性問題檢測模型
3.1 重復(fù)性問題檢測任務(wù)
3.1.1 重復(fù)性問題
3.1.2 相關(guān)任務(wù)
3.2 重復(fù)性問題檢測模型
3.2.1 模型基本框架
3.3 詞向量模型
3.3.1 詞向量
3.3.2 詞向量獲取
3.3.3 語義增強(qiáng)
3.4 詞匹配
3.4.1 基于注意力的匹配
3.4.2 匹配信息集成
3.5 句子匹配
3.5.1 結(jié)構(gòu)化自注意力機(jī)制
3.5.2 句子聯(lián)合表示
3.5.3 句子匹配
3.6 相似度判別
3.7 本章小結(jié)
第四章 實(shí)驗(yàn)與分析
4.1 數(shù)據(jù)集與數(shù)據(jù)處理
4.2 實(shí)驗(yàn)結(jié)果與對比分析
4.2.1 網(wǎng)絡(luò)參數(shù)設(shè)置
4.2.2 模型在各數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果
4.2.3 不同詞向量下模型測試結(jié)果
4.3 對比實(shí)驗(yàn)以及可解釋性
4.3.1 模型各個(gè)模塊分析
4.3.2 注意力機(jī)制的可視化
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作展望
參考文獻(xiàn)
附錄A 重復(fù)性問題數(shù)據(jù)示例
攻讀碩士學(xué)位期間參加的科研項(xiàng)目與取得的科研成果
致謝
本文編號(hào):3936738
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 選題背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 相關(guān)研究任務(wù)
1.2.2 相似性問題檢索研究現(xiàn)狀
1.2.3 可解釋性深度模型研究現(xiàn)狀
1.3 本文主要研究內(nèi)容
1.4 本文內(nèi)容安排
1.5 本章小結(jié)
第二章 預(yù)備知識(shí)和基礎(chǔ)理論
2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.1.1 循環(huán)神經(jīng)網(wǎng)絡(luò)基本原理
2.1.2 RNN的基本應(yīng)用
2.1.3 梯度消失與梯度爆炸
2.2 RNN的變體
2.2.1 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.2 長短期記憶網(wǎng)絡(luò)
2.2.3 Gated Recurrent Unit
2.3 注意力機(jī)制
2.4 孿生網(wǎng)絡(luò)
2.5 本章小結(jié)
第三章 基于注意力機(jī)制的重復(fù)性問題檢測模型
3.1 重復(fù)性問題檢測任務(wù)
3.1.1 重復(fù)性問題
3.1.2 相關(guān)任務(wù)
3.2 重復(fù)性問題檢測模型
3.2.1 模型基本框架
3.3 詞向量模型
3.3.1 詞向量
3.3.2 詞向量獲取
3.3.3 語義增強(qiáng)
3.4 詞匹配
3.4.1 基于注意力的匹配
3.4.2 匹配信息集成
3.5 句子匹配
3.5.1 結(jié)構(gòu)化自注意力機(jī)制
3.5.2 句子聯(lián)合表示
3.5.3 句子匹配
3.6 相似度判別
3.7 本章小結(jié)
第四章 實(shí)驗(yàn)與分析
4.1 數(shù)據(jù)集與數(shù)據(jù)處理
4.2 實(shí)驗(yàn)結(jié)果與對比分析
4.2.1 網(wǎng)絡(luò)參數(shù)設(shè)置
4.2.2 模型在各數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果
4.2.3 不同詞向量下模型測試結(jié)果
4.3 對比實(shí)驗(yàn)以及可解釋性
4.3.1 模型各個(gè)模塊分析
4.3.2 注意力機(jī)制的可視化
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作展望
參考文獻(xiàn)
附錄A 重復(fù)性問題數(shù)據(jù)示例
攻讀碩士學(xué)位期間參加的科研項(xiàng)目與取得的科研成果
致謝
本文編號(hào):3936738
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3936738.html
最近更新
教材專著