天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于注意力機制的重復性問題檢測模型

發(fā)布時間:2024-03-24 01:08
  近年來,隨著社區(qū)問答(Community Question Answering,CQA)網(wǎng)站的快速發(fā)展,CQA系統(tǒng)中積累了大量問題,這些問題中有很多是重復性問題,即有著相同的回答。在實際應用中,如果能從CQA問題數(shù)據(jù)庫中快速檢測出與用戶所提問題相同的問題,那么這些問題的答案便可快速返回給用戶,滿足用戶對問答系統(tǒng)及時性等的需求。因此,如何檢測出CQA系統(tǒng)中的重復性問題是影響CQA發(fā)展的一個關鍵問題。本文針對CQA中的重復性問題檢測任務,做了如下工作:1)大多已有的研究往往直接利用預訓練的詞向量作為模型輸入,并沒有考慮到預訓練詞向量沒有包含上下文信息的缺點。本文提出利用句子信息過濾詞向量中語義信息的方法,該方法可將詞向量中與上下文相關的信息提取出來,以增強詞向量中上下文相關的語義信息。2)本文提出一種基于孿生網(wǎng)絡的模型,在詞匹配過程中可以充分利用問題中詞與詞之間的相關信息。同時,在句子表示過程中,本文基于結構化注意力將傳統(tǒng)模型中僅僅由單一向量表示句子信息的方法轉化為多個向量表示,使得本文模型可以捕捉更多的句子信息。此外,本文提出了不同于原有模型中將句子單獨轉化為向量再匹配的方法,而是嘗試將...

【文章頁數(shù)】:76 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 選題背景
    1.2 國內外研究現(xiàn)狀
        1.2.1 相關研究任務
        1.2.2 相似性問題檢索研究現(xiàn)狀
        1.2.3 可解釋性深度模型研究現(xiàn)狀
    1.3 本文主要研究內容
    1.4 本文內容安排
    1.5 本章小結
第二章 預備知識和基礎理論
    2.1 循環(huán)神經網(wǎng)絡
        2.1.1 循環(huán)神經網(wǎng)絡基本原理
        2.1.2 RNN的基本應用
        2.1.3 梯度消失與梯度爆炸
    2.2 RNN的變體
        2.2.1 雙向循環(huán)神經網(wǎng)絡
        2.2.2 長短期記憶網(wǎng)絡
        2.2.3 Gated Recurrent Unit
    2.3 注意力機制
    2.4 孿生網(wǎng)絡
    2.5 本章小結
第三章 基于注意力機制的重復性問題檢測模型
    3.1 重復性問題檢測任務
        3.1.1 重復性問題
        3.1.2 相關任務
    3.2 重復性問題檢測模型
        3.2.1 模型基本框架
    3.3 詞向量模型
        3.3.1 詞向量
        3.3.2 詞向量獲取
        3.3.3 語義增強
    3.4 詞匹配
        3.4.1 基于注意力的匹配
        3.4.2 匹配信息集成
    3.5 句子匹配
        3.5.1 結構化自注意力機制
        3.5.2 句子聯(lián)合表示
        3.5.3 句子匹配
    3.6 相似度判別
    3.7 本章小結
第四章 實驗與分析
    4.1 數(shù)據(jù)集與數(shù)據(jù)處理
    4.2 實驗結果與對比分析
        4.2.1 網(wǎng)絡參數(shù)設置
        4.2.2 模型在各數(shù)據(jù)集上的實驗結果
        4.2.3 不同詞向量下模型測試結果
    4.3 對比實驗以及可解釋性
        4.3.1 模型各個模塊分析
        4.3.2 注意力機制的可視化
    4.4 本章小結
第五章 總結與展望
    5.1 本文工作總結
    5.2 未來工作展望
參考文獻
附錄A 重復性問題數(shù)據(jù)示例
攻讀碩士學位期間參加的科研項目與取得的科研成果
致謝



本文編號:3936738

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3936738.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶91e4a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com