天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向大規(guī)模知識庫的開放域問題生成技術研究

發(fā)布時間:2024-02-13 23:38
  基于知識庫的問題生成任務旨在于生成可以由一個三元組回答的簡單問題,與基于知識庫的問答系統(tǒng)的任務目標相反;谥R庫的問答系統(tǒng)的輸入為自然語言形式的疑問句,根據知識庫中大量三元組推斷出問題的答案。使用知識庫來回答問題需要大量標簽問答對,然而制作一個大規(guī)模、精確的標準數據集非常昂貴,還會受領域等因素的限制。為了減少標注工作量,問題生成被提出,并受到了工業(yè)界和學術界越來越多的關注。然而,基于知識庫的問題生成也存在許多挑戰(zhàn),比如三元組中存在大量低頻詞導致OOV(Out of Vocabulary)問題,而且模型的輸入僅為一個缺乏背景信息的三元組,生成的問題缺乏多樣性。因此,本文將探討基于大規(guī)模知識庫的開放域問題生成算法,從包含答案的三元組入手,反向生成適當的、信息量豐富的問題句。本文的主要工作如下:為了解決因大量低頻詞造成的OOV問題,本文在生成框架上融入Copy機制。由于Copy機制內部計算存在一些缺陷,導致一般常用詞匯的預測受到弱化,故本文對Copy機制進行了改善,構建出一個基于Attention-Copy機制的問題生成模型(AC-KBQG),在解決OOV問題時加強整體詞匯生成效果。在多次...

【文章頁數】:62 頁

【學位級別】:碩士

【部分圖文】:

圖2.4所示,其中V表示第/(e??N)個堆疊塊的輸出結果

圖2.4所示,其中V表示第/(e??N)個堆疊塊的輸出結果

MASTER'S?THESIS??構成,本質也是一個Encoder-Decoder的結構,在十多個自然語言處理任務中獲??得突破,這也證明了?Attention機制的有效性,本文也將其融入到QG任務中。最??初,Transformer用于機器翻譯任務,隨著其有效性,如今逐步代替主....


圖3.3基于Attention-Copy機制的解碼層結構??與編碼端一致,解碼端也基于LSTM進行解碼

圖3.3基于Attention-Copy機制的解碼層結構??與編碼端一致,解碼端也基于LSTM進行解碼

??y.i?-???'(?i??'?一丨???一一一一???、?l?l?:???1?a?—r???Decoder?Selectiver^^???(X)^?““????Readfcr?Lj?—?LSTM???(?Attention'??y_J?^??MPMamb?oddSodo??....


圖4.1本章模型框架??33??

圖4.1本章模型框架??33??

Cj^k}項士學位論文??MASTER'S?THESIS??并且還使用BERT預訓練模型獲得詞語的語義表示。與Seq2Seq模型結合,從而??較好的解決三元組所缺乏的上下文信息,以獲得更準確的潛在語義,使得模型生??成的問題更加豐富流暢。??4.2模型結構??本節(jié)將介紹基于Gra....


圖4.2所示的網絡塊中堆疊L次,在輸入殘??差網絡之前進行拼接

圖4.2所示的網絡塊中堆疊L次,在輸入殘??差網絡之前進行拼接

基于Transformer結構,在全局圖的背景語義下進一步捕捉主語實體、關系、賓??語實體之間的關聯(lián),使作為輸入的三元組具有更加符合本任務的語義粒度表示。??Vaswani等人提出的Transformer結構,通過全局上下文建模的多頭自注意力機制??來實現(xiàn)高效且并行的計算,具有并....



本文編號:3897394

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3897394.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶02e5f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com