基于神經(jīng)網(wǎng)絡(luò)的中文多文本閱讀理解模型研究
發(fā)布時(shí)間:2021-04-14 16:09
機(jī)器閱讀理解是自然語(yǔ)言處理領(lǐng)域重要的研究方向,根據(jù)提供的文本數(shù)量,可以分為單文本閱讀理解模型和多本文閱讀理解模型,鑒于后者具有更高的挑戰(zhàn)性和實(shí)際應(yīng)用價(jià)值,本文專注于多文本閱讀理解模型在中文閱讀理解數(shù)據(jù)集的研究,模型的架構(gòu)包括段落選擇器和文本閱讀器。對(duì)于給定的問(wèn)題、文檔和參考答案,首先,通過(guò)段落選擇器從文檔中選出與參考答案相關(guān)性較高的段落,然后,文本閱讀器在選擇的段落上完成閱讀工作,并預(yù)測(cè)出答案的范圍。針對(duì)段落選擇器和文本閱讀器的任務(wù),本文的主要研究工作包括:1、提出兩種基于卷積神經(jīng)網(wǎng)絡(luò)的段落選擇器,分別是二分類版本和多分類版本。兩種選擇器均將段落選擇轉(zhuǎn)化為分類的任務(wù),首先,預(yù)訓(xùn)練問(wèn)題和段落中單詞的詞向量,然后,使用雙向長(zhǎng)短時(shí)記憶網(wǎng)路分別對(duì)問(wèn)題、段落中的上下文信息進(jìn)行編碼,接著,使用注意力機(jī)制層匹配問(wèn)題和段落的語(yǔ)義信息,強(qiáng)調(diào)與問(wèn)題相關(guān)性高的段落內(nèi)容。下一步,使用卷積神經(jīng)網(wǎng)絡(luò)提取段落中重要的特征,生成段落的特征向量。最后,二分類版選擇器使用段落特征向量預(yù)測(cè)段落包含答案的概率,選擇概率較高的段落;多分類版選擇器進(jìn)一步計(jì)算段落與問(wèn)題的語(yǔ)義相似度,選擇相似度較高的段落。2、對(duì)于文本閱讀器任務(wù),實(shí)...
【文章來(lái)源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-2循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??
圖2-3?LSTM網(wǎng)絡(luò)結(jié)構(gòu)1351??
圖2-5最大池化層??
本文編號(hào):3137617
【文章來(lái)源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-2循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖??
圖2-3?LSTM網(wǎng)絡(luò)結(jié)構(gòu)1351??
圖2-5最大池化層??
本文編號(hào):3137617
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3137617.html
最近更新
教材專著