選擇題型機(jī)器閱讀理解的研究
發(fā)布時(shí)間:2021-02-27 01:04
機(jī)器閱讀理解是測(cè)評(píng)機(jī)器對(duì)自然語(yǔ)言文本理解能力的重要任務(wù),是人工智能水平的一個(gè)重要標(biāo)志。選擇題型機(jī)器閱讀理解是給出文章和問(wèn)題,讓機(jī)器從多個(gè)答案候選項(xiàng)中選擇出正確答案。這些答案候選項(xiàng)通常不是給定文章中的文本片段,而是根據(jù)文章內(nèi)容改寫的表述、總結(jié)歸納,甚至需要對(duì)文章或借助外部常識(shí)知識(shí)進(jìn)行推理獲得的信息,因此該任務(wù)有較高的語(yǔ)義理解要求。本文從語(yǔ)義匹配、語(yǔ)義推理和外部知識(shí)輔助三個(gè)方面研究選擇題型的機(jī)器閱讀理解任務(wù)。本文采用一個(gè)魯棒性強(qiáng)的Co-Matching模型作為基礎(chǔ)模型,該模型在交互層中將問(wèn)題和候選項(xiàng)分別與文章進(jìn)行同時(shí)匹配。但該模型有兩個(gè)不足,一是語(yǔ)義匹配方式不夠全面,未考慮到問(wèn)題和候選項(xiàng)之間往往存在信息互補(bǔ),二是缺乏語(yǔ)義推理。因此,本文第一個(gè)工作增加了問(wèn)題與候選項(xiàng)的互補(bǔ)信息,并將其與文章進(jìn)行語(yǔ)義匹配,實(shí)驗(yàn)結(jié)果表明此改進(jìn)有助于提高模型的語(yǔ)義匹配能力。通常選擇題型任務(wù)的答案不是原文片段,模型往往需要深入理解文本含義,進(jìn)行語(yǔ)義推理。因此,針對(duì)Co-Matching模型的第二個(gè)不足,本文第二個(gè)工作是在第一個(gè)工作進(jìn)行語(yǔ)義匹配的基礎(chǔ)上提出并增加兩種多步推理方法。為了使每一步推理不僅只依賴前一步的結(jié)果,...
【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
來(lái)自數(shù)據(jù)集CBTest的典型完形填空任務(wù)數(shù)據(jù)樣例
華東師范大學(xué)碩士學(xué)位論文第一章緒論4圖1-2來(lái)自數(shù)據(jù)集SQuAD的典型片段抽取型任務(wù)數(shù)據(jù)樣例圖1.2.3選擇題型選擇題型機(jī)器閱讀理解是指給定一篇文章、問(wèn)題以及問(wèn)題對(duì)應(yīng)的候選項(xiàng)集合,集合中存在若干答案候選項(xiàng),機(jī)器需從候選項(xiàng)集合中選擇出正確的答案。選擇題型機(jī)器閱讀理解任務(wù)可用符號(hào)表示正式定義如下:給機(jī)器一條三元組數(shù)據(jù)樣例,,OPQD,其中D表示一篇文章,Q表示問(wèn)題,OP表示答案候選項(xiàng)集合,機(jī)器需從答案候選項(xiàng)集合OP中選擇正確的候選項(xiàng)作為預(yù)測(cè)答案輸出。典型的選擇題型數(shù)據(jù)集有MCTest[6]、RACE[7]和MCScript[8]等。圖1-3中展示了一個(gè)來(lái)源于MCScript數(shù)據(jù)集,需外部知識(shí)輔助的選擇題型數(shù)據(jù)樣例,問(wèn)題詢問(wèn)種樹(shù)工具,但整篇文章都未明確提到種樹(shù)工具,只說(shuō)明種樹(shù)過(guò)程中挖洞(下劃線句子),模型需要知道鏟子可以用來(lái)挖洞這一外部知識(shí)才方便選出正確答案。圖1-3來(lái)自數(shù)據(jù)集MCScript的典型選擇題型任務(wù)數(shù)據(jù)樣例圖
華東師范大學(xué)碩士學(xué)位論文第一章緒論4圖1-2來(lái)自數(shù)據(jù)集SQuAD的典型片段抽取型任務(wù)數(shù)據(jù)樣例圖1.2.3選擇題型選擇題型機(jī)器閱讀理解是指給定一篇文章、問(wèn)題以及問(wèn)題對(duì)應(yīng)的候選項(xiàng)集合,集合中存在若干答案候選項(xiàng),機(jī)器需從候選項(xiàng)集合中選擇出正確的答案。選擇題型機(jī)器閱讀理解任務(wù)可用符號(hào)表示正式定義如下:給機(jī)器一條三元組數(shù)據(jù)樣例,,OPQD,其中D表示一篇文章,Q表示問(wèn)題,OP表示答案候選項(xiàng)集合,機(jī)器需從答案候選項(xiàng)集合OP中選擇正確的候選項(xiàng)作為預(yù)測(cè)答案輸出。典型的選擇題型數(shù)據(jù)集有MCTest[6]、RACE[7]和MCScript[8]等。圖1-3中展示了一個(gè)來(lái)源于MCScript數(shù)據(jù)集,需外部知識(shí)輔助的選擇題型數(shù)據(jù)樣例,問(wèn)題詢問(wèn)種樹(shù)工具,但整篇文章都未明確提到種樹(shù)工具,只說(shuō)明種樹(shù)過(guò)程中挖洞(下劃線句子),模型需要知道鏟子可以用來(lái)挖洞這一外部知識(shí)才方便選出正確答案。圖1-3來(lái)自數(shù)據(jù)集MCScript的典型選擇題型任務(wù)數(shù)據(jù)樣例圖
本文編號(hào):3053445
【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:82 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
來(lái)自數(shù)據(jù)集CBTest的典型完形填空任務(wù)數(shù)據(jù)樣例
華東師范大學(xué)碩士學(xué)位論文第一章緒論4圖1-2來(lái)自數(shù)據(jù)集SQuAD的典型片段抽取型任務(wù)數(shù)據(jù)樣例圖1.2.3選擇題型選擇題型機(jī)器閱讀理解是指給定一篇文章、問(wèn)題以及問(wèn)題對(duì)應(yīng)的候選項(xiàng)集合,集合中存在若干答案候選項(xiàng),機(jī)器需從候選項(xiàng)集合中選擇出正確的答案。選擇題型機(jī)器閱讀理解任務(wù)可用符號(hào)表示正式定義如下:給機(jī)器一條三元組數(shù)據(jù)樣例,,OPQD,其中D表示一篇文章,Q表示問(wèn)題,OP表示答案候選項(xiàng)集合,機(jī)器需從答案候選項(xiàng)集合OP中選擇正確的候選項(xiàng)作為預(yù)測(cè)答案輸出。典型的選擇題型數(shù)據(jù)集有MCTest[6]、RACE[7]和MCScript[8]等。圖1-3中展示了一個(gè)來(lái)源于MCScript數(shù)據(jù)集,需外部知識(shí)輔助的選擇題型數(shù)據(jù)樣例,問(wèn)題詢問(wèn)種樹(shù)工具,但整篇文章都未明確提到種樹(shù)工具,只說(shuō)明種樹(shù)過(guò)程中挖洞(下劃線句子),模型需要知道鏟子可以用來(lái)挖洞這一外部知識(shí)才方便選出正確答案。圖1-3來(lái)自數(shù)據(jù)集MCScript的典型選擇題型任務(wù)數(shù)據(jù)樣例圖
華東師范大學(xué)碩士學(xué)位論文第一章緒論4圖1-2來(lái)自數(shù)據(jù)集SQuAD的典型片段抽取型任務(wù)數(shù)據(jù)樣例圖1.2.3選擇題型選擇題型機(jī)器閱讀理解是指給定一篇文章、問(wèn)題以及問(wèn)題對(duì)應(yīng)的候選項(xiàng)集合,集合中存在若干答案候選項(xiàng),機(jī)器需從候選項(xiàng)集合中選擇出正確的答案。選擇題型機(jī)器閱讀理解任務(wù)可用符號(hào)表示正式定義如下:給機(jī)器一條三元組數(shù)據(jù)樣例,,OPQD,其中D表示一篇文章,Q表示問(wèn)題,OP表示答案候選項(xiàng)集合,機(jī)器需從答案候選項(xiàng)集合OP中選擇正確的候選項(xiàng)作為預(yù)測(cè)答案輸出。典型的選擇題型數(shù)據(jù)集有MCTest[6]、RACE[7]和MCScript[8]等。圖1-3中展示了一個(gè)來(lái)源于MCScript數(shù)據(jù)集,需外部知識(shí)輔助的選擇題型數(shù)據(jù)樣例,問(wèn)題詢問(wèn)種樹(shù)工具,但整篇文章都未明確提到種樹(shù)工具,只說(shuō)明種樹(shù)過(guò)程中挖洞(下劃線句子),模型需要知道鏟子可以用來(lái)挖洞這一外部知識(shí)才方便選出正確答案。圖1-3來(lái)自數(shù)據(jù)集MCScript的典型選擇題型任務(wù)數(shù)據(jù)樣例圖
本文編號(hào):3053445
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3053445.html
最近更新
教材專著