基于迷惑度的錯(cuò)誤選項(xiàng)自動(dòng)生成算法研究
發(fā)布時(shí)間:2021-12-29 22:36
選擇類型的題目是人們?cè)O(shè)計(jì)各類考試或問答節(jié)目的常見形式。人們?cè)谠O(shè)計(jì)有多個(gè)選項(xiàng)的選擇題時(shí),需要同時(shí)給出正確選項(xiàng)和若干迷惑選項(xiàng)。迷惑選項(xiàng)在確保自身錯(cuò)誤性的同時(shí),還需與問題或正確選項(xiàng)具備一定的語義相關(guān)性以保證其迷惑性。錯(cuò)誤性和相關(guān)性的雙重要求使得迷惑選項(xiàng)的設(shè)計(jì)通常需要人們花費(fèi)大量的時(shí)間和精力。因此,如果能夠設(shè)計(jì)一種算法針對(duì)給定的問題自動(dòng)生成若干可供選擇的迷惑選項(xiàng),將有效提高人們?cè)O(shè)計(jì)選擇題的效率。傳統(tǒng)的自動(dòng)問答系統(tǒng)(Automatic Question Answering System,QA)能夠根據(jù)用戶提出的自然語言形式的問題返回給用戶簡潔的、自然語言形式的正確答案。但問答系統(tǒng)技術(shù)僅關(guān)注正確答案的生成,很難提供錯(cuò)誤選項(xiàng)。本文針對(duì)單選類型的選擇題,提出了用于評(píng)價(jià)迷惑選項(xiàng)的迷惑度。迷惑度表示在給定問題和一個(gè)正確選項(xiàng)的前提下,一個(gè)錯(cuò)誤選項(xiàng)被測試者可能判斷為正確選項(xiàng)的程度。在此基礎(chǔ)之上,本文進(jìn)而設(shè)計(jì)了一種基于迷惑度的迷惑選項(xiàng)生成算法(Generation of Confusing Options based on Confusion Degree,COG)。該算法使用深度學(xué)習(xí)技術(shù),從迷惑選項(xiàng)與問題之間...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
迷惑選&WordNetGloVeNER
南京郵電大學(xué)碩士研究生學(xué)位論文第三章基于迷惑度的錯(cuò)誤選項(xiàng)自動(dòng)生成21度值。用WordNet、GloVe和NER[65]計(jì)算數(shù)據(jù)庫中答案的語義相關(guān)度;最后,通過選擇機(jī)制選出迷惑度最高的選項(xiàng),并與正確答案和問題相結(jié)合形成多項(xiàng)選擇題。圖3.1迷惑選項(xiàng)生成模型圖迷惑選項(xiàng)生成模型結(jié)構(gòu)圖如圖3.1所示。用戶輸入任意問題后,通過QA系統(tǒng)的候選答案集生成迷惑選項(xiàng)以及問題的數(shù)據(jù)集。對(duì)數(shù)據(jù)集里的迷惑選項(xiàng)采用WordNet、GloVe、NER三種方法計(jì)算語義相關(guān)度,將這三種方法所算得的三個(gè)語義相關(guān)度進(jìn)行加權(quán)得出一個(gè)最終的迷惑度值。最后通過選擇機(jī)制選出迷惑度最高的前幾個(gè)迷惑選項(xiàng)與正確答案和問題相結(jié)合生成選擇題。3.3.2迷惑度算法考慮到3.2.2節(jié)所提到的迷惑度計(jì)算的三個(gè)因素:迷惑選項(xiàng)和問題之間的語義相關(guān)度、迷惑選項(xiàng)和正確答案之間的語義相關(guān)度以及迷惑選項(xiàng)的類型和正確答案的類型是否匹配,就可以進(jìn)行迷惑度計(jì)算公式的設(shè)計(jì)。如果將迷惑選項(xiàng)和問題之間的語義相關(guān)度的值設(shè)置為),迷惑選項(xiàng)和正確答案之間的語義相關(guān)度的值設(shè)置為*,運(yùn)用NER判斷的迷惑選項(xiàng)和正確答案是否屬于同一類別的值設(shè)置為N。那么可以設(shè)計(jì)出如式3.1所示迷惑度計(jì)算公式:Con=[)+(1)*](3.1)式3.1中,參數(shù)的最合適的取值需要通過進(jìn)一步的實(shí)驗(yàn)來確定。&WordNetGloVeNERTopN
WN1&GV2迷惑度對(duì)比曲線圖
【參考文獻(xiàn)】:
期刊論文
[1]基于word2vec的網(wǎng)站主題分類研究[J]. 程元堃,蔣言,程光. 計(jì)算機(jī)與數(shù)字工程. 2019(01)
[2]基于詞向量特征擴(kuò)展的中文短文本分類研究[J]. 雷朔,劉旭敏,徐維祥. 計(jì)算機(jī)應(yīng)用與軟件. 2018(08)
[3]基于Word2Vec的中文短文本分類問題研究[J]. 汪靜,羅浪,王德強(qiáng). 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(05)
[4]文本相似度計(jì)算方法研究綜述[J]. 陳二靜,姜恩波. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2017(06)
[5]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春. 計(jì)算機(jī)科學(xué). 2016(06)
[6]基于TFIDF算法的關(guān)鍵詞提取方法[J]. 章志華,陸海良,郁鋼. 信息技術(shù)與信息化. 2015(08)
[7]基于TF統(tǒng)計(jì)和語法分析的關(guān)鍵詞提取算法[J]. 戰(zhàn)學(xué)剛,吳強(qiáng). 計(jì)算機(jī)應(yīng)用與軟件. 2014(01)
[8]WordNet中的綜合概念語義相似度計(jì)算方法[J]. 王桐,王磊,吳吉義,徐賀. 北京郵電大學(xué)學(xué)報(bào). 2013(02)
[9]Web問答系統(tǒng)中問句理解的研究[J]. 蘇斐,高德利,葉晨. 測試技術(shù)學(xué)報(bào). 2012(03)
[10]基于概念間邊權(quán)重的概念相似性計(jì)算方法[J]. 馮永,張洋. 計(jì)算機(jī)應(yīng)用. 2012(01)
碩士論文
[1]面向關(guān)聯(lián)數(shù)據(jù)的實(shí)體對(duì)齊方法研究[D]. 李琳.北京化工大學(xué) 2017
[2]基于word2vec詞向量的文本分類研究[D]. 朱磊.西南大學(xué) 2017
[3]自動(dòng)問答系統(tǒng)的研究與實(shí)現(xiàn)[D]. 李清.安徽大學(xué) 2012
[4]漢語句子相似度計(jì)算及其在自動(dòng)問答系統(tǒng)中的應(yīng)用[D]. 吳全娥.西南大學(xué) 2011
[5]基于課程知識(shí)的問答系統(tǒng)研究與應(yīng)用[D]. 劉祥.大連海事大學(xué) 2010
[6]相似度計(jì)算在基于本體的自動(dòng)問答系統(tǒng)中的應(yīng)用[D]. 楊志國.中央民族大學(xué) 2010
本文編號(hào):3556971
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
迷惑選&WordNetGloVeNER
南京郵電大學(xué)碩士研究生學(xué)位論文第三章基于迷惑度的錯(cuò)誤選項(xiàng)自動(dòng)生成21度值。用WordNet、GloVe和NER[65]計(jì)算數(shù)據(jù)庫中答案的語義相關(guān)度;最后,通過選擇機(jī)制選出迷惑度最高的選項(xiàng),并與正確答案和問題相結(jié)合形成多項(xiàng)選擇題。圖3.1迷惑選項(xiàng)生成模型圖迷惑選項(xiàng)生成模型結(jié)構(gòu)圖如圖3.1所示。用戶輸入任意問題后,通過QA系統(tǒng)的候選答案集生成迷惑選項(xiàng)以及問題的數(shù)據(jù)集。對(duì)數(shù)據(jù)集里的迷惑選項(xiàng)采用WordNet、GloVe、NER三種方法計(jì)算語義相關(guān)度,將這三種方法所算得的三個(gè)語義相關(guān)度進(jìn)行加權(quán)得出一個(gè)最終的迷惑度值。最后通過選擇機(jī)制選出迷惑度最高的前幾個(gè)迷惑選項(xiàng)與正確答案和問題相結(jié)合生成選擇題。3.3.2迷惑度算法考慮到3.2.2節(jié)所提到的迷惑度計(jì)算的三個(gè)因素:迷惑選項(xiàng)和問題之間的語義相關(guān)度、迷惑選項(xiàng)和正確答案之間的語義相關(guān)度以及迷惑選項(xiàng)的類型和正確答案的類型是否匹配,就可以進(jìn)行迷惑度計(jì)算公式的設(shè)計(jì)。如果將迷惑選項(xiàng)和問題之間的語義相關(guān)度的值設(shè)置為),迷惑選項(xiàng)和正確答案之間的語義相關(guān)度的值設(shè)置為*,運(yùn)用NER判斷的迷惑選項(xiàng)和正確答案是否屬于同一類別的值設(shè)置為N。那么可以設(shè)計(jì)出如式3.1所示迷惑度計(jì)算公式:Con=[)+(1)*](3.1)式3.1中,參數(shù)的最合適的取值需要通過進(jìn)一步的實(shí)驗(yàn)來確定。&WordNetGloVeNERTopN
WN1&GV2迷惑度對(duì)比曲線圖
【參考文獻(xiàn)】:
期刊論文
[1]基于word2vec的網(wǎng)站主題分類研究[J]. 程元堃,蔣言,程光. 計(jì)算機(jī)與數(shù)字工程. 2019(01)
[2]基于詞向量特征擴(kuò)展的中文短文本分類研究[J]. 雷朔,劉旭敏,徐維祥. 計(jì)算機(jī)應(yīng)用與軟件. 2018(08)
[3]基于Word2Vec的中文短文本分類問題研究[J]. 汪靜,羅浪,王德強(qiáng). 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(05)
[4]文本相似度計(jì)算方法研究綜述[J]. 陳二靜,姜恩波. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2017(06)
[5]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春. 計(jì)算機(jī)科學(xué). 2016(06)
[6]基于TFIDF算法的關(guān)鍵詞提取方法[J]. 章志華,陸海良,郁鋼. 信息技術(shù)與信息化. 2015(08)
[7]基于TF統(tǒng)計(jì)和語法分析的關(guān)鍵詞提取算法[J]. 戰(zhàn)學(xué)剛,吳強(qiáng). 計(jì)算機(jī)應(yīng)用與軟件. 2014(01)
[8]WordNet中的綜合概念語義相似度計(jì)算方法[J]. 王桐,王磊,吳吉義,徐賀. 北京郵電大學(xué)學(xué)報(bào). 2013(02)
[9]Web問答系統(tǒng)中問句理解的研究[J]. 蘇斐,高德利,葉晨. 測試技術(shù)學(xué)報(bào). 2012(03)
[10]基于概念間邊權(quán)重的概念相似性計(jì)算方法[J]. 馮永,張洋. 計(jì)算機(jī)應(yīng)用. 2012(01)
碩士論文
[1]面向關(guān)聯(lián)數(shù)據(jù)的實(shí)體對(duì)齊方法研究[D]. 李琳.北京化工大學(xué) 2017
[2]基于word2vec詞向量的文本分類研究[D]. 朱磊.西南大學(xué) 2017
[3]自動(dòng)問答系統(tǒng)的研究與實(shí)現(xiàn)[D]. 李清.安徽大學(xué) 2012
[4]漢語句子相似度計(jì)算及其在自動(dòng)問答系統(tǒng)中的應(yīng)用[D]. 吳全娥.西南大學(xué) 2011
[5]基于課程知識(shí)的問答系統(tǒng)研究與應(yīng)用[D]. 劉祥.大連海事大學(xué) 2010
[6]相似度計(jì)算在基于本體的自動(dòng)問答系統(tǒng)中的應(yīng)用[D]. 楊志國.中央民族大學(xué) 2010
本文編號(hào):3556971
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3556971.html
最近更新
教材專著