基于大規(guī)模候選集的檢索型多輪對話模型
發(fā)布時間:2021-02-08 15:15
隨著人工智能技術(shù)的深刻變革,新一代端到端聊天式對話系統(tǒng)已廣泛用于娛樂聊天機器人、個人助手和公司智能客服等實際場景中,成為人工智能領(lǐng)域最具有應(yīng)用前景的技術(shù)之一。與傳統(tǒng)的人機交互方式不同,智能對話系統(tǒng)不僅能夠理解人類日常交流的語言并作出有意義的回答,還能夠通過一系列的對話完成某一項任務(wù)。通常地說,端到端聊天式對話系統(tǒng)技術(shù)主要分為檢索式對話系統(tǒng)和生成式對話系統(tǒng)兩大類。生成式對話系統(tǒng)根據(jù)已經(jīng)進行的對話歷史利用自然語言生成技術(shù)重新生成回復(fù)。盡管生成式系統(tǒng)有希望能夠不局限于預(yù)先建立回復(fù)的范圍,但是生成式系統(tǒng)也會遭受目前自然語言生成技術(shù)所帶來的流暢性不足、傾向于回復(fù)通用性語句等問題。相比于之下,檢索式對話系統(tǒng)主要利用信息檢索技術(shù)對一組預(yù)先建立的候選回復(fù)進行打分和返回最合適的回復(fù),在大多數(shù)情況中能夠提供更加流暢并有意義的回復(fù)。然而,預(yù)建立的候選語料質(zhì)量不高會影響檢索式對話系統(tǒng)的回復(fù)合理性,預(yù)建立候選回復(fù)的數(shù)目種類不足也會顯著地降低檢索式對話系統(tǒng)的回復(fù)多樣性。針對上述問題,本文主要以較大規(guī)模候選集場景下的檢索式多輪對話模型為研究課題,首先提出時空特征匹配網(wǎng)絡(luò),研究其在大量候選回復(fù)場景下的性能和效率,同時...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 聊天式對話系統(tǒng)的研究歷史與現(xiàn)狀
1.2.1 基于人工規(guī)則的對話系統(tǒng)
1.2.2 基于信息檢索的對話系統(tǒng)
1.2.3 基于序列生成的對話系統(tǒng)
1.3 本文的主要貢獻與創(chuàng)新
1.4 本論文的結(jié)構(gòu)安排
第二章 背景知識介紹
2.1 多層神經(jīng)網(wǎng)絡(luò)
2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.2.1 卷積層
2.2.2 池化層
2.2.3 全連接層
2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3.1 長短期記憶網(wǎng)絡(luò)
2.3.2 門控循環(huán)單元
2.4 注意力機制
2.4.1 自注意力機制與Transformer
2.4.2 交互注意力機制
2.5 基于交互注意力機制的檢索式對話系統(tǒng)
2.6 本章小結(jié)
第三章 時空特征匹配網(wǎng)絡(luò)
3.1 引言
3.2 問題定義
3.3 網(wǎng)絡(luò)結(jié)構(gòu)
3.3.1 詞嵌入層
3.3.2 語義表示層
3.3.3 時空特征層
3.3.4 基于三維卷積神經(jīng)網(wǎng)絡(luò)的判別器
3.4 實驗及分析
3.4.1 實驗數(shù)據(jù)集
3.4.2 基線模型設(shè)置
3.4.3 實驗評估指標(biāo)
3.4.4 實驗結(jié)果與分析
3.5 本章小結(jié)
第四章 基于預(yù)訓(xùn)練語言模型的檢索式對話模型
4.1 引言
4.2 預(yù)訓(xùn)練語言模型
4.2.1 BERT
4.2.2 BERT-WWM
4.2.3 RoBERTa
4.3 基于微調(diào)的預(yù)訓(xùn)練對話檢索模型
4.3.1 交談?wù)叻指顧C制
4.3.2 多輪對話增強方法
4.4 實驗及分析
4.4.1 實驗數(shù)據(jù)集
4.4.2 基線模型
4.4.3 模型參數(shù)設(shè)置
4.4.4 實驗結(jié)果及分析
4.5 本章小結(jié)
第五章 全文總結(jié)與展望
5.1 全文總結(jié)
5.2 后續(xù)工作展望
致謝
參考文獻
攻讀碩士學(xué)位期間取得的成果
【參考文獻】:
期刊論文
[1]關(guān)于統(tǒng)計學(xué)習(xí)理論與支持向量機[J]. 張學(xué)工. 自動化學(xué)報. 2000(01)
本文編號:3024124
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 聊天式對話系統(tǒng)的研究歷史與現(xiàn)狀
1.2.1 基于人工規(guī)則的對話系統(tǒng)
1.2.2 基于信息檢索的對話系統(tǒng)
1.2.3 基于序列生成的對話系統(tǒng)
1.3 本文的主要貢獻與創(chuàng)新
1.4 本論文的結(jié)構(gòu)安排
第二章 背景知識介紹
2.1 多層神經(jīng)網(wǎng)絡(luò)
2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.2.1 卷積層
2.2.2 池化層
2.2.3 全連接層
2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3.1 長短期記憶網(wǎng)絡(luò)
2.3.2 門控循環(huán)單元
2.4 注意力機制
2.4.1 自注意力機制與Transformer
2.4.2 交互注意力機制
2.5 基于交互注意力機制的檢索式對話系統(tǒng)
2.6 本章小結(jié)
第三章 時空特征匹配網(wǎng)絡(luò)
3.1 引言
3.2 問題定義
3.3 網(wǎng)絡(luò)結(jié)構(gòu)
3.3.1 詞嵌入層
3.3.2 語義表示層
3.3.3 時空特征層
3.3.4 基于三維卷積神經(jīng)網(wǎng)絡(luò)的判別器
3.4 實驗及分析
3.4.1 實驗數(shù)據(jù)集
3.4.2 基線模型設(shè)置
3.4.3 實驗評估指標(biāo)
3.4.4 實驗結(jié)果與分析
3.5 本章小結(jié)
第四章 基于預(yù)訓(xùn)練語言模型的檢索式對話模型
4.1 引言
4.2 預(yù)訓(xùn)練語言模型
4.2.1 BERT
4.2.2 BERT-WWM
4.2.3 RoBERTa
4.3 基于微調(diào)的預(yù)訓(xùn)練對話檢索模型
4.3.1 交談?wù)叻指顧C制
4.3.2 多輪對話增強方法
4.4 實驗及分析
4.4.1 實驗數(shù)據(jù)集
4.4.2 基線模型
4.4.3 模型參數(shù)設(shè)置
4.4.4 實驗結(jié)果及分析
4.5 本章小結(jié)
第五章 全文總結(jié)與展望
5.1 全文總結(jié)
5.2 后續(xù)工作展望
致謝
參考文獻
攻讀碩士學(xué)位期間取得的成果
【參考文獻】:
期刊論文
[1]關(guān)于統(tǒng)計學(xué)習(xí)理論與支持向量機[J]. 張學(xué)工. 自動化學(xué)報. 2000(01)
本文編號:3024124
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3024124.html
最近更新
教材專著