檢索式對(duì)話系統(tǒng)中的主題建模設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-05-12 03:04
近年來,開放域(閑聊型)對(duì)話系統(tǒng)越來越受到人們的關(guān)注,相對(duì)于傳統(tǒng)信息服務(wù)形式(如問答系統(tǒng)、搜索引擎等),開放域?qū)υ捪到y(tǒng)提供更豐富語義內(nèi)容和更有效的交互模式,這些特性使得其在可預(yù)見的未來生活中越來越普及,因此開放域?qū)υ捪到y(tǒng)相關(guān)技術(shù)的研究具有極大的經(jīng)濟(jì)效應(yīng)和社會(huì)價(jià)值。隨著深度學(xué)習(xí)在自然語言處理領(lǐng)域的飛速發(fā)展,對(duì)話系統(tǒng)正伴隨著便攜移動(dòng)設(shè)備市場(chǎng)的拓展走向成熟,在客服、金融、醫(yī)療、教育和生活服務(wù)等方面應(yīng)用廣泛。開放域?qū)υ捪到y(tǒng)按照其回復(fù)產(chǎn)生的方式可以分為檢索式與生成式兩種方式:檢索式對(duì)話系統(tǒng)通過匹配技術(shù)從系統(tǒng)回復(fù)庫中檢索與用戶查詢匹配的話語并排序,選取出排名最高的回復(fù),該方法具有回復(fù)質(zhì)量高的特點(diǎn),但是其依賴于人工撰寫的大量對(duì)話數(shù)據(jù);而生成式對(duì)話系統(tǒng)基于數(shù)據(jù)驅(qū)動(dòng)的方法能訓(xùn)練回復(fù)生成模型,該方法具有靈活性更好并可自動(dòng)生成新的回復(fù)等特點(diǎn),但是容易生成通用的無內(nèi)容回復(fù)。目前的開放域?qū)υ捘P脱芯抗ぷ鞔蠖嗷谏窠?jīng)網(wǎng)絡(luò)的方法,由一個(gè)端到端的神經(jīng)網(wǎng)絡(luò)模型產(chǎn)生對(duì)話回復(fù)或者對(duì)候選回復(fù)排序。這種端到端模型的缺點(diǎn)在于難以解釋對(duì)話的生成或排序過程。為了增加對(duì)話過程的可解釋性并避免開放域?qū)υ捪到y(tǒng)兩類方法的主要問題,本課題研究...
【文章來源】:江西師范大學(xué)江西省
【文章頁數(shù)】:47 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 概述
1.1 研究背景與研究意義
1.2 本文的研究?jī)?nèi)容
1.3 本文章節(jié)安排
2 國(guó)內(nèi)外相關(guān)研究
2.1 對(duì)話系統(tǒng)相關(guān)技術(shù)
2.2 檢索式對(duì)話技術(shù)
2.3 對(duì)話主題建模相關(guān)技術(shù)
2.4 研究現(xiàn)狀小結(jié)
3 對(duì)話的主題抽取建模
3.1 主題詞抽取方法
3.1.1 基于BiLSTM+CRF的方法
3.1.2 結(jié)合分詞信息
3.2 主題向量抽取方法
3.3 實(shí)驗(yàn)數(shù)據(jù)及數(shù)據(jù)預(yù)處理
3.3.1 實(shí)驗(yàn)數(shù)據(jù)
3.3.2 數(shù)據(jù)預(yù)處理
3.3.3 數(shù)據(jù)標(biāo)注
3.4 實(shí)驗(yàn)設(shè)置與結(jié)果分析
3.5 本章小結(jié)
4 對(duì)話主題與主題詞預(yù)測(cè)建模
4.1 引言
4.2 基于多標(biāo)簽分類的關(guān)鍵詞預(yù)測(cè)
4.2.1 基于CNN的主題詞預(yù)測(cè)模型
4.3 基于序列生成的關(guān)鍵詞預(yù)測(cè)
4.3.1 基于Seq2Seq生成模型的關(guān)鍵詞預(yù)測(cè)
4.4 主題預(yù)測(cè)
4.5 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)價(jià)指標(biāo)
4.5.2 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.6 本章小結(jié)
5 基于主題的檢索式對(duì)話系統(tǒng)及系統(tǒng)開發(fā)
5.1 引言
5.2 回復(fù)排序算法
5.2.1 對(duì)偶長(zhǎng)短期記憶模型(dual-LSTM)
5.2.2 深度注意力匹配模型(DAM)
5.3 系統(tǒng)實(shí)現(xiàn)
5.4 系統(tǒng)展示
5.5 系統(tǒng)效果分析
5.6 本章小結(jié)
6 總結(jié)與展望
6.1 本文工作總結(jié)
6.2 未來工作展望
參考文獻(xiàn)
致謝
在讀期間公開發(fā)表論文(著)及科研情況
本文編號(hào):3182609
【文章來源】:江西師范大學(xué)江西省
【文章頁數(shù)】:47 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 概述
1.1 研究背景與研究意義
1.2 本文的研究?jī)?nèi)容
1.3 本文章節(jié)安排
2 國(guó)內(nèi)外相關(guān)研究
2.1 對(duì)話系統(tǒng)相關(guān)技術(shù)
2.2 檢索式對(duì)話技術(shù)
2.3 對(duì)話主題建模相關(guān)技術(shù)
2.4 研究現(xiàn)狀小結(jié)
3 對(duì)話的主題抽取建模
3.1 主題詞抽取方法
3.1.1 基于BiLSTM+CRF的方法
3.1.2 結(jié)合分詞信息
3.2 主題向量抽取方法
3.3 實(shí)驗(yàn)數(shù)據(jù)及數(shù)據(jù)預(yù)處理
3.3.1 實(shí)驗(yàn)數(shù)據(jù)
3.3.2 數(shù)據(jù)預(yù)處理
3.3.3 數(shù)據(jù)標(biāo)注
3.4 實(shí)驗(yàn)設(shè)置與結(jié)果分析
3.5 本章小結(jié)
4 對(duì)話主題與主題詞預(yù)測(cè)建模
4.1 引言
4.2 基于多標(biāo)簽分類的關(guān)鍵詞預(yù)測(cè)
4.2.1 基于CNN的主題詞預(yù)測(cè)模型
4.3 基于序列生成的關(guān)鍵詞預(yù)測(cè)
4.3.1 基于Seq2Seq生成模型的關(guān)鍵詞預(yù)測(cè)
4.4 主題預(yù)測(cè)
4.5 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)價(jià)指標(biāo)
4.5.2 實(shí)驗(yàn)設(shè)置與結(jié)果分析
4.6 本章小結(jié)
5 基于主題的檢索式對(duì)話系統(tǒng)及系統(tǒng)開發(fā)
5.1 引言
5.2 回復(fù)排序算法
5.2.1 對(duì)偶長(zhǎng)短期記憶模型(dual-LSTM)
5.2.2 深度注意力匹配模型(DAM)
5.3 系統(tǒng)實(shí)現(xiàn)
5.4 系統(tǒng)展示
5.5 系統(tǒng)效果分析
5.6 本章小結(jié)
6 總結(jié)與展望
6.1 本文工作總結(jié)
6.2 未來工作展望
參考文獻(xiàn)
致謝
在讀期間公開發(fā)表論文(著)及科研情況
本文編號(hào):3182609
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3182609.html
最近更新
教材專著