基于深度學(xué)習(xí)和強化學(xué)習(xí)的對話模型研究
發(fā)布時間:2021-06-23 17:00
對話系統(tǒng)目前已經(jīng)成為人機交互最常見的方式之一,相較于其他的交互方式對話具有更加自然和便捷的優(yōu)勢。對話系統(tǒng)能夠和人用最簡單的語言進行溝通,不需要用戶具備任何專業(yè)知識。并且對話的形式能夠讓用戶解放雙手,因此幾乎適用于任何場景,同時由于語言是人類進行交流的最基本方式,也使得具備對話功能的系統(tǒng)在使用中顯得更加友好。目前對話系統(tǒng)已經(jīng)應(yīng)用于例如智能音箱、語音助手、智能客服、虛擬人物等領(lǐng)域。因此,一個具備優(yōu)秀語義理解能力和大量知識的對話系統(tǒng)有著廣闊的發(fā)展前景。經(jīng)過學(xué)術(shù)界數(shù)十年的研究,對話技術(shù)已經(jīng)有了巨大的發(fā)展,在商業(yè)領(lǐng)域也已經(jīng)取得了廣泛地應(yīng)用,F(xiàn)有的對話系統(tǒng)在語義理解、人格一致性、融合知識甚至模型本身都還存在大量不足,這些不足也是我們探索此領(lǐng)域的動力。目前,對話系統(tǒng)在商業(yè)應(yīng)用時會采用大量工程化的手段解決上述問題,而學(xué)術(shù)界期望采用更低成本更加智能的方法使現(xiàn)有對話系統(tǒng)更加智能和易用。所以利用強化學(xué)習(xí)和深度學(xué)習(xí)技術(shù)讓對話系統(tǒng)智能化是一個非常有挑戰(zhàn)性又亟待解決的方向。本文不僅利用深度學(xué)習(xí)技術(shù)改進對話系統(tǒng),也嘗試研究如何利用強化學(xué)習(xí)提升對話效果。本工作針對對話系統(tǒng)的一致性、模型結(jié)構(gòu)、語義理解和知識融合四個方面...
【文章來源】:北京科技大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:112 頁
【學(xué)位級別】:博士
【部分圖文】:
圖1-1目前市面主要的對話系統(tǒng)??如圖1-1近年來,為了適應(yīng)不同的應(yīng)用領(lǐng)域,開發(fā)出了各種不同類型的??
指導(dǎo)的對話數(shù)據(jù)集?18000?-?|?丨7?|?是??下面分別對三類對話任務(wù)的基本方法和發(fā)展脈絡(luò)進行總結(jié)。??1.2.1任務(wù)型對話??任務(wù)型機器人指特定條件下提供信息或服務(wù)的機器人。通常情況下是為??了滿足帶有明確目的用戶,例如查流量,查話費,訂餐,訂票,咨詢等任務(wù)??型場景。由于用戶的需求較為復(fù)雜,通常情況下需分多輪互動,用戶也可能??在對話過程中不斷修改與完善自己的需求,任務(wù)型機器人需要通過詢問、澄??清和確認(rèn)來幫助用戶明確目的。??任務(wù)型機器人核心模塊主要包括三部分,如圖1-3所示。??(1)自然語言理解模塊?Natural?Language?Understanding。??(2)對話管理模塊?Dialog?Management。??(3)自然語言生成模塊?Natural?Language?Generation。??,丨?ndmea???Request(movie;福0i?’灼變飛闕??Bill?Murray?麵^?act〇r^iH?murraY>?Knowledge?Base??^?'"When?was?Request??t—{rei—丨.....■??圖1-3任務(wù)型對話機器人流程圖??(1)自然語言理解模塊。當(dāng)用戶語言經(jīng)過自然語言理解模塊時,需要經(jīng)??過領(lǐng)域識別(domain?detection),用戶意圖識別(intent?detection)以及槽位??提。畛洌ǎ螅欤铮?filling)三個主要子模塊。??其中領(lǐng)域識別模塊用于識別該語句是屬于哪個任務(wù)場景,領(lǐng)域識別應(yīng)當(dāng)??-7?-??
?(2)對話管理模塊。對話管理模塊的作用是存儲對話當(dāng)前狀態(tài)以及決策??回復(fù)策略。經(jīng)過自然語言理解模塊解析完成后的輸出將作為對話管理模塊的??輸入。對話管理模塊包括兩部分,狀態(tài)追蹤(Dialogue?State?Tracking,?DST)??以及對話策略(Dialogue?Policy?Learning,?DPL)。??狀態(tài)追蹤模塊包括持續(xù)對話的各種信息,它根據(jù)舊狀態(tài)(即對話歷史),??用戶狀態(tài)(即目前槽值填充情況)與系統(tǒng)狀態(tài)(即通過與數(shù)據(jù)庫的查詢情況)??來更新當(dāng)前的對話狀態(tài),如圖1-4所示。通常由于語音識別不準(zhǔn)確或者自然??語言本身存在歧義性等原因,語義理解模塊輸出的結(jié)果一般存在不準(zhǔn)確性,??它的輸出往往與真實情況存在一定的誤差。所以,語義理解模塊輸出每一種??可能的結(jié)果都會帶有一個相對應(yīng)的置信度。因此對話狀態(tài)跟蹤模塊在判斷當(dāng)??前的對話狀態(tài)時有兩種方法,分別是可以選擇卜Best或者N-Best。實現(xiàn)DST??模塊的主要方法有:基于條件隨機場模型的序列跟蹤模型、基于RNN和??LSTM的序列跟蹤模型等。??系統(tǒng)狀態(tài)??舊狀態(tài)—HHSB?.新狀態(tài)??用戶狀態(tài)??圖1一對話管理模塊??-9?-??
【參考文獻(xiàn)】:
期刊論文
[1]強化學(xué)習(xí)研究綜述[J]. 馬騁乾,謝偉,孫偉杰. 指揮控制與仿真. 2018(06)
[2]智能對話系統(tǒng)研究綜述[J]. 賈熹濱,李讓,胡長建,陳軍成. 北京工業(yè)大學(xué)學(xué)報. 2017(09)
[3]知識圖譜研究進展[J]. 漆桂林,高桓,吳天星. 情報工程. 2017(01)
[4]深度強化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長,鐘珊,周倩,章鵬,徐進. 計算機學(xué)報. 2018(01)
[5]強化學(xué)習(xí)研究綜述[J]. 高陽,陳世福,陸鑫. 自動化學(xué)報. 2004(01)
[6]強化學(xué)習(xí)理論、算法及應(yīng)用[J]. 張汝波,顧國昌,劉照德,王醒策. 控制理論與應(yīng)用. 2000(05)
博士論文
[1]強化學(xué)習(xí)方法及其應(yīng)用研究[D]. 黃炳強.上海交通大學(xué) 2007
[2]策略梯度增強學(xué)習(xí)的理論、算法及應(yīng)用研究[D]. 王學(xué)寧.國防科學(xué)技術(shù)大學(xué) 2006
本文編號:3245319
【文章來源】:北京科技大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:112 頁
【學(xué)位級別】:博士
【部分圖文】:
圖1-1目前市面主要的對話系統(tǒng)??如圖1-1近年來,為了適應(yīng)不同的應(yīng)用領(lǐng)域,開發(fā)出了各種不同類型的??
指導(dǎo)的對話數(shù)據(jù)集?18000?-?|?丨7?|?是??下面分別對三類對話任務(wù)的基本方法和發(fā)展脈絡(luò)進行總結(jié)。??1.2.1任務(wù)型對話??任務(wù)型機器人指特定條件下提供信息或服務(wù)的機器人。通常情況下是為??了滿足帶有明確目的用戶,例如查流量,查話費,訂餐,訂票,咨詢等任務(wù)??型場景。由于用戶的需求較為復(fù)雜,通常情況下需分多輪互動,用戶也可能??在對話過程中不斷修改與完善自己的需求,任務(wù)型機器人需要通過詢問、澄??清和確認(rèn)來幫助用戶明確目的。??任務(wù)型機器人核心模塊主要包括三部分,如圖1-3所示。??(1)自然語言理解模塊?Natural?Language?Understanding。??(2)對話管理模塊?Dialog?Management。??(3)自然語言生成模塊?Natural?Language?Generation。??,丨?ndmea???Request(movie;福0i?’灼變飛闕??Bill?Murray?麵^?act〇r^iH?murraY>?Knowledge?Base??^?'"When?was?Request??t—{rei—丨.....■??圖1-3任務(wù)型對話機器人流程圖??(1)自然語言理解模塊。當(dāng)用戶語言經(jīng)過自然語言理解模塊時,需要經(jīng)??過領(lǐng)域識別(domain?detection),用戶意圖識別(intent?detection)以及槽位??提。畛洌ǎ螅欤铮?filling)三個主要子模塊。??其中領(lǐng)域識別模塊用于識別該語句是屬于哪個任務(wù)場景,領(lǐng)域識別應(yīng)當(dāng)??-7?-??
?(2)對話管理模塊。對話管理模塊的作用是存儲對話當(dāng)前狀態(tài)以及決策??回復(fù)策略。經(jīng)過自然語言理解模塊解析完成后的輸出將作為對話管理模塊的??輸入。對話管理模塊包括兩部分,狀態(tài)追蹤(Dialogue?State?Tracking,?DST)??以及對話策略(Dialogue?Policy?Learning,?DPL)。??狀態(tài)追蹤模塊包括持續(xù)對話的各種信息,它根據(jù)舊狀態(tài)(即對話歷史),??用戶狀態(tài)(即目前槽值填充情況)與系統(tǒng)狀態(tài)(即通過與數(shù)據(jù)庫的查詢情況)??來更新當(dāng)前的對話狀態(tài),如圖1-4所示。通常由于語音識別不準(zhǔn)確或者自然??語言本身存在歧義性等原因,語義理解模塊輸出的結(jié)果一般存在不準(zhǔn)確性,??它的輸出往往與真實情況存在一定的誤差。所以,語義理解模塊輸出每一種??可能的結(jié)果都會帶有一個相對應(yīng)的置信度。因此對話狀態(tài)跟蹤模塊在判斷當(dāng)??前的對話狀態(tài)時有兩種方法,分別是可以選擇卜Best或者N-Best。實現(xiàn)DST??模塊的主要方法有:基于條件隨機場模型的序列跟蹤模型、基于RNN和??LSTM的序列跟蹤模型等。??系統(tǒng)狀態(tài)??舊狀態(tài)—HHSB?.新狀態(tài)??用戶狀態(tài)??圖1一對話管理模塊??-9?-??
【參考文獻(xiàn)】:
期刊論文
[1]強化學(xué)習(xí)研究綜述[J]. 馬騁乾,謝偉,孫偉杰. 指揮控制與仿真. 2018(06)
[2]智能對話系統(tǒng)研究綜述[J]. 賈熹濱,李讓,胡長建,陳軍成. 北京工業(yè)大學(xué)學(xué)報. 2017(09)
[3]知識圖譜研究進展[J]. 漆桂林,高桓,吳天星. 情報工程. 2017(01)
[4]深度強化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長,鐘珊,周倩,章鵬,徐進. 計算機學(xué)報. 2018(01)
[5]強化學(xué)習(xí)研究綜述[J]. 高陽,陳世福,陸鑫. 自動化學(xué)報. 2004(01)
[6]強化學(xué)習(xí)理論、算法及應(yīng)用[J]. 張汝波,顧國昌,劉照德,王醒策. 控制理論與應(yīng)用. 2000(05)
博士論文
[1]強化學(xué)習(xí)方法及其應(yīng)用研究[D]. 黃炳強.上海交通大學(xué) 2007
[2]策略梯度增強學(xué)習(xí)的理論、算法及應(yīng)用研究[D]. 王學(xué)寧.國防科學(xué)技術(shù)大學(xué) 2006
本文編號:3245319
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3245319.html
最近更新
教材專著