天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

面向客服輔助領域的任務型對話研究

發(fā)布時間:2020-07-20 22:00
【摘要】:近年來,隨著人工智能技術的飛速發(fā)展,基于自然語言的任務型對話研究得到了學術界乃至工業(yè)界的諸多關注。當前的客服對話主要以人工參與為主,因此如何提高智能客服的服務體驗與落地可實施性是本文研究的重點。將自然語言對話研究加入到客服對話領域可以有效降低人力消耗,提高客服對話的效率。任務型對話主要的研究方向可分為檢索式和生成式兩種,檢索式方法在限定領域內表現(xiàn)順暢,生成式方法回復的內容更具創(chuàng)新性。由于深度學習方法可以有效提取語義特征和上下文的互信息,因此為本文提供了新的研究思路。本文主要是面向客服輔助領域的任務型對話研究,重點從以下三個方向進行研究:面向客服輔助領域的檢索式對話研究。傳統(tǒng)對話研究主要基于知識庫檢索和回復匹配,本文依次實現(xiàn)了WMD、BM25和SMN三種檢索式對話模型。經實驗對比發(fā)現(xiàn),加入深度語義理解的SMN模型在準確率上接近40%,明顯優(yōu)于其他兩者,由此表明深度學習方法有利于提取語義特征信息。面向客服輔助領域的生成式對話研究。循環(huán)神經網絡具有記憶功能、參數(shù)共享等特性,且善于處理序列化的數(shù)據信息。本文實現(xiàn)了seq2seq的基線模型,并使用LSTM和Bi-LSTM改進模型編碼,豐富語義信息表達;在此基礎上引入注意力機制,提升模型的解碼能力。改進后的實驗模型最終達到68.3%的準確率,相比基線模型提升許多,這說明深度學習方法對于語義信息理解效果顯著,但實驗精度還有待提高。綜上,將檢索與生成相結合進行實驗對話研究。本文將檢索信息和檢索信息的主題詞分別加入到生成模型的編碼和解碼部分,用以豐富模型信息編碼和改善模型解碼結果,最優(yōu)實驗結果達到77.41%。為了增加對話模型的落地可行性,在此基礎上又添加了任務式對話,與檢索式對話和生成式對話基于一定的策略相結合,最后測試實驗結果達到88.71%。最終,綜合模型匯集了檢索與生成的優(yōu)點,且在對話的效率以及服務體驗上都大幅提升,經試驗證明,該方案更具落地的可實施性。
【學位授予單位】:江西農業(yè)大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.1;TP18
【圖文】:

框架圖,匹配模型,框架,檢索式


2 面向客服輔助領域的檢索式對話研究十年代,檢索就被率先應用到對話領域,由于其操在多個領域有很好的應用。檢索式對話需要檢索工出候選回復,然后對候選回復進行打分排序,最后復[32]。檢索式對話所使用的數(shù)據均需經過預先處理復內容古板沒有創(chuàng)新,無法回答領域外的問題。主要提取問句與候選回復之間的特征信息,使用機模型,返回匹配度最高的匹配結果。文本信息特征文本信息表示成數(shù)據信息,但傳統(tǒng)信息特征提取只深入理解文本的語義信息。隨著深度學習在自然語的被應用于提取文本的語義信息,將文本信息進行研究方向是問句與候選回復的匹配程度,在對候選據匹配模型進行相關度打分,最后得到候選回復的話任務上的基本框架如圖 2.1 所示。

相似度,漢語詞典,詞賦,向量


容處理簡化為向量空間中方式為余弦相似度。有兩種,其二是使用 TF-IDF 衡量檔轉換為單獨的詞(term,定義一個 M 維的向量(給這個詞賦一個實數(shù)值或,如 20 萬個詞的漢語詞典疏。當文檔轉換為向量后?臻g向量表示完成,可以如(2-1)所示。cosθ (( )( 知識庫中挑選候選回復,和回復文本,然后將測試樣回相似度較大的候選回復

歐式距離,文本,相似性,度量關系


(Word Mover’s Distance)是計算句子之間距離的方法,主要用于似度,距離越小其相似度越高。WMD 模型衍生于 EMD(Eart模型,他們都是定義距離度量關系,用于測量兩個分布的距離,語音信號處理。WMD 將這種思想的使用范圍延伸到自然語言領效。況下,計算文本距離時率先想到的是使用 word2vec 對兩段文本然后再使用歐式距離或余弦相似性進行求解。不過 word2vec 獲映詞與詞之間的語義差別,但無法從文檔的整體來考慮相似性,下文信息缺失,因此使用 WMD 來計算文本整體相似度。想要反相似度,就需要將文檔距離建模成兩個文本語義距離的組合,比的任意兩個詞所對應的詞向量求歐式距離并加權求和,表示形式示。, ( , ) ( , )為 , 兩個詞對應詞向量的歐式距離,T 表示加權矩陣,類似于移矩陣,將其概率轉化為權重,以下通過圖 2.3 對其原理做詳細

【相似文獻】

相關期刊論文 前10條

1 廖祥文;謝媛媛;魏晶晶;桂林;程學旗;陳國龍;;基于卷積記憶網絡的視角級微博情感分類[J];模式識別與人工智能;2018年03期

2 張學武;劉廣聰;蔡念;;基于Attention-biLSTM的候選答案句抽取[J];福建電腦;2019年04期

3 雷葉;;從餐館評論中提取方面術語[J];智能計算機與應用;2019年03期

4 張俊青;孔芳;;基于序列到序列模型的事件識別[J];中文信息學報;2019年06期

5 張家穎;楊文軍;;基于深度學習的網絡流量分類識別研究[J];天津理工大學學報;2019年06期

6 李家樂;吳明禮;;基于深度學習的問題回答技術研究[J];數(shù)字技術與應用;2019年02期

7 劉蕊;沈海斌;;序列—結構的文本分類算法[J];電子技術;2018年02期

8 王翰林;何中市;;基于Faster R-CNN的復雜背景下的人臉檢測[J];現(xiàn)代計算機(專業(yè)版);2019年07期

9 孫鑫;王厚峰;;問答中的問句意圖識別和約束條件分析[J];中文信息學報;2017年06期

10 董葉豪;柯宗武;熊旭輝;孫玉霞;夏端峰;;基于Seq2Seq的問答系統(tǒng)應用研究[J];福建電腦;2018年10期

相關碩士學位論文 前7條

1 劉治成;基于出租車軌跡數(shù)據的目標車輛軌跡恢復算法研究[D];哈爾濱工業(yè)大學;2019年

2 劉芝鵬;面向客服輔助領域的任務型對話研究[D];江西農業(yè)大學;2019年

3 龔琴;基于深度學習的電商產品評論情感分析研究[D];重慶郵電大學;2019年

4 紀清晨;基于深度學習的行人屬性識別研究[D];哈爾濱工業(yè)大學;2019年

5 劉沖;基于深度學習的流量分類系統(tǒng)[D];北京郵電大學;2019年

6 張賞;基于本體的地理知識問答[D];東南大學;2018年

7 王新波;用戶評論方面級情感分析算法研究[D];北京郵電大學;2018年



本文編號:2764005

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2764005.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶674d2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com