天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于強化學習的開放領域聊天機器人對話生成算法

發(fā)布時間:2018-04-26 11:07

  本文選題:聊天機器人 + 對話生成。 參考:《哈爾濱工業(yè)大學》2017年碩士論文


【摘要】:近年來,大規(guī)模深度學習算法的發(fā)展使得聊天機器人不再僅僅依靠模板匹配與檢索等方式,生成式對話算法逐步成為可能。與檢索式聊天機器人相比,生成式的聊天機器人的遷移性與泛化性更佳,擁有著更廣闊的應用場景。本文主要關注開放領域的聊天機器人,區(qū)別于特定任務的聊天機器人,開放領域下的聊天機器人其目標不是為了盡快完成用戶指定的任務,而是吸引并留住用戶令其有興趣與機器人繼續(xù)交談。本文首先對生成式聊天機器人領域主流的基于RNN的Encoder-Decoder算法模型進行實驗,同時對比了LSTM和GRU等不同的神經(jīng)網(wǎng)絡單元對結果的影響,隨后加入attention注意力模型機制提高了生成效果,而后又采用了beam search方法提升生成效果的多樣性。由于目前seq2seq的生成式算法在輸出時采用最大似然估計方法,極易產(chǎn)生大量無實際意義的安全回復。為解決這個問題,本文采用強化學習的方法評估對話的未來獎勵,不再是針對當前輸入選擇對應的最大可能回復,而是評估其對未來對話的獎勵,以促進聊天持續(xù)發(fā)展。同時本文認為一個更為智能的機器人應具有情感色彩,故本文在強化學習的獎勵函數(shù)上,除對生成的語句流暢性等方面進行檢測并將其作為獎勵外,還加入了對候選句的情感檢測,以期令聊天機器人盡可能選擇對未來對話情感指數(shù)有提升的候選句,有效地延續(xù)對話。本文還將情感信息作為監(jiān)督信號加入到生成過程中,從語料中學習聊天過程的情感轉(zhuǎn)移分布,并將該分布作為監(jiān)督信號指導聊天機器人回復,使其產(chǎn)生蘊含情感的語句。最后,通過自動評價結合人工評價的方式,本文就上述幾種方法進行了對比,驗證了所提出模型方法的有效性。
[Abstract]:In recent years, with the development of large-scale in-depth learning algorithms, chat robots no longer rely solely on template matching and retrieval, so it is gradually possible to generate dialogue algorithms. Compared with the retrieval chat robot, the generative chat robot has better mobility and generalization, and has a wider application scenario. This paper focuses on the open domain chat robot, which is different from the specific task chat robot. The goal of the open domain chat robot is not to complete the user assigned task as soon as possible. Instead, attract and retain users to be interested in continuing to talk to the robot. In this paper, the main Encoder-Decoder algorithm model based on RNN in the field of generative chat robot is experimented at first. At the same time, the influence of different neural network units, such as LSTM and GRU, on the result is compared, and then the attention model mechanism is added to improve the effect of the algorithm. Then the beam search method is used to improve the diversity of the generation effect. Because the seq2seq generation algorithm adopts the maximum likelihood estimation method in output, it is easy to produce a large number of meaningless security responses. In order to solve this problem, this paper uses the reinforcement learning method to evaluate the future reward of the dialogue, instead of selecting the maximum possible reply corresponding to the current input, but to evaluate the reward for the future dialogue so as to promote the sustainable development of chat. At the same time, this paper holds that a more intelligent robot should have emotional color, so in the reward function of reinforcement learning, besides detecting the fluency of the generated sentence and taking it as a reward, In order to make the chat robot choose the candidate sentence which can improve the emotion index of the future dialogue as much as possible, it can effectively continue the dialogue. In this paper, emotional information is added to the generation process as a supervisory signal to learn the emotional transfer distribution of the chat process from the corpus, and the distribution is used as a supervisory signal to guide the chat robot to reply, so that it can produce emotional sentences. Finally, through the way of automatic evaluation combined with manual evaluation, this paper compares the methods mentioned above, and verifies the validity of the proposed model method.
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP242

【相似文獻】

相關期刊論文 前10條

1 李紅美;;論網(wǎng)絡教育環(huán)境下學習者學習動機的激發(fā)[J];繼續(xù)教育;2006年11期

2 李秀英;;網(wǎng)絡環(huán)境下學生學習的特點[J];教師;2009年04期

3 夏定海,黃智英;教會學習 學會學習 終身學習[J];發(fā)明與革新;2000年06期

4 黃啟兵;汪芳;;論網(wǎng)絡時代學習與創(chuàng)新的統(tǒng)一[J];教學研究;2002年03期

5 陳相安;把檔案部門建成學習型組織[J];中國檔案;2003年09期

6 顧新,蔡兵,李久平;學習與學習型社會[J];軟科學;2004年02期

7 鄭軍;試論編輯的學習特征[J];中國編輯;2005年06期

8 邱曉榮,孔一童;試論網(wǎng)絡環(huán)境中的合作學習[J];當代教育論壇;2005年02期

9 冷平,王仁蓉,刁永鋒;網(wǎng)絡學習的成功要素探析[J];教育信息化;2005年03期

10 張建光;朱秀娥;張笑雙;;網(wǎng)絡學習社區(qū)的特征和構建[J];中國教育技術裝備;2006年03期

相關會議論文 前10條

1 韓文;;讓合作學習在逆境中重生[A];中華教育理論與實踐科研論文成果選編(第2卷)[C];2010年

2 呂啟春;;淺談小學數(shù)學中的小組合作學習[A];2014年1月現(xiàn)代教育教學探索學術交流會論文集[C];2014年

3 杜俊娟;;用學習動機培養(yǎng)策略課題的學習對體育教師進行研究性學習培養(yǎng)的實驗研究[A];第七屆全國體育科學大會論文摘要匯編(一)[C];2004年

4 瞿春波;;淺議合作學習之誤區(qū)[A];校園文學編輯部寫作教學年會論文集[C];2007年

5 時龍;;把握分析學情是改進教學和促進學習的基礎[A];2012·學術前沿論叢——科學發(fā)展:深化改革與改善民生(下)[C];2012年

6 韋彩紅;;如何組織學生共享學習成果[A];中華教育理論與實踐科研論文成果選編(第2卷)[C];2010年

7 格保耿;;培養(yǎng)學生學習物理的興趣[A];2014年5月現(xiàn)代教育教學探索學術交流會論文集[C];2014年

8 鈕榮榮;;關于小學數(shù)學教學中小組合作學習的幾點思考[A];2014年6月現(xiàn)代教育教學探索學術交流會論文集[C];2014年

9 陳妙;;讓數(shù)學課堂效率得到真正的提高——淺談新課改下學生學習興趣的培養(yǎng)[A];中華教育理論與實踐科研論文成果選編(第3卷)[C];2010年

10 黃春妙;;淺談語文課堂合作學習的有效把握[A];中華教育理論與實踐科研論文成果選編(第3卷)[C];2010年

相關重要報紙文章 前10條

1 農(nóng)行浙江東陽支行 吳新國 周龍飛;銀行如何創(chuàng)建學習型組織[N];上海金融報;2003年

2 西北師范大學 李瑾瑜;校長:如何引領和促進教師學習[N];中國教育報;2008年

3 永壽縣店頭中學 劉俊鋒;大力提倡合作學習 全面促進有效教學[N];咸陽日報;2009年

4 本報評論員;要在真學習上下功夫[N];酒泉日報;2009年

5 本報記者 李天然;學習應該是一種終身行為[N];大連日報;2010年

6 劉繼芳;淺議建設學習型黨組織中的“學習”內(nèi)涵[N];伊犁日報(漢);2010年

7 哈爾濱市第五醫(yī)院 蒙碩;淺談醫(yī)院創(chuàng)建學習型黨組織[N];黑龍江日報;2010年

8 翟愛霞;淺談如何深入推進學習型黨組織建設[N];太行日報;2011年

9 李振 上海交通大學國際與公共事務學院;制度變遷中的制度學習[N];中國社會科學報;2012年

10 重慶市教育評估院院長、中國高等教育學會學習科學研究分會常務副會長 龔春燕;實施新學習,建設學習型社會[N];中國教育報;2013年

相關博士學位論文 前10條

1 徐峰;基于社會網(wǎng)絡的大學生學習網(wǎng)絡結構研究[D];江西財經(jīng)大學;2014年

2 付亦寧;本科生深層學習過程及其教學策略研究[D];蘇州大學;2014年

3 馮子勇;基于深度學習的圖像特征學習和分類方法的研究及應用[D];華南理工大學;2016年

4 王星;關系分類模型的學習界限與應用[D];哈爾濱工業(yè)大學;2015年

5 潘劍寒;基于多潛在空間的遷移學習算法研究[D];合肥工業(yè)大學;2016年

6 楊春;反饋類型對大學生學習成績的影響:自我調(diào)節(jié)學習的中介作用[D];東北師范大學;2016年

7 王浩宇;資源整合、創(chuàng)業(yè)學習與新創(chuàng)企業(yè)創(chuàng)新的關系研究[D];吉林大學;2017年

8 田青;有序?qū)W習及在圖像分析中的應用研究[D];南京航空航天大學;2016年

9 鄒朋成;有監(jiān)督的相似性度量學習研究與應用[D];南京航空航天大學;2016年

10 馬相春;基于大數(shù)據(jù)的初中數(shù)學智慧學習系統(tǒng)模型研究[D];東北師范大學;2017年

相關碩士學位論文 前10條

1 曹東巖;基于強化學習的開放領域聊天機器人對話生成算法[D];哈爾濱工業(yè)大學;2017年

2 付曉麗;基于問題的深度學習研究[D];河南師范大學;2017年

3 王以宣;感知教師支持、基本心理需要滿足與初中學生英語學習倦怠的關系[D];上海師范大學;2015年

4 李榮敬;不同情緒狀態(tài)對學習判斷的影響[D];河北師范大學;2015年

5 李蘭翠;M00C學習平臺的應用研究[D];上海師范大學;2015年

6 孫航;農(nóng)民工隨遷子女學習生態(tài)研究[D];上海師范大學;2015年

7 左揚揚;碎片化時代下企業(yè)微課程設計與應用[D];上海師范大學;2015年

8 戚政霞;基于翻轉(zhuǎn)課堂的小學語文教學設計研究[D];上海師范大學;2015年

9 蘇治芳;小學中高年級“微課題式”語文學習的實踐研究[D];上海師范大學;2015年

10 張華;提高中職生語文課堂學習動力的策略研究[D];上海師范大學;2015年

,

本文編號:1805763

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1805763.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶bdf90***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com