基于強(qiáng)化學(xué)習(xí)的開放領(lǐng)域聊天機(jī)器人對(duì)話生成算法
本文選題:聊天機(jī)器人 + 對(duì)話生成; 參考:《哈爾濱工業(yè)大學(xué)》2017年碩士論文
【摘要】:近年來(lái),大規(guī)模深度學(xué)習(xí)算法的發(fā)展使得聊天機(jī)器人不再僅僅依靠模板匹配與檢索等方式,生成式對(duì)話算法逐步成為可能。與檢索式聊天機(jī)器人相比,生成式的聊天機(jī)器人的遷移性與泛化性更佳,擁有著更廣闊的應(yīng)用場(chǎng)景。本文主要關(guān)注開放領(lǐng)域的聊天機(jī)器人,區(qū)別于特定任務(wù)的聊天機(jī)器人,開放領(lǐng)域下的聊天機(jī)器人其目標(biāo)不是為了盡快完成用戶指定的任務(wù),而是吸引并留住用戶令其有興趣與機(jī)器人繼續(xù)交談。本文首先對(duì)生成式聊天機(jī)器人領(lǐng)域主流的基于RNN的Encoder-Decoder算法模型進(jìn)行實(shí)驗(yàn),同時(shí)對(duì)比了LSTM和GRU等不同的神經(jīng)網(wǎng)絡(luò)單元對(duì)結(jié)果的影響,隨后加入attention注意力模型機(jī)制提高了生成效果,而后又采用了beam search方法提升生成效果的多樣性。由于目前seq2seq的生成式算法在輸出時(shí)采用最大似然估計(jì)方法,極易產(chǎn)生大量無(wú)實(shí)際意義的安全回復(fù)。為解決這個(gè)問(wèn)題,本文采用強(qiáng)化學(xué)習(xí)的方法評(píng)估對(duì)話的未來(lái)獎(jiǎng)勵(lì),不再是針對(duì)當(dāng)前輸入選擇對(duì)應(yīng)的最大可能回復(fù),而是評(píng)估其對(duì)未來(lái)對(duì)話的獎(jiǎng)勵(lì),以促進(jìn)聊天持續(xù)發(fā)展。同時(shí)本文認(rèn)為一個(gè)更為智能的機(jī)器人應(yīng)具有情感色彩,故本文在強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)函數(shù)上,除對(duì)生成的語(yǔ)句流暢性等方面進(jìn)行檢測(cè)并將其作為獎(jiǎng)勵(lì)外,還加入了對(duì)候選句的情感檢測(cè),以期令聊天機(jī)器人盡可能選擇對(duì)未來(lái)對(duì)話情感指數(shù)有提升的候選句,有效地延續(xù)對(duì)話。本文還將情感信息作為監(jiān)督信號(hào)加入到生成過(guò)程中,從語(yǔ)料中學(xué)習(xí)聊天過(guò)程的情感轉(zhuǎn)移分布,并將該分布作為監(jiān)督信號(hào)指導(dǎo)聊天機(jī)器人回復(fù),使其產(chǎn)生蘊(yùn)含情感的語(yǔ)句。最后,通過(guò)自動(dòng)評(píng)價(jià)結(jié)合人工評(píng)價(jià)的方式,本文就上述幾種方法進(jìn)行了對(duì)比,驗(yàn)證了所提出模型方法的有效性。
[Abstract]:In recent years, with the development of large-scale in-depth learning algorithms, chat robots no longer rely solely on template matching and retrieval, so it is gradually possible to generate dialogue algorithms. Compared with the retrieval chat robot, the generative chat robot has better mobility and generalization, and has a wider application scenario. This paper focuses on the open domain chat robot, which is different from the specific task chat robot. The goal of the open domain chat robot is not to complete the user assigned task as soon as possible. Instead, attract and retain users to be interested in continuing to talk to the robot. In this paper, the main Encoder-Decoder algorithm model based on RNN in the field of generative chat robot is experimented at first. At the same time, the influence of different neural network units, such as LSTM and GRU, on the result is compared, and then the attention model mechanism is added to improve the effect of the algorithm. Then the beam search method is used to improve the diversity of the generation effect. Because the seq2seq generation algorithm adopts the maximum likelihood estimation method in output, it is easy to produce a large number of meaningless security responses. In order to solve this problem, this paper uses the reinforcement learning method to evaluate the future reward of the dialogue, instead of selecting the maximum possible reply corresponding to the current input, but to evaluate the reward for the future dialogue so as to promote the sustainable development of chat. At the same time, this paper holds that a more intelligent robot should have emotional color, so in the reward function of reinforcement learning, besides detecting the fluency of the generated sentence and taking it as a reward, In order to make the chat robot choose the candidate sentence which can improve the emotion index of the future dialogue as much as possible, it can effectively continue the dialogue. In this paper, emotional information is added to the generation process as a supervisory signal to learn the emotional transfer distribution of the chat process from the corpus, and the distribution is used as a supervisory signal to guide the chat robot to reply, so that it can produce emotional sentences. Finally, through the way of automatic evaluation combined with manual evaluation, this paper compares the methods mentioned above, and verifies the validity of the proposed model method.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP242
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李紅美;;論網(wǎng)絡(luò)教育環(huán)境下學(xué)習(xí)者學(xué)習(xí)動(dòng)機(jī)的激發(fā)[J];繼續(xù)教育;2006年11期
2 李秀英;;網(wǎng)絡(luò)環(huán)境下學(xué)生學(xué)習(xí)的特點(diǎn)[J];教師;2009年04期
3 夏定海,黃智英;教會(huì)學(xué)習(xí) 學(xué)會(huì)學(xué)習(xí) 終身學(xué)習(xí)[J];發(fā)明與革新;2000年06期
4 黃啟兵;汪芳;;論網(wǎng)絡(luò)時(shí)代學(xué)習(xí)與創(chuàng)新的統(tǒng)一[J];教學(xué)研究;2002年03期
5 陳相安;把檔案部門建成學(xué)習(xí)型組織[J];中國(guó)檔案;2003年09期
6 顧新,蔡兵,李久平;學(xué)習(xí)與學(xué)習(xí)型社會(huì)[J];軟科學(xué);2004年02期
7 鄭軍;試論編輯的學(xué)習(xí)特征[J];中國(guó)編輯;2005年06期
8 邱曉榮,孔一童;試論網(wǎng)絡(luò)環(huán)境中的合作學(xué)習(xí)[J];當(dāng)代教育論壇;2005年02期
9 冷平,王仁蓉,刁永鋒;網(wǎng)絡(luò)學(xué)習(xí)的成功要素探析[J];教育信息化;2005年03期
10 張建光;朱秀娥;張笑雙;;網(wǎng)絡(luò)學(xué)習(xí)社區(qū)的特征和構(gòu)建[J];中國(guó)教育技術(shù)裝備;2006年03期
相關(guān)會(huì)議論文 前10條
1 韓文;;讓合作學(xué)習(xí)在逆境中重生[A];中華教育理論與實(shí)踐科研論文成果選編(第2卷)[C];2010年
2 呂啟春;;淺談小學(xué)數(shù)學(xué)中的小組合作學(xué)習(xí)[A];2014年1月現(xiàn)代教育教學(xué)探索學(xué)術(shù)交流會(huì)論文集[C];2014年
3 杜俊娟;;用學(xué)習(xí)動(dòng)機(jī)培養(yǎng)策略課題的學(xué)習(xí)對(duì)體育教師進(jìn)行研究性學(xué)習(xí)培養(yǎng)的實(shí)驗(yàn)研究[A];第七屆全國(guó)體育科學(xué)大會(huì)論文摘要匯編(一)[C];2004年
4 瞿春波;;淺議合作學(xué)習(xí)之誤區(qū)[A];校園文學(xué)編輯部寫作教學(xué)年會(huì)論文集[C];2007年
5 時(shí)龍;;把握分析學(xué)情是改進(jìn)教學(xué)和促進(jìn)學(xué)習(xí)的基礎(chǔ)[A];2012·學(xué)術(shù)前沿論叢——科學(xué)發(fā)展:深化改革與改善民生(下)[C];2012年
6 韋彩紅;;如何組織學(xué)生共享學(xué)習(xí)成果[A];中華教育理論與實(shí)踐科研論文成果選編(第2卷)[C];2010年
7 格保耿;;培養(yǎng)學(xué)生學(xué)習(xí)物理的興趣[A];2014年5月現(xiàn)代教育教學(xué)探索學(xué)術(shù)交流會(huì)論文集[C];2014年
8 鈕榮榮;;關(guān)于小學(xué)數(shù)學(xué)教學(xué)中小組合作學(xué)習(xí)的幾點(diǎn)思考[A];2014年6月現(xiàn)代教育教學(xué)探索學(xué)術(shù)交流會(huì)論文集[C];2014年
9 陳妙;;讓數(shù)學(xué)課堂效率得到真正的提高——淺談新課改下學(xué)生學(xué)習(xí)興趣的培養(yǎng)[A];中華教育理論與實(shí)踐科研論文成果選編(第3卷)[C];2010年
10 黃春妙;;淺談?wù)Z文課堂合作學(xué)習(xí)的有效把握[A];中華教育理論與實(shí)踐科研論文成果選編(第3卷)[C];2010年
相關(guān)重要報(bào)紙文章 前10條
1 農(nóng)行浙江東陽(yáng)支行 吳新國(guó) 周龍飛;銀行如何創(chuàng)建學(xué)習(xí)型組織[N];上海金融報(bào);2003年
2 西北師范大學(xué) 李瑾瑜;校長(zhǎng):如何引領(lǐng)和促進(jìn)教師學(xué)習(xí)[N];中國(guó)教育報(bào);2008年
3 永壽縣店頭中學(xué) 劉俊鋒;大力提倡合作學(xué)習(xí) 全面促進(jìn)有效教學(xué)[N];咸陽(yáng)日?qǐng)?bào);2009年
4 本報(bào)評(píng)論員;要在真學(xué)習(xí)上下功夫[N];酒泉日?qǐng)?bào);2009年
5 本報(bào)記者 李天然;學(xué)習(xí)應(yīng)該是一種終身行為[N];大連日?qǐng)?bào);2010年
6 劉繼芳;淺議建設(shè)學(xué)習(xí)型黨組織中的“學(xué)習(xí)”內(nèi)涵[N];伊犁日?qǐng)?bào)(漢);2010年
7 哈爾濱市第五醫(yī)院 蒙碩;淺談醫(yī)院創(chuàng)建學(xué)習(xí)型黨組織[N];黑龍江日?qǐng)?bào);2010年
8 翟愛(ài)霞;淺談如何深入推進(jìn)學(xué)習(xí)型黨組織建設(shè)[N];太行日?qǐng)?bào);2011年
9 李振 上海交通大學(xué)國(guó)際與公共事務(wù)學(xué)院;制度變遷中的制度學(xué)習(xí)[N];中國(guó)社會(huì)科學(xué)報(bào);2012年
10 重慶市教育評(píng)估院院長(zhǎng)、中國(guó)高等教育學(xué)會(huì)學(xué)習(xí)科學(xué)研究分會(huì)常務(wù)副會(huì)長(zhǎng) 龔春燕;實(shí)施新學(xué)習(xí),建設(shè)學(xué)習(xí)型社會(huì)[N];中國(guó)教育報(bào);2013年
相關(guān)博士學(xué)位論文 前10條
1 徐峰;基于社會(huì)網(wǎng)絡(luò)的大學(xué)生學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)研究[D];江西財(cái)經(jīng)大學(xué);2014年
2 付亦寧;本科生深層學(xué)習(xí)過(guò)程及其教學(xué)策略研究[D];蘇州大學(xué);2014年
3 馮子勇;基于深度學(xué)習(xí)的圖像特征學(xué)習(xí)和分類方法的研究及應(yīng)用[D];華南理工大學(xué);2016年
4 王星;關(guān)系分類模型的學(xué)習(xí)界限與應(yīng)用[D];哈爾濱工業(yè)大學(xué);2015年
5 潘劍寒;基于多潛在空間的遷移學(xué)習(xí)算法研究[D];合肥工業(yè)大學(xué);2016年
6 楊春;反饋類型對(duì)大學(xué)生學(xué)習(xí)成績(jī)的影響:自我調(diào)節(jié)學(xué)習(xí)的中介作用[D];東北師范大學(xué);2016年
7 王浩宇;資源整合、創(chuàng)業(yè)學(xué)習(xí)與新創(chuàng)企業(yè)創(chuàng)新的關(guān)系研究[D];吉林大學(xué);2017年
8 田青;有序?qū)W習(xí)及在圖像分析中的應(yīng)用研究[D];南京航空航天大學(xué);2016年
9 鄒朋成;有監(jiān)督的相似性度量學(xué)習(xí)研究與應(yīng)用[D];南京航空航天大學(xué);2016年
10 馬相春;基于大數(shù)據(jù)的初中數(shù)學(xué)智慧學(xué)習(xí)系統(tǒng)模型研究[D];東北師范大學(xué);2017年
相關(guān)碩士學(xué)位論文 前10條
1 曹東巖;基于強(qiáng)化學(xué)習(xí)的開放領(lǐng)域聊天機(jī)器人對(duì)話生成算法[D];哈爾濱工業(yè)大學(xué);2017年
2 付曉麗;基于問(wèn)題的深度學(xué)習(xí)研究[D];河南師范大學(xué);2017年
3 王以宣;感知教師支持、基本心理需要滿足與初中學(xué)生英語(yǔ)學(xué)習(xí)倦怠的關(guān)系[D];上海師范大學(xué);2015年
4 李榮敬;不同情緒狀態(tài)對(duì)學(xué)習(xí)判斷的影響[D];河北師范大學(xué);2015年
5 李蘭翠;M00C學(xué)習(xí)平臺(tái)的應(yīng)用研究[D];上海師范大學(xué);2015年
6 孫航;農(nóng)民工隨遷子女學(xué)習(xí)生態(tài)研究[D];上海師范大學(xué);2015年
7 左揚(yáng)揚(yáng);碎片化時(shí)代下企業(yè)微課程設(shè)計(jì)與應(yīng)用[D];上海師范大學(xué);2015年
8 戚政霞;基于翻轉(zhuǎn)課堂的小學(xué)語(yǔ)文教學(xué)設(shè)計(jì)研究[D];上海師范大學(xué);2015年
9 蘇治芳;小學(xué)中高年級(jí)“微課題式”語(yǔ)文學(xué)習(xí)的實(shí)踐研究[D];上海師范大學(xué);2015年
10 張華;提高中職生語(yǔ)文課堂學(xué)習(xí)動(dòng)力的策略研究[D];上海師范大學(xué);2015年
,本文編號(hào):1805763
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1805763.html