天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

多輪對話系統(tǒng)中語句生成方法研究

發(fā)布時間:2021-12-17 05:26
  隨著人工智能的快速發(fā)展,對話系統(tǒng)開始走入人們的視野。對話系統(tǒng)是一種能以自然語言的形式與人進行溝通交流的系統(tǒng),它們可以為用戶提供信息,甚至可以為用戶提供幫助,如由微軟推出的小冰和由蘋果公司推出的Siri等。多輪對話系統(tǒng)則是可以根據(jù)之前的對話內(nèi)容進行連續(xù)響應(yīng)的系統(tǒng),它正在影響人們的生活,通過多次溝通的方式為用戶提供更便捷的服務(wù)和有價值的信息。近年來,對話系統(tǒng)開始由以前的檢索式對話系統(tǒng)向基于神經(jīng)網(wǎng)絡(luò)模型的生成式對話系統(tǒng)發(fā)展。盡管多輪對話系統(tǒng)性能不斷提高,但還存在許多亟待解決的問題,比如現(xiàn)有的對話系統(tǒng)會輸出一些含有語法錯誤或者有歧義的句子;會生成一些敷衍式的沒有太多信息量的無用語句等。針對多輪對話系統(tǒng)目前存在的問題,本文從語句困惑度評價、語句中詞語話題相關(guān)性和語句生成等方面進行了深入研究。本文主要工作及創(chuàng)新點如下:(1)提出一種基于對句子語義語法信息分析的語句困惑度計算方法首先,該方法從目標語句中去掉所有修飾成分,獲得句子主干;然后,通過對句子主干和原句進行句法依存分析,獲得語義和語法方面信息,用于計算目標句子相對參照方案的困惑度;最后,對各個困惑度加權(quán)計算則求得目標語句整體的困惑度。該方法可... 

【文章來源】:山東師范大學山東省

【文章頁數(shù)】:54 頁

【學位級別】:碩士

【部分圖文】:

多輪對話系統(tǒng)中語句生成方法研究


小冰與用戶之間的多輪對話實例多輪對話的研究意圖更側(cè)重于如何準確地把握用戶的對話需求,維持對話的正常進行,同時避免系統(tǒng)輸出有語法錯誤或者語義有歧義的句子,能聯(lián)系上下文信息和用戶的一些個

句法分析,句子


圖 2-1 句子依存句法分析圖圖 2-1 展示了一句中文語句進行依存句法分析之后得到詞語之間的依賴關(guān)系,每一線連接的兩個詞都能構(gòu)成一個詞語對。從圖中,可以看出句子中的“堅持”是中心謂詞前是句子主語部分,向后是句子賓語以及其他并列謂詞。對依存分析結(jié)果的分析表明對句法的依存語法分析能把句子中關(guān)鍵的主謂關(guān)系、動賓關(guān)系和謂語的并列關(guān)系都表來,如與 Root 相連的動詞是整個句子K 的核心以及弧線連接的各個詞語對。2.2.2 語法困惑度計算如果一個句子的語法錯誤非常明顯或非常多,那么這句話從語法角度評價就會有較困惑度,也就是即便語義組合和搭配都是正確的,混亂的語法或者一些語病就足以讓法讀懂這句話。中文語法的使用非常復雜,所以有相關(guān)研究利用抽取的語言語法規(guī)則建自動機[41],利用這種自動機來對中文語句進行分析,所以本文借鑒這種自動化處理想對句子進行語法分析,具體如算法 2-3 所示。法 2-3. 中文語句的語法分析

分布圖,句子長度,分布圖,困惑度


圖 2-2 句子長度分布圖每個機器翻譯的句子的真實的困惑度,我們組織了 6 名研究生結(jié)果對所有機器翻譯結(jié)果的合理性進行人工評價,評分采用的了檢驗 8 人評分的一致性,我們匯總評分數(shù)據(jù)后計算其 kappa據(jù) kappa 系數(shù)分級,評分人員的評價結(jié)果具有較高一致性,可S 數(shù)據(jù)分析軟件對實驗數(shù)據(jù)進行回歸分析,得出了 4 個困惑度.25,常數(shù)項的值小于 0.0001,所以可以用這 4 個分析得到的困終困惑度。中,首先用基于譯文加權(quán)改進后的 BLEU 算法和 EPBSS 方法得出在翻譯數(shù)據(jù)集上不同數(shù)據(jù)量情況下的準確率,準確率對比可以看出 EPBSS 方法準確率要高于基于譯文加權(quán)改進后的 BL增加到 700 句之后,準確率數(shù)值波動開始減小。當測試句子數(shù)夠判別正確的有 544 句。在實驗過程中,EPBSS 直接以所有參

【參考文獻】:
期刊論文
[1]From Eliza to XiaoIce:challenges and opportunities with social chatbots[J]. Heung-yeung SHUM,Xiao-dong HE,Di LI.  Frontiers of Information Technology & Electronic Engineering. 2018(01)
[2]TF-IDF與規(guī)則相結(jié)合的中文關(guān)鍵詞自動抽取研究[J]. 牛萍,黃德根.  小型微型計算機系統(tǒng). 2016(04)
[3]口語對話系統(tǒng)中對話管理方法研究綜述[J]. 王玉,任福繼,全昌勤.  計算機科學. 2015(06)
[4]文本情感分類中生成式情感模型的發(fā)展[J]. 張輝,劉奕群,馬少平.  計算機應(yīng)用研究. 2014(12)
[5]基于有意義串聚類的微博熱點話題發(fā)現(xiàn)方法[J]. 賀敏,王麗宏,杜攀,張瑾,程學旗.  通信學報. 2013(S1)
[6]統(tǒng)計機器翻譯中雙語語料的過濾及詞對齊的改進[J]. 梁華參,趙鐵軍.  智能計算機與應(yīng)用. 2013(04)
[7]漢語組塊分析研究綜述[J]. 李業(yè)剛,黃河燕.  中文信息學報. 2013(03)
[8]基于中文維基百科的詞語相關(guān)度計算[J]. 諶志群,高飛,曾智軍.  情報學報. 2012 (12)
[9]基于BLEU的英語翻譯自動評分研究[J]. 王茜.  安徽電子信息職業(yè)技術(shù)學院學報. 2010(04)
[10]機器翻譯及其評測技術(shù)簡介[J]. 趙紅梅,劉群.  術(shù)語標準化與信息技術(shù). 2010(01)

碩士論文
[1]基于中草藥語義網(wǎng)的自動問答系統(tǒng)的研究與實現(xiàn)[D]. 錢宏澤.浙江大學 2016



本文編號:3539480

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3539480.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ea0f7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com