天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向消化內(nèi)科輔助診療的生成式對話系統(tǒng)研究

發(fā)布時(shí)間:2020-08-23 20:47
【摘要】:隨著社會的快速發(fā)展,群眾的壓力也越來越大。不規(guī)律飲食已成為現(xiàn)代人的共同問題,食物安全性的問題也一直存在,這導(dǎo)致了患有消化系統(tǒng)疾病的人數(shù)不斷增多。消化系統(tǒng)很多疾病的發(fā)病周期長,通常早期對人的影響很小,只會出現(xiàn)一些輕微的不適感,對現(xiàn)在忙于工作的上班族不構(gòu)成去醫(yī)院問診的充分條件。一般在身體剛出現(xiàn)消化系統(tǒng)異常情況時(shí),大多數(shù)人會首先選擇在互聯(lián)網(wǎng)上尋找信息幫助。傳統(tǒng)搜索引擎在處理疾病的搜索請求時(shí),技術(shù)原理通常為關(guān)鍵字匹配,存在諸多限制,例如丟失疾病的關(guān)鍵信息,并且整個(gè)過程耗時(shí),甚至可能是無效的查詢。在這種背景下,考慮到對話系統(tǒng)作為一種先進(jìn)的信息檢索系統(tǒng),能夠根據(jù)用戶的輸入及時(shí)返回相關(guān)的有效信息,本文探索了一種適用于消化內(nèi)科領(lǐng)域的生成式對話系統(tǒng),研究內(nèi)容主要包括語料的分詞、文本的分類和對話模型三個(gè)部分。1.研究一些常用的分詞方法,分析各種方法的優(yōu)缺點(diǎn),以及對適用于中文的結(jié)巴分詞工具展開研究,分析其處理消化內(nèi)科語料分詞時(shí)出現(xiàn)的問題。本文在結(jié)巴分詞的基礎(chǔ)上,構(gòu)建消化內(nèi)科領(lǐng)域的專業(yè)詞典,使用雙向最大匹配分詞法進(jìn)行分詞操作,同時(shí)增加歧義消除策略。實(shí)驗(yàn)結(jié)果表明我們的分詞策略能有效解決結(jié)巴分詞在處理消化內(nèi)科語料分詞過程中出現(xiàn)的疾病名稱、癥狀名、藥名錯(cuò)分問題,以及降低分詞歧義的產(chǎn)生概率。2.研究消化內(nèi)科領(lǐng)域問答數(shù)據(jù)缺乏的問題。通過Beautiful Soup爬蟲獲取初始語料,在進(jìn)行數(shù)據(jù)清洗和分詞處理之后,對常用的關(guān)鍵詞提取算法展開研究,本文在此基礎(chǔ)上提出關(guān)鍵詞聯(lián)系類別的詞向量構(gòu)建方法,構(gòu)建問句的句向量,將句向量作為支持向量機(jī)(Support Vector Machine,SVM)的輸入特征,通過主動學(xué)習(xí)策略進(jìn)行分類模型的訓(xùn)練,實(shí)現(xiàn)文本的分類。實(shí)驗(yàn)結(jié)果表明使用本文提出的句向量進(jìn)行文本分類的效果比使用word2vec(Word to Vector)向量進(jìn)行分類的效果要好,得到的分類模型能夠獲取到較均衡的消化內(nèi)科五大類數(shù)據(jù)。3.研究傳統(tǒng)的序列到序列模型(Sequence to Sequence,seq2seq),分析該模型在生成消化內(nèi)科問診答案時(shí)具備的缺陷,并對谷歌的語法分析樹生成模型展開研究,在兩者的基礎(chǔ)上,通過組合多層編碼、注意力機(jī)制解碼、門控循環(huán)單元(Gated Recurrent Unit,GRU)和集束算法(Beam Search)形成本文提出的對話模型結(jié)構(gòu),并結(jié)合鍵值對向量和word2vec向量提出新的模型訓(xùn)練方法。實(shí)驗(yàn)結(jié)果表明本文提出的對話模型結(jié)構(gòu)在進(jìn)行消化內(nèi)科疾病的答復(fù)的生成時(shí),能夠解決傳統(tǒng)生成模型產(chǎn)生的回答與問句無關(guān)的問題,生成的語句結(jié)構(gòu)不完整的問題,以及規(guī)定輸入語句長度一致的問題,同時(shí)新的模型訓(xùn)練方法能夠一定程度上提高模型的有效性。
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:R57;TP391.1
【圖文】:

上下文相關(guān),模型結(jié)構(gòu),獨(dú)熱編碼,對話模型


將語料進(jìn)行獨(dú)熱編碼形式表示為初始詞向量,通過一層神經(jīng)網(wǎng)絡(luò),采取逡逑CBOW訓(xùn)練方式得到word2vec向量[54,55],下面對CBOW進(jìn)行簡單的介紹,其逡逑訓(xùn)練數(shù)據(jù)的模型結(jié)構(gòu)如圖4.5所示。逡逑?入邐神經(jīng)網(wǎng)絡(luò)邐輸出逡逑W(t-2)-逡逑W(t-l)-逡逑邐邋邐?邐邐?邋W(t)逡逑W(t+1)-逡逑W(t+2)-逡逑圖4.5邋CBOW模型結(jié)構(gòu)逡逑CBOW可以理解成通過某個(gè)詞的上下文相關(guān)的詞來表示該詞,本文采取該逡逑模型的原因在于,對話模型的機(jī)制也是根據(jù)當(dāng)前詞預(yù)測下一個(gè)詞,既根據(jù)上文預(yù)逡逑測下文。逡逑4.2.3模型搭建與訓(xùn)練逡逑4.2.3.邋1模型結(jié)構(gòu)逡逑42逡逑

曲線,對話模型


邐考慮邐是邐急性》r>炎,邐

本文編號:2802002

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/xiaohjib/2802002.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3b1ee***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com