天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

醫(yī)療問答系統(tǒng)的中文分詞算法研究

發(fā)布時間:2021-09-28 23:34
  醫(yī)療問答系統(tǒng)一直是智能醫(yī)療發(fā)展的重要內(nèi)容,也是自然語言處理領域的研究熱點。為了用準確、簡潔的文本回答用戶提出的醫(yī)療問題,滿足用戶盡快得到正確的答案的需求,醫(yī)療問答系統(tǒng)需要有較高的執(zhí)行效率。而中文分詞的準確率直接影響著問答系統(tǒng)的執(zhí)行效率,提高中文分詞的準確率可以從根本上提高醫(yī)療問答系統(tǒng)的答題準確率并縮短答題時間。本文研究了LSTM-CRF組合網(wǎng)絡提高中文分詞的準確率和分詞速率,實現(xiàn)自動分詞,不依賴人工標注特征,研究的內(nèi)容包括:醫(yī)療文本數(shù)據(jù)的采集存儲、設計融合的神經(jīng)網(wǎng)絡分詞結(jié)構以及測試基于改進后中文分詞算法對醫(yī)療問答系統(tǒng)執(zhí)行率的影響。主要研究成果如下:采集并構建了醫(yī)療文本數(shù)據(jù)集,通過量化存儲搜集的疾病信息和醫(yī)療問答信息,構建了29610條疾病語料信息和23632對問答信息,其中包含39個科室的9856個疾病。設計了基于LSTM和CRF模型的融合網(wǎng)絡中文分詞算法。首先對兩個LSTM神經(jīng)網(wǎng)絡進行反向連接,然后調(diào)節(jié)雙層網(wǎng)絡的權重矩陣,對前后序列信息設置不同的選擇權重,通過上下文關系特征向量的線性變換與CRF標注推理層融合。同時,對BI-LSTM-CRF組合網(wǎng)絡詞位標注增加到6詞位標注集;卺t(yī)療... 

【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:86 頁

【學位級別】:碩士

【部分圖文】:

醫(yī)療問答系統(tǒng)的中文分詞算法研究


自動分詞框架圖

框架圖,鍵值,分詞系統(tǒng),自動分詞


圖 1-1 自動分詞框架圖1991 年,北京航空航天大學完成了 的設計之后,進一步對該系統(tǒng)進行升級。研制了 系統(tǒng)[4],如圖 1-2 所示。 系統(tǒng)融合字節(jié)轉(zhuǎn)碼和分析框架 的優(yōu)點,進行中文的分詞處理。由于 系統(tǒng)和 系統(tǒng)內(nèi)部詞典存儲的方式不同, 系統(tǒng)根據(jù)首字索引建立字典一樣的鍵值對,同時,對不同鍵值對沒有長度的要求。內(nèi)部主要的存儲結(jié)構有效的減少了分詞系統(tǒng)運行的時間復雜度,極大的提高了 系統(tǒng)分詞的效率。分詞速度是每分鐘12000個字,分詞誤差也比 系統(tǒng)更小,并且可移植性和通用性的優(yōu)點讓 系統(tǒng)在我國中文分詞技術發(fā)展的初期發(fā)揮了極大的優(yōu)勢和研究價值。

機器學習,搜索算法,準確率,應用統(tǒng)計方法


華 中 科 技 大 學 碩 士 學 位 論 文字‘ ’和‘ ’就越可能代表為一個詞。當訓練的文本數(shù)據(jù)集包由計算的概率結(jié)果,可以得到文本的組成結(jié)構,得到準確率較高的eba 分詞[9]就是應用統(tǒng)計方法的一個高效分詞方法,但是也存在很大要得到比較高的分詞準確率,需要豐富的語料數(shù)據(jù)集支撐。


本文編號:3412749

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3412749.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶e3b54***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com