醫(yī)療問答系統(tǒng)的中文分詞算法研究

發(fā)布時間：2021-09-28 23:34

　　醫(yī)療問答系統(tǒng)一直是智能醫(yī)療發(fā)展的重要內(nèi)容,也是自然語言處理領域的研究熱點。為了用準確、簡潔的文本回答用戶提出的醫(yī)療問題,滿足用戶盡快得到正確的答案的需求,醫(yī)療問答系統(tǒng)需要有較高的執(zhí)行效率。而中文分詞的準確率直接影響著問答系統(tǒng)的執(zhí)行效率,提高中文分詞的準確率可以從根本上提高醫(yī)療問答系統(tǒng)的答題準確率并縮短答題時間。本文研究了LSTM-CRF組合網(wǎng)絡提高中文分詞的準確率和分詞速率,實現(xiàn)自動分詞,不依賴人工標注特征,研究的內(nèi)容包括:醫(yī)療文本數(shù)據(jù)的采集存儲、設計融合的神經(jīng)網(wǎng)絡分詞結(jié)構以及測試基于改進后中文分詞算法對醫(yī)療問答系統(tǒng)執(zhí)行率的影響。主要研究成果如下:采集并構建了醫(yī)療文本數(shù)據(jù)集,通過量化存儲搜集的疾病信息和醫(yī)療問答信息,構建了29610條疾病語料信息和23632對問答信息,其中包含39個科室的9856個疾病。設計了基于LSTM和CRF模型的融合網(wǎng)絡中文分詞算法。首先對兩個LSTM神經(jīng)網(wǎng)絡進行反向連接,然后調(diào)節(jié)雙層網(wǎng)絡的權重矩陣,對前后序列信息設置不同的選擇權重,通過上下文關系特征向量的線性變換與CRF標注推理層融合。同時,對BI-LSTM-CRF組合網(wǎng)絡詞位標注增加到6詞位標注集�；卺t(yī)療...

【文章來源】：華中科技大學湖北省 211工程院校 985工程院校教育部直屬院校

【文章頁數(shù)】：86 頁

【學位級別】：碩士

【部分圖文】：

自動分詞框架圖

框架圖,鍵值,分詞系統(tǒng),自動分詞

圖 1-1 自動分詞框架圖1991 年，北京航空航天大學完成了的設計之后，進一步對該系統(tǒng)進行升級。研制了系統(tǒng)[4],如圖 1-2 所示。系統(tǒng)融合字節(jié)轉(zhuǎn)碼和分析框架的優(yōu)點，進行中文的分詞處理。由于系統(tǒng)和系統(tǒng)內(nèi)部詞典存儲的方式不同，系統(tǒng)根據(jù)首字索引建立字典一樣的鍵值對，同時，對不同鍵值對沒有長度的要求。內(nèi)部主要的存儲結(jié)構有效的減少了分詞系統(tǒng)運行的時間復雜度，極大的提高了系統(tǒng)分詞的效率。分詞速度是每分鐘12000個字，分詞誤差也比系統(tǒng)更小，并且可移植性和通用性的優(yōu)點讓系統(tǒng)在我國中文分詞技術發(fā)展的初期發(fā)揮了極大的優(yōu)勢和研究價值。

機器學習,搜索算法,準確率,應用統(tǒng)計方法

華中科技大學碩士學位論文字‘ ’和‘ ’就越可能代表為一個詞。當訓練的文本數(shù)據(jù)集包由計算的概率結(jié)果，可以得到文本的組成結(jié)構，得到準確率較高的eba 分詞[9]就是應用統(tǒng)計方法的一個高效分詞方法，但是也存在很大要得到比較高的分詞準確率，需要豐富的語料數(shù)據(jù)集支撐。

本文編號：3412749

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/shengwushengchang/3412749.html

上一篇：面向探究式學習的Web3D虛擬實驗交互設計研究
下一篇：基于多特征分類的目標檢測算法研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

醫(yī)療問答系統(tǒng)的中文分詞算法研究