面向醫(yī)療健康領(lǐng)域的問答系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-01-21 00:51
在當(dāng)前數(shù)字信息迅速增長的時(shí)代,人們越來越依賴于從互聯(lián)網(wǎng)上獲取信息。對于醫(yī)療健康方面,人們常常從互聯(lián)網(wǎng)上查詢疾病和癥狀信息,用以了解自身健康狀況并及時(shí)預(yù)防或治療。然而,通過搜索引擎檢索信息的傳統(tǒng)方式十分不便,因其需要用戶自己設(shè)計(jì)和提煉關(guān)鍵詞,甚至做進(jìn)一步的篩選才能得到答案,難以滿足人們快速獲取醫(yī)療健康信息的要求。本文旨在研究和開發(fā)一個(gè)針對醫(yī)療健康領(lǐng)域的問答系統(tǒng),用以輔助醫(yī)療服務(wù),幫助用戶快速了解自身健康狀況,以便人們在去醫(yī)院就診時(shí)能夠心里有數(shù)。本文主要工作如下。首先針對人們表達(dá)醫(yī)療問題的形式多樣,很難用規(guī)則模板的方式從問題中提取疾病癥狀實(shí)體的情況,提出了語義相似度計(jì)算方法,該方法主要由基于編輯距離的方法、基于字符重疊系數(shù)的方法和基于詞向量的方法構(gòu)成。實(shí)驗(yàn)結(jié)果表明混合方法的效果優(yōu)于三個(gè)方法單獨(dú)使用時(shí)的效果,說明該方法能有效抽取詞典外語義相似的疾病癥狀實(shí)體。其次出于對數(shù)據(jù)庫查詢需要查詢目標(biāo)的考慮,設(shè)計(jì)了意圖識別的多分類模型,該模型由樸素貝葉斯算法訓(xùn)練得到。在測試實(shí)驗(yàn)中,該多分類模型的最佳F1值達(dá)到了0.9686,說明該多分類器能有效識別出大多數(shù)用戶輸入信息的查詢意圖類型。最后針對醫(yī)療問題通常...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:94 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于結(jié)構(gòu)化數(shù)據(jù)的問答系統(tǒng)架構(gòu)
圖 1.2 基于自由文本的問答系統(tǒng)架構(gòu)據(jù)的問答系統(tǒng)的架構(gòu)如圖 1.3 所示,它的研究主要有的問答系統(tǒng)研究階段和基于社區(qū)問答的問答系統(tǒng)研究于自由文本的問答系統(tǒng)一樣,除了信息檢索和答案抽用戶問題類似的問題, 然后返回答案或者相似問題列案對已經(jīng)有了答案, 答案抽取最重要的工作就是判斷多答案中選擇一個(gè)最好的答案。因此基于問答對的問相似的問題。
圖 1.3 基于問答對數(shù)據(jù)的問答系統(tǒng)架構(gòu)域的復(fù)雜問題,單獨(dú)使用某種數(shù)據(jù)源都無法達(dá)到體信息或描述太復(fù)雜,那么不論是結(jié)構(gòu)化數(shù)據(jù)還出正確答案。問答系統(tǒng)按領(lǐng)域可劃分為開放領(lǐng)域系統(tǒng)因其涉及知識面廣而資源收集困難,因此其領(lǐng)域的問答系統(tǒng)因其有許多領(lǐng)域相關(guān)資源可以借都比較容易[14]。因此,在一個(gè)復(fù)雜度適中的限定得很好的效果,本文就結(jié)合使用了醫(yī)療知識庫和研究現(xiàn)狀的限制性領(lǐng)域,可以通過健康醫(yī)療網(wǎng)站為其收集掃描醫(yī)學(xué)文獻(xiàn)來收集文檔數(shù)據(jù)。因此,醫(yī)療領(lǐng)域
本文編號:2990114
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:94 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于結(jié)構(gòu)化數(shù)據(jù)的問答系統(tǒng)架構(gòu)
圖 1.2 基于自由文本的問答系統(tǒng)架構(gòu)據(jù)的問答系統(tǒng)的架構(gòu)如圖 1.3 所示,它的研究主要有的問答系統(tǒng)研究階段和基于社區(qū)問答的問答系統(tǒng)研究于自由文本的問答系統(tǒng)一樣,除了信息檢索和答案抽用戶問題類似的問題, 然后返回答案或者相似問題列案對已經(jīng)有了答案, 答案抽取最重要的工作就是判斷多答案中選擇一個(gè)最好的答案。因此基于問答對的問相似的問題。
圖 1.3 基于問答對數(shù)據(jù)的問答系統(tǒng)架構(gòu)域的復(fù)雜問題,單獨(dú)使用某種數(shù)據(jù)源都無法達(dá)到體信息或描述太復(fù)雜,那么不論是結(jié)構(gòu)化數(shù)據(jù)還出正確答案。問答系統(tǒng)按領(lǐng)域可劃分為開放領(lǐng)域系統(tǒng)因其涉及知識面廣而資源收集困難,因此其領(lǐng)域的問答系統(tǒng)因其有許多領(lǐng)域相關(guān)資源可以借都比較容易[14]。因此,在一個(gè)復(fù)雜度適中的限定得很好的效果,本文就結(jié)合使用了醫(yī)療知識庫和研究現(xiàn)狀的限制性領(lǐng)域,可以通過健康醫(yī)療網(wǎng)站為其收集掃描醫(yī)學(xué)文獻(xiàn)來收集文檔數(shù)據(jù)。因此,醫(yī)療領(lǐng)域
本文編號:2990114
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2990114.html
最近更新
教材專著