天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于自然語言處理技術(shù)的循證醫(yī)學(xué)信息提取研究

發(fā)布時(shí)間:2021-12-24 20:52
  背景:流行病學(xué)是研究人類致病因素的科學(xué)。生物醫(yī)學(xué)研究文獻(xiàn)中有很多流行病學(xué)研究成果,但是這些信息并不能直接使用計(jì)算機(jī)進(jìn)行分析。傳統(tǒng)上,循證醫(yī)學(xué)研究依靠人工閱讀的方式從流行病學(xué)研究文獻(xiàn)中提取信息,但是這種方式費(fèi)時(shí)費(fèi)力,難以應(yīng)對海量的數(shù)據(jù)。為了設(shè)計(jì)出能夠進(jìn)行自動信息提取的系統(tǒng),以用于建立循證醫(yī)學(xué)研究知識庫,本課題開發(fā)了基于機(jī)器學(xué)習(xí)和基于規(guī)則的自動信息提取系統(tǒng)。方法:本文研究出兩種自動信息提取系統(tǒng),從生物醫(yī)學(xué)文獻(xiàn)中提取致病因素和疾病信息。在研究初期,課題開發(fā)出DEEL系統(tǒng)(用于從生物醫(yī)學(xué)文獻(xiàn)中提取致病因素)。該系統(tǒng)由一個(gè)自然語言處理引擎和一個(gè)基于規(guī)則的文本分類器構(gòu)成,用于從流行病學(xué)文獻(xiàn)中自動提取致病因素相關(guān)的信息。之后的研究中,本課題又開發(fā)出另一個(gè)系統(tǒng),它也由兩部分組成,第一部分使用一個(gè)自然語言引擎來標(biāo)識出所有的名詞短語,并收集該名詞短語的語義等信息。第二部分是一個(gè)基于機(jī)器學(xué)習(xí)的文本分類器,利用從自然語言處理引擎中獲取的信息,它能夠標(biāo)識出三類術(shù)語(名詞短語):致病因素、疾病以及不相關(guān)的短語。在該系統(tǒng)中,本課題應(yīng)用了四種算法:樸素貝葉斯算法、決策樹算法、支持向量機(jī)算法和邏輯回歸算法。并且比較了這... 

【文章來源】:復(fù)旦大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:81 頁

【學(xué)位級別】:博士

【部分圖文】:

基于自然語言處理技術(shù)的循證醫(yī)學(xué)信息提取研究


致病!川索的分類本研究課題,!,,流行病學(xué)專家共審閱廠1600個(gè)來「IJ幾關(guān)!l{I流行病’學(xué)雜志的文

信息圖,語義圖,數(shù)據(jù)圖,整體框架


圖5.1DEEL系統(tǒng)的整體框架圖KMclNLP引擎[65·“伙卜要用于從數(shù)據(jù)中提取語義等相關(guān)信息。它,lJ’以幫助研究者從生物醫(yī)學(xué)領(lǐng)域的文獻(xiàn)中找到感興趣的知識,鄉(xiāng)門1確定這止匕信息在UnitedMediealLanguagesystem(uMLs)[59,67]L},的具體概念不rl語義類)(,〕。J.仁J幾u(yù)MLs提供的適川J幾自然語一言處理的一T一具,在本課題,},,將應(yīng)川KMC!去處理所有的在八JEI幾發(fā)表的論文。KMel,:。J幾規(guī)則表達(dá)式應(yīng)川I,art。fspeeeh(l,05)tag168]愈7.法,這樣就!:J’以獲得AJE文本‘},自勺所丫J‘名L,IJ矢以語。從J幾規(guī)則的分類器:本擬{究利川訓(xùn)練數(shù)據(jù)集,設(shè)i!出從J‘規(guī)則的分類器,‘已將川J幾決定名L司i「lJ夕11_足臺足致71與I大I索。JI七J從KMCINll),JI擎斬汀{l}義件,l,了夫得的信息,這個(gè)分類器將到叮}發(fā)式的規(guī)則分派少lJ各個(gè)名i,,Ji,1』匆!。l冬15.1還給{!{個(gè)例句,L匕夕11”八55、)Ciatioll()t‘b()dy,1::,551;、。Ic、:‘,101Wcigl“tel:allgcwitllall一eause,n、)rtalityi:1tl:cclderly.”這個(gè)f.JJ幾輸入j·IJKM(’11’I然i島.’i處J,11弓l擎后,經(jīng)過KMcl處J,}l)!虧就示呀j(luò)、IJ11_個(gè)名L,IJ)、:丈i{}分別足:門):,55、)ei:,ti、);1二儀)b“,“l(fā)y

原理圖,機(jī)器學(xué)習(xí),概念,背景知識


背背景知識識識 識識識識識識識識識識識圖6.1機(jī)器學(xué)習(xí)的簡要原理圖如圖6.1所示,學(xué)習(xí)算法能夠根據(jù)預(yù)先所提供的-一組概念樣木和背景知識獲得1個(gè)對特定概念的模式的描述,以此來預(yù)測或判斷某個(gè)概念是否為這個(gè)概念類別。概念樣本為門例和反例,如在學(xué)習(xí)111n乳動物時(shí),貓就是一個(gè)幣例(因?yàn)椤咽荹l[Il乳動物),蟻蛤就是個(gè)反例(囚為它不是一個(gè)喃乳動物)。背娥知識包含很多描述概念和樣本的語,’泊勺情況,‘已日J(rèn)’以足個(gè)概念的屬性的可能取值及其層次、車南助句法規(guī)貝lJ、i’l’{語等。學(xué)習(xí)勸.法鼓終就足根州樣本類型,背l共知識以及設(shè)計(jì)者的經(jīng)驗(yàn)等構(gòu)


本文編號:3551174

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/swyx/3551174.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dc3ff***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com