當(dāng)前位置：主頁 > 醫(yī)學(xué)論文 > 生物醫(yī)學(xué)論文 >

基于自然語言處理技術(shù)的循證醫(yī)學(xué)信息提取研究

發(fā)布時(shí)間：2021-12-24 20:52

　　背景：流行病學(xué)是研究人類致病因素的科學(xué)。生物醫(yī)學(xué)研究文獻(xiàn)中有很多流行病學(xué)研究成果,但是這些信息并不能直接使用計(jì)算機(jī)進(jìn)行分析。傳統(tǒng)上,循證醫(yī)學(xué)研究依靠人工閱讀的方式從流行病學(xué)研究文獻(xiàn)中提取信息,但是這種方式費(fèi)時(shí)費(fèi)力,難以應(yīng)對海量的數(shù)據(jù)。為了設(shè)計(jì)出能夠進(jìn)行自動信息提取的系統(tǒng),以用于建立循證醫(yī)學(xué)研究知識庫,本課題開發(fā)了基于機(jī)器學(xué)習(xí)和基于規(guī)則的自動信息提取系統(tǒng)。方法：本文研究出兩種自動信息提取系統(tǒng),從生物醫(yī)學(xué)文獻(xiàn)中提取致病因素和疾病信息。在研究初期,課題開發(fā)出DEEL系統(tǒng)（用于從生物醫(yī)學(xué)文獻(xiàn)中提取致病因素）。該系統(tǒng)由一個(gè)自然語言處理引擎和一個(gè)基于規(guī)則的文本分類器構(gòu)成,用于從流行病學(xué)文獻(xiàn)中自動提取致病因素相關(guān)的信息。之后的研究中,本課題又開發(fā)出另一個(gè)系統(tǒng),它也由兩部分組成,第一部分使用一個(gè)自然語言引擎來標(biāo)識出所有的名詞短語,并收集該名詞短語的語義等信息。第二部分是一個(gè)基于機(jī)器學(xué)習(xí)的文本分類器,利用從自然語言處理引擎中獲取的信息,它能夠標(biāo)識出三類術(shù)語（名詞短語）：致病因素、疾病以及不相關(guān)的短語。在該系統(tǒng)中,本課題應(yīng)用了四種算法：樸素貝葉斯算法、決策樹算法、支持向量機(jī)算法和邏輯回歸算法。并且比較了這...

【文章來源】：復(fù)旦大學(xué)上海市 211工程院校 985工程院校教育部直屬院校

【文章頁數(shù)】：81 頁

【學(xué)位級別】：博士

【部分圖文】：

致病!川索的分類本研究課題，!，，流行病學(xué)專家共審閱廠1600個(gè)來「IJ幾關(guān)!l{I流行病’學(xué)雜志的文

信息圖,語義圖,數(shù)據(jù)圖,整體框架

圖5.1DEEL系統(tǒng)的整體框架圖KMclNLP引擎[65·“伙卜要用于從數(shù)據(jù)中提取語義等相關(guān)信息。它，lJ’以幫助研究者從生物醫(yī)學(xué)領(lǐng)域的文獻(xiàn)中找到感興趣的知識，鄉(xiāng)門1確定這止匕信息在UnitedMediealLanguagesystem(uMLs)[59，67]L}，的具體概念不rl語義類)(，〕。J.仁J幾u(yù)MLs提供的適川J幾自然語一言處理的一T一具，在本課題，}，，將應(yīng)川KMC!去處理所有的在八JEI幾發(fā)表的論文。KMel，:。J幾規(guī)則表達(dá)式應(yīng)川I，art。fspeeeh(l，05)tag168]愈7.法，這樣就!:J’以獲得AJE文本‘}，自勺所丫J‘名L，IJ矢以語。從J幾規(guī)則的分類器:本擬{究利川訓(xùn)練數(shù)據(jù)集，設(shè)i!出從J‘規(guī)則的分類器，‘已將川J幾決定名L司i「lJ夕11_足臺足致71與I大I索。JI七J從KMCINll)，JI擎斬汀{l}義件，l，了夫得的信息，這個(gè)分類器將到叮}發(fā)式的規(guī)則分派少lJ各個(gè)名i，，Ji，1』匆!。l冬15.1還給{!{個(gè)例句，L匕夕11”八55、)Ciatioll()t‘b()dy，1::，551;、。Ic、:‘，101Wcigl“tel:allgcwitllall一eause，n、)rtalityi:1tl:cclderly.”這個(gè)f.JJ幾輸入j·IJKM(’11’I然i島.’i處J，11弓l擎后，經(jīng)過KMcl處J，}l)!虧就示呀j(luò)、IJ11_個(gè)名L，IJ)、:丈i{}分別足:門):，55、)ei:，ti、);1二儀)b“，“l(fā)y

原理圖,機(jī)器學(xué)習(xí),概念,背景知識

背背景知識識識識識識識識識識識識識識圖6.1機(jī)器學(xué)習(xí)的簡要原理圖如圖6.1所示，學(xué)習(xí)算法能夠根據(jù)預(yù)先所提供的-一組概念樣木和背景知識獲得1個(gè)對特定概念的模式的描述，以此來預(yù)測或判斷某個(gè)概念是否為這個(gè)概念類別。概念樣本為門例和反例，如在學(xué)習(xí)111n乳動物時(shí)，貓就是一個(gè)幣例(因?yàn)椤咽荹l[Il乳動物)，蟻蛤就是個(gè)反例(囚為它不是一個(gè)喃乳動物)。背娥知識包含很多描述概念和樣本的語，’泊勺情況，‘已日J(rèn)’以足個(gè)概念的屬性的可能取值及其層次、車南助句法規(guī)貝lJ、i’l’{語等。學(xué)習(xí)勸.法鼓終就足根州樣本類型，背l共知識以及設(shè)計(jì)者的經(jīng)驗(yàn)等構(gòu)

本文編號：3551174

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/yixuelunwen/swyx/3551174.html

上一篇：新常態(tài)護(hù)理管理模式在手術(shù)室醫(yī)療設(shè)備維護(hù)保養(yǎng)中應(yīng)用的效果
下一篇：視網(wǎng)膜神經(jīng)節(jié)細(xì)胞電活動的相關(guān)性分析

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于自然語言處理技術(shù)的循證醫(yī)學(xué)信息提取研究