基于海量醫(yī)學(xué)詞典的查找方法
發(fā)布時(shí)間:2021-03-07 14:43
醫(yī)學(xué)詞典查找方法對促進(jìn)醫(yī)學(xué)信息研究有重要意義。針對現(xiàn)有醫(yī)學(xué)詞典查找方法速度慢的問題,提出高效查找方法。利用詞典樹結(jié)構(gòu)存儲詞典詞條,并結(jié)合匹配跳轉(zhuǎn)機(jī)制進(jìn)行匹配,有效降低回朔查詢。快速查找方法性能優(yōu)越,在30000詞條規(guī)模的中英文詞典上,比普通方法分別提升188倍和161倍。
【文章來源】:現(xiàn)代計(jì)算機(jī). 2019,(15)
【文章頁數(shù)】:6 頁
【部分圖文】:
中文詞典樹構(gòu)建22.2構(gòu)建詞典樹
研究與開發(fā)現(xiàn)代計(jì)算機(jī)2019.05下法,還有我們設(shè)計(jì)的快速查找方法。實(shí)驗(yàn)結(jié)果如圖4所示。普通查找方法在30000個(gè)詞條規(guī)模下所花費(fèi)的時(shí)間是1.501秒。而快速查找方法時(shí)間為0.008秒。快速查找方法比普通查找快188倍。圖4中文醫(yī)學(xué)詞典運(yùn)行時(shí)間對比在英文醫(yī)學(xué)詞典測試上,我們結(jié)合了基于疾病和化學(xué)實(shí)體的詞典,詞典的詞條規(guī)模為30000條,查找英文文本字?jǐn)?shù)規(guī)模同樣也為1000。實(shí)驗(yàn)結(jié)果如圖5所示。普通查找方法在30000個(gè)詞條規(guī)模下所花費(fèi)的時(shí)間是1.93秒?焖俨檎曳椒〞r(shí)間為0.012秒?焖俨檎曳椒ū绕胀ú檎铱161倍。從圖4和圖5的實(shí)驗(yàn)結(jié)果可以看出,隨著醫(yī)學(xué)詞典詞條規(guī)模的增加,普通查找方法的查找時(shí)間呈現(xiàn)出線性增長的趨勢。而快速查找方法所花費(fèi)的時(shí)間一直保持在穩(wěn)定的較短時(shí)間水平。證明了本文提出的查找方法的有效性,可以應(yīng)用在海量醫(yī)學(xué)詞典查找的應(yīng)用上。圖5英文醫(yī)學(xué)詞典運(yùn)行時(shí)間對比4結(jié)語本文設(shè)計(jì)了一種高效的基于海量醫(yī)學(xué)詞典資源的查找方法。該方法利用詞典樹的結(jié)構(gòu)存儲詞典詞條,結(jié)合匹配跳轉(zhuǎn)機(jī)制進(jìn)行匹配,避免無效的回朔查詢。設(shè)計(jì)了最大長度詞典詞項(xiàng)搜索算法搜索出最長的詞典匹配項(xiàng)。實(shí)驗(yàn)結(jié)果表明快速查找方法性能優(yōu)越,對于促進(jìn)醫(yī)學(xué)信息研究具有積極的意義。參考文獻(xiàn):[1]J.Li,etal.BioCreativeVCDRTaskCorpus:aResourceforChemicalDiseaseRelationExtraction[J].DatabaseJ.Biol.DatabasesCura-tion,2016,p.baw068.[2]J.Li,S.Zheng,B.Chen,A.J.Butte,S.J.Swamidass,Z.Lu.ASurveyofCurrentTrendsinComputationalDrugRepositioning[J].Brief.Bio-inform.2016,17(1):2-12.[3]C.H.Wei,H.Y.Kao,Z.Lu.PubTator:aWeb-BasedTextMiningToolforAssistingBiocuratio
本文編號:3069297
【文章來源】:現(xiàn)代計(jì)算機(jī). 2019,(15)
【文章頁數(shù)】:6 頁
【部分圖文】:
中文詞典樹構(gòu)建22.2構(gòu)建詞典樹
研究與開發(fā)現(xiàn)代計(jì)算機(jī)2019.05下法,還有我們設(shè)計(jì)的快速查找方法。實(shí)驗(yàn)結(jié)果如圖4所示。普通查找方法在30000個(gè)詞條規(guī)模下所花費(fèi)的時(shí)間是1.501秒。而快速查找方法時(shí)間為0.008秒。快速查找方法比普通查找快188倍。圖4中文醫(yī)學(xué)詞典運(yùn)行時(shí)間對比在英文醫(yī)學(xué)詞典測試上,我們結(jié)合了基于疾病和化學(xué)實(shí)體的詞典,詞典的詞條規(guī)模為30000條,查找英文文本字?jǐn)?shù)規(guī)模同樣也為1000。實(shí)驗(yàn)結(jié)果如圖5所示。普通查找方法在30000個(gè)詞條規(guī)模下所花費(fèi)的時(shí)間是1.93秒?焖俨檎曳椒〞r(shí)間為0.012秒?焖俨檎曳椒ū绕胀ú檎铱161倍。從圖4和圖5的實(shí)驗(yàn)結(jié)果可以看出,隨著醫(yī)學(xué)詞典詞條規(guī)模的增加,普通查找方法的查找時(shí)間呈現(xiàn)出線性增長的趨勢。而快速查找方法所花費(fèi)的時(shí)間一直保持在穩(wěn)定的較短時(shí)間水平。證明了本文提出的查找方法的有效性,可以應(yīng)用在海量醫(yī)學(xué)詞典查找的應(yīng)用上。圖5英文醫(yī)學(xué)詞典運(yùn)行時(shí)間對比4結(jié)語本文設(shè)計(jì)了一種高效的基于海量醫(yī)學(xué)詞典資源的查找方法。該方法利用詞典樹的結(jié)構(gòu)存儲詞典詞條,結(jié)合匹配跳轉(zhuǎn)機(jī)制進(jìn)行匹配,避免無效的回朔查詢。設(shè)計(jì)了最大長度詞典詞項(xiàng)搜索算法搜索出最長的詞典匹配項(xiàng)。實(shí)驗(yàn)結(jié)果表明快速查找方法性能優(yōu)越,對于促進(jìn)醫(yī)學(xué)信息研究具有積極的意義。參考文獻(xiàn):[1]J.Li,etal.BioCreativeVCDRTaskCorpus:aResourceforChemicalDiseaseRelationExtraction[J].DatabaseJ.Biol.DatabasesCura-tion,2016,p.baw068.[2]J.Li,S.Zheng,B.Chen,A.J.Butte,S.J.Swamidass,Z.Lu.ASurveyofCurrentTrendsinComputationalDrugRepositioning[J].Brief.Bio-inform.2016,17(1):2-12.[3]C.H.Wei,H.Y.Kao,Z.Lu.PubTator:aWeb-BasedTextMiningToolforAssistingBiocuratio
本文編號:3069297
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3069297.html
最近更新
教材專著