基于UMLS專(zhuān)家詞典與工具的詞形歸并算法研究
發(fā)布時(shí)間:2017-10-01 13:37
本文關(guān)鍵詞:基于UMLS專(zhuān)家詞典與工具的詞形歸并算法研究
更多相關(guān)文章: 詞形歸并 UMLS專(zhuān)家詞典 Norm原形化工具
【摘要】:在簡(jiǎn)述詞形歸并(原形化處理)基本目標(biāo)的基礎(chǔ)上,著重分析UMLS專(zhuān)家詞典的構(gòu)建方式與詞典工具的核心功能,以及Norm原形化工具的處理機(jī)制;在此基礎(chǔ)上,提出一種詞形歸并算法及Norm處理缺陷的修正辦法,并收集醫(yī)學(xué)詞表數(shù)據(jù)進(jìn)行算法測(cè)試與驗(yàn)證;此外,本文算法與經(jīng)典的Porter算法進(jìn)行了多方面的深入比較研究。
【作者單位】: 中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所;
【關(guān)鍵詞】: 詞形歸并 UMLS專(zhuān)家詞典 Norm原形化工具
【基金】:國(guó)家科技支撐計(jì)劃(2011BAH10B02)
【分類(lèi)號(hào)】:H06;H087
【正文快照】: 1引言在語(yǔ)言學(xué)中,詞形歸并(lemmatisation或lemma tization)是指將一個(gè)詞與它不同的屈折變形(inflec tion)【1】組織起來(lái),以使它們可被視為同一個(gè)詞項(xiàng)(Term)的過(guò)程【2】。就英語(yǔ)而言,由于人稱、時(shí)態(tài)、語(yǔ)態(tài)的不同,一個(gè)單詞會(huì)出現(xiàn)多種屈折變形;而詞形歸并的重點(diǎn)就是查找單詞的,
本文編號(hào):953794
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/953794.html
最近更新
教材專(zhuān)著