簡(jiǎn)單本體在實(shí)用信息抽取中的使用及針對(duì)實(shí)用本體的高級(jí)信息抽取
發(fā)布時(shí)間:2017-11-11 22:07
本文關(guān)鍵詞:簡(jiǎn)單本體在實(shí)用信息抽取中的使用及針對(duì)實(shí)用本體的高級(jí)信息抽取
更多相關(guān)文章: 本體 信息抽取 關(guān)系抽取 規(guī)則自動(dòng)學(xué)習(xí)
【摘要】:信息抽取是用來(lái)理解自然語(yǔ)言文本語(yǔ)義的一種非常實(shí)用的方法。而本體則對(duì)知識(shí)(例如實(shí)體和概念間的關(guān)系)的定義與建模起重要作用。因此本體經(jīng)常被用來(lái)定義信息抽取任務(wù)。高級(jí)信息抽取技術(shù),例如復(fù)雜的多元關(guān)系抽取,可用于學(xué)習(xí)語(yǔ)言模板,進(jìn)而從自然文本中識(shí)別出本體定義的關(guān)系,并抽取出這些關(guān)系的實(shí)例。本文將描述一個(gè)為信息抽取任務(wù)而設(shè)計(jì)的本體模型,以及一個(gè)關(guān)系抽取的框架系統(tǒng)——DARE。DARE使用了機(jī)器學(xué)習(xí)方法,可以自動(dòng)學(xué)習(xí)關(guān)系抽取的語(yǔ)言模板,并應(yīng)用這些模板來(lái)抽取關(guān)系實(shí)例。DARE系統(tǒng)已被深度應(yīng)用于英語(yǔ)文本的關(guān)系抽取。本文將進(jìn)一步使用DARE來(lái)處理中文新聞文本,從中學(xué)習(xí)語(yǔ)言模板和抽取關(guān)系實(shí)例,并與英文處理的結(jié)果進(jìn)行比較。
【作者單位】: 德國(guó)人工智能研究中心;
【分類號(hào)】:H03
【正文快照】: 1.概述本體(ontology)在信息技術(shù)中起著組織與分類知識(shí)和信息的關(guān)鍵作用。在本體的各類應(yīng)用中,最具潛在價(jià)值的是語(yǔ)義網(wǎng)絡(luò)(semantic web),一個(gè)利于語(yǔ)義訪問的結(jié)構(gòu)化萬(wàn)維網(wǎng)(Berners-Lee1999)。另一方面,信息抽取(information ex-traction)技術(shù)旨在從自然語(yǔ)言文本中抽取結(jié)構(gòu)化的
【相似文獻(xiàn)】
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 虞歡歡;陳九昌;錢龍華;周國(guó)棟;;基于樹核函數(shù)的中文語(yǔ)義關(guān)系抽取[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
,本文編號(hào):1173060
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/1173060.html
最近更新
教材專著