《漢語主題詞表》本體化的自動生成研究
發(fā)布時間:2020-07-29 15:38
【摘要】: 對自然語言中的詞匯進行選擇、規(guī)范、控制,并揭示詞匯間的各種關(guān)系是敘詞表的本質(zhì),在自然語言的基礎(chǔ)上形成受控詞匯的集合,從而構(gòu)成一個敘詞表。敘詞表中的每個詞匯都稱為敘詞,每個敘詞都表達一定的概念。我國《漢語主題詞表》(以下簡稱《漢表》)作為一部大型綜合性科技檢索工具,收詞范圍包括自然科學、醫(yī)學、農(nóng)業(yè)、工程技術(shù)等各學科領(lǐng)域的主要名詞術(shù)語,是主題標引、檢索和組織目錄、索引的主要工具。而本體是一種新型的網(wǎng)絡(luò)信息組織方法,作為一種能在語義知識層次上描述信息的概念模型工具,已經(jīng)受到越來越多的關(guān)注。但由于本體自身的復(fù)雜性,現(xiàn)階段本體的構(gòu)建將是一項費時、費力的工作。由于敘詞表已經(jīng)匯集了眾多領(lǐng)域?qū)<业闹R,包括了各學科領(lǐng)域中比較完整的詞匯。因此,有人提議,以現(xiàn)有敘詞表為基礎(chǔ)構(gòu)建本體。敘詞表中的簡單語義關(guān)系可以為本體的屬性、實例以及各種關(guān)系的創(chuàng)建提供指導。本文以《漢語主題詞表》為核心,構(gòu)建基于詞表的本體,對于促進詞表在語義網(wǎng)下的發(fā)展具有一定的理論意義和實際應(yīng)用價值。 文章對《漢表》和本體的定義、構(gòu)成要素和特點進行了詳細的分析,并得出基于《漢表》轉(zhuǎn)換本體的必要性和優(yōu)越性。結(jié)合《漢表》的特點,提出了自身的一套構(gòu)建本體的程序步驟,針對傳統(tǒng)紙質(zhì)版詞表的缺陷,形成了詞表的SQL數(shù)據(jù)庫形式。最終借助Java程序調(diào)用Jena包自動生成基于《漢表》構(gòu)建本體的模板,并按照規(guī)則提取出限制條件。最終實現(xiàn)《漢表》SQL數(shù)據(jù)庫到本體的自動轉(zhuǎn)換,并使用本體表示語言O(shè)WL對詞表進行形式化表示。
【學位授予單位】:山西大學
【學位級別】:碩士
【學位授予年份】:2010
【分類號】:G353
本文編號:2774163
【學位授予單位】:山西大學
【學位級別】:碩士
【學位授予年份】:2010
【分類號】:G353
【引證文獻】
相關(guān)期刊論文 前1條
1 肖京文;;從《漢語主題詞表》獲取本體概念的研究[J];科技情報開發(fā)與經(jīng)濟;2012年17期
本文編號:2774163
本文鏈接:http://sikaile.net/tushudanganlunwen/2774163.html
最近更新
教材專著