學(xué)術(shù)資源本體非等級(jí)關(guān)系抽取研究
本文選題:本體構(gòu)建 + 非等級(jí)關(guān)系抽取。 參考:《圖書(shū)情報(bào)工作》2016年20期
【摘要】:[目的 /意義]概念非等級(jí)關(guān)系抽取是本體構(gòu)建的必要步驟,學(xué)術(shù)文獻(xiàn)作為一種重要的學(xué)術(shù)資源類型,本文主要利用其結(jié)構(gòu)特點(diǎn)來(lái)進(jìn)行本體概念非等級(jí)關(guān)系的抽取。[方法 /過(guò)程]首先,在本體概念抽取的基礎(chǔ)上,對(duì)文獻(xiàn)中概念的類型進(jìn)行分類,以便于后期關(guān)系動(dòng)詞搭配的概念類型來(lái)排除不符合條件的三元組;其次,確定學(xué)術(shù)文獻(xiàn)中的關(guān)系類型,并采用C-value方法抽取表示關(guān)系的動(dòng)詞,進(jìn)行本體關(guān)系的表示;再次,評(píng)價(jià)概念對(duì)的關(guān)聯(lián)性,利用互信息法對(duì)概念對(duì)進(jìn)行排序并去除非相關(guān)概念對(duì),實(shí)驗(yàn)表明該方法非常有效;最后評(píng)價(jià)概念對(duì)與關(guān)系動(dòng)詞的關(guān)聯(lián),分析影響三元組關(guān)聯(lián)的因素,再采用實(shí)驗(yàn)確定模型挖掘三元組,實(shí)驗(yàn)比較現(xiàn)有的關(guān)聯(lián)規(guī)則挖掘的方法。[結(jié)果 /結(jié)論]結(jié)果表明本文提出的三元組選擇模型效果明顯超過(guò)現(xiàn)有的關(guān)聯(lián)規(guī)則挖掘方法,并且在語(yǔ)料集擴(kuò)大的情況下這種優(yōu)勢(shì)更為明顯。
[Abstract]:Abstract of concept non-hierarchical relation is a necessary step in ontology construction. As an important type of academic resources, this paper mainly uses its structural characteristics to extract non-hierarchical relationship of ontology concept. [methods / process] first, on the basis of ontology concept extraction, the classification of concept types in literature is carried out so as to facilitate the conceptual types of post-relational verb collocations to exclude unqualified triples. To determine the types of relationships in academic literature, and use C-value method to extract verbs to express relationships, and to represent ontology relations; thirdly, to evaluate the relevance of concept pairs, and to use mutual information method to sort the concept pairs unless the related concept pairs. The experimental results show that this method is very effective. Finally, we evaluate the relationship between the concept and the relational verbs, analyze the factors that affect the association of triples, and then use the experimental deterministic model to mine the triples, and compare the existing methods of association rules mining. [results / conclusion] the results show that the proposed triple selection model is more effective than the existing association rules mining methods, and this advantage is more obvious when the corpus is enlarged.
【作者單位】: 南京大學(xué)信息管理學(xué)院;
【基金】:國(guó)家社會(huì)科學(xué)基金重大招標(biāo)項(xiàng)目“面向?qū)W科領(lǐng)域的網(wǎng)絡(luò)信息資源深度聚合與服務(wù)研究”(項(xiàng)目編號(hào):12&ZD221) 南京大學(xué)優(yōu)秀博士研究生創(chuàng)新能力提升計(jì)劃(項(xiàng)目編號(hào):201601B033)研究成果之一
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前6條
1 熊霞;常春;吳雯娜;;等級(jí)關(guān)系循環(huán)錯(cuò)誤檢查算法的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2010年05期
2 余凡;程虹;樓雯;;語(yǔ)法規(guī)則和改進(jìn)關(guān)聯(lián)規(guī)則的中文文本非等級(jí)關(guān)系提取研究[J];圖書(shū)情報(bào)工作;2013年22期
3 王冠華;危紅;;網(wǎng)絡(luò)環(huán)境下《漢語(yǔ)主題詞表》(工程技術(shù)版)詞間等同、等級(jí)關(guān)系的處理[J];圖書(shū)館論壇;2014年08期
4 王志強(qiáng);;如此日本人[J];出版參考;2006年17期
5 余凡;程虹;樓雯;;基于改進(jìn)相似度算法的文本等級(jí)關(guān)系提取方法研究[J];情報(bào)理論與實(shí)踐;2014年05期
6 ;[J];;年期
相關(guān)碩士學(xué)位論文 前1條
1 王榮濤;秦嶺川金絲猴(Rhinopithecus roxellana)全雄群的組成,,亞群體類型及個(gè)體間等級(jí)關(guān)系[D];西北大學(xué);2014年
本文編號(hào):2023219
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2023219.html