中文領(lǐng)域?qū)I(yè)術(shù)語(yǔ)層次關(guān)系構(gòu)建研究
本文選題:術(shù)語(yǔ) 切入點(diǎn):層次關(guān)系 出處:《現(xiàn)代圖書(shū)情報(bào)技術(shù)》2016年01期
【摘要】:【目的】對(duì)如何從中文非結(jié)構(gòu)化文本獲取術(shù)語(yǔ)的層次關(guān)系進(jìn)行探討!痉椒ā繌腃NKI獲取數(shù)字圖書(shū)館學(xué)科領(lǐng)域文獻(xiàn),通過(guò)術(shù)語(yǔ)抽取、術(shù)語(yǔ)向量空間模型構(gòu)建、BIRCH算法聚類和聚類標(biāo)簽確定構(gòu)建術(shù)語(yǔ)的語(yǔ)義層次結(jié)構(gòu)。【結(jié)果】構(gòu)建數(shù)字圖書(shū)館領(lǐng)域術(shù)語(yǔ)的層次結(jié)構(gòu),并對(duì)構(gòu)建結(jié)果進(jìn)行驗(yàn)證,聚類正確率達(dá)到80.88%,類標(biāo)簽抽取正確率達(dá)到89.71%!揪窒蕖繉(duì)構(gòu)建效果的驗(yàn)證是通過(guò)隨機(jī)抽樣進(jìn)行的,且僅與一種其他構(gòu)建方法進(jìn)行實(shí)證比較!窘Y(jié)論】應(yīng)用BIRCH算法聚類構(gòu)建術(shù)語(yǔ)層次結(jié)構(gòu),該方法與K-means聚類方法相比具有明顯優(yōu)勢(shì),具備較高的執(zhí)行效率和聚類有效性。
[Abstract]:[objective] to discuss how to obtain the hierarchical relationship of terms from unstructured Chinese texts. [methods] to obtain the subject domain literature of digital library from CNKI, and extract the terms from them. The term vector space model is constructed by clustering and clustering tags to determine the semantic hierarchy of the constructed terms. [results] the hierarchical structure of the terminology in the digital library domain is constructed, and the construction results are verified. The correct rate of clustering is 80.88 and the correct rate of class label extraction is 89.71. [limitation] the effect of construction is verified by random sampling. And it is only compared with one other construction method. [conclusion] using BIRCH clustering algorithm to construct term hierarchy, this method has obvious advantages over K-means clustering method, and has higher execution efficiency and clustering effectiveness.
【作者單位】: 南京大學(xué)信息管理學(xué)院;江蘇省數(shù)據(jù)工程與知識(shí)服務(wù)重點(diǎn)實(shí)驗(yàn)室;
【基金】:江蘇省自然科學(xué)基金項(xiàng)目“面向?qū)@A(yù)警的中文本體學(xué)習(xí)研究”(項(xiàng)目編號(hào):BK20130587) 中央高;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目“我國(guó)圖書(shū)情報(bào)學(xué)科知識(shí)結(jié)構(gòu)及演化動(dòng)態(tài)研究”(項(xiàng)目編號(hào):20620140645)的研究成果之一
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張建文;王強(qiáng);;面向語(yǔ)義Web的本體學(xué)習(xí)研究[J];科技廣場(chǎng);2006年08期
2 張海營(yíng);;本體學(xué)習(xí)和基于句型規(guī)則的自舉本體學(xué)習(xí)方法模型設(shè)計(jì)[J];圖書(shū)情報(bào)工作;2007年09期
3 張囡囡;李冠宇;曲麗寧;;主要本體學(xué)習(xí)工具的比較分析[J];微計(jì)算機(jī)信息;2008年12期
4 徐濟(jì)成;李紹穩(wěn);張友華;;農(nóng)業(yè)本體及本體學(xué)習(xí)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年08期
5 鹿彥;孫靜波;;基于文本的本體概念提取[J];科技信息;2010年13期
6 鄧子平;張傳宏;;面向醫(yī)學(xué)的本體學(xué)習(xí)方法[J];計(jì)算機(jī)時(shí)代;2010年10期
7 梁健;吳丹;;種子概念方法及其在基于文本的本體學(xué)習(xí)中的應(yīng)用[J];圖書(shū)情報(bào)工作;2006年09期
8 梁健;王惠臨;;基于文本的本體學(xué)習(xí)方法研究[J];情報(bào)理論與實(shí)踐;2007年01期
9 宗江琴;范榮;;基于粒計(jì)算的本體學(xué)習(xí)研究[J];科技廣場(chǎng);2007年05期
10 任斌;毛應(yīng)爽;;基于本體的主動(dòng)學(xué)習(xí)主題爬行的研究與實(shí)現(xiàn)[J];長(zhǎng)春工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年01期
相關(guān)會(huì)議論文 前3條
1 劉柏嵩;高濟(jì);;通用本體學(xué)習(xí)框架研究(英文)[A];全國(guó)語(yǔ)域web與本體能研討會(huì)論文集[C];2006年
2 劉強(qiáng);林世平;;基于蟻群聚類算法的中文本體學(xué)習(xí)[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
3 徐惠;高志強(qiáng);陸青健;朱萬(wàn)穎;;ORIGO:一種基于數(shù)字化圖書(shū)館資源的本體學(xué)習(xí)方法[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
相關(guān)博士學(xué)位論文 前5條
1 刁麗娟;通用本體學(xué)習(xí)方法及其應(yīng)用的關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2015年
2 邱桃榮;面向本體學(xué)習(xí)的粒計(jì)算方法研究[D];北京交通大學(xué);2009年
3 劉柏嵩;基于Web的通用本體學(xué)習(xí)研究[D];浙江大學(xué);2007年
4 傅魁;基于Web的本體學(xué)習(xí)研究[D];武漢理工大學(xué);2007年
5 賈真;面向中文網(wǎng)絡(luò)百科的本體學(xué)習(xí)與知識(shí)獲取研究[D];西南交通大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 王曉慶;基于框架語(yǔ)義的中文本體學(xué)習(xí)研究[D];中國(guó)海洋大學(xué);2008年
2 程波波;基于文本的茶學(xué)本體學(xué)習(xí)方法研究[D];安徽農(nóng)業(yè)大學(xué);2010年
3 賈秀玲;面向文本的本體學(xué)習(xí)中概念提取及關(guān)系提取的研究[D];中南大學(xué);2007年
4 鹿彥;面向文本的本體學(xué)習(xí)方法研究[D];長(zhǎng)春工業(yè)大學(xué);2011年
5 謝彩云;基于法律領(lǐng)域的本體學(xué)習(xí)方法的研究與應(yīng)用[D];南昌大學(xué);2012年
6 胡冬潤(rùn);面向網(wǎng)絡(luò)輿情任務(wù)的本體學(xué)習(xí)方法研究[D];南京航空航天大學(xué);2013年
7 楊芬;本體學(xué)習(xí)中概念和關(guān)系抽取方法研究[D];重慶大學(xué);2010年
8 劉婷;本體學(xué)習(xí)及其在語(yǔ)義檢索中應(yīng)用的研究[D];南昌大學(xué);2011年
9 劉明生;粒計(jì)算及其在本體學(xué)習(xí)中應(yīng)用的研究[D];南昌大學(xué);2007年
10 陳紹琛;基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)[D];哈爾濱工程大學(xué);2009年
,本文編號(hào):1659929
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1659929.html