中文領(lǐng)域?qū)I(yè)術(shù)語層次關(guān)系構(gòu)建研究
本文選題:術(shù)語 切入點:層次關(guān)系 出處:《現(xiàn)代圖書情報技術(shù)》2016年01期
【摘要】:【目的】對如何從中文非結(jié)構(gòu)化文本獲取術(shù)語的層次關(guān)系進(jìn)行探討。【方法】從CNKI獲取數(shù)字圖書館學(xué)科領(lǐng)域文獻(xiàn),通過術(shù)語抽取、術(shù)語向量空間模型構(gòu)建、BIRCH算法聚類和聚類標(biāo)簽確定構(gòu)建術(shù)語的語義層次結(jié)構(gòu)�!窘Y(jié)果】構(gòu)建數(shù)字圖書館領(lǐng)域術(shù)語的層次結(jié)構(gòu),并對構(gòu)建結(jié)果進(jìn)行驗證,聚類正確率達(dá)到80.88%,類標(biāo)簽抽取正確率達(dá)到89.71%�!揪窒蕖繉�(gòu)建效果的驗證是通過隨機(jī)抽樣進(jìn)行的,且僅與一種其他構(gòu)建方法進(jìn)行實證比較�!窘Y(jié)論】應(yīng)用BIRCH算法聚類構(gòu)建術(shù)語層次結(jié)構(gòu),該方法與K-means聚類方法相比具有明顯優(yōu)勢,具備較高的執(zhí)行效率和聚類有效性。
[Abstract]:[objective] to discuss how to obtain the hierarchical relationship of terms from unstructured Chinese texts. [methods] to obtain the subject domain literature of digital library from CNKI, and extract the terms from them. The term vector space model is constructed by clustering and clustering tags to determine the semantic hierarchy of the constructed terms. [results] the hierarchical structure of the terminology in the digital library domain is constructed, and the construction results are verified. The correct rate of clustering is 80.88 and the correct rate of class label extraction is 89.71. [limitation] the effect of construction is verified by random sampling. And it is only compared with one other construction method. [conclusion] using BIRCH clustering algorithm to construct term hierarchy, this method has obvious advantages over K-means clustering method, and has higher execution efficiency and clustering effectiveness.
【作者單位】: 南京大學(xué)信息管理學(xué)院;江蘇省數(shù)據(jù)工程與知識服務(wù)重點實驗室;
【基金】:江蘇省自然科學(xué)基金項目“面向?qū)@A(yù)警的中文本體學(xué)習(xí)研究”(項目編號:BK20130587) 中央高校基本科研業(yè)務(wù)費專項資金項目“我國圖書情報學(xué)科知識結(jié)構(gòu)及演化動態(tài)研究”(項目編號:20620140645)的研究成果之一
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張建文;王強(qiáng);;面向語義Web的本體學(xué)習(xí)研究[J];科技廣場;2006年08期
2 張海營;;本體學(xué)習(xí)和基于句型規(guī)則的自舉本體學(xué)習(xí)方法模型設(shè)計[J];圖書情報工作;2007年09期
3 張囡囡;李冠宇;曲麗寧;;主要本體學(xué)習(xí)工具的比較分析[J];微計算機(jī)信息;2008年12期
4 徐濟(jì)成;李紹穩(wěn);張友華;;農(nóng)業(yè)本體及本體學(xué)習(xí)研究[J];計算機(jī)技術(shù)與發(fā)展;2009年08期
5 鹿彥;孫靜波;;基于文本的本體概念提取[J];科技信息;2010年13期
6 鄧子平;張傳宏;;面向醫(yī)學(xué)的本體學(xué)習(xí)方法[J];計算機(jī)時代;2010年10期
7 梁健;吳丹;;種子概念方法及其在基于文本的本體學(xué)習(xí)中的應(yīng)用[J];圖書情報工作;2006年09期
8 梁健;王惠臨;;基于文本的本體學(xué)習(xí)方法研究[J];情報理論與實踐;2007年01期
9 宗江琴;范榮;;基于粒計算的本體學(xué)習(xí)研究[J];科技廣場;2007年05期
10 任斌;毛應(yīng)爽;;基于本體的主動學(xué)習(xí)主題爬行的研究與實現(xiàn)[J];長春工程學(xué)院學(xué)報(自然科學(xué)版);2011年01期
相關(guān)會議論文 前3條
1 劉柏嵩;高濟(jì);;通用本體學(xué)習(xí)框架研究(英文)[A];全國語域web與本體能研討會論文集[C];2006年
2 劉強(qiáng);林世平;;基于蟻群聚類算法的中文本體學(xué)習(xí)[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2006年
3 徐惠;高志強(qiáng);陸青健;朱萬穎;;ORIGO:一種基于數(shù)字化圖書館資源的本體學(xué)習(xí)方法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
相關(guān)博士學(xué)位論文 前5條
1 刁麗娟;通用本體學(xué)習(xí)方法及其應(yīng)用的關(guān)鍵技術(shù)研究[D];華東師范大學(xué);2015年
2 邱桃榮;面向本體學(xué)習(xí)的粒計算方法研究[D];北京交通大學(xué);2009年
3 劉柏嵩;基于Web的通用本體學(xué)習(xí)研究[D];浙江大學(xué);2007年
4 傅魁;基于Web的本體學(xué)習(xí)研究[D];武漢理工大學(xué);2007年
5 賈真;面向中文網(wǎng)絡(luò)百科的本體學(xué)習(xí)與知識獲取研究[D];西南交通大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 王曉慶;基于框架語義的中文本體學(xué)習(xí)研究[D];中國海洋大學(xué);2008年
2 程波波;基于文本的茶學(xué)本體學(xué)習(xí)方法研究[D];安徽農(nóng)業(yè)大學(xué);2010年
3 賈秀玲;面向文本的本體學(xué)習(xí)中概念提取及關(guān)系提取的研究[D];中南大學(xué);2007年
4 鹿彥;面向文本的本體學(xué)習(xí)方法研究[D];長春工業(yè)大學(xué);2011年
5 謝彩云;基于法律領(lǐng)域的本體學(xué)習(xí)方法的研究與應(yīng)用[D];南昌大學(xué);2012年
6 胡冬潤;面向網(wǎng)絡(luò)輿情任務(wù)的本體學(xué)習(xí)方法研究[D];南京航空航天大學(xué);2013年
7 楊芬;本體學(xué)習(xí)中概念和關(guān)系抽取方法研究[D];重慶大學(xué);2010年
8 劉婷;本體學(xué)習(xí)及其在語義檢索中應(yīng)用的研究[D];南昌大學(xué);2011年
9 劉明生;粒計算及其在本體學(xué)習(xí)中應(yīng)用的研究[D];南昌大學(xué);2007年
10 陳紹琛;基于非結(jié)構(gòu)中文數(shù)據(jù)源的本體學(xué)習(xí)[D];哈爾濱工程大學(xué);2009年
,本文編號:1659929
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1659929.html