數據驅動的細粒度中文屬性對齊方法
[Abstract]:In order to improve the accuracy of attribute relationship recognition among Chinese open source data sets, a data-driven fine-grained alignment method is proposed to identify the synonyms, inclusions and correlations among attributes by using the extension of attributes and the domain of definition. Methods firstly, the data types of attributes are determined by statistical theory, and the method of calculating the similarity of attributes is given. On this basis, attribute relationship recognition is modeled as a multi-classification problem, and effective features are extracted to describe different relationships and to be used in the construction of stochastic forest model. The experimental results show that the accuracy of attribute data type discrimination in this method is 94.60.The F1 values of synonym, inclusion and correlation recognition are 71.37.3% and 59.9%, respectively. Compared with traditional methods which only focus on synonymous attributes fine-grained attribute alignment not only improves the accuracy of synonymous attribute recognition but also recognizes mutually contained and related attributes which proves its effectiveness in Chinese open source data sets.
【作者單位】: 中科院空間信息處理與應用系統(tǒng)技術重點實驗室;中國科學院電子學研究所;中國科學院大學;
【基金】:國家高技術研究發(fā)展計劃(863計劃)資助項目(2012AA011005)
【分類號】:TP391.1
【相似文獻】
相關期刊論文 前10條
1 張愛平;張小紅;;屬性值為語言區(qū)間的多屬性決策方法[J];計算機工程與應用;2011年07期
2 崔勇;高巖;王福利;王子敬;;模糊信息系統(tǒng)屬性值的重要性度量[J];河南理工大學學報(自然科學版);2007年04期
3 李中華,施麗華,李玉茜;屬性的增量賦值[J];計算機工程;1993年01期
4 ;第六章 多屬性索引法[J];計算機工程與應用;1981年Z2期
5 關欣;衣曉;何友;周一宇;;一種區(qū)間屬性值離散化的新方法[J];宇航學報;2009年03期
6 張艷芹;張虹;楊習貝;;區(qū)間屬性值信息系統(tǒng)的不確定性度量[J];計算機應用與軟件;2009年01期
7 程顯毅;施Oz;沈學華;田宇賀;;屬性和屬性值組合的概念模板[J];北京大學學報(自然科學版);2013年01期
8 林宏康;范成賢;史開泉;;倒向P-推理與屬性剩余發(fā)現-應用[J];計算機科學;2011年10期
9 坐看云起;《天使》人物屬性攻略[J];網絡與信息;2002年11期
10 洪帆,饒雙宜,段素娟;基于屬性的權限—角色分配模型[J];計算機應用;2004年S2期
相關會議論文 前2條
1 王宇;方濱興;吳博;宋林海;郭巖;;結合屬性分布特征的模式匹配算法[A];第五屆全國信息檢索學術會議論文集[C];2009年
2 張亮;胡學鋼;;多層次屬性值下概念格的動態(tài)轉化[A];計算機技術與應用進展——全國第17屆計算機科學與技術應用(CACIS)學術會議論文集(上冊)[C];2006年
相關重要報紙文章 前4條
1 重慶 韓濤;中望CAD中塊屬性的制作[N];電腦報;2004年
2 7Star;教你做RM壓縮程序[N];電腦報;2003年
3 北京郵電大學 張劍;通過DOM操作數據(下)[N];計算機世界;2001年
4 ;查找替換的技巧[N];中國電腦教育報;2001年
相關碩士學位論文 前10條
1 張麗芬;一種基于混合QOS的服務選擇方法[D];華中師范大學;2015年
2 于芳芳;基于屬性的權限訪問控制研究與應用[D];河北工業(yè)大學;2015年
3 高乙童;大數據時效性關鍵技術的研究[D];哈爾濱工業(yè)大學;2016年
4 陳祖軍;基于偽近鄰及區(qū)間距離的不完備數據聚類方法[D];大連理工大學;2016年
5 趙爽;基于敏感屬性值語義的個性化匿名方法研究[D];天津財經大學;2015年
6 徐海堂;屬性證書及應用研究[D];中國人民解放軍信息工程大學;2005年
7 童先群;基于屬性值信息熵的KNN算法改進研究[D];漳州師范學院;2010年
8 張秀麗;符號屬性值的相似度學習及屬性重要性研究[D];河北大學;2011年
9 張朝勝;領域本體概念實例、屬性及屬性值提取研究[D];昆明理工大學;2011年
10 雷玉霞;基于本體的軍事知識聯通[D];中國科學院研究生院(軟件研究所);2002年
,本文編號:2325361
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2325361.html