基于列重合度的網絡表格一致性擴展
發(fā)布時間:2018-02-27 15:42
本文關鍵詞: 網絡表格擴展 列重合度 列映射 一致性支持度 出處:《計算機科學》2017年09期 論文類型:期刊論文
【摘要】:網絡表格的擴展是根據已知信息擴展與主列相關的其他屬性列,以滿足人們通過表格獲取感興趣信息的需求。目前的研究工作主要針對由主列和待擴展列組成的實體-屬性二元表,并將主列視為其他屬性列擴展的唯一依據,但該技術運用到具有多個待擴展列的網絡表格時,由多個二元表拼接而成的結果表很容易出現實體不一致現象。綜合考慮各屬性列間以及元組行間的關系,提出一致性支持度概念,設計并實現了基于列重合度的表格一致性擴展系統(tǒng)CCA,其既能保證候選值的高匹配分數,又能使結果表中填值所使用的數據源表數目最小化,有效地避免了實體不一致問題。實驗表明,與現有方法相比CCA系統(tǒng)有更高的精確度、覆蓋率、一致性,以及更低的查詢時間代價。
[Abstract]:The extension of the network table extends the other attribute columns associated with the main column based on known information, In order to meet the need of obtaining information of interest through tables, the current research mainly focuses on the entity attribute binary table, which consists of the main column and the column to be expanded, and regards the main column as the sole basis for the extension of other attribute columns. However, when this technique is applied to network tables with multiple columns to be expanded, the result tables, which are composed of multiple binary tables, are prone to entity inconsistency. The relationships between attribute columns and tuple rows are considered synthetically. The concept of consistency support is proposed, and a table consistency extension system (CCAA) based on column coincidence degree is designed and implemented. It can not only guarantee the high matching score of candidate values, but also minimize the number of data source tables used for filling out values in the result table. Experimental results show that CCA systems have higher accuracy, coverage, consistency and lower query time cost than the existing methods.
【作者單位】: 北京交通大學計算機與信息技術學院;
【基金】:國家自然科學基金面上項目(61370060)資助
【分類號】:TP393.0
【相似文獻】
相關期刊論文 前2條
1 鄭雨田;;未發(fā)表文章與已發(fā)表文章內容重合度分析——以醫(yī)學文章為例[J];中國科技期刊研究;2011年06期
2 ;[J];;年期
相關碩士學位論文 前2條
1 張娟;大重合度變速器齒輪的承載能力研究[D];合肥工業(yè)大學;2014年
2 渠珍珍;高重合度行星齒輪傳動系統(tǒng)設計及動力學分析[D];南京航空航天大學;2011年
,本文編號:1543284
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1543284.html
最近更新
教材專著