天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

異構(gòu)數(shù)據(jù)聯(lián)合式的真值發(fā)現(xiàn)算法

發(fā)布時(shí)間:2018-03-28 05:03

  本文選題:真值 切入點(diǎn):真值發(fā)現(xiàn) 出處:《東北大學(xué)學(xué)報(bào)(自然科學(xué)版)》2017年10期


【摘要】:互聯(lián)網(wǎng)上提供的同一事實(shí)的信息通常會(huì)存在沖突,影響數(shù)據(jù)集成和知識(shí)發(fā)現(xiàn).為了甄別真值,提出了一種基于距離的異構(gòu)數(shù)據(jù)聯(lián)合真值發(fā)現(xiàn)算法.首先,關(guān)于同一數(shù)據(jù)項(xiàng),基于數(shù)據(jù)源聲明值與真值的距離,計(jì)算數(shù)據(jù)項(xiàng)向量;采用KMeans聚類(lèi)算法,獲得數(shù)據(jù)項(xiàng)初始聚類(lèi).然后,迭代進(jìn)行信任分析和聚類(lèi),即在每個(gè)類(lèi)簇內(nèi),采用最優(yōu)化思想,聯(lián)合異構(gòu)類(lèi)型數(shù)據(jù),更新事實(shí)的可信度和數(shù)據(jù)源的類(lèi)簇內(nèi)可靠性,重新計(jì)算每個(gè)數(shù)據(jù)項(xiàng)向量,再次聚類(lèi),迭代直至類(lèi)簇達(dá)到穩(wěn)定.實(shí)驗(yàn)結(jié)果表明:由于細(xì)粒度的數(shù)據(jù)源質(zhì)量劃分,聯(lián)合考慮異構(gòu)數(shù)據(jù)類(lèi)型,可以獲得更高的真值發(fā)現(xiàn)準(zhǔn)確度.
[Abstract]:The information of the same fact provided on the Internet usually conflicts, which affects data integration and knowledge discovery. In order to identify the true value, a distance based algorithm for the discovery of the joint truth value of heterogeneous data is proposed. First, for the same data item, Based on the distance between the declared value of the data source and the true value, the data item vector is calculated, and the initial clustering of data items is obtained by using KMeans clustering algorithm. Then, trust analysis and clustering are carried out iteratively, that is, the optimization idea is adopted in each cluster. Combining heterogeneous type data, updating the reliability of the facts and the reliability of the data source in the cluster, recalculating each data item vector, clustering again, The experimental results show that due to the fine grained data source quality partition and considering the heterogeneous data types, a higher accuracy of true value discovery can be obtained.
【作者單位】: 東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院;渤海大學(xué)信息科學(xué)與技術(shù)學(xué)院;
【基金】:國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃項(xiàng)目(2012CB316201) 國(guó)家自然科學(xué)基金資助項(xiàng)目(61033007,61472070)
【分類(lèi)號(hào)】:TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 趙琳;黃玉文;;異構(gòu)數(shù)據(jù)交換的理論研究[J];科技信息;2010年21期

2 劉揚(yáng),趙文吉,宮輝力;關(guān)于異構(gòu)數(shù)據(jù)連接的研究[J];首都師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年01期

3 鄒曉玉;;一種異構(gòu)數(shù)據(jù)的解決方案[J];臺(tái)聲.新視角;2006年01期

4 刁興春;嚴(yán)浩;丁鯤;;異構(gòu)數(shù)據(jù)轉(zhuǎn)換關(guān)鍵技術(shù)的實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2008年17期

5 梁艷;胡先智;;異構(gòu)數(shù)據(jù)轉(zhuǎn)換系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];信息與電腦(理論版);2011年08期

6 詹國(guó)華;何炎雯;李志華;;智能健康管理多源異構(gòu)數(shù)據(jù)融合體系與方法[J];計(jì)算機(jī)應(yīng)用與軟件;2012年09期

7 唐鈺;陳浩;葉柏龍;;基于逆向清理的實(shí)時(shí)異構(gòu)數(shù)據(jù)整合模型研究[J];計(jì)算機(jī)工程;2012年23期

8 梁合功;;異構(gòu)數(shù)據(jù)遷移系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];科技致富向?qū)?2013年23期

9 盧慶齡,李慶全,黃俊,張威;異構(gòu)數(shù)據(jù)倉(cāng)庫(kù)中的知識(shí)管理體系研究[J];計(jì)算機(jī)應(yīng)用;2003年S2期

10 閆健卓;王普;方麗英;呂效;;“數(shù)字校園”異構(gòu)數(shù)據(jù)整合系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];北京工業(yè)大學(xué)學(xué)報(bào);2005年S1期

相關(guān)會(huì)議論文 前6條

1 姚燕;李湘;郭萍;鄭波;;基于中間件的異構(gòu)數(shù)據(jù)檢索服務(wù)[A];2011年中國(guó)氣象學(xué)會(huì)氣象通信與信息技術(shù)委員會(huì)暨國(guó)家氣象信息中心科技年會(huì)論文摘要[C];2011年

2 伍尚杰;陳立定;曾明;;基于XML異構(gòu)數(shù)據(jù)的組態(tài)軟件[A];中南六省(區(qū))自動(dòng)化學(xué)會(huì)第24屆學(xué)術(shù)年會(huì)會(huì)議論文集[C];2006年

3 李剛;高春陽(yáng);崔明;;高校異構(gòu)數(shù)據(jù)整合平臺(tái)建設(shè)研究[A];第十屆沈陽(yáng)科學(xué)學(xué)術(shù)年會(huì)論文集(信息科學(xué)與工程技術(shù)分冊(cè))[C];2013年

4 江濤;劉東波;劉巍;;基于XML的異構(gòu)數(shù)據(jù)集成中間件研究[A];促進(jìn)企業(yè)信息化進(jìn)程——第十屆中國(guó)Java技術(shù)及應(yīng)用大會(huì)文集[C];2007年

5 周翔;翁劍成;榮建;;基于MDA的異構(gòu)交通數(shù)據(jù)管理平臺(tái)的研究與開(kāi)發(fā)[A];2007第三屆中國(guó)智能交通年會(huì)論文集[C];2007年

6 陳亞洲;齊從謙;甘屹;;基于Web的CAM異構(gòu)數(shù)據(jù)轉(zhuǎn)換和傳輸?shù)难芯縖A];制造業(yè)與未來(lái)中國(guó)——2002年中國(guó)機(jī)械工程學(xué)會(huì)年會(huì)論文集[C];2002年

相關(guān)博士學(xué)位論文 前4條

1 吳紅星;面向多業(yè)態(tài)集團(tuán)企業(yè)多源異構(gòu)數(shù)據(jù)的協(xié)同系統(tǒng)集成方法研究[D];合肥工業(yè)大學(xué);2015年

2 歐明棟;面向大規(guī)模異構(gòu)數(shù)據(jù)的哈希表征學(xué)習(xí)研究[D];清華大學(xué);2016年

3 于寶琴;成套電器企業(yè)異構(gòu)數(shù)據(jù)整合及其物流系統(tǒng)的研究[D];天津大學(xué);2006年

4 繆嘉嘉;異構(gòu)數(shù)據(jù)映射技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年

相關(guān)碩士學(xué)位論文 前10條

1 陳毅飛;基于多源異構(gòu)數(shù)據(jù)的楊凌水肥信息管理系統(tǒng)研究[D];西北農(nóng)林科技大學(xué);2015年

2 葉茂偉;大規(guī)模異構(gòu)數(shù)據(jù)即時(shí)整合系統(tǒng)的研究與實(shí)現(xiàn)[D];浙江大學(xué);2016年

3 荊志;海量異構(gòu)數(shù)據(jù)定制平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];河北師范大學(xué);2013年

4 朱峰;基于JSON的互聯(lián)網(wǎng)異構(gòu)數(shù)據(jù)整合的應(yīng)用研究[D];南京郵電大學(xué);2016年

5 李瀚晨;基于“用戶(hù)—景點(diǎn)”關(guān)系建模的景點(diǎn)推薦技術(shù)的研究[D];北京工業(yè)大學(xué);2016年

6 徐凱;智慧高速海量異構(gòu)數(shù)據(jù)處理關(guān)鍵技術(shù)研究[D];重慶交通大學(xué);2016年

7 孫靖怡;基于異構(gòu)數(shù)據(jù)的復(fù)雜關(guān)聯(lián)比對(duì)方法的研究與應(yīng)用[D];沈陽(yáng)理工大學(xué);2008年

8 邢雅瓊;多業(yè)務(wù)繳費(fèi)系統(tǒng)異構(gòu)數(shù)據(jù)的轉(zhuǎn)換及其實(shí)現(xiàn)[D];蘭州理工大學(xué);2011年

9 黃豪球;多學(xué)科協(xié)同設(shè)計(jì)過(guò)程異構(gòu)數(shù)據(jù)共享方法研究[D];沈陽(yáng)理工大學(xué);2012年

10 劉建珍;畜產(chǎn)品溯源系統(tǒng)中異構(gòu)數(shù)據(jù)整合問(wèn)題研究[D];哈爾濱工業(yè)大學(xué);2009年

,

本文編號(hào):1674852

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1674852.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)a2327***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com