基于內(nèi)容相關(guān)的條件函數(shù)依賴的一致性清洗方法
本文關(guān)鍵詞:基于內(nèi)容相關(guān)的條件函數(shù)依賴的一致性清洗方法
更多相關(guān)文章: 數(shù)據(jù)清洗 條件函數(shù)依賴 內(nèi)容相關(guān) 數(shù)據(jù)一致性 修復(fù)代價(jià)模型
【摘要】:基于條件函數(shù)依賴提出了一種內(nèi)容相關(guān)的條件函數(shù)依賴,并給出基于內(nèi)容相關(guān)的條件函數(shù)依賴的一致性清洗方法.通過分析條件函數(shù)依賴之間的關(guān)系,將相關(guān)聯(lián)的條件函數(shù)依賴合并組成內(nèi)容相關(guān)的條件函數(shù)依賴.內(nèi)容相關(guān)的條件函數(shù)依賴可以檢測多條件值下的數(shù)據(jù)一致性問題并提供可用于一致性修復(fù)的參考值.同時(shí),提出了一種一致性修復(fù)的代價(jià)模型.模型參考內(nèi)容相關(guān)的條件函數(shù)依賴對(duì)應(yīng)元組的實(shí)際情況進(jìn)行修復(fù),實(shí)現(xiàn)代價(jià)最優(yōu),同時(shí)保證數(shù)據(jù)一致性.通過在兩組真實(shí)數(shù)據(jù)集上進(jìn)行試驗(yàn)測試,證明提出的基于內(nèi)容相關(guān)的條件函數(shù)依賴的一致性清洗方法能夠準(zhǔn)確地檢測數(shù)據(jù)的一致性問題并加以修復(fù).
【作者單位】: 東北大學(xué)信息科學(xué)與工程學(xué)院;中國人民解放軍65154部隊(duì);
【關(guān)鍵詞】: 數(shù)據(jù)清洗 條件函數(shù)依賴 內(nèi)容相關(guān) 數(shù)據(jù)一致性 修復(fù)代價(jià)模型
【基金】:國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃項(xiàng)目(2012CB316201) 國家自然科學(xué)基金資助項(xiàng)目(61033007)
【分類號(hào)】:TP311.13
【正文快照】: 美國商業(yè)調(diào)查顯示美國每年因數(shù)據(jù)質(zhì)量造成的損失高達(dá)6000億美元[1].數(shù)據(jù)一致性[2-3]是數(shù)據(jù)質(zhì)量管理的一項(xiàng)重要內(nèi)容.不一致數(shù)據(jù)會(huì)使數(shù)據(jù)產(chǎn)生歧義進(jìn)而對(duì)數(shù)據(jù)分析造成影響,所以必須加以更正.隨著對(duì)數(shù)據(jù)質(zhì)量的研究愈加深入,關(guān)于數(shù)據(jù)一致性的管理技術(shù)也在不斷成熟.近年來,對(duì)數(shù)據(jù)一
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 熊中敏;郝忠孝;;基于路徑函數(shù)依賴和鍵約束的復(fù)雜對(duì)象嵌套結(jié)構(gòu)規(guī)范化[J];計(jì)算機(jī)工程;2006年04期
2 衛(wèi)強(qiáng);周曉滄;;基于屬性預(yù)掃描的不確定性函數(shù)依賴挖掘[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年06期
3 程錄慶;;條件函數(shù)依賴與數(shù)據(jù)質(zhì)量控制[J];信息系統(tǒng)工程;2009年11期
4 彭湘凱;陳富強(qiáng);;函數(shù)依賴對(duì)商覆蓋立方體生成效率的影響[J];計(jì)算機(jī)工程與應(yīng)用;2009年34期
5 程錄慶;;數(shù)據(jù)約束表達(dá)研究——比較條件函數(shù)依賴與傳統(tǒng)函數(shù)依賴[J];洛陽師范學(xué)院學(xué)報(bào);2011年11期
6 耿寅融;劉波;;基于條件函數(shù)依賴的數(shù)據(jù)庫一致性檢測研究[J];計(jì)算機(jī)工程與應(yīng)用;2012年03期
7 杜曉昕;王波;戴學(xué)豐;;函數(shù)依賴判定可行域的人工魚群屬性約簡[J];計(jì)算機(jī)工程與應(yīng)用;2012年09期
8 李丁月;劉建勛;翟海軍;;一種增量發(fā)現(xiàn)條件函數(shù)依賴的算法[J];計(jì)算機(jī)工程與科學(xué);2013年08期
9 馬垣;屬性集合函數(shù)依賴的半序同構(gòu)集[J];計(jì)算機(jī)學(xué)報(bào);1987年10期
10 馮玉才,紀(jì)岳;函數(shù)依賴結(jié)構(gòu)的研究及應(yīng)用[J];華中理工大學(xué)學(xué)報(bào);1989年03期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 陳長清;馮劍琳;向隆剛;馮玉才;;維之間帶函數(shù)依賴關(guān)系的數(shù)據(jù)立方的有效計(jì)算[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年
2 張忠平;曹順良;李榮;朱揚(yáng)勇;;基于約束的XML模式規(guī)范化研究[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
3 馬垣;張小平;白雪;王旭;劉楊;楊鴻雁;;函數(shù)依賴作用域及分類規(guī)則的挖掘[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
4 趙相國;王國仁;張恩德;丁大斌;霍歡;;XML函數(shù)依賴的定義及分析[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年
5 馬垣;;動(dòng)態(tài)Fuzzy函數(shù)依賴[A];第十二屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集[C];1994年
6 劉云峰;楊冬青;唐世渭;王騰蛟;;基于XML數(shù)據(jù)交換中的函數(shù)依賴轉(zhuǎn)換方法[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
7 張忠平;余靖;朱揚(yáng)勇;;基于函數(shù)依賴的XML鍵的推理及其求解算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
8 彭玉青;何華;顧軍華;;基于粗集理論的歸納依賴關(guān)系的研究[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2000年
9 岳昆;郭志懋;胥正川;周傲英;;從XML鍵到關(guān)系數(shù)據(jù)庫函數(shù)依賴[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年
10 趙文兵;廖湖聲;謝昆青;;基于函數(shù)依賴的信息泄漏評(píng)估研究[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 葉杰敏;不確定數(shù)據(jù)庫及相關(guān)理論研究[D];東華大學(xué);2014年
2 李高仕;XML數(shù)據(jù)庫的規(guī)范化理論研究[D];湖南師范大學(xué);2008年
3 閆淵;基于信息論和函數(shù)依賴的半監(jiān)督學(xué)習(xí)[D];吉林大學(xué);2013年
4 吳佳;多態(tài)依賴蘊(yùn)含判定方法的研究[D];北京工業(yè)大學(xué);2015年
5 蘇杰;基于編輯距離和條件函數(shù)依賴的酒店數(shù)據(jù)清洗方法研究[D];南昌大學(xué);2014年
6 張峰;XML不完全信息的動(dòng)態(tài)發(fā)現(xiàn)[D];山東大學(xué);2009年
7 侯林嬌;基于函數(shù)依賴的成批處理模式挖掘方法研究[D];湖南科技大學(xué);2011年
8 曹穎;云計(jì)算環(huán)境下分布式數(shù)據(jù)不一致的研究[D];中國海洋大學(xué);2013年
9 周莉;帶約束的XML與RDB數(shù)據(jù)轉(zhuǎn)換關(guān)鍵技術(shù)的研究[D];江西師范大學(xué);2005年
10 畢玉龍;基于Hadoop平臺(tái)的實(shí)體識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D];黑龍江大學(xué);2012年
,本文編號(hào):835562
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/835562.html