數(shù)據(jù)質(zhì)量多種性質(zhì)的關(guān)聯(lián)關(guān)系研究
本文關(guān)鍵詞:數(shù)據(jù)質(zhì)量多種性質(zhì)的關(guān)聯(lián)關(guān)系研究
更多相關(guān)文章: 數(shù)據(jù)質(zhì)量 數(shù)據(jù)質(zhì)量性質(zhì) 多性質(zhì)關(guān)系 數(shù)據(jù)清洗 數(shù)據(jù)管理
【摘要】:信息化時代數(shù)據(jù)海量增長的同時,用戶需要利用多種指標從不同性質(zhì)角度對數(shù)據(jù)質(zhì)量進行評價和改善.但在目前數(shù)據(jù)質(zhì)量管理過程中,影響數(shù)據(jù)可用性的多種重要因素并非完全孤立,在評估機制和指導(dǎo)數(shù)據(jù)清洗規(guī)則時,彼此會發(fā)生關(guān)聯(lián).研究了在實際信息系統(tǒng)中適用的綜合性數(shù)據(jù)質(zhì)量評估方法,將文獻所提出以及在實際的信息系統(tǒng)中常用的數(shù)據(jù)質(zhì)量性質(zhì)指標按其定義與性質(zhì)進行了歸納總結(jié),提出了基于性質(zhì)的數(shù)據(jù)質(zhì)量綜合評估框架.之后針對影響數(shù)據(jù)可用性的4個重要性質(zhì):精確性、完整性、一致性以及時效性整理出在數(shù)據(jù)集合上的操作方法,并逐一介紹其違反模式的定義,隨后給出其具體關(guān)系證明,進而確定數(shù)據(jù)質(zhì)量多維關(guān)聯(lián)關(guān)系評估策略,并通過實驗驗證了該策略的有效性.
【作者單位】: 哈爾濱工業(yè)大學(xué)計算機科學(xué)與技術(shù)學(xué)院;
【基金】:國家重點基礎(chǔ)研究發(fā)展計劃(973)(2012CB316200) 國家自然科學(xué)基金(U1509216,61472099,61133002) 黑龍江省留學(xué)回國人員基金(LC2016026)~~
【分類號】:TP311.13
【正文快照】:
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 李默涵;李建中;高宏;;數(shù)據(jù)時效性判定問題的求解算法[J];計算機學(xué)報;2012年11期
2 郭志懋,周傲英;數(shù)據(jù)質(zhì)量和數(shù)據(jù)清洗研究綜述[J];軟件學(xué)報;2002年11期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 潘峗;;數(shù)據(jù)中心網(wǎng)絡(luò)的體系結(jié)構(gòu)研究[J];無線互聯(lián)科技;2016年12期
2 李建中;王宏志;高宏;;大數(shù)據(jù)可用性的研究進展[J];軟件學(xué)報;2016年07期
3 楊洵;張文德;廖彬;;高校數(shù)據(jù)精簡整合系統(tǒng)管理研究[J];情報探索;2016年04期
4 丁小歐;王宏志;張笑影;李建中;高宏;;數(shù)據(jù)質(zhì)量多種性質(zhì)的關(guān)聯(lián)關(guān)系研究[J];軟件學(xué)報;2016年07期
5 孫曉玲;鄭勉;李偉勤;羅恩韜;;位置信息記錄中基于期望最大化的名稱消重算法[J];計算機科學(xué);2016年03期
6 蘇云梅;武建光;;大數(shù)據(jù)之下我國情報學(xué)面臨的挑戰(zhàn)及應(yīng)對策略[J];大學(xué)圖書情報學(xué)刊;2016年02期
7 柴振國;;孔隙水類型礦山水文地質(zhì)勘察[J];黑龍江科學(xué);2016年03期
8 張燕;湯一彬;李旭斐;;RFID數(shù)據(jù)清洗算法概述[J];微處理機;2016年01期
9 吳波;王t,
本文編號:1251507
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1251507.html