數(shù)據(jù)開采的數(shù)據(jù)質(zhì)量問題
本文選題:數(shù)據(jù)開采 + 數(shù)據(jù)質(zhì)量; 參考:《管理工程學(xué)報(bào)》2002年01期
【摘要】:數(shù)據(jù)質(zhì)量是影響數(shù)據(jù)開采效果的重要因素 ,這個(gè)問題并未受到人們的充分重視。本文針對(duì)數(shù)據(jù)質(zhì)量在數(shù)據(jù)開采中的地位 ,給出了數(shù)據(jù)質(zhì)量評(píng)價(jià)的幾個(gè)主要尺度。并且結(jié)合統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)的理論 ,分析了解決數(shù)據(jù)質(zhì)量的方法 ,強(qiáng)調(diào)提高數(shù)據(jù)質(zhì)量的出發(fā)點(diǎn)在于控制數(shù)據(jù)源的質(zhì)量。
[Abstract]:Data quality is an important factor affecting the effect of data mining, which has not been paid enough attention to. According to the status of data quality in data mining, this paper gives several main scales of data quality evaluation. Combined with the theory of statistics and machine learning, this paper analyzes the methods of data quality, and emphasizes that the starting point of improving data quality is to control the quality of data sources.
【作者單位】: 東南大學(xué)經(jīng)管學(xué)院 合肥工業(yè)大學(xué)
【基金】:江蘇省自然科學(xué)基金資助項(xiàng)目 ( 76 0 5 730 0 72 )
【分類號(hào)】:F222
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊萍,楊明;基于VPRS的重要屬性評(píng)價(jià)方法研究[J];安徽工程科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年01期
2 林成龍,孫即祥;粗糙集理論在決策判斷中的應(yīng)用[J];電光與控制;2005年01期
3 李龍澍,程慧霞,盧冰原;基于凸Rough集的數(shù)據(jù)約簡和規(guī)則發(fā)現(xiàn)研究[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年02期
4 許少華,趙萬平,廖太平,魯?shù)?李欣;一類模式識(shí)別及其在地層對(duì)比中的應(yīng)用[J];大慶石油學(xué)院學(xué)報(bào);2002年01期
5 葉東毅;Jelonek屬性約簡算法的一個(gè)改進(jìn)[J];電子學(xué)報(bào);2000年12期
6 葉東毅,陳昭炯;一個(gè)新的差別矩陣及其求核方法[J];電子學(xué)報(bào);2002年07期
7 楊明,孫志揮;改進(jìn)的差別矩陣及其求核方法[J];復(fù)旦學(xué)報(bào)(自然科學(xué)版);2004年05期
8 葉東毅;基于粗糙隸屬函數(shù)的規(guī)則組合可信度計(jì)算與推理[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年03期
9 緱錦,葉東毅;基于概念格的求所有絕對(duì)屬性約簡的一個(gè)算法[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年03期
10 葉東毅,陳昭炯;不相容決策表屬性約簡計(jì)算的一個(gè)可辨識(shí)矩陣方法[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年01期
相關(guān)會(huì)議論文 前6條
1 游鳳荷;游汛;;粗糙集的約簡算法在渦流傳感器設(shè)計(jì)中的應(yīng)用[A];2007'湖北·武漢NDT學(xué)術(shù)年會(huì)論文集[C];2007年
2 張錚;蘇旭武;張道德;陳學(xué)鋒;;裝載機(jī)故障診斷屬性約簡算法[A];湖北省機(jī)械工程學(xué)會(huì)青年分會(huì)2006年年會(huì)暨第2屆機(jī)械學(xué)院院長(系主任)會(huì)議論文集(下)[C];2006年
3 李仁璞;黃道;高茂庭;;一種快速的決策規(guī)則抽取方法[A];2005中國控制與決策學(xué)術(shù)年會(huì)論文集(下)[C];2005年
4 馬翠;劉瓊蓀;周先東;;基于相對(duì)區(qū)分矩陣的遺傳模擬退火屬性約簡算法[A];第九屆中國青年信息與管理學(xué)者大會(huì)論文集[C];2007年
5 王丹;吳孟達(dá);劉銀山;;屬性約簡的一種簡單算法[A];第12屆全國模糊系統(tǒng)與模糊數(shù)學(xué)學(xué)術(shù)年會(huì)論文集[C];2004年
6 楊善林;劉業(yè)政;馬溪駿;;基于β-δ_0粗糙集模型的屬性約簡算法[A];2003年中國管理科學(xué)學(xué)術(shù)會(huì)議論文集[C];2003年
相關(guān)博士學(xué)位論文 前10條
1 許志興;粗集理論的若干技術(shù)及其應(yīng)用研究[D];南京航空航天大學(xué);2001年
2 劉沐宇;基于范例推理的邊坡穩(wěn)定性智能評(píng)價(jià)方法研究[D];武漢理工大學(xué);2002年
3 何離慶;網(wǎng)絡(luò)環(huán)境下的智能化農(nóng)業(yè)信息平臺(tái)研究[D];重慶大學(xué);2002年
4 蘇健;基于粗糙集的數(shù)據(jù)挖掘與決策支持方法研究[D];浙江大學(xué);2002年
5 吳濤;構(gòu)造性知識(shí)發(fā)現(xiàn)方法研究[D];安徽大學(xué);2003年
6 張小剛;關(guān)聯(lián)規(guī)則挖掘及其在復(fù)雜工業(yè)過程控制中的應(yīng)用研究[D];湖南大學(xué);2002年
7 賽英;粗糙集擴(kuò)展模型及其在數(shù)據(jù)挖掘中的應(yīng)用研究[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2002年
8 趙軍;基于粗集理論的KDD技術(shù)研究[D];重慶大學(xué);2003年
9 許琦;粗糙集理論在旋轉(zhuǎn)機(jī)械故障診斷技術(shù)上應(yīng)用的研究[D];南京工業(yè)大學(xué);2003年
10 譚天樂;基于粗糙集的過程建模、控制與故障診斷[D];浙江大學(xué);2003年
相關(guān)碩士學(xué)位論文 前10條
1 鄒先霞;基于C/S模式數(shù)據(jù)挖掘的研究及其在AEFS中的應(yīng)用[D];華中師范大學(xué);2001年
2 緱錦;基于概念格的屬性約簡算法及粗糙集在聚類分析中的應(yīng)用探討[D];福州大學(xué);2002年
3 康勝武;基于粗集理論的屬性處理方法和模糊規(guī)則提取及應(yīng)用研究[D];廈門大學(xué);2001年
4 仲維國;信息系統(tǒng)中粗糙集理論若干問題的研究[D];南京理工大學(xué);2002年
5 張新霞;基于統(tǒng)計(jì)相關(guān)性的有趣關(guān)聯(lián)規(guī)則的挖掘[D];武漢科技大學(xué);2002年
6 孫巍巍;基于多指標(biāo)群決策理論的股票預(yù)測系統(tǒng)研究[D];昆明理工大學(xué);2002年
7 彭云;ARMRDB模型中的聚類分析和規(guī)則提取[D];江西師范大學(xué);2002年
8 陳云化;基于粗糙集理論的增量算法的研究和應(yīng)用[D];福州大學(xué);2003年
9 趙士亮;粗糙集理論中若干問題的研究及應(yīng)用[D];福州大學(xué);2003年
10 劉成鋼;基于粗糙集理論的不確定決策問題的研究與應(yīng)用[D];南京航空航天大學(xué);2003年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 葛萌萌;彭現(xiàn)美;王有剛;;住戶調(diào)查樣本選擇及數(shù)據(jù)誤差問題探討[J];安徽農(nóng)學(xué)通報(bào)(下半月刊);2011年16期
2 鄭向群;張鐵亮;姚秀榮;;我國農(nóng)業(yè)資源環(huán)境信息統(tǒng)計(jì)的歷史回顧與未來展望[J];農(nóng)業(yè)環(huán)境與發(fā)展;2011年03期
3 劉虹;;淺析企業(yè)會(huì)計(jì)與統(tǒng)計(jì)在市場經(jīng)濟(jì)條件下的相互適應(yīng)性[J];中國集體經(jīng)濟(jì);2011年19期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)會(huì)議論文 前4條
1 曹會(huì)平;;縣級(jí)GDP核算工作面臨的問題與思考[A];2005—2006山西省統(tǒng)計(jì)科研成果匯編[C];2006年
2 竇志達(dá);耿愛蓮;李文選;;關(guān)于縮小國家與地區(qū)GDP核算差異方法的思考[A];2005—2006山西省統(tǒng)計(jì)科研成果匯編[C];2006年
3 霍成義;莫琳;許加宏;;2006年1季度山東省銀行家問卷調(diào)查分析報(bào)告[A];社會(huì)主義新農(nóng)村建設(shè)與金融支持學(xué)術(shù)研討會(huì)論文集[C];2006年
4 高新萍;;縱觀經(jīng)濟(jì)普查全過程,淺談基層普查的組織工作[A];北京市第十三次統(tǒng)計(jì)科學(xué)討論會(huì)論文選編[C];2006年
相關(guān)重要報(bào)紙文章 前10條
1 ;國務(wù)院經(jīng)普辦數(shù)據(jù)質(zhì)量抽查工作在浙遼陜順次展開[N];中國信息報(bào);2009年
2 高立業(yè);臨朐縣嚴(yán)控經(jīng)普登記數(shù)據(jù)質(zhì)量[N];中國信息報(bào);2009年
3 ;采取多種舉措確保數(shù)據(jù)質(zhì)量[N];鄭州日?qǐng)?bào);2009年
4 李艷;華寧確保經(jīng)普數(shù)據(jù)質(zhì)量[N];玉溪日?qǐng)?bào);2009年
5 本報(bào)記者 趙曉赤;黑龍江扎實(shí)開展農(nóng)村數(shù)據(jù)質(zhì)量檢查[N];中國信息報(bào);2005年
6 海南省統(tǒng)計(jì)局局長 張恒;堅(jiān)持依法統(tǒng)計(jì) 提高數(shù)據(jù)質(zhì)量[N];中國信息報(bào);2002年
7 本報(bào)記者 王布剛;視數(shù)據(jù)質(zhì)量為生命[N];中國信息報(bào);2003年
8 ;大連市“四四一”確保單位清查數(shù)據(jù)質(zhì)量[N];中國信息報(bào);2008年
9 ;按要求做好經(jīng)普數(shù)據(jù)質(zhì)量抽查工作[N];中國信息報(bào);2009年
10 張新沙;提高數(shù)據(jù)質(zhì)量的“五招”[N];中國信息報(bào);2003年
相關(guān)碩士學(xué)位論文 前4條
1 黃麗莎;非國有經(jīng)濟(jì)統(tǒng)計(jì)指標(biāo)體系與調(diào)查方法研究[D];東北林業(yè)大學(xué);2007年
2 周光洪;基于國際可比性的我國GDP數(shù)據(jù)質(zhì)量研究[D];湖南大學(xué);2009年
3 渠田田;GDP數(shù)據(jù)質(zhì)量的統(tǒng)計(jì)診斷[D];江蘇大學(xué);2010年
4 張敏敏;中國經(jīng)濟(jì)普查的數(shù)據(jù)挖掘方法研究[D];東北林業(yè)大學(xué);2007年
,本文編號(hào):1902711
本文鏈接:http://sikaile.net/weiguanjingjilunwen/1902711.html