高維相關(guān)性缺失數(shù)據(jù)的分塊填補(bǔ)算法研究
本文選題:高維相關(guān)性數(shù)據(jù) + 缺失數(shù)據(jù); 參考:《計(jì)算機(jī)科學(xué)與探索》2017年10期
【摘要】:研究了高維相關(guān)性缺失數(shù)據(jù)的填補(bǔ)方法,提出了分塊填補(bǔ)算法。該算法核心思想是:在填補(bǔ)數(shù)據(jù)的過程中會(huì)考慮變量之間的相互關(guān)系,僅利用與待填補(bǔ)數(shù)據(jù)有相關(guān)性的數(shù)據(jù)進(jìn)行填補(bǔ),從而降低不相關(guān)數(shù)據(jù)對(duì)缺失數(shù)據(jù)填補(bǔ)的影響,提高數(shù)據(jù)填補(bǔ)的準(zhǔn)確度。同時(shí),該算法能夠并行處理缺失數(shù)據(jù),從而提高數(shù)據(jù)填補(bǔ)效率,對(duì)于高維缺失數(shù)據(jù)的填補(bǔ)有重要意義。為了對(duì)分塊情況未知的缺失數(shù)據(jù)進(jìn)行分塊,提出了基于k-means聚類的分塊算法。大量的仿真實(shí)驗(yàn)和基于真實(shí)數(shù)據(jù)集的實(shí)驗(yàn)表明,對(duì)于相關(guān)性數(shù)據(jù),分塊填補(bǔ)算法能夠有效地利用相關(guān)信息進(jìn)行填補(bǔ),從而提高數(shù)據(jù)填補(bǔ)準(zhǔn)確度。
[Abstract]:The filling method of high dimensional correlation missing data is studied, and a block filling algorithm is proposed. The core idea of the algorithm is that the relationship between variables will be considered in the process of filling the data, and only the data that is relevant to the data to be filled will be used to fill the missing data, so as to reduce the impact of the irrelevant data on the missing data filling. Improve the accuracy of data filling. At the same time, the algorithm can process the missing data in parallel, so as to improve the efficiency of data filling, which is of great significance for the filling of high dimensional missing data. In order to block the missing data which is unknown, a block algorithm based on k-means clustering is proposed. A large number of simulation experiments and experiments based on real data sets show that the block filling algorithm can effectively use the relevant information to fill the correlation data and thus improve the accuracy of data filling.
【作者單位】: 中央財(cái)經(jīng)大學(xué)信息學(xué)院;國網(wǎng)荊州供電公司信通分公司;國網(wǎng)遼寧省電力有限公司信息通信分公司;
【基金】:中央財(cái)經(jīng)大學(xué)青年教師發(fā)展基金No.QJJ1510 國家電網(wǎng)科技部項(xiàng)目No.SGTYHT/14-JS-188~~
【分類號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張星;郝偉;;不完備或缺失數(shù)據(jù)及其填補(bǔ)方法研究[J];福建電腦;2007年04期
2 劉星毅;曾春華;江南雨;陳振華;韋小玲;;缺失數(shù)據(jù)的處理和挑戰(zhàn)[J];欽州學(xué)院學(xué)報(bào);2008年06期
3 肖靜;駱如九;宋雯;湯在祥;徐辰武;;帶有缺失數(shù)據(jù)的一種動(dòng)態(tài)聚類方法[J];中國農(nóng)業(yè)科學(xué);2012年21期
4 周秀梅;李作春;覃澤;;有序填充微陣列缺失數(shù)據(jù)[J];計(jì)算機(jī)工程與應(yīng)用;2009年22期
5 郝勝軒;宋宏;周曉鋒;;基于近鄰噪聲處理的KNN缺失數(shù)據(jù)填補(bǔ)算法[J];計(jì)算機(jī)仿真;2014年07期
6 馮志蘭,劉桂芬,劉力生,郝建生;缺失數(shù)據(jù)的多重估算[J];中國衛(wèi)生統(tǒng)計(jì);2005年05期
7 黃華東;方小勇;陳政;洪俊;黃櫻;;一種基于RBF的時(shí)序缺失數(shù)據(jù)修復(fù)方法[J];懷化學(xué)院學(xué)報(bào);2013年05期
8 張亞萍;陳得寶;侯俊欽;楊一軍;;樸素貝葉斯分類算法的改進(jìn)及應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2011年15期
9 王鳳梅;胡麗霞;;一種基于近鄰規(guī)則的缺失數(shù)據(jù)填補(bǔ)方法[J];計(jì)算機(jī)工程;2012年21期
10 張赤;豐洪才;金凱;楊婷;;基于聚類分析的缺失數(shù)據(jù)最近鄰填補(bǔ)算法[J];計(jì)算機(jī)應(yīng)用與軟件;2014年05期
相關(guān)會(huì)議論文 前1條
1 管河山;姜青山;Steven X.Wei;;一種處理缺失數(shù)據(jù)的新方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
相關(guān)博士學(xué)位論文 前1條
1 馬友;基于QoS缺失數(shù)據(jù)預(yù)測(cè)的個(gè)性化Web服務(wù)推薦方法研究[D];北京郵電大學(xué);2015年
相關(guān)碩士學(xué)位論文 前7條
1 朱建斐;數(shù)據(jù)集缺失數(shù)據(jù)恢復(fù)算法研究[D];西安電子科技大學(xué);2015年
2 姜瑤;基于缺失數(shù)據(jù)的系統(tǒng)辨識(shí)方法研究及相關(guān)軟件設(shè)計(jì)與實(shí)現(xiàn)[D];東南大學(xué);2016年
3 陳慧佳;基于Random Forest的缺失數(shù)據(jù)補(bǔ)全策略研究[D];南昌大學(xué);2016年
4 張赤;基于聚類分析的缺失數(shù)據(jù)填補(bǔ)算法研究[D];武漢輕工大學(xué);2013年
5 沈雪;基于貝葉斯方法的缺失數(shù)據(jù)補(bǔ)全研究[D];重慶大學(xué);2011年
6 楊賀;基于Active Learning的數(shù)據(jù)修復(fù)補(bǔ)全策略研究[D];南昌大學(xué);2014年
7 朱彥君;基于張量分解的缺失數(shù)據(jù)插補(bǔ)算法的研究[D];杭州電子科技大學(xué);2014年
,本文編號(hào):2063735
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2063735.html