大數(shù)據(jù)中用戶所需信息資源檢測仿真
本文選題:大數(shù)據(jù) + 用戶所需信息 ; 參考:《計算機(jī)仿真》2017年11期
【摘要】:通過對數(shù)據(jù)缺失特征進(jìn)行檢測實現(xiàn)信息資源的有效檢測,能夠保證大數(shù)據(jù)中用戶所需信息的完整性和準(zhǔn)確性,對用戶所需信息資源的檢測,需要計算出數(shù)據(jù)特征距離,分析分配缺失數(shù)據(jù)屬性特征權(quán)重,完成信息資源的檢測。傳統(tǒng)方法定義約束容差集合差異度,計算出不完備數(shù)據(jù)特征集合內(nèi)全部對象的總體相異程度,但忽略了分析分配缺失數(shù)據(jù)屬性特征權(quán)重,導(dǎo)致檢測精度偏低。提出基于遺傳優(yōu)化的大數(shù)據(jù)中用戶所需信息資源檢測方法。結(jié)合遺傳優(yōu)化思想估計用戶所需信息均值和協(xié)方差矩陣,以用戶所需信息的對數(shù)似然函數(shù)作為目標(biāo)函數(shù),通過已有缺失數(shù)據(jù)樣本獲得參數(shù)的相應(yīng)約束條件,建立大數(shù)據(jù)中缺失數(shù)據(jù)估計模型,消除用戶所需信息量綱的影響,計算出數(shù)據(jù)特征的距離,利用聚類分析分配缺失數(shù)據(jù)屬性特征權(quán)重,完成大數(shù)據(jù)中用戶所需信息資源檢測。實驗結(jié)果表明,所提方法具有較高的填補(bǔ)準(zhǔn)確性,且可擴(kuò)展性較強(qiáng)。
[Abstract]:By detecting the missing features of the data to realize the effective detection of the information resources, the integrity and accuracy of the information needed by the users in big data can be guaranteed, and the distance of the data features should be calculated for the detection of the information resources needed by the users. Analysis and allocation of missing data attribute feature weights to complete the detection of information resources. The traditional method defines the difference degree of constraint tolerance set, calculates the total difference degree of all objects in the incomplete data feature set, but ignores the analysis and allocation of missing data attribute feature weights, which results in low detection accuracy. Based on genetic optimization, a method of information resource detection for users in big data is proposed. Combined with genetic optimization idea to estimate the average value and covariance matrix of information required by the user, the logarithmic likelihood function of the information required by the user is taken as the objective function, and the corresponding constraint conditions of the parameters are obtained through the existing missing data samples. The missing data estimation model in big data is established to eliminate the influence of the information dimension needed by the user, the distance of the data features is calculated, and the attribute weights of missing data are assigned by cluster analysis, and the information resources needed by the user in big data are detected. The experimental results show that the proposed method has higher filling accuracy and better scalability.
【作者單位】: 江西應(yīng)用科技學(xué)院信息工程學(xué)院;
【分類號】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張星;郝偉;;不完備或缺失數(shù)據(jù)及其填補(bǔ)方法研究[J];福建電腦;2007年04期
2 劉星毅;曾春華;江南雨;陳振華;韋小玲;;缺失數(shù)據(jù)的處理和挑戰(zhàn)[J];欽州學(xué)院學(xué)報;2008年06期
3 楊燕;我國網(wǎng)絡(luò)信息資源的開發(fā)與管理的幾點思考[J];圖書館建設(shè);2000年06期
4 金朝陽,徐進(jìn);中國互聯(lián)網(wǎng)絡(luò)發(fā)展現(xiàn)狀與圖書館信息資源建設(shè)[J];圖書館建設(shè);2002年05期
5 梁 莉;開發(fā)信息資源 迎接網(wǎng)絡(luò)現(xiàn)代化[J];河南機(jī)電高等專科學(xué)校學(xué)報;2002年01期
6 王曉麗;對充分利用圖書館信息資源的思考[J];廣西民族學(xué)院學(xué)報(哲學(xué)社會科學(xué)版);2004年S2期
7 李琦;;圖書館信息資源的開發(fā)與利用[J];山東電大學(xué)報;2006年02期
8 葛雪雁;王海斌;;淺析網(wǎng)絡(luò)信息資源的開發(fā)與利用[J];工程建設(shè)與設(shè)計;2007年06期
9 趙炳武;;評《網(wǎng)絡(luò)環(huán)境下圖書館信息資源的整合開發(fā)》[J];中共青島市委黨校(青島行政學(xué)院學(xué)報);2007年05期
10 彭鳳蘭;朱長菊;;略論網(wǎng)絡(luò)信息資源的整合[J];情報探索;2009年03期
相關(guān)會議論文 前10條
1 管河山;姜青山;Steven X.Wei;;一種處理缺失數(shù)據(jù)的新方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
2 張惠榮;;網(wǎng)絡(luò)環(huán)境下醫(yī)院圖書館信息資源建設(shè)與服務(wù)[A];中華醫(yī)學(xué)會第十次全國醫(yī)學(xué)信息學(xué)術(shù)會議論文匯編[C];2004年
3 郭峰;;網(wǎng)絡(luò)環(huán)境下圖書館信息資源的共建共享[A];新環(huán)境下圖書館建設(shè)與發(fā)展——第六屆中國社區(qū)和鄉(xiāng)鎮(zhèn)圖書館發(fā)展戰(zhàn)略研討會征文集(下冊)[C];2007年
4 王志紅;劉兵;;論圖書館網(wǎng)絡(luò)信息資源的組織管理[A];向數(shù)字化轉(zhuǎn)型的圖書館工作[C];2004年
5 楊姝;;網(wǎng)絡(luò)環(huán)境下圖書館信息資源的開發(fā)利用[A];全面建設(shè)小康社會:中國科技工作者的歷史責(zé)任——中國科協(xié)2003年學(xué)術(shù)年會論文集(下)[C];2003年
6 李曉紅;;淺談我國信息資源建設(shè)政策的制定及實施[A];全國高校社科信息資料研究會第六次會員代表大會暨第13次學(xué)術(shù)研討會論文集[C];2010年
7 王俊俐;;對圖書館信息資源科學(xué)化建設(shè)和管理的若干思考[A];信息時代——科技情報研究學(xué)術(shù)論文集(第二輯)[C];2006年
8 郭光友;曾令濤;呂小定;唐清安;;教學(xué)多媒體信息資源表征及應(yīng)用研究[A];中國電化教育協(xié)會2002年年會論文集[C];2002年
9 劉樂群;;我院圖書館信息資源建設(shè)的現(xiàn)狀及對策[A];陜西省圖書館學(xué)會第五次會員代表大會暨學(xué)術(shù)研討會與全國圖書館部室主任工作、學(xué)術(shù)研討會論文集[C];2003年
10 段瑋弘;王寶英;;我國互聯(lián)網(wǎng)的發(fā)展現(xiàn)狀及其對圖書館的影響[A];山西省科學(xué)技術(shù)情報學(xué)會學(xué)術(shù)年會論文集[C];2004年
相關(guān)重要報紙文章 前3條
1 北京市新聞出版局 李超;數(shù)字出版再認(rèn)識[N];中國新聞出版報;2013年
2 陳玉龍;信息資源開發(fā)利用的基本框架[N];計算機(jī)世界;2007年
3 陶穎;利用圖書館資源優(yōu)勢 構(gòu)建區(qū)域經(jīng)濟(jì)信息中心[N];黑龍江經(jīng)濟(jì)報;2006年
相關(guān)博士學(xué)位論文 前3條
1 馬友;基于QoS缺失數(shù)據(jù)預(yù)測的個性化Web服務(wù)推薦方法研究[D];北京郵電大學(xué);2015年
2 龔奇源;面向數(shù)據(jù)發(fā)布的數(shù)據(jù)匿名技術(shù)研究[D];東南大學(xué);2016年
3 李后卿;我國網(wǎng)絡(luò)信息資源區(qū)域配置中的數(shù)字鴻溝研究[D];中南大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 朱建斐;數(shù)據(jù)集缺失數(shù)據(jù)恢復(fù)算法研究[D];西安電子科技大學(xué);2015年
2 姜瑤;基于缺失數(shù)據(jù)的系統(tǒng)辨識方法研究及相關(guān)軟件設(shè)計與實現(xiàn)[D];東南大學(xué);2016年
3 陳慧佳;基于Random Forest的缺失數(shù)據(jù)補(bǔ)全策略研究[D];南昌大學(xué);2016年
4 張赤;基于聚類分析的缺失數(shù)據(jù)填補(bǔ)算法研究[D];武漢輕工大學(xué);2013年
5 沈雪;基于貝葉斯方法的缺失數(shù)據(jù)補(bǔ)全研究[D];重慶大學(xué);2011年
6 于會萍;網(wǎng)絡(luò)環(huán)境下圖書館信息資源管理系統(tǒng)設(shè)計[D];河北大學(xué);2005年
7 魏佳;我國網(wǎng)絡(luò)信息資源永久保存策略研究[D];遼寧師范大學(xué);2012年
8 姜玉晶;網(wǎng)絡(luò)環(huán)境下圖書館數(shù)字海洋信息資源的組織與服務(wù)創(chuàng)新研究[D];山東大學(xué);2010年
9 楊賀;基于Active Learning的數(shù)據(jù)修復(fù)補(bǔ)全策略研究[D];南昌大學(xué);2014年
10 周莉;網(wǎng)絡(luò)信息資源知識組織與揭示研究[D];東北師范大學(xué);2006年
,本文編號:1794068
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1794068.html