天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

大數(shù)據(jù)下的快速KNN分類算法

發(fā)布時(shí)間:2017-06-13 08:04

  本文關(guān)鍵詞:大數(shù)據(jù)下的快速KNN分類算法,由筆耕文化傳播整理發(fā)布。


【摘要】:針對(duì)K最近鄰算法測試復(fù)雜度至少為線性,導(dǎo)致其在大數(shù)據(jù)樣本情況下的效率很低的問題,提出了一種應(yīng)用于大數(shù)據(jù)下的快速KNN分類算法。該算法創(chuàng)新性地在K最近鄰算法中引入訓(xùn)練過程,即通過線性復(fù)雜度聚類方法對(duì)大數(shù)據(jù)樣本進(jìn)行分塊,然后在測試過程中找出與待測樣本距離最近的塊,并將其作為新的訓(xùn)練樣本進(jìn)行K最近鄰分類。這樣的過程大幅度地減少了K最近鄰算法的測試開銷,使其能在大數(shù)據(jù)集中得以應(yīng)用。實(shí)驗(yàn)表明,該算法在與經(jīng)典KNN分類準(zhǔn)確率保持近似的情況下,分類的速度明顯快于經(jīng)典KNN算法。
【作者單位】: 廣西師范學(xué)院計(jì)算機(jī)與信息工程學(xué)院;廣西師范大學(xué)廣西多源信息挖掘與安全重點(diǎn)實(shí)驗(yàn)室和廣西區(qū)域多源信息集成與智能處理協(xié)同創(chuàng)新中心;
【關(guān)鍵詞】K最近鄰 測試復(fù)雜度 大數(shù)據(jù) 分塊 聚類中心
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61450001;61263035;61573270) 國家“863”計(jì)劃資助項(xiàng)目(2012AA011005) 國家“973”計(jì)劃資助項(xiàng)目(2013CB329404) 廣西自然科學(xué)基金資助項(xiàng)目(2012GXNSFGA060004;2014jj AA70175;2015GXNSFAA139306;2015GXNSFCB13901) 廣西八桂創(chuàng)新團(tuán)隊(duì)、廣西百人計(jì)劃和廣西高�?茖W(xué)技術(shù)研究重點(diǎn)項(xiàng)目(2013ZD04)
【分類號(hào)】:TP311.13
【正文快照】: 0引言隨著互聯(lián)網(wǎng)的迅猛發(fā)展,大數(shù)據(jù)不斷地產(chǎn)生,分類作為當(dāng)前數(shù)據(jù)挖掘中最實(shí)用的技術(shù)之一,已得到廣泛的應(yīng)用。目前常用的分類方法有決策樹、人工神經(jīng)網(wǎng)絡(luò)、SVM、Bayes、KNN等。KNN算法因其簡單和有效在分類算法中得到了廣泛的應(yīng)用,其基本思想是:在訓(xùn)練樣本中找到待測樣本的k個(gè)

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 宋杰;;蛋白質(zhì)亞細(xì)胞定位預(yù)測的最近鄰算法[J];計(jì)算機(jī)應(yīng)用研究;2007年11期

2 張瑞民;郭海剛;李培巒;;基于核的k最近鄰算法[J];華北水利水電學(xué)院學(xué)報(bào);2007年06期

3 潘世瑞;張陽;李雪;王勇;;針對(duì)不確定正例和未標(biāo)記學(xué)習(xí)的最近鄰算法(英文)[J];計(jì)算機(jī)科學(xué)與探索;2010年09期

4 李強(qiáng);蔣靜坪;;量子K最近鄰算法[J];系統(tǒng)工程與電子技術(shù);2008年05期

5 宋杰;;蛋白質(zhì)相互作用預(yù)測的核最近鄰算法[J];計(jì)算機(jī)應(yīng)用研究;2009年11期

6 周武;趙春霞;張浩峰;;動(dòng)態(tài)聯(lián)合最近鄰算法[J];電子學(xué)報(bào);2010年02期

7 于學(xué)斗;;基于核的K-最近鄰算法的主動(dòng)式防御研究[J];計(jì)算機(jī)安全;2009年07期

8 楊夢雄;楊貫中;;基于K-最近鄰算法的話務(wù)智能預(yù)測技術(shù)[J];科學(xué)技術(shù)與工程;2007年21期

9 陳凱;王立松;;一種新的加權(quán)最近鄰算法的降水預(yù)報(bào)試驗(yàn)[J];計(jì)算機(jī)仿真;2014年06期

10 謝金晶;張藝瀕;;基于改進(jìn)的K-最近鄰算法的病毒檢測方法[J];現(xiàn)代電子技術(shù);2007年03期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前2條

1 潘世瑞;張陽;李雪;王勇;;針對(duì)不確定正例和未標(biāo)記學(xué)習(xí)的最近鄰算法(英文)[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集A輯二[C];2010年

2 周曉丹;馮少榮;薛永生;;一種基于改進(jìn)最近鄰算法的缺失數(shù)據(jù)處理[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 陳煜;基于多維度量的出租車推薦系統(tǒng)的研究與實(shí)現(xiàn)[D];大連理工大學(xué);2015年


  本文關(guān)鍵詞:大數(shù)據(jù)下的快速KNN分類算法,由筆耕文化傳播整理發(fā)布。

,

本文編號(hào):446043

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/446043.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4321a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com