融合改進K近鄰和隨機森林的機器學習方法
本文關(guān)鍵詞: 機器學習 K近鄰 隨機森林 支持向量機 目標分類 出處:《計算機工程與設(shè)計》2017年08期 論文類型:期刊論文
【摘要】:對K近鄰和隨機森林學習方法進行改進,提出一種融合的機器學習方法。通過計算待分類特征與訓練庫中各個類中心之間的距離,進行最近鄰分類,增強K近鄰學習方法的魯棒性,提高其運算效率;通過隨機劃分將改進KNN分類器的多元輸出轉(zhuǎn)化為二元輸出,用其構(gòu)建隨機森林中各個決策結(jié)點的決策函數(shù),降低各決策結(jié)點數(shù)據(jù)的錯分率,提高隨機森林學習方法的目標分類正確率。實驗結(jié)果表明,該方法對手寫數(shù)字目標的分類正確率高于經(jīng)典的K近鄰、Adaboost、支持向量機和隨機森林學習方法。
[Abstract]:The K-nearest neighbor and random forest learning methods are improved, and a fusion machine learning method is proposed. The nearest neighbor classification is carried out by calculating the distance between the feature to be classified and the distance between each class center in the training database. Enhance the robustness of K-nearest neighbor learning method and improve its computational efficiency; The multivariate output of the improved KNN classifier is transformed into a binary output by random partitioning, and the decision function of each decision node in the random forest is constructed to reduce the error rate of the data of each decision node. The experimental results show that the classification accuracy of this method is higher than that of classical K-nearest neighbor Adaboost. Support vector machine and stochastic forest learning method.
【作者單位】: 成都師范學院計算機科學學院;中原工學院信息商務(wù)學院信息技術(shù)系;
【基金】:中國博士后科學基金面上基金項目(2014M560730) 四川省科技廳應(yīng)用基礎(chǔ)基金項目(2015JY0071) 成都師范學院高層次引進人才專項科研基金項目(YJRC2014-9);成都師范學院自然科學類培育基金項目(CS14ZD02)
【分類號】:TP181
【正文快照】: 0引言目前經(jīng)典的機器學習[1-3]方法有多種,如:K近鄰(K-nearest neighbor,KNN)學習方法是一種簡單的機器學習方法,實質(zhì)上是一種統(tǒng)計分類器,分類時首先計算待分類特征向量與數(shù)據(jù)庫中每一個特征向量之間的距離,選擇最鄰近的k個類別,然后統(tǒng)計這k個最鄰近類別中每類訓練樣本出現(xiàn)的
【相似文獻】
相關(guān)期刊論文 前10條
1 王象剛;;基于K均值隨機森林快速算法及入侵檢測中的應(yīng)用[J];科技通報;2013年08期
2 張華偉;王明文;甘麗新;;基于隨機森林的文本分類模型研究[J];山東大學學報(理學版);2006年03期
3 邱一卉;林成德;;基于隨機森林方法的異常樣本檢測方法[J];福建工程學院學報;2007年04期
4 馬昕;王雪;楊洋;;基于隨機森林算法的大學生異動情況的預測[J];江蘇科技大學學報(自然科學版);2012年01期
5 楊帆;林琛;周綺鳳;符長虹;羅林開;;基于隨機森林的潛在k近鄰算法及其在基因表達數(shù)據(jù)分類中的應(yīng)用[J];系統(tǒng)工程理論與實踐;2012年04期
6 聶斌;王卓;杜建強;朱明峰;林劍鳴;艾國平;熊玲珠;;基于粗糙集和隨機森林算法輔助糖尿病并發(fā)癥分類研究[J];江西師范大學學報(自然科學版);2014年03期
7 郭穎婕;劉曉燕;郭茂祖;鄒權(quán);;植物抗性基因識別中的隨機森林分類方法[J];計算機科學與探索;2012年01期
8 邱一卉;林成德;;基于隨機森林和單類支持向量機的電信行業(yè)客戶流失預測[J];廈門大學學報(自然科學版);2013年05期
9 于化龍;高尚;趙靖;秦斌;;基于過采樣技術(shù)和隨機森林的不平衡微陣列數(shù)據(jù)分類方法研究[J];計算機科學;2012年05期
10 姚登舉;楊靜;詹曉娟;;基于隨機森林的特征選擇算法[J];吉林大學學報(工學版);2014年01期
相關(guān)博士學位論文 前2條
1 張乾;基于隨機森林的視覺數(shù)據(jù)分類關(guān)鍵技術(shù)研究[D];華南理工大學;2016年
2 雷震;隨機森林及其在遙感影像處理中應(yīng)用研究[D];上海交通大學;2012年
相關(guān)碩士學位論文 前10條
1 朱琪;基于最大平衡度與最大共識的改進隨機森林算法研究[D];吉林大學;2016年
2 馬驪;隨機森林算法的優(yōu)化改進研究[D];暨南大學;2016年
3 程政;城市道路短時車流量預測模型研究[D];中國科學技術(shù)大學;2016年
4 陳實;基于隨機森林的神經(jīng)肽剪切位點預測方法研究[D];華中科技大學;2015年
5 胡宗杰;基于極值隨機森林的慢性胃炎中醫(yī)問診證候分類研究[D];華東理工大學;2017年
6 康雅文;基于隨機森林的醫(yī)療行業(yè)供應(yīng)商的等級評估模型[D];安徽大學;2017年
7 李貞貴;隨機森林改進的若干研究[D];廈門大學;2013年
8 姚明煌;隨機森林及其在遙感圖像分類中的應(yīng)用[D];華僑大學;2014年
9 肖堅;基于隨機森林的不平衡數(shù)據(jù)分類方法研究[D];哈爾濱工業(yè)大學;2013年
10 雍凱;隨機森林的特征選擇和模型優(yōu)化算法研究[D];哈爾濱工業(yè)大學;2008年
,本文編號:1448580
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1448580.html