基于Hadoop平臺的SVM_WNB分類算法的研究
發(fā)布時間:2017-07-14 04:06
本文關(guān)鍵詞:基于Hadoop平臺的SVM_WNB分類算法的研究
更多相關(guān)文章: 大數(shù)據(jù) 數(shù)據(jù)挖掘 SVM_WNB算法 Hadoop云平臺 并行化
【摘要】:SVM算法和樸素貝葉斯分類算法是對大量復(fù)雜數(shù)據(jù)分類中性能優(yōu)秀的算法。然而它們的缺點使得分類效果受到了影響,而且傳統(tǒng)的數(shù)據(jù)挖掘分類算法也無法滿足對于海量數(shù)據(jù)的處理。針對這些問題,這里對傳統(tǒng)的樸素貝葉斯算法進(jìn)行了分析和改進(jìn),提出了SVM_WNB分類算法,并且在Hadoop云平臺上對算法實現(xiàn)并行化處理,使其能夠?qū)Υ髷?shù)據(jù)進(jìn)行處理。實驗驗證,改進(jìn)后的算法在準(zhǔn)確性和效率等方面有明顯提升,在大數(shù)據(jù)的分類上將會起到顯著的效果。
【作者單位】: 南京郵電大學(xué)計算機(jī)學(xué)院;
【關(guān)鍵詞】: 大數(shù)據(jù) 數(shù)據(jù)挖掘 SVM_WNB算法 Hadoop云平臺 并行化
【分類號】:TP301.6
【正文快照】: 現(xiàn)今,在不同的領(lǐng)域中到處充滿著含有巨大的潛在價值的數(shù)據(jù)。根據(jù)國際分析機(jī)構(gòu)IDC的統(tǒng)計,到2020年,預(yù)計全球通過不同設(shè)備產(chǎn)生的數(shù)據(jù)量將會超過40 ZB,而在中國,到2020年,整個數(shù)據(jù)量將突破8 ZB[1]。要想在這些數(shù)據(jù)中挖掘出豐富的價值,對大數(shù)據(jù)進(jìn)行有效的分類是至關(guān)重要的一步。在
【相似文獻(xiàn)】
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 趙波;唐常杰;朱明放;魏大剛;左R,
本文編號:539571
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/539571.html
最近更新
教材專著