天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

大樣本的線性可分支持向量機(jī)算法

發(fā)布時(shí)間:2020-05-22 15:31
【摘要】:伴隨產(chǎn)業(yè)界數(shù)據(jù)量的爆炸式增進(jìn),大數(shù)據(jù)概念的關(guān)注度也得到很大程度的提升。因?yàn)榇髷?shù)據(jù)的龐大、復(fù)雜多樣等特征,傳統(tǒng)的支持向量機(jī)分類算法在大數(shù)據(jù)環(huán)境下已不再實(shí)用。因而,大數(shù)據(jù)下支持向量機(jī)分類算法的研究成為各界密切關(guān)注的方向。為了能夠?qū)⒅С窒蛄繖C(jī)應(yīng)用于海量樣本數(shù)據(jù)的快速分類,需要從大樣本數(shù)據(jù)集中篩選潛在的支持向量集,以此作為SVM的訓(xùn)練集,提高學(xué)習(xí)效率。因?yàn)闃颖救萘枯^大時(shí),支持向量機(jī)的學(xué)習(xí)難度會增大,并且會消費(fèi)大量的學(xué)習(xí)時(shí)間,這使得支持向量機(jī)在海量樣本數(shù)據(jù)學(xué)習(xí)難以被采用。支持向量機(jī)的分離超平面是由支持向量所決定,其他訓(xùn)練樣本點(diǎn)對分離超平面的確定完全不起作用。本文將大規(guī)模的數(shù)據(jù)縮減成小規(guī)模的數(shù)據(jù),在小規(guī)模的數(shù)據(jù)上學(xué)習(xí)支持向量并進(jìn)行迭代,得到最終的支持向量。本文提出了一種線性可分支持向量機(jī)分組算法,該算法將大樣本隨機(jī)分成若干組的小樣本訓(xùn)練數(shù)據(jù)集,在小樣本訓(xùn)練數(shù)據(jù)集上進(jìn)行訓(xùn)練,得到嫌疑支持向量,將這些支持向量加到下一組進(jìn)行訓(xùn)練,以此類推,最后一組訓(xùn)練得到的支持向量為大樣本數(shù)據(jù)集的支持向量。其次提出了錯(cuò)分樣本預(yù)選算法,該算法根據(jù)支持向量對分離超平面的決定性作用,在大量的訓(xùn)練樣本數(shù)據(jù)集中去除遠(yuǎn)離分離超平面的樣本點(diǎn),提取支持向量的嫌疑樣本,用這些嫌疑樣本訓(xùn)練支持向量機(jī),既使用了所有樣本的有用信息,又提高了學(xué)習(xí)效率并節(jié)約了時(shí)間。實(shí)驗(yàn)結(jié)果表明:本文提出的兩個(gè)算法與解凸二次規(guī)劃所得到的支持向量完全一致,降低了支持向量機(jī)的學(xué)習(xí)難度和運(yùn)行時(shí)間,具有實(shí)時(shí)性和高效性。
【圖文】:

分類問題,分類器,監(jiān)督學(xué)習(xí),分程


慶大學(xué)碩士學(xué)位論文 2 分類2 分類學(xué)習(xí).1 分類的理論基礎(chǔ)分類(classification)是把數(shù)據(jù)按照一定的要求或者規(guī)則進(jìn)行整理和歸納,進(jìn)行辨別和預(yù)測[15]。分類問題的實(shí)質(zhì)是利用對已知數(shù)據(jù)進(jìn)行分析得到的模型新采集的未知數(shù)據(jù)進(jìn)行預(yù)測的過程。分類問題包括學(xué)習(xí)和分類兩個(gè)過程。在過程中,根據(jù)已知的訓(xùn)練數(shù)據(jù)集利用有效的學(xué)習(xí)方法學(xué)習(xí)一個(gè)分類器;在分程中,利用學(xué)習(xí)的分類器對新的輸入實(shí)例進(jìn)行分類,它的核心問題是監(jiān)督學(xué)習(xí)類步驟如圖 2.1 所示:

模型圖,決策樹,模型,分類決策樹


的問題的基礎(chǔ)。為了對訓(xùn)練數(shù)據(jù)進(jìn)行正確分類,統(tǒng)計(jì)學(xué)方面的法,,神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)下的決策樹、感知機(jī)、SVM 算法等。針對上述的各個(gè)方面的算法,本文主要講述運(yùn)用相對比較廣和支持向量機(jī)。首先介紹這些算法的基本概念以及相應(yīng)的模每個(gè)算法的優(yōu)劣之處。分類算法策樹樹(decision tree)分為兩種:分類決策樹和回歸決策樹,其中樹。因?yàn)榉诸悊栴}的實(shí)質(zhì)是利用對已知數(shù)據(jù)進(jìn)行分析得到的模知數(shù)據(jù)進(jìn)行預(yù)測的過程。決策樹由結(jié)點(diǎn)(node)和有向邊(dire中結(jié)點(diǎn)分為內(nèi)部結(jié)點(diǎn)(Internal node)和葉結(jié)點(diǎn)(leaf node)特征或?qū)傩,葉結(jié)點(diǎn)表示一個(gè)類。因此,分類決策樹先對已知型,再利用該模型對未知數(shù)據(jù)進(jìn)行正確的預(yù)測[3]。
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:C81

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 趙丹;;SVM核函數(shù)與選擇算法[J];數(shù)字技術(shù)與應(yīng)用;2014年09期

2 苗苗;姜建國;;一種采用類電磁機(jī)制算法的線性分類方法[J];西安電子科技大學(xué)學(xué)報(bào);2015年02期

3 何清;李寧;羅文娟;史忠植;;大數(shù)據(jù)下的機(jī)器學(xué)習(xí)算法綜述[J];模式識別與人工智能;2014年04期

4 陳雪芳;楊繼臣;;交叉驗(yàn)證KNN支持向量預(yù)選取算法在說話人識別上的應(yīng)用[J];科學(xué)技術(shù)與工程;2013年20期

5 葉菲;羅軍;;基于錯(cuò)分樣本的AdaBoost支持向量預(yù)選取算法[J];微電子學(xué)與計(jì)算機(jī);2013年04期

6 王冉;楊道軍;;基于支持向量機(jī)的巢湖富營養(yǎng)化程度評價(jià)研究[J];環(huán)境科學(xué)與管理;2011年05期

7 白鳳鳳;;基于不平衡數(shù)據(jù)集的文本分類技術(shù)研究[J];電腦編程技巧與維護(hù);2010年06期

8 朱方;顧軍華;楊欣偉;楊瑞霞;;一種新的支持向量機(jī)大規(guī)模訓(xùn)練樣本集縮減策略[J];計(jì)算機(jī)應(yīng)用;2009年10期

9 鄒元君;王瑋;吳運(yùn)明;;隨機(jī)分組算法的研究與實(shí)現(xiàn)[J];長春理工大學(xué)學(xué)報(bào)(高教版);2007年04期

10 周建欽,趙志遠(yuǎn);隨機(jī)分組查找算法[J];科學(xué)通報(bào);1990年24期

相關(guān)會議論文 前2條

1 林關(guān)成;李亞安;;一種支持向量機(jī)訓(xùn)練集選取算法改進(jìn)[A];2009’中國西部地區(qū)聲學(xué)學(xué)術(shù)交流會論文集[C];2009年

2 晏慶華;;支持向量機(jī)算法綜述[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年

相關(guān)博士學(xué)位論文 前1條

1 田亞男;視頻輸入聽覺顯示的導(dǎo)盲系統(tǒng)關(guān)鍵技術(shù)研究[D];東北大學(xué);2013年

相關(guān)碩士學(xué)位論文 前5條

1 王春雷;光伏出力短期預(yù)測技術(shù)研究[D];南昌大學(xué);2015年

2 羅偉;前視車輛檢測及定位算法研究與實(shí)現(xiàn)[D];電子科技大學(xué);2015年

3 宋麗;基于決策樹的組合分類器的研究[D];西安電子科技大學(xué);2012年

4 孟慶武;基于分類不可指定性的清晰決策樹歸納算法研究[D];河北大學(xué);2010年

5 楊顯飛;基于邊界向量預(yù)選的支持向量機(jī)算法研究[D];哈爾濱工程大學(xué);2008年



本文編號:2676208

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2676208.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b4900***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com