【摘要】: 超大規(guī)模的模式識(shí)別問(wèn)題是現(xiàn)在機(jī)器學(xué)習(xí)算法在實(shí)際應(yīng)用中遇到的越來(lái)越多的一個(gè)難題。隨著信息時(shí)代的到來(lái),現(xiàn)實(shí)中這種大規(guī)模問(wèn)題是很常見(jiàn)的,例如專利分類問(wèn)題。即便是像支持向量機(jī)這樣高效率的學(xué)習(xí)算法,面對(duì)超大規(guī)模的分類問(wèn)題,也是難以克服的。在這種情況下,利用豐富的計(jì)算資源,使得機(jī)器學(xué)習(xí)并行化,是當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)重要發(fā)展方向。 最小最大模塊化支持向量機(jī)(M3-SVM)是基于“分而治之”的思想解決大規(guī)模問(wèn)題的有效的學(xué)習(xí)算法。它通過(guò)分解大規(guī)模問(wèn)題,使之轉(zhuǎn)化為大量小規(guī)模問(wèn)題進(jìn)行學(xué)習(xí),并通過(guò)有效的分類器集成方法將它們重新組合成為大規(guī)模問(wèn)題的原解,該算法具有天生的并行適應(yīng)性。 為了降低M3-SVM在模塊統(tǒng)合階段的時(shí)間復(fù)雜度,我們?cè)谠械姆菍?duì)稱選擇和對(duì)稱選擇等分類器選擇方法的基礎(chǔ)上,提出了基于決策樹(shù)的分類器選擇算法。實(shí)驗(yàn)證明,決策樹(shù)選擇算法在分類效果上與原方法相似。但是大大提高了訓(xùn)練的復(fù)雜度。 在此基礎(chǔ)上,我們又提出了決策樹(shù)訓(xùn)練數(shù)據(jù)的選擇方法。該方法大大降低的決策樹(shù)訓(xùn)練的時(shí)間,同時(shí)也降低的決策樹(shù)的規(guī)模。與ACS與SCS相比更小規(guī)模的決策樹(shù)在并行學(xué)習(xí)的計(jì)算復(fù)雜度方面更有優(yōu)勢(shì),同時(shí)也節(jié)省了磁盤(pán)存儲(chǔ)空間。 在本文中我們?cè)O(shè)計(jì)了大量的實(shí)驗(yàn),包括小規(guī)模的雙螺旋線實(shí)驗(yàn)和大規(guī)模的專利分類實(shí)驗(yàn)來(lái)驗(yàn)證上述觀點(diǎn)。
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2010
【分類號(hào)】:G30;TP181
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 楊緒兵,韓自存;ε不敏感的核Adaline算法及其在圖像去噪中的應(yīng)用[J];安徽工程科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年04期
2 陶秀鳳,唐詩(shī)忠,周鳴爭(zhēng);基于支持向量機(jī)的軟測(cè)量模型及應(yīng)用[J];安徽工程科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2004年02期
3 許高程;張文君;王衛(wèi)紅;;支持向量機(jī)技術(shù)在遙感影像滑坡體提取中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2009年06期
4 郭立萍;唐家奎;米素娟;張成雯;趙理君;;基于支持向量機(jī)遙感圖像融合分類方法研究進(jìn)展[J];安徽農(nóng)業(yè)科學(xué);2010年17期
5 馮學(xué)軍;;最小二乘支持向量機(jī)的研究與應(yīng)用[J];安慶師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2009年01期
6 鄒心遙;姚若河;;基于LSSVM的威布爾分布形狀參數(shù)估計(jì)(英文)[J];半導(dǎo)體技術(shù);2008年06期
7 鄒心遙;姚若河;;基于LSSVM的小子樣元器件壽命預(yù)測(cè)[J];半導(dǎo)體技術(shù);2011年09期
8 李卓遠(yuǎn),吳為民,王e
本文編號(hào):2792905
本文鏈接:http://sikaile.net/guanlilunwen/keyanlw/2792905.html