基于示例加權(quán)支持向量機(jī)的多示例學(xué)習(xí)算法研究
本文關(guān)鍵詞:基于示例加權(quán)支持向量機(jī)的多示例學(xué)習(xí)算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著Internet的迅速普及,知識和信息的爆炸,人們所面臨的數(shù)據(jù)量急劇增長,各行各業(yè)面臨著大量的數(shù)據(jù)處理。這些豐富的數(shù)據(jù)資源背后,富含著極為重要的、潛在的、有用的知識。在現(xiàn)實(shí)世界的數(shù)據(jù)中,它們往往可能存在誤差,例如,屬性值的缺損,數(shù)據(jù)形式的不合適,數(shù)據(jù)的重復(fù)、異常、含噪聲、不一致等。因此,如何從這些數(shù)據(jù)中獲取有效的信息是我們?nèi)孕杞鉀Q的問題。多示例學(xué)習(xí)最初的提出是用來解決藥物分子活性預(yù)測問題,目的是希望能夠從大量的分子中提取出更有活性的分子,來幫助制藥公司集中有限的資源用于更有意義的研究。目前,很多經(jīng)典的多示例學(xué)習(xí)算法相繼提出,如基于支持向量機(jī)的多示例學(xué)習(xí)算法、基于神經(jīng)網(wǎng)絡(luò)的多示例學(xué)習(xí)算法、基于決策樹的多示例學(xué)習(xí)算法等,多示例學(xué)習(xí)框架得到了廣泛的研究與應(yīng)用,已被應(yīng)用到如藥物活性預(yù)測、圖像檢索、股票預(yù)測、物體檢測等眾多領(lǐng)域。在傳統(tǒng)的多示例學(xué)習(xí)中,訓(xùn)練集由若干個多示例包組成,每個包中包含若干個示例,標(biāo)簽作用于包,而多示例包內(nèi)的示例沒有標(biāo)簽。每個正包至少包含一個正示例,也就是說正包除了含有正示例,還可能包括負(fù)示例。另外,負(fù)包中的全部示例都是負(fù)示例。多示例學(xué)習(xí)的任務(wù)是通過已標(biāo)記多示例包來學(xué)習(xí)分類器,并利用其來預(yù)測未標(biāo)記多示例包的標(biāo)簽。本文介紹了支持向量機(jī)的相關(guān)理論基礎(chǔ),給出了多示例學(xué)習(xí)的相關(guān)研究,著重介紹了在數(shù)據(jù)受到噪聲干擾的情況下,如何結(jié)合多示例學(xué)習(xí)與支持向量機(jī),降低噪聲對分類結(jié)果的影響。由于數(shù)據(jù)收集設(shè)備誤差、傳輸偏差等原因,多示例包的示例可能存在噪聲信息。在這種情況下,傳統(tǒng)的多示例學(xué)習(xí)可能無法有效地處理多示例包中存在的噪聲問題。本文在多示例學(xué)習(xí)與支持向量機(jī)結(jié)合的基礎(chǔ)之上,通過示例加權(quán),降低噪聲示例對分類預(yù)測的影響。在實(shí)驗(yàn)中,本文使用了麝香分子數(shù)據(jù)集和基于內(nèi)容的圖像檢索數(shù)據(jù)集,對比了多種經(jīng)典的多示例學(xué)習(xí)算法。實(shí)驗(yàn)結(jié)果證明,本文的方法獲得了更高的分類精度。
【關(guān)鍵詞】:多示例學(xué)習(xí) 支持向量機(jī) 噪聲信息
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP181
【目錄】:
- 摘要4-5
- Abstract5-11
- 第一章 緒論11-15
- 1.1 研究背景及意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-13
- 1.3 論文主要內(nèi)容13
- 1.4 論文組織架構(gòu)13-15
- 第二章 支持向量機(jī)理論基礎(chǔ)15-22
- 2.1 統(tǒng)計(jì)學(xué)習(xí)理論15-16
- 2.2 支持向量理論16-19
- 2.2.1 線性可分情況17-18
- 2.2.2 非線性情況18-19
- 2.2.3 核函數(shù)19
- 2.3 最優(yōu)化問題求解19-20
- 2.4 支持向量機(jī)的應(yīng)用20-21
- 2.5 本章小結(jié)21-22
- 第三章 多示例學(xué)習(xí)相關(guān)研究22-33
- 3.1 經(jīng)典的多示例學(xué)習(xí)算法23-27
- 3.1.1 軸平行矩形算法23-24
- 3.1.2 基于概率統(tǒng)計(jì)類的多示例學(xué)習(xí)算法24-25
- 3.1.3 基于算法適應(yīng)類的多示例學(xué)習(xí)算法25
- 3.1.4 基于問題轉(zhuǎn)換類的多示例學(xué)習(xí)算法25-27
- 3.2 經(jīng)典的基于支持向量機(jī)的多示例學(xué)習(xí)算法27-28
- 3.3 多示例學(xué)習(xí)與傳統(tǒng)學(xué)習(xí)框架的區(qū)別28-30
- 3.4 多示例學(xué)習(xí)的應(yīng)用30-31
- 3.5 本章小結(jié)31-33
- 第四章 基于示例加權(quán)支持向量機(jī)的多示例學(xué)習(xí)算法33-42
- 4.1 多示例數(shù)據(jù)的噪聲問題33-34
- 4.2 多示例學(xué)習(xí)問題描述34-37
- 4.4 基于示例加權(quán)支持向量機(jī)的多示例學(xué)習(xí)算法37-41
- 4.5 本章小結(jié)41-42
- 第五章 實(shí)驗(yàn)結(jié)果與分析42-50
- 5.1 實(shí)驗(yàn)數(shù)據(jù)集合42-44
- 5.1.1 MUSK數(shù)據(jù)集42-43
- 5.1.2 CBIR數(shù)據(jù)集43-44
- 5.2 實(shí)驗(yàn)設(shè)計(jì)44-46
- 5.3 實(shí)驗(yàn)結(jié)果分析46-48
- 5.4 本章小結(jié)48-50
- 總結(jié)與展望50-52
- 參考文獻(xiàn)52-57
- 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文57-59
- 致謝59
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 吳娟;范玉妹;王麗;;關(guān)于改進(jìn)的支持向量機(jī)的研究[J];攀枝花學(xué)院學(xué)報;2006年05期
2 劉碩明;劉佳;楊海濱;;一種新的多類支持向量機(jī)算法[J];計(jì)算機(jī)應(yīng)用;2008年S2期
3 尹傳環(huán);牟少敏;田盛豐;黃厚寬;;單類支持向量機(jī)的研究進(jìn)展[J];計(jì)算機(jī)工程與應(yīng)用;2012年12期
4 王云英;閻滿富;;C-支持向量機(jī)及其改進(jìn)[J];唐山師范學(xué)院學(xué)報;2012年05期
5 李逢煥;;試述不確定支持向量機(jī)應(yīng)用分析及改進(jìn)思路[J];中國證券期貨;2012年12期
6 邵惠鶴;支持向量機(jī)理論及其應(yīng)用[J];自動化博覽;2003年S1期
7 曾嶸,蔣新華,劉建成;基于支持向量機(jī)的異常值檢測的兩種方法[J];信息技術(shù);2004年05期
8 張凡,賀蘇寧;模糊判決支持向量機(jī)在自動語種辨識中的研究[J];計(jì)算機(jī)工程與應(yīng)用;2004年21期
9 魏玲,張文修;基于支持向量機(jī)集成的分類[J];計(jì)算機(jī)工程;2004年13期
10 沈翠華,鄧乃揚(yáng),肖瑞彥;基于支持向量機(jī)的個人信用評估[J];計(jì)算機(jī)工程與應(yīng)用;2004年23期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 余樂安;姚瀟;;基于中心化支持向量機(jī)的信用風(fēng)險評估模型[A];第六屆(2011)中國管理學(xué)年會——商務(wù)智能分會場論文集[C];2011年
2 劉希玉;徐志敏;段會川;;基于支持向量機(jī)的創(chuàng)新分類器[A];山東省計(jì)算機(jī)學(xué)會2005年信息技術(shù)與信息化研討會論文集(一)[C];2005年
3 史曉濤;劉建麗;駱玉榮;;一種抗噪音的支持向量機(jī)學(xué)習(xí)方法[A];全國第19屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集(下冊)[C];2008年
4 何琴淑;劉信恩;肖世富;;基于支持向量機(jī)的系統(tǒng)辨識方法研究及應(yīng)用[A];中國力學(xué)大會——2013論文摘要集[C];2013年
5 劉駿;;基于支持向量機(jī)方法的衢州降雪模型[A];第五屆長三角氣象科技論壇論文集[C];2008年
6 王婷;胡秀珍;;基于組合向量的支持向量機(jī)方法預(yù)測膜蛋白類型[A];第十一次中國生物物理學(xué)術(shù)大會暨第九屆全國會員代表大會摘要集[C];2009年
7 趙晶;高雋;張旭東;謝昭;;支持向量機(jī)綜述[A];全國第十五屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用學(xué)術(shù)會議論文集[C];2003年
8 周星宇;王思元;;智能數(shù)學(xué)與支持向量機(jī)[A];2005年中國智能自動化會議論文集[C];2005年
9 顏根廷;馬廣富;朱良寬;宋斌;;一種魯棒支持向量機(jī)算法[A];2006中國控制與決策學(xué)術(shù)年會論文集[C];2006年
10 侯澍e,
本文編號:276633
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/276633.html