基于代價(jià)敏感SVM的直接優(yōu)化F-measure算法研究
本文關(guān)鍵詞:基于代價(jià)敏感SVM的直接優(yōu)化F-measure算法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著社會(huì)的發(fā)展、科學(xué)的進(jìn)步,數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等領(lǐng)域的研究正逐漸改變我們的生活。數(shù)據(jù)分類作為機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域的重要組成部分,成為眾多學(xué)者的研究重點(diǎn),人們提出了不同的分類算法來構(gòu)建不同的分類器。以二分類為例,當(dāng)樣本數(shù)據(jù)分布不平衡時(shí),為了更準(zhǔn)確的度量分類器的性能,一般選用查準(zhǔn)率和查全率的調(diào)和平均——F-measure作為評(píng)估標(biāo)準(zhǔn)。由于F-measure在不平衡分類的廣泛應(yīng)用,如何設(shè)計(jì)出有效的面向F-measure的分類器是近年來的研究熱點(diǎn)。但是由于F-measure的非凸性,直接優(yōu)化起來較為困難,現(xiàn)有的優(yōu)化算法主要通過代價(jià)敏感算法或者直接優(yōu)化算法構(gòu)造面向F-measure的學(xué)習(xí)器。不同于已有的研究,本文以SVM為工具,提出一種結(jié)合代價(jià)敏感和直接優(yōu)化F-measure的新型算法。本文的主要工作如下:(1)文中從二分類入手,介紹了基于支持向量機(jī)的二分類學(xué)習(xí)及不平衡二分類的度量標(biāo)準(zhǔn)F-measure,并在此基礎(chǔ)上,分析了現(xiàn)有代價(jià)敏感算法和直接優(yōu)化F-measure算法的研究現(xiàn)狀,提出了一種將二者相融合的新方法。(2)新方法首先給出了從最大化F-measure到代價(jià)敏感SVM的一個(gè)直接轉(zhuǎn)換。針對(duì)新的目標(biāo)函數(shù)具備非光滑從而導(dǎo)致傳統(tǒng)梯度優(yōu)化算法難以直接使用的特點(diǎn),提出使用基于次梯度的束方法進(jìn)行求解。不僅可以解決上述問題,且算法的迭代次數(shù)僅為O(1),不依賴于樣本數(shù)。不平衡數(shù)據(jù)集上的實(shí)驗(yàn)表明:相比起已有面向F-measure的分類器,本文所提算法得到的模型明顯更加精確。(3)針對(duì)束方法在求解主問題最小值時(shí)是通過轉(zhuǎn)換成對(duì)偶問題來解決的,而算法內(nèi)部的每次迭代只能保證對(duì)偶問題的單調(diào)遞增,并不能保證主問題的單調(diào)遞減,可能降低算法的收斂速度。提出一個(gè)高效的線性搜索算法,確保了主問題的單調(diào)遞減,消除了主問題的波動(dòng),進(jìn)一步提高了算法的效率。大規(guī)模數(shù)據(jù)集上的實(shí)驗(yàn)表明,該算法不僅能獲得高精度的二分類模型,且相比起已有其他直接優(yōu)化F-measure算法也更為高效。
【關(guān)鍵詞】:F-measure 支持向量機(jī) 不平衡二分類 代價(jià)敏感 束方法 線性搜索
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP181;TP311.13
【目錄】:
- 摘要3-4
- Abstract4-10
- 第一章 緒論10-14
- 1.1 研究背景及意義10-11
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-12
- 1.3 本文的工作與安排12-14
- 第二章 相關(guān)理論14-28
- 2.1 二分類學(xué)習(xí)的概述14-17
- 2.2 支持向量機(jī)的概述17-21
- 2.2.1 支持向量機(jī)的基本原理17-18
- 2.2.2 線性支持向量機(jī)18-21
- 2.2.3 支持向量機(jī)的實(shí)現(xiàn)21
- 2.3 二分類學(xué)習(xí)的度量標(biāo)準(zhǔn)——F-measure21-24
- 2.4 代價(jià)敏感學(xué)習(xí)算法概述24-26
- 2.5 直接優(yōu)化F-measure算法概述26-27
- 2.6 本章小結(jié)27-28
- 第三章 一種融合代價(jià)敏感與直接優(yōu)化F-measure的新型算法28-41
- 3.1 從直接優(yōu)化F-measure到代價(jià)敏感SVM28-30
- 3.2 基于束方法算法的優(yōu)化30-35
- 3.2.1 束方法的基本思想30-33
- 3.2.2 基于束方法的求解過程33-35
- 3.3 實(shí)驗(yàn)結(jié)果與分析35-40
- 3.3.1 折中因子對(duì)實(shí)驗(yàn)結(jié)果影響36-37
- 3.3.2 代價(jià)參數(shù)對(duì)實(shí)驗(yàn)結(jié)果影響37-38
- 3.3.3 不同算法性能對(duì)比實(shí)驗(yàn)38-40
- 3.4 本章小結(jié)40-41
- 第四章 面向大規(guī)模應(yīng)用的高效直接優(yōu)化F-measure算法41-53
- 4.1 BM-CS算法的主問題波動(dòng)41-42
- 4.2 高效直接優(yōu)化F-measure算法的實(shí)現(xiàn)42-47
- 4.2.1 算法的基本思想42-46
- 4.2.2 高效線性搜索算法的實(shí)現(xiàn)46-47
- 4.3 算法的復(fù)雜度分析47-48
- 4.4 實(shí)驗(yàn)結(jié)果與分析48-52
- 4.4.1 實(shí)驗(yàn)數(shù)據(jù)集及比較算法48-49
- 4.4.2 對(duì)比實(shí)驗(yàn)與分析49-52
- 4.5 本章小結(jié)52-53
- 第五章 總結(jié)與展望53-55
- 5.1 論文總結(jié)53
- 5.2 工作展望53-55
- 參考文獻(xiàn)55-60
- 致謝60-62
- 攻讀碩士學(xué)位期間發(fā)表的論文62-63
- 攻讀碩士學(xué)位期間參加的科研項(xiàng)目63
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 鄒汪平;;一種基于網(wǎng)絡(luò)安全控制的蜂群算法應(yīng)用研究[J];吉林師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年04期
2 李向偉;曹博;;時(shí)間參數(shù)在HITS算法中的應(yīng)用及改進(jìn)[J];蘭州工業(yè)高等?茖W(xué)校學(xué)報(bào);2006年02期
3 吳濤;彭篤學(xué);;一種改進(jìn)的直線段裁剪算法[J];湛江師范學(xué)院學(xué)報(bào);2008年03期
4 張瑞子;南琳;胡琨元;田景賀;;基于EPC Class-1 Gen-2標(biāo)準(zhǔn)的防沖突算法與改進(jìn)[J];計(jì)算機(jī)工程;2009年02期
5 黃超;周寧;倪佑生;;基于蟻群算法的攻擊圖分析[J];計(jì)算機(jī)工程;2009年18期
6 秦永彬;許道云;;警示傳播算法的原理分析及算法改進(jìn)[J];計(jì)算機(jī)工程與應(yīng)用;2010年19期
7 郭毅可;韓銳;;云計(jì)算中的彈性算法:概要和展望[J];上海大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年01期
8 牛玉靜;唐棣;;雙步圓的反走樣生成算法[J];計(jì)算機(jī)工程與應(yīng)用;2010年23期
9 肖璞;;XML索引更新算法的改進(jìn)[J];南京工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年03期
10 周駿;陳鳴;張佳明;;兩類頻繁項(xiàng)算法在網(wǎng)絡(luò)流上的適用性評(píng)估[J];計(jì)算機(jī)工程;2011年16期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 黃紀(jì)武;毛澤華;李松濤;張錦雄;;SPMD并行查找算法的MPI實(shí)現(xiàn)[A];廣西計(jì)算機(jī)學(xué)會(huì)——2004年學(xué)術(shù)年會(huì)論文集[C];2004年
2 黃紀(jì)武;毛澤華;李松濤;張錦雄;;SPMD并行查找算法的MPI實(shí)現(xiàn)[A];廣西計(jì)算機(jī)學(xué)會(huì)2004年學(xué)術(shù)年會(huì)論文集[C];2004年
3 符麗錦;覃華;鄧海;孫欣;;一種改進(jìn)的Apriori算法的研究[A];廣西計(jì)算機(jī)學(xué)會(huì)2012年學(xué)術(shù)年會(huì)論文集[C];2012年
4 王東鋒;王軍民;陳英武;;模糊定性仿真理論研究與算法實(shí)現(xiàn)[A];'2000系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2000年
5 趙唯;;晶粒度評(píng)級(jí)的改進(jìn)算法[A];中國(guó)圖象圖形科學(xué)技術(shù)新進(jìn)展——第九屆全國(guó)圖象圖形科技大會(huì)論文集[C];1998年
6 劉啟文;;可擴(kuò)展的圖形學(xué)算法演示系統(tǒng)的研究[A];’2004計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)議論文集[C];2004年
7 佘智;蔣泰;朱延生;;基于Type C協(xié)議的防沖突改進(jìn)算法[A];廣西計(jì)算機(jī)學(xué)會(huì)25周年紀(jì)念會(huì)暨2011年學(xué)術(shù)年會(huì)論文集[C];2011年
8 朱紹文;趙培;朱秋云;;基于pSPADE并行挖掘序列算法的研究[A];2003年中國(guó)智能自動(dòng)化會(huì)議論文集(下冊(cè))[C];2003年
9 楊霞;;新的基于啟發(fā)式蟻群算法的QoS路由算法[A];廣西計(jì)算機(jī)學(xué)會(huì)2009年年會(huì)論文集[C];2009年
10 陳黎飛;姜青山;董槐林;;基于圖形輪廓的快速聚類算法[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 鐘永騰;基于近場(chǎng)MUSIC算法的復(fù)合材料結(jié)構(gòu)健康監(jiān)測(cè)研究[D];南京航空航天大學(xué);2014年
2 劉燕;入侵雜草優(yōu)化算法在陣列天線綜合中的應(yīng)用[D];西安電子科技大學(xué);2015年
3 苗義烽;突發(fā)事件下的列車運(yùn)行調(diào)度模型與算法研究[D];中國(guó)鐵道科學(xué)研究院;2015年
4 楊玉婷;頭腦風(fēng)暴優(yōu)化算法與基于視頻的非接觸式運(yùn)動(dòng)定量分析方法研究[D];浙江大學(xué);2015年
5 單美靜;求解非線性實(shí)代數(shù)系統(tǒng)的混合算法研究[D];華東師范大學(xué);2008年
6 邱劍鋒;人工蜂群算法的改進(jìn)方法與收斂性理論的研究[D];安徽大學(xué);2014年
7 潘磊;若干社區(qū)發(fā)現(xiàn)算法研究[D];南京大學(xué);2014年
8 陳俊波;頻繁閉合項(xiàng)集挖掘算法及應(yīng)用研究[D];浙江大學(xué);2009年
9 陸楠;關(guān)聯(lián)規(guī)則的挖掘及其算法的研究[D];吉林大學(xué);2007年
10 范洪博;快速精確字符串匹配算法研究[D];哈爾濱工程大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 安世勇;命題邏輯中隨機(jī)3-SAT問題算法研究[D];西南交通大學(xué);2015年
2 畢曉慶;油氣探礦權(quán)競(jìng)爭(zhēng)性出讓系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)地質(zhì)大學(xué)(北京);2015年
3 王明明;鐵路大機(jī)與線路固定設(shè)施間距檢測(cè)算法研究[D];西南交通大學(xué);2015年
4 李靜;基于視頻圖像序列的運(yùn)動(dòng)目標(biāo)檢測(cè)與跟蹤算法研究[D];寧夏大學(xué);2015年
5 劉貝玲;基于天地圖的租房平臺(tái)開發(fā)及其關(guān)鍵技術(shù)研究[D];西南交通大學(xué);2015年
6 曹海鋒;IDS中串匹配臭算法并行優(yōu)化研究[D];西安建筑科技大學(xué);2015年
7 周攀;基于蟻群算法的山區(qū)高速鐵路隧道火災(zāi)應(yīng)急疏散最優(yōu)路徑研究[D];西南交通大學(xué);2015年
8 張路奇;基于改進(jìn)蟻群算法的WSN路由協(xié)議的研究[D];中國(guó)地質(zhì)大學(xué)(北京);2015年
9 王曉晨;入侵雜草優(yōu)化算法的應(yīng)用與改進(jìn)[D];長(zhǎng)安大學(xué);2015年
10 信琴琴;手勢(shì)控制和識(shí)別算法研究[D];閩南師范大學(xué);2015年
本文關(guān)鍵詞:基于代價(jià)敏感SVM的直接優(yōu)化F-measure算法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):254716
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/254716.html