三種代價環(huán)境下的代價敏感屬性擇
本文關鍵詞:三種代價環(huán)境下的代價敏感屬性擇
更多相關文章: 代價敏感學習 預算約束 屬性選擇 動態(tài)誤分類代價
【摘要】:代價敏感學習是數(shù)據(jù)挖掘的研究熱點,預算約束滿足問題是人工智能和機器學習領域著名的問題之一。最近幾年,研究最小測試代價下的屬性選擇問題一直是代價敏感學習中的重點。但在實際應用中,由于任何一樣資源都是有限的,所以解決任何一個實際問題,都是在一定的預算約束下完成的。因此研究預算約束下的代價敏感屬性選擇問題在眾多的應用領域有著重要的意義和廣泛的應用。另外,當前代價敏感算法普遍采用靜態(tài)的靜態(tài)誤分類代價,僅能滿足實驗和前瞻性的需要,不能適應同一類分布樣本數(shù)量變化的數(shù)據(jù)集的分類模型的學習。針對靜態(tài)誤分類代價的不足,如何設計動態(tài)的誤分類代價機制正受到越來越多學者的青睞。本文針對最小測試代價下的屬性選擇問題,預算約束下的屬性選擇問題和動態(tài)誤分類代價下的屬性選擇問題進行了研究,主要取得了如下創(chuàng)新成果。首先,研究了最小代價下的代價敏感屬性選擇問題。這個最小代價只單純考慮了測試代價這一種代價類型。本文提出了一個對數(shù)加權算法來求解最小測試代價下的代價敏感屬性選擇問題。實驗結果表明,在大多數(shù)情況下,新算法的效果優(yōu)于已有的算法。其次,研究了預算約束下的代價敏感屬性選擇問題。預算約束是指所能花費的最大測試代價大于最小測試代價但不大于總測試代價。這意味著,在預算約束的條件下,只能求解能夠最大程度保留系統(tǒng)信息的屬性子集。本文在預算約束的條件下,設計了一個模擬退火算法來求解代價敏感屬性選擇問題。實驗結果表明,我們設計的算法能夠在效果和效率方面獲得良好的實驗結果,實驗結果優(yōu)于已有的啟發(fā)式算法和遺傳算法。最后,研究了動態(tài)誤分類代價機制下的代價敏感屬性選擇問題,并設計了四個最優(yōu)誤分類代價函數(shù),四個函數(shù)可以根據(jù)少數(shù)類與多數(shù)類以及與測試代價之間的關系,形成客觀的具有代表性的誤分類代價空間,并對不同數(shù)據(jù)子集可以靈活地選擇更合適的誤分類代價,這樣能更好的逼近數(shù)據(jù)集真實的誤分類代價。
【關鍵詞】:代價敏感學習 預算約束 屬性選擇 動態(tài)誤分類代價
【學位授予單位】:閩南師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP18;TP311.13
【目錄】:
- 摘要5-6
- Abstract6-11
- 第1章 緒論11-17
- 1.1 課題研究的背景及意義11-12
- 1.2 國際國內(nèi)研究現(xiàn)狀分析12-15
- 1.2.1 代價敏感學習研究現(xiàn)狀12-13
- 1.2.2 粗糙集研究現(xiàn)狀13
- 1.2.3 代價敏感粗糙集的研究現(xiàn)狀13-14
- 1.2.4 預算約束滿足問題研究現(xiàn)狀14-15
- 1.3 本文研究內(nèi)容15-16
- 1.4 本文結構安排16-17
- 第2章 背景知識17-27
- 2.1 粗糙集的基本理論17-21
- 2.2 代價敏感學習21-27
- 第3章 最小測試代價下的代價敏感屬性選擇27-37
- 3.1 最小測試代價屬性選擇問題27-29
- 3.1.1 測試代價決策系統(tǒng)27-28
- 3.1.2 最小測試代價的屬性選擇28-29
- 3.2 最小測試代價屬性選擇的對數(shù)加權算法29-32
- 3.2.1 構造測試代價屬性選擇的啟發(fā)式函數(shù)29-31
- 3.2.2 最小測試代價屬性選擇的對數(shù)加權算法31-32
- 3.3 實驗與結果分析32-36
- 3.3.1 數(shù)據(jù)集的信息32
- 3.3.2 算法評價指標32-33
- 3.3.3 分析算法的效果與效率33-36
- 3.4 本章小結36-37
- 第4章 預算約束下的代價敏感屬性選擇37-59
- 4.1 預算約束下的代價敏感屬性選擇問題37-42
- 4.1.1 屬性選擇問題下的搜索方法37-38
- 4.1.2 預算約束滿足問題38-40
- 4.1.3 預算約束下的屬性選擇問題40-42
- 4.2 預算約束下的代價敏感屬性選擇模擬退火算法42-48
- 4.2.1 預算約束下的模擬退火算法42-46
- 4.2.2 算法的復雜性和收斂性分析46
- 4.2.3 運行實例46-48
- 4.3 實驗與結果分析48-56
- 4.3.1 數(shù)據(jù)集的信息49
- 4.3.2 算法的評價指標49-51
- 4.3.3 模擬退火算法的效果和效率51-56
- 4.4 本章小結56-59
- 第5章 動態(tài)誤分類代價下的代價敏感屬性選擇59-81
- 5.1 靜態(tài)誤分類代價59-61
- 5.1.1 值靜態(tài)的誤分類代價機制60
- 5.1.2 比例靜態(tài)的誤分類代價機制60-61
- 5.2 對靜態(tài)誤分類代價的改進策略61-64
- 5.2.1 誤分類代價的動態(tài)性61
- 5.2.2 誤分類代價函數(shù)的構造61-64
- 5.3 基于動態(tài)誤分類代價下的代價敏感屬性選擇問題64-66
- 5.4 動態(tài)誤分類代價下的模擬退火算法66-70
- 5.4.1 非啟發(fā)式搜索算法66
- 5.4.2 啟發(fā)式的模擬退火搜索算法66-70
- 5.5 實驗分析70-79
- 5.5.1 數(shù)據(jù)集的信息70-71
- 5.5.2 實驗的設置71-74
- 5.5.3 動態(tài)誤分類代價的效果74-77
- 5.5.4 比較動態(tài)誤分類代價和靜態(tài)誤分類代價77-79
- 5.6 本章小結79-81
- 第6章 總結與展望81-85
- 6.1 總結81-82
- 6.2 未來工作展望82-85
- 參考文獻85-93
- 致謝93-95
- 攻讀學位期間取得的科研成果95
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王淑俠;誤分類原因分析[J];圖書館學刊;1994年02期
2 亢華愛,彭新光;一種降低誤分類代價的權值分布優(yōu)化算法[J];太原理工大學學報;2005年04期
3 龍軍;殷建平;祝恩;趙文濤;;主動學習中一種基于委員會的誤分類采樣算法[J];計算機工程與科學;2008年04期
4 鄒超;鄭恩輝;任玉玲;張英;范玉剛;;嵌入誤分類代價和拒識代價的二元分類算法[J];廣西師范大學學報(自然科學版);2010年03期
5 安春霖;陸慧娟;鄭恩輝;王明怡;陸羿;;嵌入誤分類代價和拒識代價的極限學習機基因表達數(shù)據(jù)分類[J];山東大學學報(工學版);2013年04期
6 周生明;廖元秀;;Cost-Sensitive學習的一個新課題[J];廣西師范大學學報(自然科學版);2007年04期
7 衛(wèi)東;鄭恩輝;楊敏;吳向陽;張英;陳樂;;基于支持向量機的誤分類代價敏感模糊推理系統(tǒng)[J];控制與決策;2010年02期
8 徐晶;劉旭敏;關永;董睿;;基于條件誤分類的決策樹剪枝算法[J];計算機工程;2010年23期
9 盧致杰;;基于粒度變換的多范疇復雜信息分類方法[J];計算機與現(xiàn)代化;2014年03期
10 林姿瓊;趙紅;;代價敏感最優(yōu)誤差邊界選擇[J];計算機科學與探索;2013年12期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 李春雨;盛昭瀚;;對學習樣本無誤分類的改進BP算法[A];1996年中國控制會議論文集[C];1996年
中國博士學位論文全文數(shù)據(jù)庫 前4條
1 唐明珠;類別不平衡和誤分類代價不等的數(shù)據(jù)集分類方法及應用[D];中南大學;2012年
2 陳曉林;基于動態(tài)代價敏感的機器學習研究[D];華中科技大學;2010年
3 鄭恩輝;基于支持向量機的代價敏感數(shù)據(jù)挖掘研究與應用[D];浙江大學;2006年
4 付連艷;處理效應評估的統(tǒng)計方法[D];東北師范大學;2011年
中國碩士學位論文全文數(shù)據(jù)庫 前4條
1 劉星星;基于任務的機組失誤預測模型研究[D];中國民航大學;2013年
2 牛軍霞;三種代價環(huán)境下的代價敏感屬性擇[D];閩南師范大學;2016年
3 孟斌;基于結構化模型的飛行人誤分類分析系統(tǒng)開發(fā)[D];中國民用航空飛行學院;2015年
4 李海燕;中國民航簽派人誤分類分析系統(tǒng)的研究[D];中國民用航空飛行學院;2009年
,本文編號:763834
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/763834.html