天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

代價敏感粒計算若干方法的研究

發(fā)布時間:2020-08-26 20:59
【摘要】:代價敏感學習是數(shù)據(jù)挖掘和機器學習領(lǐng)域的一大挑戰(zhàn)性問題,由于其在數(shù)據(jù)處理過程中考慮了現(xiàn)實的代價信息,因此具有較強的實際意義。粒計算是信息處理和知識發(fā)現(xiàn)的一種新的研究方法,它能把一個復(fù)雜的問題轉(zhuǎn)化為若干比較簡單的問題,從而有助于復(fù)雜問題的分析和解決。將代價敏感學習與粒計算相結(jié)合,是解決實用性問題的一個有效途徑。本文主要基于鄰域和粗糙集理論,對代價敏感粒計算的若干關(guān)鍵問題進行研究,主要的創(chuàng)新性研究成果概述如下:1.提出了一系列基于觀測誤差和可變代價的屬性與屬性值粒度同步選擇的方法(為了方便,本文中有時簡記“屬性與屬性值粒度”為“屬性粒度”),F(xiàn)有的代價敏感屬性選擇(在粗糙集中也稱屬性選擇為屬性約簡)研究中只有極少數(shù)同時考慮了屬性值粒度的選擇,并且它們都只考慮了單重的粒度,也沒有涉及到混合型數(shù)據(jù)和代價受限的情況。此外,已有的代價敏感學習中經(jīng)常假設(shè)屬性的測試代價和對象的誤分類代價都是固定不變的,但現(xiàn)實中測試代價往往是可變的,它們和屬性值的粒度之間存在著密切的關(guān)系,而誤分類代價的可變性則跟所考慮的對象有關(guān)。本文根據(jù)現(xiàn)實情況,用屬性值的觀測誤差的置信水平來衡量其粒度,充分考慮了該誤差置信水平與測試代價和誤分類代價這三者之間的關(guān)系,并討論了數(shù)據(jù)處理中平均總代價(即論域中對象的總代價的平均值)的計算方法。在此基礎(chǔ)上,以最小化平均總代價為目標,基于觀測誤差和可變代價分別研究了單粒度和多粒度的屬性與屬性值粒度同步選擇的方法,具體如下:(1)針對混合型數(shù)據(jù)建立了一個基于誤差置信水平的自適應(yīng)鄰域模型,并根據(jù)實際情況討論了幾種可變的測試代價和誤分類代價函數(shù);在此基礎(chǔ)上分別針對測試代價受限和不受限兩種情形提出了較為高效的單粒度的屬性與屬性值粒度同步選擇的算法;在多個UCI數(shù)據(jù)集上的實驗結(jié)果驗證了算法的有效性。特別地,文中同時探討了不同的代價背景對所選擇的最優(yōu)屬性子集和最優(yōu)屬性值粒度的影響,從而為決策制定提供了可行的方案。(第3章)(2)考慮到實際應(yīng)用中對不同的屬性可能有不同的屬性值粒度要求,首次探討了多粒度的代價敏感的屬性與屬性值粒度同步選擇的方法。首先建立了基于誤差置信水平向量的鄰域粗糙集模型,并給出了屬性粒度對(即屬性與屬性值粒度的有序?qū)?的重要度函數(shù),從而提出了高效的多粒度的屬性與屬性值粒度同步選擇的算法。實驗結(jié)果驗證了所提出的多粒度方法相比已有的單粒度方法在解決實際問題方面具有明顯的優(yōu)越性。(第4章)2.提出了鄰域粗糙集中基于不一致鄰域的屬性約簡方法。首先介紹了不一致鄰域的概念,并探討它跟鄰域粗糙集中已有的基本概念的關(guān)系,從而得到上下近似集、正區(qū)域、邊界區(qū)域等的新表示方式,再利用不一致鄰域的性質(zhì)分別設(shè)計了高效的代價不敏感和測試代價敏感的屬性約簡算法。通過理論和實驗分析發(fā)現(xiàn),相比運用傳統(tǒng)的鄰域,用不一致鄰域來進行鄰域粗糙集中的相關(guān)計算具有一定的優(yōu)越性。(第5章)3.提出了決策粗糙集中代價敏感的屬性約簡方法。由于決策粗糙集中正區(qū)域有可能隨著屬性的增加反而縮小,這給該粗糙集中的屬性約簡帶來了一定的困難。本文根據(jù)決策粗糙集的這一特點,在綜合考慮決策代價和測試代價的基礎(chǔ)上,建立了該粗糙集中代價敏感的屬性約簡方法的理論模型,特別是給出了代價敏感的屬性子集重要度函數(shù),并以最小化平均總代價為目標分別提出了回溯的和啟發(fā)式的屬性約簡算法。實驗結(jié)果驗證了所提出算法的有效性。(第6章)綜上所述,本文研究了代價敏感粒計算的若干關(guān)鍵問題。對于每個問題,分別建立了相應(yīng)的理論模型,并提出了有效的算法,再做實驗加以驗證。該研究豐富了代價敏感粒計算的理論與方法體系,也為今后的研究工作奠定了重要基礎(chǔ)。
【學位授予單位】:電子科技大學
【學位級別】:博士
【學位授予年份】:2018
【分類號】:TP181;TP311.13
【圖文】:

平均運行時間,數(shù)據(jù)集,因子


屬性約簡算法(a) (b)圖5-7 Ionosphere數(shù)據(jù)集上平均運行時間的比較接著,最優(yōu)發(fā)現(xiàn)因子(FOF)和平均超標因子(AEF)的值如圖5-12至圖5-14所示.這兩個指標值是通過比較本節(jié)所提出的算法和文獻[139]中的回溯算法的結(jié)果來計算得到的,原因在于后者得到的一定是最優(yōu)約簡.從這3個圖中可知,雖然在某些時候最優(yōu)發(fā)現(xiàn)因子不夠高,但是大部分的平均超標因子不超過0.2,所以我們的算法的91

平均運行時間,數(shù)據(jù)集,分類性能


電子科技大學博士學位論文(a) (b)圖5-8 Sonar數(shù)據(jù)集上平均運行時間的比較(a) (b)圖5-9 Wdbc數(shù)據(jù)集上平均運行時間的比較結(jié)果是可以接受的,該算法能在最小化總測試代價方面取得良好的效果.然后,基于10折交叉驗證比較原始數(shù)據(jù)和由所提出的算法得到的約簡數(shù)據(jù)的分類性能,其中分別采用了CART分類器和RBF核的SVM分類器,結(jié)果如圖5-15至圖5-20所示.由結(jié)果可知,該算法得到的約簡數(shù)據(jù)大多數(shù)情況下能保持原始數(shù)據(jù)的分類性能,有時甚至能取得比原來高得多的分類精度.最后,我們探討鄰域半徑 的取值大小對實驗結(jié)果的影響. 一方面

平均運行時間,數(shù)據(jù)集,分類性能,約簡


數(shù)據(jù)集上平均運行時間的比較(a) (b)圖5-9 Wdbc數(shù)據(jù)集上平均運行時間的比較結(jié)果是可以接受的,該算法能在最小化總測試代價方面取得良好的效果.然后,基于10折交叉驗證比較原始數(shù)據(jù)和由所提出的算法得到的約簡數(shù)據(jù)的分類性能,其中分別采用了CART分類器和RBF核的SVM分類器,結(jié)果如圖5-15至圖5-20所示.由結(jié)果可知,該算法得到的約簡數(shù)據(jù)大多數(shù)情況下能保持原始數(shù)據(jù)的分類性能,有時甚至能取得比原來高得多的分類精度.最后,我們探討鄰域半徑 的取值大小對實驗結(jié)果的影響. 一方面

【相似文獻】

相關(guān)期刊論文 前10條

1 馬建春;張昊亮;馬灶亮;陳吉生;;基于粗糙集理論的中藥復(fù)方專利防治糖尿病藥證規(guī)律研究[J];今日藥學;年期

2 黃愛萍;黃鳳英;;基于覆蓋粗糙集的超圖連通性[J];數(shù)碼設(shè)計;2016年02期

3 劉艷芳;陳雪云;;關(guān)系粗糙集的鄰域擬陣結(jié)構(gòu)研究[J];數(shù)碼設(shè)計;2016年02期

4 汪小燕;申元霞;;基于粒度矩陣的程度多粒度粗糙集粒度約簡[J];系統(tǒng)工程與電子技術(shù);2016年12期

5 薛占熬;司小朦;王楠;朱泰隆;;基于最小/最大描述的多粒度覆蓋粗糙直覺模糊集模型[J];計算機科學;2017年01期

6 段云艷;呂躍進;謝鳳平;;優(yōu)勢關(guān)系下多粒度粗糙集排序方法及其應(yīng)用[J];計算機工程與應(yīng)用;2017年01期

7 胡成祥;趙國柱;;優(yōu)勢關(guān)系多粒度粗糙集中近似集動態(tài)更新方法[J];中國科學技術(shù)大學學報;2017年01期

8 汪小燕;沈家蘭;申元霞;;基于加權(quán)粒度和優(yōu)勢關(guān)系的程度多粒度粗糙集[J];山東大學學報(理學版);2017年03期

9 鐘誠;李金海;;組合多粒度粗糙集及其在教學評價中的應(yīng)用[J];數(shù)碼設(shè)計;2017年01期

10 吳漢卿;吳緩緩;楊瑩瑩;紀霞;;基于粗糙集的大學生學習與就業(yè)關(guān)系分析[J];計算機技術(shù)與發(fā)展;2017年05期

相關(guān)會議論文 前10條

1 尹宗成;;粗糙集理論在我國糧食產(chǎn)量預(yù)測中的應(yīng)用[A];現(xiàn)代農(nóng)業(yè)理論與實踐——安徽現(xiàn)代農(nóng)業(yè)博士科技論壇論文集[C];2007年

2 劉碧森;鐘守銘;陳華富;;基于支持向量機與粗糙集理論的信息處理[A];第二屆全國信息獲取與處理學術(shù)會議論文集[C];2004年

3 李雄;李勝利;徐宗昌;;基于粗糙集理論的狀態(tài)監(jiān)測與故障診斷(英文)[A];第三屆全國信息獲取與處理學術(shù)會議論文集[C];2005年

4 卓明;王麗珍;譚旭;;基于粗糙集近似集擴展的規(guī)則提取算法[A];第十七屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2000年

5 葛麗;傅彥;;粗糙集在科學數(shù)據(jù)屬性約簡中的應(yīng)用[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2004年

6 孫亮;楊飛;于建均;陳梅蓮;;一種基于指數(shù)粗糙集合的變精度控制器應(yīng)用研究[A];第25屆中國控制會議論文集(下冊)[C];2006年

7 陳釘均;劉熠;李涵;吳開騰;;變精度覆蓋粗糙集的新型算子研究[A];中國運籌學會模糊信息與模糊工程分會第五屆學術(shù)年會論文集[C];2010年

8 劉慶珍;蔡金錠;;基于粗糙集理論的電力電子電路故障診斷[A];第十六屆電工理論學術(shù)年會論文集[C];2004年

9 黃偉;趙寅邦;陳喬生;王俊凱;;基于改進遺傳算法和粗糙集的變壓器故障診斷[A];2015年全國智能電網(wǎng)用戶端能源管理學術(shù)年會論文集[C];2015年

10 王旭陽;王彤;李明;;基于粗糙集理論的分類規(guī)則挖掘方法[A];第二十二屆中國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2005年

相關(guān)重要報紙文章 前2條

1 本報記者 李智 通訊員 梁憲生;零的突破[N];山西經(jīng)濟日報;2001年

2 重慶郵電學院黨委書記徐仲偉 院長 聶能;發(fā)揮學科優(yōu)勢 打造信息平臺[N];科技日報;2005年

相關(guān)博士學位論文 前10條

1 廖淑嬌;代價敏感粒計算若干方法的研究[D];電子科技大學;2018年

2 黎文善(LE VAN THIEN);基于覆蓋的概率粗糙集和L-模糊變精度粗糙集研究[D];武漢大學;2015年

3 王麗娜;基于陰影集和粗糙集的模糊聚類算法研究與應(yīng)用[D];南京航空航天大學;2016年

4 譚天樂;基于粗糙集的過程建模、控制與故障診斷[D];浙江大學;2003年

5 喬斌;粗糙集理論分層遞階約簡算法的研究[D];浙江大學;2003年

6 何亞群;基于粗糙集的智能決策理論與應(yīng)用研究[D];南京航空航天大學;2005年

7 馬玉良;知識獲取中的Rough Sets理論及其應(yīng)用研究[D];浙江大學;2005年

8 張勇;粗糙集—神經(jīng)網(wǎng)絡(luò)智能系統(tǒng)在浮選過程中的應(yīng)用研究[D];大連理工大學;2006年

9 王加陽;面向海量數(shù)據(jù)的粗糙集理論與方法研究[D];中南大學;2005年

10 喬梅;基于粗糙集和數(shù)據(jù)庫技術(shù)的知識發(fā)現(xiàn)與推理方法研究[D];天津大學;2005年

相關(guān)碩士學位論文 前10條

1 韓志偉;基于聚類與粗糙集的配電網(wǎng)故障診斷研究[D];電子科技大學;2018年

2 李倩倩;粗糙集的最優(yōu)近似及其在約簡中的應(yīng)用[D];山西師范大學;2017年

3 孟建釗;基于壓縮感知的匯率預(yù)測與粗糙集加權(quán)的聚類研究[D];華南理工大學;2017年

4 張寧;基于鄰域粗糙集的屬性約簡算法研究[D];湖南大學;2017年

5 靳永飛;優(yōu)勢關(guān)系粗糙集的擴展模型及快速約簡方法[D];河北大學;2017年

6 于群;優(yōu)勢關(guān)系下基于論域遞減的屬性約簡方法[D];河北大學;2017年

7 姚紅娟;基于局部粗糙集的三支決策模型[D];長安大學;2017年

8 王潔;基于粒計算的公交客流量分析與預(yù)測研究[D];杭州電子科技大學;2017年

9 程新洪;基于粗糙集與多元回歸的公交客流預(yù)測模型研究[D];杭州電子科技大學;2017年

10 潘曉;基于粗糙集的證據(jù)理論及其在網(wǎng)絡(luò)證據(jù)融合中的應(yīng)用[D];山東師范大學;2017年



本文編號:2805690

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2805690.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fdb03***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com