天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

不完整數(shù)據(jù)集的多視角集成分類研究

發(fā)布時(shí)間:2018-01-03 15:03

  本文關(guān)鍵詞:不完整數(shù)據(jù)集的多視角集成分類研究 出處:《安徽大學(xué)》2016年博士論文 論文類型:學(xué)位論文


  更多相關(guān)文章: 不完整數(shù)據(jù) 商空間 神經(jīng)網(wǎng)絡(luò) 多視角 集成學(xué)習(xí)


【摘要】:隨著通訊技術(shù),物聯(lián)網(wǎng)技術(shù),傳感器技術(shù)等技術(shù)的迅速發(fā)展,當(dāng)今幾乎在任何地方都可以產(chǎn)生數(shù)據(jù)。這些實(shí)際應(yīng)用中獲取的數(shù)據(jù),往往由于各種各樣的原因會出現(xiàn)數(shù)據(jù)缺失的情況。例如,在調(diào)查問卷中,由于接受問卷者個(gè)人原因,一些問卷會出現(xiàn)拒絕回答的項(xiàng)目;在生物信息中的基因表達(dá)數(shù)據(jù)中,由于芯片的擦痕,灰塵等原因,同樣會導(dǎo)致部分?jǐn)?shù)據(jù)的缺失。考慮到傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)往往針對的是完整數(shù)據(jù),因此,如何處理不完整數(shù)據(jù)成為了機(jī)器學(xué)習(xí)中的一個(gè)重要的研究課題。當(dāng)前對不完整數(shù)據(jù)集分類的研究,如對缺失值進(jìn)行填充等,多數(shù)方法都需要依賴一些假設(shè),比如隨機(jī)缺失(MAR)假設(shè),屬性獨(dú)立性假設(shè)等。集成學(xué)習(xí)方法作為不完整數(shù)據(jù)集的一種有效的處理方法,與缺失值填充的方法相比,其最大的優(yōu)點(diǎn)是不依賴MAR假設(shè),但是當(dāng)前集成方法在處理不完整數(shù)據(jù)集時(shí)仍然面臨著諸如時(shí)間復(fù)雜度高,算法效率不夠理想等問題。粒度計(jì)算是近年來人工智能領(lǐng)域中模擬人類思維求解問題的新的方法。它涵蓋了所有有關(guān)粒度的理論、方法和工具,已成為不確定性、模糊性、復(fù)雜性問題求解以及海量信息處理的重要工具。粒度計(jì)算的主要理論模型包括粗糙集理論,模糊集理論以及商空間理論。其中商空間理論是多粒度計(jì)算的主要理論模型。本文針對不完整數(shù)據(jù)集數(shù)據(jù)缺失的特點(diǎn),基于商空間理論中的多側(cè)面、多視角問題求解的思路,提出針對不同缺失屬性組合構(gòu)造多個(gè)不同視角的分類器,以及對各個(gè)分類器重要度的度量方法,并在此基礎(chǔ)上研究了多視角分類器的優(yōu)化方法。同時(shí)本文針對癌癥基因表達(dá)式數(shù)據(jù)的特點(diǎn),提出首先進(jìn)行屬性選擇,然后利用選擇性的多視角集成方式實(shí)現(xiàn)多視角的集成分類。本文的主要研究內(nèi)容概括如下:(1)研究不完整數(shù)據(jù)集多視角分類器的構(gòu)建及重要度度量方法基于不完整數(shù)據(jù)集中存在的不完整屬性的組合,構(gòu)建不完整數(shù)據(jù)集對應(yīng)的缺失屬性樹。基于該缺失屬性樹,得到一組數(shù)據(jù)子集,同時(shí)利用神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ)分類器,采用Bagging策略在每個(gè)數(shù)據(jù)子集上訓(xùn)練得到一個(gè)子分類器,對于一個(gè)測試樣本,算法首先選擇合適的子分類器對其進(jìn)行預(yù)測,然后利用多數(shù)投票的方式?jīng)Q定其最終的類別。本文同時(shí)引入了信息熵來度量子分類器的重要度,并具體研究了幾種不同的加權(quán)方法對算法準(zhǔn)確率的影響。(2)研究不完整數(shù)據(jù)集多視角分類器的優(yōu)化方法在缺失屬性樹的基礎(chǔ)上,針對神經(jīng)網(wǎng)絡(luò)集成分類方法在子分類器過多時(shí),算法復(fù)雜度過高的問題,提出了一種多視角集成分類的優(yōu)化方法(SNNE)。該方法通過判斷缺失屬性樹中對應(yīng)的缺失屬性集(有效屬性集合)之間的包含關(guān)系以及兩者與類別的相關(guān)度,在保證算法可預(yù)測率和準(zhǔn)確率的基礎(chǔ)上,通過一個(gè)給定的閾值刪除一部分冗余的數(shù)據(jù)子集,通過減少子分類器個(gè)數(shù),有效的提高算法的執(zhí)行效率。實(shí)驗(yàn)表明,在給定閾值為0.05的情況下,算法能夠在保證準(zhǔn)確率的基礎(chǔ)上有效的提升執(zhí)行效率。(3)研究了基于卡方檢驗(yàn)和超限學(xué)習(xí)機(jī)的多視角集成分類方法針對不完整數(shù)據(jù)集中存在的與類別的相關(guān)度非常低,對分類的精度有著不利的影響的屬性。本文提出了一種基于卡方檢驗(yàn)的屬性選擇方法(C_ELM),該方法通過將傳統(tǒng)的卡方檢驗(yàn)應(yīng)用到不完整數(shù)據(jù)集中,通過一個(gè)給定的閡值,選擇刪除部分與類別相關(guān)性較小的屬性。同時(shí)考慮到,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)由于采用梯度下降方法而造成時(shí)間復(fù)雜度過高的問題,利用超限學(xué)習(xí)機(jī)作為基礎(chǔ)分類器,在缺失屬性樹的基礎(chǔ)上,構(gòu)造一組基于投票的超限學(xué)習(xí)機(jī)(v-elms)。針對由于缺失值導(dǎo)致的少量的樣本可能無法找到合適的分類器進(jìn)行預(yù)測的問題,我們又利用單屬性訓(xùn)練得到一組備選分類器用來解決此類樣本的分類問題。實(shí)驗(yàn)表明,通過刪除不相關(guān)屬性和采用ELM,該方法能夠有效的提升算法的預(yù)測精度和穩(wěn)定性。(4)研究癌癥基因表達(dá)數(shù)據(jù)的選擇性多視角集成分類方法本文針對癌癥基因表達(dá)式數(shù)據(jù)樣本較少且維數(shù)(基因個(gè)數(shù))較高的特征,提出了利用卡方檢驗(yàn)進(jìn)行特征選擇,并依據(jù)相關(guān)度的大小對剩余的基因進(jìn)行相關(guān)度的排序,按照best first search (BFS)的策略,提出了一種基于BFS的選擇性多視角集成分類算法。實(shí)驗(yàn)表明,該方法能夠有效的刪除大量的不相關(guān)屬性,同時(shí)通過選擇最重要的屬性能夠有效的提升預(yù)測的精度。
[Abstract]:This paper presents a new method to solve the problem of incomplete data set , such as random missing ( MAR ) hypothesis , attribute independence hypothesis , etc . ( 2 ) The optimization method of incomplete data set multi - view classifier is studied on the basis of missing attribute tree .

【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP181

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 趙姝;呂靖;張燕平;張以文;;不完整數(shù)據(jù)集的信息熵集成分類算法[J];模式識別與人工智能;2014年03期

2 郎咸吉;王加陽;;商空間合成技術(shù)[J];模式識別與人工智能;2013年12期

3 王加陽;楊正華;;兩種結(jié)構(gòu)的商空間模型比較研究[J];電子學(xué)報(bào);2013年11期

4 張鈸;張鈴;;粒計(jì)算未來發(fā)展方向探討[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年05期

5 王國胤;張清華;胡軍;;粒計(jì)算研究綜述[J];智能系統(tǒng)學(xué)報(bào);2007年06期

6 ;Three Perspectives of Granular Computing[J];南昌工程學(xué)院學(xué)報(bào);2006年02期

7 蒙祖強(qiáng);蔡自興;;一種新的計(jì)算方法:粒度進(jìn)化計(jì)算[J];計(jì)算機(jī)工程與應(yīng)用;2006年01期

8 仇國芳,陳勁;概念知識系統(tǒng)與概念信息粒格[J];工程數(shù)學(xué)學(xué)報(bào);2005年06期

9 張燕平,張鈴,吳濤;機(jī)器學(xué)習(xí)中的多側(cè)面遞進(jìn)算法MIDA[J];電子學(xué)報(bào);2005年02期

10 張燕平,張鈴,吳濤,徐鋒,張,王倫文;基于覆蓋的構(gòu)造性學(xué)習(xí)算法SLA及在股票預(yù)測中的應(yīng)用[J];計(jì)算機(jī)研究與發(fā)展;2004年06期

相關(guān)博士學(xué)位論文 前5條

1 毛莎莎;基于貪婪優(yōu)化和投影變換的集成分類器算法研究[D];西安電子科技大學(xué);2014年

2 孫永宣;集成學(xué)習(xí)下的圖像分析關(guān)鍵問題研究[D];合肥工業(yè)大學(xué);2013年

3 祁瑞華;不完整數(shù)據(jù)分類知識發(fā)現(xiàn)算法研究[D];大連理工大學(xué);2011年

4 王清;集成學(xué)習(xí)中若干關(guān)鍵問題的研究[D];復(fù)旦大學(xué);2011年

5 陳景年;選擇性貝葉斯分類算法研究[D];北京交通大學(xué);2008年

相關(guān)碩士學(xué)位論文 前2條

1 趙亮;不完整數(shù)據(jù)減法聚類填充算法研究與應(yīng)用[D];大連理工大學(xué);2014年

2 呂靖;不完整數(shù)據(jù)集成分類算法的研究[D];安徽大學(xué);2013年

,

本文編號:1374385

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1374385.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶418cf***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
日韩人妻中文字幕精品| 中国黄色色片色哟哟哟哟哟哟| 亚洲乱妇熟女爽的高潮片| 麻豆印象传媒在线观看| 欧美整片精品日韩综合| 精品女同一区二区三区| 女人高潮被爽到呻吟在线观看| 99国产一区在线播放| 99热九九热这里只有精品| 亚洲中文字幕高清视频在线观看 | 色一情一乱一区二区三区码| 五月天综合网五月天综合网| 暴力三级a特黄在线观看| 久久国产青偷人人妻潘金莲| 午夜激情视频一区二区| 亚洲欧美中文日韩综合| 九九热这里只有免费精品| 欧美一区二区三区99| 男女午夜福利院在线观看| 精品亚洲一区二区三区w竹菊| 久久精品蜜桃一区二区av| 精品国产亚洲av成人一区| 欧美日韩一区二区午夜| 福利新区一区二区人口| 欧美大胆美女a级视频| 国产精品一区二区视频成人| 91精品国产综合久久福利| 日本精品免费在线观看| 日韩欧美中文字幕人妻| 国产一区在线免费国产一区| 欧美一级不卡视频在线观看| 日韩精品视频高清在线观看| 五月婷婷综合激情啪啪| av一区二区三区天堂| 亚洲中文字幕在线观看黑人| 丝袜美女诱惑在线观看| 国产免费一区二区不卡| 欧美成人久久久免费播放| 蜜桃传媒视频麻豆第一区| 神马午夜福利免费视频| 国产一级内片内射免费看|