天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

半監(jiān)督特征選擇關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2017-08-11 09:33

  本文關(guān)鍵詞:半監(jiān)督特征選擇關(guān)鍵技術(shù)研究


  更多相關(guān)文章: 降維 特征選擇 屬性依賴(lài) 聚類(lèi) l_(2.1)-norm 分類(lèi)


【摘要】:特征選擇是一種重要的數(shù)據(jù)預(yù)處理方法,通過(guò)在原始數(shù)據(jù)中篩選出特征子集并進(jìn)行優(yōu)化,對(duì)算法性能的提高起到事半功倍的作用。針對(duì)傳統(tǒng)利用互信息以及成對(duì)約束的特征選擇算法通常忽略特征之間的依賴(lài)性的問(wèn)題,本文基于屬性依賴(lài)率先提出了一種特征選擇算法。主要工作包括:第一,對(duì)屬性依賴(lài)進(jìn)行分析,根據(jù)特征相關(guān)性重構(gòu)原始數(shù)據(jù);第二,定義目標(biāo)函數(shù),計(jì)算每一維特征與其他特征之間的互信息,進(jìn)而根據(jù)得分對(duì)特征進(jìn)行排序;第三,利用K-means方法對(duì)特征選擇的結(jié)果進(jìn)行分析,并采用不同的評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行評(píng)價(jià)。本實(shí)驗(yàn)采用UCI數(shù)據(jù)集并與五種傳統(tǒng)的特征選擇算法(UFSMI、Laplacian Score、MCFS、SPECFS、LDA)進(jìn)行對(duì)比。理論分析及實(shí)驗(yàn)表明,該算法能夠有效地利用屬性依賴(lài)之間的關(guān)系,提高特征選擇的準(zhǔn)確率和性能;虮磉_(dá)數(shù)據(jù)是DNA微陣列數(shù)據(jù)分析的重點(diǎn),但是由于該數(shù)據(jù)的樣本數(shù)目遠(yuǎn)遠(yuǎn)小于樣本維數(shù),將特征選擇算法應(yīng)用在高維數(shù)據(jù)上意義重大。本文提出了基于l2,1-norm的半監(jiān)督特征選擇算法,該方法同時(shí)結(jié)合了損失函數(shù)和正則化方法,可以有效的去除離群點(diǎn),同時(shí)利用稀疏性進(jìn)行特征選擇,用于解決現(xiàn)實(shí)生活中高維數(shù)據(jù)的計(jì)算復(fù)雜度問(wèn)題。數(shù)據(jù)診斷模型的關(guān)鍵是對(duì)高維數(shù)據(jù)進(jìn)行預(yù)處理,另一方面是使用分類(lèi)器對(duì)數(shù)據(jù)進(jìn)行分類(lèi)研究,對(duì)比分析分類(lèi)器的分類(lèi)性能和執(zhí)行效率。本實(shí)驗(yàn)主要采用基因表達(dá)序列數(shù)據(jù)集,一是對(duì)比分析選擇不同特征維數(shù)對(duì)分類(lèi)精度的影響;二是對(duì)比分析了特征選擇前后SVM和ELM的分類(lèi)精度;三是對(duì)比分析了算法的執(zhí)行時(shí)間。理論分析及實(shí)驗(yàn)表明,選擇合適的特征選擇器和分類(lèi)器可以有效提高實(shí)驗(yàn)診斷模型的準(zhǔn)確率及性能。
【關(guān)鍵詞】:降維 特征選擇 屬性依賴(lài) 聚類(lèi) l_(2.1)-norm 分類(lèi)
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP311.13;TP18
【目錄】:
  • 摘要6-7
  • Abstract7-11
  • 第1章 緒論11-16
  • 1.1 研究的背景和意義11-12
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀12-14
  • 1.2.1 特征選擇研究現(xiàn)狀12-13
  • 1.2.2 特征選擇應(yīng)用研究現(xiàn)狀13-14
  • 1.3 本文主要研究?jī)?nèi)容和結(jié)構(gòu)安排14-16
  • 第2章 相關(guān)理論基礎(chǔ)概述16-24
  • 2.1 特征選擇算法分析16-20
  • 2.1.1 特征選擇的一般過(guò)程16
  • 2.1.2 產(chǎn)生過(guò)程16-18
  • 2.1.3 評(píng)價(jià)函數(shù)18-20
  • 2.2 特征選擇算法分類(lèi)20-21
  • 2.3 聚類(lèi)算法分析21-23
  • 2.4 本章小結(jié)23-24
  • 第3章 基于屬性依賴(lài)的半監(jiān)督特征選擇24-40
  • 3.1 半監(jiān)督學(xué)習(xí)方法24-26
  • 3.1.1 Constraint Score算法24-25
  • 3.1.2 基于Constraint Score的半監(jiān)督特征選擇算法25-26
  • 3.2 基于屬性依賴(lài)的半監(jiān)督特征選擇26-34
  • 3.2.1 問(wèn)題描述和符號(hào)定義27-28
  • 3.2.2 算法總體框架28-29
  • 3.2.3 算法總體描述29-34
  • 3.3 實(shí)驗(yàn)及分析34-38
  • 3.3.1 實(shí)驗(yàn)數(shù)據(jù)集34-35
  • 3.3.2 實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)35-36
  • 3.3.3 算法聚類(lèi)性能分析36-37
  • 3.3.4 屬性依賴(lài)對(duì)特征選擇的影響37-38
  • 3.4 本章小結(jié)38-40
  • 第4章 半監(jiān)督特征選擇的應(yīng)用40-48
  • 4.1 數(shù)據(jù)分析及實(shí)驗(yàn)診斷模型40-42
  • 4.1.1 基因表達(dá)數(shù)據(jù)分析40-41
  • 4.1.2 基因表達(dá)數(shù)據(jù)診斷模型41-42
  • 4.2 分類(lèi)器算法42-44
  • 4.2.1 樸素貝葉斯分類(lèi)算法42
  • 4.2.2 K近鄰分類(lèi)算法42-43
  • 4.2.3 支持向量機(jī)算法43-44
  • 4.2.4 極限學(xué)習(xí)機(jī)算法44
  • 4.3 半監(jiān)督特征選擇的應(yīng)用44-47
  • 4.4 本章小結(jié)47-48
  • 第5章 半監(jiān)督特征選擇應(yīng)用實(shí)驗(yàn)與分析48-57
  • 5.1 實(shí)驗(yàn)數(shù)據(jù)集48
  • 5.2 實(shí)驗(yàn)與分析48-55
  • 5.2.1 特征選擇前后分類(lèi)精度對(duì)比實(shí)驗(yàn)49-51
  • 5.2.2 選擇不同特征維數(shù)對(duì)分類(lèi)精度的影響51-54
  • 5.2.3 算法時(shí)間復(fù)雜度分析54-55
  • 5.3 本章小結(jié)55-57
  • 總結(jié)與展望57-58
  • 致謝58-59
  • 參考文獻(xiàn)59-64
  • 攻讀碩士學(xué)位期間發(fā)表的論文及科研成果64

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 吉小軍,李世中,李霆;相關(guān)分析在特征選擇中的應(yīng)用[J];測(cè)試技術(shù)學(xué)報(bào);2001年01期

2 賈沛;桑農(nóng);唐紅衛(wèi);;一種改進(jìn)的類(lèi)別依賴(lài)型特征選擇技術(shù)[J];計(jì)算機(jī)與數(shù)子工程;2003年06期

3 靖紅芳;王斌;楊雅輝;徐燕;;基于類(lèi)別分布的特征選擇框架[J];計(jì)算機(jī)研究與發(fā)展;2009年09期

4 吳洪麗;朱顥東;周瑞瓊;;使用特征分辨率和差別對(duì)象對(duì)集的特征選擇[J];計(jì)算機(jī)工程與應(yīng)用;2010年16期

5 楊藝;韓德強(qiáng);韓崇昭;;基于排序融合的特征選擇[J];控制與決策;2011年03期

6 李云;;穩(wěn)定的特征選擇研究[J];微型機(jī)與應(yīng)用;2012年15期

7 錢(qián)學(xué)雙;多重篩選逐步回歸特征選擇法及其應(yīng)用[J];信息與控制;1986年05期

8 宣國(guó)榮;柴佩琪;;基于巴氏距離的特征選擇[J];模式識(shí)別與人工智能;1996年04期

9 范勁松,方廷健;特征選擇和提取要素的分析及其評(píng)價(jià)[J];計(jì)算機(jī)工程與應(yīng)用;2001年13期

10 王新峰;邱靜;劉冠軍;;基于特征相關(guān)性和冗余性分析的機(jī)械故障特征選擇研究[J];中國(guó)機(jī)械工程;2006年04期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 靖紅芳;王斌;楊雅輝;;基于類(lèi)別分布的特征選擇框架[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

2 李長(zhǎng)升;盧漢清;;排序?qū)W習(xí)模型中的特征選擇[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年

3 劉功申;李建華;李生紅;;基于類(lèi)信息的特征選擇和加權(quán)方法[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年

4 倪友平;王思臣;馬桂珍;陳曾平;;分支界定算法在低分辨雷達(dá)飛機(jī)架次判別中的應(yīng)用[A];第十三屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2007)論文集[C];2007年

5 李澤輝;聶生東;陳兆學(xué);;應(yīng)用多類(lèi)SVM分割MR腦圖像特征選擇與優(yōu)化的實(shí)驗(yàn)研究[A];中國(guó)儀器儀表學(xué)會(huì)第九屆青年學(xué)術(shù)會(huì)議論文集[C];2007年

6 蒙新泛;王厚峰;;主客觀識(shí)別中的上下文因素的研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

7 萬(wàn)京;王建東;;一種基于新的差異性度量的ReliefF方法[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年

8 范麗;許潔萍;;基于GMM的音樂(lè)信號(hào)音色模型研究[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2008年

9 陳友;戴磊;程學(xué)旗;;基于MRMHC-C4.5的IP流分類(lèi)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

10 申f;楊宏暉;袁帥;;用于水聲目標(biāo)識(shí)別的互信息無(wú)監(jiān)督特征選擇[A];第三屆上!靼猜晫W(xué)學(xué)會(huì)學(xué)術(shù)會(huì)議論文集[C];2013年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 李靜;高維數(shù)據(jù)交互特征選擇和分類(lèi)研究[D];燕山大學(xué);2015年

2 劉風(fēng);基于磁共振成像的多變量模式分析方法學(xué)與應(yīng)用研究[D];電子科技大學(xué);2014年

3 王石平;粗糙擬陣及其在高維數(shù)據(jù)降維中的應(yīng)用研究[D];電子科技大學(xué);2014年

4 代琨;基于支持向量機(jī)的網(wǎng)絡(luò)數(shù)據(jù)特征選擇技術(shù)研究[D];解放軍信息工程大學(xué);2013年

5 王愛(ài)國(guó);微陣列基因表達(dá)數(shù)據(jù)的特征分析方法研究[D];合肥工業(yè)大學(xué);2015年

6 王博;文本分類(lèi)中特征選擇技術(shù)的研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2009年

7 張明錦;基于特征選擇的多變量數(shù)據(jù)分析方法及其在譜學(xué)研究中的應(yīng)用[D];華東理工大學(xué);2011年

8 高青斌;蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)相關(guān)問(wèn)題研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年

9 馮國(guó)忠;文本分類(lèi)中的貝葉斯特征選擇[D];東北師范大學(xué);2011年

10 張麗新;高維數(shù)據(jù)的特征選擇及基于特征選擇的集成學(xué)習(xí)研究[D];清華大學(xué);2004年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 張金蕾;蛋白質(zhì)SUMO化修飾位點(diǎn)預(yù)測(cè)的數(shù)據(jù)挖掘技術(shù)研究[D];西北農(nóng)林科技大學(xué);2015年

2 史德飛;自適應(yīng)特征選擇在線瓷磚分類(lèi)系統(tǒng)[D];南京大學(xué);2014年

3 馬錚;網(wǎng)絡(luò)流量特征分析與特征選擇[D];北京郵電大學(xué);2013年

4 徐冬;基于特征選擇的入侵檢測(cè)方法研究[D];吉林大學(xué);2016年

5 鄭芳泉;稀有數(shù)據(jù)的集成特征選擇與入侵檢測(cè)[D];福州大學(xué);2013年

6 徐子偉;基于分步特征選擇和組合分類(lèi)器的電信客戶(hù)流失預(yù)測(cè)模型[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年

7 肖麗莎;半監(jiān)督特征選擇關(guān)鍵技術(shù)研究[D];西南交通大學(xué);2016年

8 李昌;概率特征選擇分類(lèi)向量機(jī)[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年

9 黃春虎;基于ReliefF-FCBF組合的入侵特征選擇算法研究[D];新疆大學(xué);2016年

10 譚蘊(yùn)琨;面向稀疏數(shù)據(jù)的在線學(xué)習(xí)特征選擇方法研究[D];華南理工大學(xué);2016年



本文編號(hào):655398

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/655398.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)0de18***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com