天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類博士論文 >

面向動(dòng)態(tài)不完備數(shù)據(jù)的特征選擇模型與算法研究

發(fā)布時(shí)間:2017-06-21 03:00

  本文關(guān)鍵詞:面向動(dòng)態(tài)不完備數(shù)據(jù)的特征選擇模型與算法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著計(jì)算機(jī)與網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,數(shù)據(jù)的數(shù)量和規(guī)模呈現(xiàn)出空前的增長(zhǎng)速度,為我們帶來了一個(gè)數(shù)據(jù)膨脹、信息爆炸時(shí)代。一方面,現(xiàn)有數(shù)據(jù)從TB級(jí)向PB的急劇增長(zhǎng)使得數(shù)據(jù)在規(guī)模上已超于人類分析和獲取知識(shí)的能力。另一方面,數(shù)據(jù)量的爆炸式增長(zhǎng)使傳統(tǒng)的知識(shí)獲取方法顯得束手無策,但是不斷豐富的數(shù)據(jù)蘊(yùn)含信息給人們帶來了更多有價(jià)值的知識(shí)。如何對(duì)現(xiàn)實(shí)領(lǐng)域中的海量高維數(shù)據(jù)進(jìn)行有效的預(yù)處理,從而挖掘出潛在有用的知識(shí),已成為當(dāng)前數(shù)據(jù)挖掘、計(jì)算智能和機(jī)器學(xué)習(xí)的重要研究課題之一。 特征選擇是數(shù)據(jù)挖掘中一個(gè)重要數(shù)據(jù)預(yù)處理技術(shù)。面臨著現(xiàn)實(shí)中許多復(fù)雜環(huán)境下數(shù)據(jù)往往呈現(xiàn)的動(dòng)態(tài)性、不完備性和不精確性等特征,如何高效可行地對(duì)數(shù)據(jù)進(jìn)行特征選擇,是目前特征選擇研究面臨的巨大挑戰(zhàn)問題之一。作為一種刻畫不確定性和不精確信息的數(shù)學(xué)工具,粗糙集理論已被廣泛應(yīng)用到數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)和機(jī)器學(xué)習(xí)等領(lǐng)域中,該理論最大的優(yōu)勢(shì)是不依賴給定數(shù)據(jù)集之外的任何先驗(yàn)信息來處理問題,對(duì)問題的描述和處理更加客觀。因此,利用粗糙集理論方法研究面向動(dòng)態(tài)不完備數(shù)據(jù)的特征選擇有著重要的理論和現(xiàn)實(shí)意義。 本文在動(dòng)態(tài)不完備數(shù)據(jù)的現(xiàn)實(shí)背景下,在如何快速、有效地獲取特征子集結(jié)果進(jìn)而獲取動(dòng)態(tài)知識(shí)這一實(shí)際需求的驅(qū)動(dòng)下,在基于粗糙集理論的特征選擇框架下,以增量式更新策略為研究方法,以不完備數(shù)據(jù)集發(fā)生動(dòng)態(tài)變化的三種不同情景為主線,系統(tǒng)地研究了動(dòng)態(tài)不完備數(shù)據(jù)集下特征子集的增量式更新問題,研究目的以增量式方法為動(dòng)態(tài)不完備數(shù)據(jù)的特征選擇探索有效的途徑,為動(dòng)態(tài)數(shù)據(jù)的知識(shí)發(fā)現(xiàn)探尋新的理論依據(jù)和實(shí)現(xiàn)方法。為此,本文以粗糙集理論為研究工具,針對(duì)動(dòng)態(tài)不完備數(shù)據(jù)進(jìn)行系統(tǒng)的特征選擇研究,取得的主要研究成果如下。 1)提出不完備數(shù)據(jù)集中對(duì)象集發(fā)生增加和刪除時(shí)正區(qū)域的增量式更新機(jī)制,在正區(qū)域更新機(jī)制的基礎(chǔ)上,定義特征重要度的度量函數(shù),并設(shè)計(jì)對(duì)象集隨時(shí)間變化時(shí)基于正區(qū)域的增量式特征選擇算法。相關(guān)實(shí)驗(yàn)結(jié)果驗(yàn)證了提出算法的高效性和可行性。(第二章) 2)針對(duì)不完備數(shù)據(jù)集中特征集發(fā)生增加和刪除情況,通過分析不完備數(shù)據(jù)集中容差粒度的變化,分別建立特征集增加和刪除下正區(qū)域的增量式更新機(jī)制,并依此分別設(shè)計(jì)了特征集增加和刪除時(shí)的增量式特征選擇算法。理論分析和相關(guān)實(shí)驗(yàn)結(jié)果都驗(yàn)證了提出算法的高效性和有效性。(第三章) 3)提出不完備數(shù)據(jù)集中特征值發(fā)生動(dòng)態(tài)變化時(shí)正區(qū)域的增量式更新機(jī)制,在此基礎(chǔ)上,并設(shè)計(jì)了特征值隨時(shí)間變化時(shí)增量式特征選擇算法。特別是當(dāng)多個(gè)對(duì)象的特征值發(fā)生動(dòng)態(tài)變化時(shí),提出算法可一次性求得特征子集結(jié)果,無需重復(fù)執(zhí)行單個(gè)對(duì)象特征值變化時(shí)的增量式特征選擇算法來求解特征子集。理論分析和相關(guān)實(shí)驗(yàn)結(jié)果都驗(yàn)證了提出算法的高效性和有效性。(第四章) 4)針對(duì)不完備數(shù)據(jù)集中單一特征評(píng)估函數(shù)在現(xiàn)有特征選擇算法中面臨的缺點(diǎn),結(jié)合粒度度量準(zhǔn)則,從不同角度出發(fā),提出一種基于混合特征評(píng)估函數(shù)來度量候選特征的區(qū)分能力,并設(shè)計(jì)基于貪心向前搜索的特征選擇算法。同時(shí),針對(duì)代價(jià)敏感的不完備數(shù)據(jù)集,以混合度量的視角為出發(fā)點(diǎn),提出一種混合評(píng)估函數(shù)來度量特征子集的質(zhì)量。在此基礎(chǔ)上,為進(jìn)一步加快特征選擇進(jìn)程,提出一種特征選擇中不斷減小搜索空間的策略,結(jié)合此策略設(shè)計(jì)了面向代價(jià)敏感的高效特征選擇算法。相關(guān)實(shí)驗(yàn)結(jié)果驗(yàn)證了提出算法的高效性和有效性。(第五章)
【關(guān)鍵詞】:數(shù)據(jù)挖掘 動(dòng)態(tài)不完備數(shù)據(jù) 特征選擇 粒度計(jì)算 粗糙集理論
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.13;TP18
【目錄】:
  • 致謝5-6
  • 摘要6-8
  • ABSTRACT8-11
  • 目錄11-14
  • 1 緒論14-36
  • 1.1 研究意義14-16
  • 1.2 特征選擇16-18
  • 1.3 基于粗糙集的特征選擇18-27
  • 1.3.1 粗糙集理論的預(yù)備知識(shí)20-24
  • 1.3.2 粗糙集特征選擇的研究現(xiàn)狀24-27
  • 1.4 動(dòng)態(tài)不完備數(shù)據(jù)的特征選擇27-31
  • 1.4.1 面向不完備數(shù)據(jù)的特征選擇27-29
  • 1.4.2 面向動(dòng)態(tài)數(shù)據(jù)的特征選擇29-31
  • 1.5 本文的研究框架31-36
  • 1.5.1 研究思路31-33
  • 1.5.2 研究?jī)?nèi)容和組織結(jié)構(gòu)33-36
  • 2 對(duì)象集動(dòng)態(tài)變化時(shí)增量式特征選擇36-64
  • 2.1 引言36-38
  • 2.2 問題描述38-39
  • 2.3 基于正區(qū)域的特征選擇39-44
  • 2.4 單個(gè)對(duì)象增刪時(shí)增量式特征選擇44-51
  • 2.4.1 單個(gè)對(duì)象增刪時(shí)正區(qū)域的更新機(jī)制44-47
  • 2.4.2 單個(gè)對(duì)象同時(shí)增刪時(shí)特征選擇算法47-51
  • 2.5 多個(gè)對(duì)象增刪時(shí)增量式特征選擇51-57
  • 2.5.1 多個(gè)對(duì)象增刪時(shí)正區(qū)域的更新機(jī)制52-54
  • 2.5.2 多個(gè)對(duì)象同時(shí)增刪時(shí)特征選擇算法54-57
  • 2.6 實(shí)驗(yàn)分析57-62
  • 2.6.1 特征子集57-58
  • 2.6.2 運(yùn)行時(shí)間58-60
  • 2.6.3 分類精度60-62
  • 2.7 本章小結(jié)62-64
  • 3 特征集動(dòng)態(tài)變化時(shí)增量式特征選擇64-86
  • 3.1 引言64-65
  • 3.2 問題描述65-66
  • 3.3 特征集增刪時(shí)正區(qū)域更新機(jī)制66-69
  • 3.4 特征集合增刪時(shí)增量式特征選擇算法69-74
  • 3.4.1 算法設(shè)計(jì)69-73
  • 3.4.2 算法時(shí)間復(fù)雜度分析73-74
  • 3.5 實(shí)驗(yàn)分析74-84
  • 3.5.1 運(yùn)行時(shí)間75-80
  • 3.5.2 敏感性分析80-81
  • 3.5.3 特征集同時(shí)增加和刪除的比較81-83
  • 3.5.4. 分類精度83-84
  • 3.6 本章小結(jié)84-86
  • 4 特征值動(dòng)態(tài)變化時(shí)增量式特征選擇86-114
  • 4.1 引言86-87
  • 4.2 問題描述87-88
  • 4.3 單個(gè)對(duì)象特征值變化時(shí)增量式特征選擇88-95
  • 4.3.1 單個(gè)對(duì)象特征值變化時(shí)正區(qū)域的更新機(jī)制88-92
  • 4.3.2 單個(gè)對(duì)象特征值變化時(shí)增量式特征選擇算法92-95
  • 4.4 多個(gè)對(duì)象特征值變化時(shí)增量式特征選擇95-99
  • 4.4.1 多個(gè)對(duì)象特征值變化時(shí)正區(qū)域的更新機(jī)制95-97
  • 4.4.2 多個(gè)對(duì)象特征值變化時(shí)增量式特征選擇算法97-99
  • 4.5 實(shí)驗(yàn)分析99-113
  • 4.5.1 算法的高效性100-103
  • 4.5.2 算法的有效性103-113
  • 4.6 本章小結(jié)113-114
  • 5 基于混合度量的高效特征選擇114-144
  • 5.1 引言114-115
  • 5.2 面向不完備數(shù)據(jù)的混合度量特征選擇算法115-124
  • 5.2.1 問題描述116
  • 5.2.2 特征度量116-118
  • 5.2.3 算法設(shè)計(jì)118-119
  • 5.2.4 實(shí)驗(yàn)分析119-124
  • 5.3 面向代價(jià)敏感數(shù)據(jù)的混合度量特征選擇算法124-141
  • 5.3.1 問題描述125
  • 5.3.2 相關(guān)工作125-128
  • 5.3.3 特征度量128-131
  • 5.3.4 算法設(shè)計(jì)131-135
  • 5.3.5 實(shí)驗(yàn)分析135-141
  • 5.4 本章小結(jié)141-144
  • 6 結(jié)論與展望144-148
  • 6.1 研究工作總結(jié)144-145
  • 6.2 進(jìn)一步研究展望145-148
  • 參考文獻(xiàn)148-158
  • 附錄A158-160
  • 作者簡(jiǎn)歷及攻讀博士學(xué)位期間取得的研究成果160-164
  • 學(xué)位論文數(shù)據(jù)集164

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 錢進(jìn);苗奪謙;張澤華;;云計(jì)算環(huán)境下知識(shí)約簡(jiǎn)算法[J];計(jì)算機(jī)學(xué)報(bào);2011年12期

2 苗奪謙;陳玉明;王睿智;張紅云;;圖表示下的知識(shí)約簡(jiǎn)[J];電子學(xué)報(bào);2010年08期

3 官禮和;王國(guó)胤;;決策表屬性約簡(jiǎn)集的增量式更新算法[J];計(jì)算機(jī)科學(xué)與探索;2010年05期

4 劉勇;熊蓉;褚健;;Hash快速屬性約簡(jiǎn)算法[J];計(jì)算機(jī)學(xué)報(bào);2009年08期

5 楊明;楊萍;;基于廣義差別矩陣的核和屬性約簡(jiǎn)算法[J];控制與決策;2008年09期

6 葉玉玲;傘冶;;基于遺傳算法的粗糙集混合數(shù)據(jù)屬性約簡(jiǎn)[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2008年05期

7 胡清華;于達(dá)仁;謝宗霞;;基于鄰域;痛植诒平臄(shù)值屬性約簡(jiǎn)[J];軟件學(xué)報(bào);2008年03期

8 葉東毅;廖建坤;;基于二進(jìn)制粒子群優(yōu)化的一個(gè)最小屬性約簡(jiǎn)算法[J];模式識(shí)別與人工智能;2007年03期

9 楊明;;一種基于改進(jìn)差別矩陣的屬性約簡(jiǎn)增量式更新算法[J];計(jì)算機(jī)學(xué)報(bào);2007年05期

10 楊成福;舒蘭;;基于容差關(guān)系的不完備決策系統(tǒng)屬性約簡(jiǎn)算法[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年09期


  本文關(guān)鍵詞:面向動(dòng)態(tài)不完備數(shù)據(jù)的特征選擇模型與算法研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):467446

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/467446.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cb9ef***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com