天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于粗糙集理論—神經(jīng)網(wǎng)絡(luò)集成的數(shù)據(jù)流分類方法研究

發(fā)布時(shí)間:2017-08-09 04:03

  本文關(guān)鍵詞:基于粗糙集理論—神經(jīng)網(wǎng)絡(luò)集成的數(shù)據(jù)流分類方法研究


  更多相關(guān)文章: 粗糙集 屬性約簡 神經(jīng)網(wǎng)絡(luò) 集成學(xué)習(xí) 數(shù)據(jù)流


【摘要】:隨著計(jì)算機(jī)技術(shù)、通信技術(shù)以及網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,許多信息系統(tǒng)在運(yùn)行過程中都會(huì)產(chǎn)生大量的流式數(shù)據(jù)。典型的例子包括電信呼叫數(shù)據(jù)、股票交易數(shù)據(jù)、互聯(lián)網(wǎng)通信數(shù)據(jù)、搜索引擎數(shù)據(jù)等。這種新的數(shù)據(jù)類型——數(shù)據(jù)流,是一種實(shí)時(shí)的、連續(xù)到達(dá)且速度快、規(guī)模宏大的數(shù)據(jù)有序序列。 數(shù)據(jù)流上的分類就是通過單遍掃描數(shù)據(jù)流,提出一個(gè)分類模型或函數(shù),并利用該模型將數(shù)據(jù)對象映射到某一個(gè)給定的類別中。對數(shù)據(jù)流數(shù)據(jù)進(jìn)行分類時(shí)主要的困難在于:數(shù)據(jù)包含大量的冗余屬性,過多的屬性會(huì)影響模型的構(gòu)建速度和分類精度;同時(shí),由于數(shù)據(jù)連續(xù)不斷地持續(xù)到達(dá),,分類模型必須隨著數(shù)據(jù)的快速流入而實(shí)現(xiàn)高效地更新,從而達(dá)到分類模型能夠正確地映射當(dāng)前數(shù)據(jù)中的分類信息的目的。數(shù)據(jù)流數(shù)據(jù)的特殊性,決定了對數(shù)據(jù)流分類所采用的方法必須有別于傳統(tǒng)的數(shù)據(jù)挖掘分類方法,同時(shí)分類方法和技術(shù)在不同的學(xué)科領(lǐng)域都有著非常廣闊的應(yīng)用前景,因此,研究穩(wěn)定的、快速的、準(zhǔn)確的數(shù)據(jù)流分類方法具有巨大的理論價(jià)值和應(yīng)用價(jià)值。 本文將粗糙集理論和神經(jīng)網(wǎng)絡(luò)方法相結(jié)合,充分發(fā)揮了二者的優(yōu)勢互補(bǔ)性來應(yīng)對數(shù)據(jù)流的高維性、數(shù)據(jù)量大等特點(diǎn)。粗糙集理論具有較強(qiáng)的不確定、不完整信息處理能力,并且只通過數(shù)據(jù)本身而無需任何多余的信息,就可以獲得數(shù)據(jù)之間的相關(guān)性并約簡屬性個(gè)數(shù);神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性映射能力,在處理非線性模式時(shí)其精確度優(yōu)于其他的數(shù)據(jù)挖掘方法,尤其適合處理大數(shù)據(jù)集數(shù)據(jù),并且具有良好的容錯(cuò)性、自適應(yīng)性和抗噪聲干擾的能力。將二者的優(yōu)勢充分結(jié)合起來,能夠有效地降低神經(jīng)網(wǎng)絡(luò)輸入端的節(jié)點(diǎn)數(shù),極大地簡化神經(jīng)網(wǎng)絡(luò)的復(fù)雜結(jié)構(gòu),從而提高神經(jīng)網(wǎng)絡(luò)模型的分類預(yù)測精度。 另外,本文采用了滑動(dòng)窗口技術(shù)來應(yīng)對數(shù)據(jù)流流速快的問題,將數(shù)據(jù)流劃分成若干個(gè)大小相同的數(shù)據(jù)塊,每個(gè)數(shù)據(jù)塊訓(xùn)練一個(gè)個(gè)體分類器,多個(gè)個(gè)體分類器組成一個(gè)集成分類器,利用集成方法能夠有效地降低模型的泛化誤差;并且,個(gè)體分類器的訓(xùn)練速度一般要高于單一模型的更新速度,也更加適合處理高速產(chǎn)生的數(shù)據(jù)流。 根據(jù)粗糙集理論、神經(jīng)網(wǎng)絡(luò)方法和集成學(xué)習(xí)理論,本文提出了一種基于粗糙集約簡、神經(jīng)網(wǎng)絡(luò)集成的數(shù)據(jù)流分類方法,并且在實(shí)際數(shù)據(jù)上的對比仿真實(shí)驗(yàn)得到了很好的分類預(yù)測效果,從而證明了該方法是可行且有效的。
【關(guān)鍵詞】:粗糙集 屬性約簡 神經(jīng)網(wǎng)絡(luò) 集成學(xué)習(xí) 數(shù)據(jù)流
【學(xué)位授予單位】:河北大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP18;TP311.13
【目錄】:
  • 摘要5-7
  • Abstract7-11
  • 第1章 緒論11-19
  • 1.1 研究背景和意義11-13
  • 1.1.1 研究背景11-12
  • 1.1.2 研究意義12-13
  • 1.2 國內(nèi)外研究現(xiàn)狀13-16
  • 1.2.1 數(shù)據(jù)流分類研究現(xiàn)狀13-15
  • 1.2.2 粗糙集神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀15-16
  • 1.3 研究內(nèi)容及創(chuàng)新點(diǎn)16-17
  • 1.3.1 研究內(nèi)容16-17
  • 1.3.2 創(chuàng)新點(diǎn)17
  • 1.4 本文的組織結(jié)構(gòu)17-19
  • 第2章 相關(guān)理論基礎(chǔ)19-33
  • 2.1 數(shù)據(jù)流19-24
  • 2.1.1 數(shù)據(jù)流的定義及特點(diǎn)19-20
  • 2.1.2 數(shù)據(jù)流模型20-21
  • 2.1.3 數(shù)據(jù)流數(shù)據(jù)挖掘結(jié)構(gòu)圖及其技術(shù)21-24
  • 2.2 粗糙集24-27
  • 2.2.1 粗糙集概述24-26
  • 2.2.2 粗糙集的基本概念26-27
  • 2.3 神經(jīng)網(wǎng)絡(luò)27-32
  • 2.3.1 神經(jīng)網(wǎng)絡(luò)簡介27
  • 2.3.2 神經(jīng)網(wǎng)絡(luò)模型和結(jié)構(gòu)27-30
  • 2.3.3 改進(jìn)的 BP 神經(jīng)網(wǎng)絡(luò)30-31
  • 2.3.4 BP 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)31-32
  • 2.4 本章小結(jié)32-33
  • 第3章 基于粗糙集和神經(jīng)網(wǎng)絡(luò)多分類器集成的數(shù)據(jù)流分類模型構(gòu)建33-47
  • 3.1 粗糙集和神經(jīng)網(wǎng)絡(luò)的結(jié)合33-36
  • 3.1.1 兩種方法優(yōu)勢互補(bǔ)33-34
  • 3.1.2 兩種方法結(jié)合的方式34-36
  • 3.2 數(shù)據(jù)流分類預(yù)測模型的構(gòu)建思想及流程圖36-38
  • 3.2.1 模型構(gòu)建思想36-37
  • 3.2.2 模型流程圖37-38
  • 3.3 構(gòu)建模型38-46
  • 3.3.1 數(shù)據(jù)預(yù)處理38-39
  • 3.3.2 基于特征選擇的屬性約簡方法39-40
  • 3.3.3 BP 神經(jīng)網(wǎng)絡(luò)各層參數(shù)的選擇40-41
  • 3.3.4 集成分類器方法41-44
  • 3.3.5 神經(jīng)網(wǎng)絡(luò)多分類器集成用于數(shù)據(jù)流分類44-46
  • 3.4 本章小結(jié)46-47
  • 第4章 仿真實(shí)驗(yàn)與結(jié)果分析47-54
  • 4.1 實(shí)驗(yàn)數(shù)據(jù)47
  • 4.2 連續(xù)屬性離散化47-49
  • 4.3 粗糙集屬性約簡49
  • 4.4 對比實(shí)驗(yàn)49-53
  • 4.5 本章小結(jié)53-54
  • 第5章 總結(jié)與展望54-56
  • 5.1 工作總結(jié)54
  • 5.2 研究展望54-56
  • 參考文獻(xiàn)56-59
  • 致謝59-60
  • 攻讀碩士學(xué)位期間科研及發(fā)表論文情況60

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前4條

1 歐陽震諍;羅建書;胡東敏;吳泉源;;一種不平衡數(shù)據(jù)流集成分類模型[J];電子學(xué)報(bào);2010年01期

2 周志華,陳世福;神經(jīng)網(wǎng)絡(luò)集成[J];計(jì)算機(jī)學(xué)報(bào);2002年01期

3 陳遵德;;Rough Set身經(jīng)網(wǎng)絡(luò)智能系統(tǒng)及其應(yīng)用[J];模式識(shí)別與人工智能;1999年01期

4 金澈清,錢衛(wèi)寧,周傲英;流數(shù)據(jù)分析與管理綜述[J];軟件學(xué)報(bào);2004年08期

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 楊顯飛;數(shù)據(jù)流集成分類器算法研究[D];哈爾濱工程大學(xué);2011年



本文編號(hào):643388

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/643388.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶78f9d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com