基于可變滑動(dòng)窗口的不確定數(shù)據(jù)流聚類方法研究
發(fā)布時(shí)間:2021-05-14 00:57
不確定數(shù)據(jù)流聚類技術(shù)是一種用于發(fā)現(xiàn)不確定數(shù)據(jù)流中數(shù)據(jù)項(xiàng)分布信息的方法,可以實(shí)時(shí)地幫助用戶在海量的數(shù)據(jù)中發(fā)掘有價(jià)值的信息。不確定數(shù)據(jù)流聚類技術(shù)的根本目的是提高聚類結(jié)果的質(zhì)量、過濾噪聲及過期信息并降低時(shí)空資源的消耗。為了能用較少的資源消耗獲得高精度的聚類結(jié)果,本文對(duì)傳統(tǒng)滑動(dòng)窗口技術(shù)進(jìn)行了改進(jìn),并在此基礎(chǔ)上給出了基于可變滑動(dòng)窗口技術(shù)的聚類算法,主要研究?jī)?nèi)容如下:(1)改進(jìn)了傳統(tǒng)的可變滑動(dòng)窗口技術(shù)。針對(duì)傳統(tǒng)可變滑動(dòng)窗口技術(shù)中,窗口大小設(shè)置不靈活的問題,本文設(shè)置窗口大小可隨著數(shù)據(jù)流速度的變化動(dòng)態(tài)調(diào)節(jié),并將窗口大小均勻劃分為大小相等的子窗口,定義為元窗口,以元窗口為緩沖數(shù)據(jù)的基本單元。通過動(dòng)態(tài)設(shè)置概率閾值,可在聚類的同時(shí)為最近元窗口內(nèi)數(shù)據(jù)項(xiàng)分類,將低概率數(shù)據(jù)直接納入離群點(diǎn)緩沖區(qū),降低資源消耗。同時(shí)還定義了數(shù)據(jù)流速變化幅度和變化頻度兩個(gè)概念,合理地選擇兩種窗口調(diào)節(jié)算法,適應(yīng)數(shù)據(jù)流的演化情況。(2)給出了基于可變滑動(dòng)窗口技術(shù)的不確定數(shù)據(jù)流聚類算法。通過結(jié)合改進(jìn)后的滑動(dòng)窗口技術(shù),文章給出了一種新的不確定聚類算法VSWC,將聚類過程模塊化,使聚類過程更加清晰,并定義了新的不確定數(shù)據(jù)聚類特征SWUCF,能更...
【文章來源】:安徽理工大學(xué)安徽省
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)安排
第2章 不確定數(shù)據(jù)流概述
2.1 不確定數(shù)據(jù)流
2.1.1 不確定數(shù)據(jù)流的概念
2.1.2 不確定數(shù)據(jù)流的產(chǎn)生
2.1.3 不確定數(shù)據(jù)流的特點(diǎn)
2.1.4 不缺定數(shù)據(jù)流的描述
2.1.5 不確定數(shù)據(jù)的應(yīng)用領(lǐng)域
2.2 數(shù)據(jù)流聚類技術(shù)
2.2.1 聚類分析
2.2.2 數(shù)據(jù)流聚類與數(shù)據(jù)集聚類的區(qū)別與聯(lián)系
2.2.3 數(shù)據(jù)集聚類算法
2.2.4 數(shù)據(jù)流聚類算法
2.3 聚類效果評(píng)價(jià)
2.4 本章小結(jié)
第3章 動(dòng)態(tài)數(shù)據(jù)流中的可變滑動(dòng)窗口研究
3.1 窗口模型
3.2 可變滑動(dòng)窗口模型
3.2.1 元窗口
3.2.2 可變滑動(dòng)窗口
3.3 窗口調(diào)整算法
3.4 兩種窗口調(diào)整算法選擇
3.5 本章小結(jié)
第4章 基于可變滑動(dòng)窗口的不確定數(shù)據(jù)流聚類方法研究
4.1 不確定數(shù)據(jù)流聚類的相關(guān)定義
4.2 聚類算法VSWC
4.2.1 聚類的初始化
4.2.2 最優(yōu)簇尋找
4.2.3 金字塔時(shí)間框架
4.2.4 微簇的衰減與淘汰
4.2.5 參數(shù)動(dòng)態(tài)調(diào)整
4.2.6 用戶請(qǐng)求處理
4.3 本章小結(jié)
第5章 基于可變滑動(dòng)窗口的不確定數(shù)據(jù)流聚類實(shí)驗(yàn)分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 數(shù)據(jù)流
5.3 評(píng)價(jià)指標(biāo)與參數(shù)設(shè)置
5.4 三種聚類算法比較
5.4.1 聚類純度
5.4.2 距離平方和
5.4.3 聚類處理時(shí)間
5.4.4 內(nèi)存開銷
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 全文總結(jié)
6.2 工作展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)介及讀研期間主要科研成果
【參考文獻(xiàn)】:
期刊論文
[1]基于合并分層聚類的網(wǎng)絡(luò)拓?fù)渫茢嗨惴╗J]. 張潤(rùn)生,李艷斌,李嘯天. 電子學(xué)報(bào). 2013(12)
[2]一種基于滑動(dòng)窗口的不確定數(shù)據(jù)流聚類算法[J]. 朱娟芳,霍歡,徐亞,奚金金,彭敦陸,高麗萍. 信息技術(shù). 2013(04)
[3]不確定性數(shù)據(jù)管理技術(shù)研究綜述[J]. 周傲英,金澈清,王國(guó)仁,李建中. 計(jì)算機(jī)學(xué)報(bào). 2009(01)
[4]聚類有效性評(píng)價(jià)綜述[J]. 楊燕,靳蕃,KAMEL Mohamed. 計(jì)算機(jī)應(yīng)用研究. 2008(06)
[5]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇. 軟件學(xué)報(bào). 2008(01)
本文編號(hào):3184960
【文章來源】:安徽理工大學(xué)安徽省
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)安排
第2章 不確定數(shù)據(jù)流概述
2.1 不確定數(shù)據(jù)流
2.1.1 不確定數(shù)據(jù)流的概念
2.1.2 不確定數(shù)據(jù)流的產(chǎn)生
2.1.3 不確定數(shù)據(jù)流的特點(diǎn)
2.1.4 不缺定數(shù)據(jù)流的描述
2.1.5 不確定數(shù)據(jù)的應(yīng)用領(lǐng)域
2.2 數(shù)據(jù)流聚類技術(shù)
2.2.1 聚類分析
2.2.2 數(shù)據(jù)流聚類與數(shù)據(jù)集聚類的區(qū)別與聯(lián)系
2.2.3 數(shù)據(jù)集聚類算法
2.2.4 數(shù)據(jù)流聚類算法
2.3 聚類效果評(píng)價(jià)
2.4 本章小結(jié)
第3章 動(dòng)態(tài)數(shù)據(jù)流中的可變滑動(dòng)窗口研究
3.1 窗口模型
3.2 可變滑動(dòng)窗口模型
3.2.1 元窗口
3.2.2 可變滑動(dòng)窗口
3.3 窗口調(diào)整算法
3.4 兩種窗口調(diào)整算法選擇
3.5 本章小結(jié)
第4章 基于可變滑動(dòng)窗口的不確定數(shù)據(jù)流聚類方法研究
4.1 不確定數(shù)據(jù)流聚類的相關(guān)定義
4.2 聚類算法VSWC
4.2.1 聚類的初始化
4.2.2 最優(yōu)簇尋找
4.2.3 金字塔時(shí)間框架
4.2.4 微簇的衰減與淘汰
4.2.5 參數(shù)動(dòng)態(tài)調(diào)整
4.2.6 用戶請(qǐng)求處理
4.3 本章小結(jié)
第5章 基于可變滑動(dòng)窗口的不確定數(shù)據(jù)流聚類實(shí)驗(yàn)分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 數(shù)據(jù)流
5.3 評(píng)價(jià)指標(biāo)與參數(shù)設(shè)置
5.4 三種聚類算法比較
5.4.1 聚類純度
5.4.2 距離平方和
5.4.3 聚類處理時(shí)間
5.4.4 內(nèi)存開銷
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 全文總結(jié)
6.2 工作展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)介及讀研期間主要科研成果
【參考文獻(xiàn)】:
期刊論文
[1]基于合并分層聚類的網(wǎng)絡(luò)拓?fù)渫茢嗨惴╗J]. 張潤(rùn)生,李艷斌,李嘯天. 電子學(xué)報(bào). 2013(12)
[2]一種基于滑動(dòng)窗口的不確定數(shù)據(jù)流聚類算法[J]. 朱娟芳,霍歡,徐亞,奚金金,彭敦陸,高麗萍. 信息技術(shù). 2013(04)
[3]不確定性數(shù)據(jù)管理技術(shù)研究綜述[J]. 周傲英,金澈清,王國(guó)仁,李建中. 計(jì)算機(jī)學(xué)報(bào). 2009(01)
[4]聚類有效性評(píng)價(jià)綜述[J]. 楊燕,靳蕃,KAMEL Mohamed. 計(jì)算機(jī)應(yīng)用研究. 2008(06)
[5]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇. 軟件學(xué)報(bào). 2008(01)
本文編號(hào):3184960
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3184960.html
最近更新
教材專著