天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 營銷論文 >

多尺度聚類挖掘方法

發(fā)布時間:2017-06-14 22:13

  本文關鍵詞:多尺度聚類挖掘方法,由筆耕文化傳播整理發(fā)布。


【摘要】:聚類挖掘是數(shù)據(jù)挖掘研究領域的一個重要研究分支,在語音識別、圖像分割、市場營銷、金融保險、電子商務等諸多領域廣泛應用。聚類挖掘的實質是旨在將樣本集按其自身屬性聚成若干類,以保證類內樣本相似度盡可能高,而類間樣本相似度盡可能低。多尺度聚類是典型的跨學科課題,其本質是利用聚類技術多尺度、多層次地剖析研究客體的客觀構成,研究尺度轉換引起的尺度效應現(xiàn)象和各尺度間的函數(shù)關系。多尺度理論已在聚類挖掘領域取得了可觀的進展,提出了一些多尺度聚類挖掘的理論和方法,但研究多局限于空間、圖像數(shù)據(jù),限制了多尺度科學在聚類技術上的應用和推廣。論文結合多尺度科學與聚類挖掘各自領域特點,進一步研究面向一般數(shù)據(jù)集的多尺度理論與多尺度聚類挖掘方法。在聚類挖掘領域引入多尺度科學的相關理論與方法,提出以概念分層為基準的廣義尺度定義,分析尺度轉換和尺度效應實質,構建多尺度聚類挖掘系統(tǒng)結構,最終形成多尺度聚類挖掘理論體系;以多尺度聚類挖掘理論與方法為指導思想,結合無偏最優(yōu)估計的克里格方法,提出多尺度聚類挖掘的尺度上推挖掘算法和尺度下推挖掘算法,實現(xiàn)數(shù)據(jù)聚類的多尺度化;最后,提出基于信息熵的多尺度聚類尺度轉換結果評價指標,為最終的多尺度聚類挖掘結果提供了理論和方法支持。本文立足聚類挖掘,借助多尺度科學理論,探索構建多尺度聚類挖掘理論體系,研究多尺度聚類尺度轉換方法以及尺度轉換結果評價指標。主要研究內容包括以下幾個方面:1)探討構建多尺度聚類挖掘理論體系傳統(tǒng)的聚類挖掘未對數(shù)據(jù)的多尺度特性進行深入研究,并且已有的多尺度聚類挖掘理論和方法多局限于空間、圖像數(shù)據(jù)。針對存在的問題,從多尺度數(shù)據(jù)集、尺度轉換、尺度效應和多尺度聚類挖掘系統(tǒng)結構四個方面研究多尺度聚類挖掘理論體系。首先,提出基于概念分層的數(shù)據(jù)尺度、尺度劃分和多尺度數(shù)據(jù)集以及多尺度數(shù)據(jù)集之間祖孫、父子、兄弟和上下層關系的定義,確立理論基礎;其次,分析多尺度聚類挖掘核心——尺度轉換的定義、原因、分類和途徑;再次,歸納多尺度聚類尺度效應的定義及其影響;最后,在傳統(tǒng)數(shù)據(jù)挖掘過程的基礎上,提出多尺度聚類挖掘系統(tǒng)結構,為多尺度聚類的后續(xù)研究提供理論支撐和實現(xiàn)思路。2)提出多尺度聚類挖掘算法多尺度聚類挖掘理論體系為尺度轉換提供了理論基礎,結合尺度轉換過程,構造多尺度聚類挖掘算法框架;分析克里格法可用于一般數(shù)據(jù)集的本質;通過分析目前地學、圖像學、生物學等學科較為成熟的尺度轉換方法思想,基于塊狀克里格法BK(Block Kriging)提出多尺度聚類挖掘尺度上推算法MSCSUA(Multi-Scale Clustering Scaling Up Algorithm),并基于回歸面到點克里格法ATPRK(Area To Point Regression Kriging)提出多尺度聚類挖掘尺度下推算法MSCSDA(Multi-Scale Clustering Scaling Down Algorithm)。算法實現(xiàn)了聚類挖掘知識的多尺度化,與傳統(tǒng)聚類算法直接在目標尺度進行聚類的結果進行比對,并對算法的正確性和可行性進行分析。3)提出多尺度聚類有效性指標多尺度聚類有效性指標是對多尺度聚類尺度上推和下推結果的定量評估,是對尺度轉換算法直觀的分析評價。論文結合多尺度領域尺度轉換精度評價指標和聚類有效性指標,引入信息熵度量不同聚類有效性指標下聚類結果尺度效應的不確定程度,并將信息熵結果歸一化后作為各聚類有效性指標的權重,加權集成得到多尺度聚類有效性指標MSCVI(Multi-Scale Clustering Validity Index),以便更好地適于不同實際應用。4)驗證多尺度聚類挖掘算法和多尺度聚類有效性指標針對提出的多尺度聚類挖掘算法及多尺度聚類有效性指標應用于多個UCI公用數(shù)據(jù)集和真實數(shù)據(jù)H省全員人口數(shù)據(jù)進行測試分析。實驗結果表明本文算法相比傳統(tǒng)聚類算法正確率高,運行時間短,是可行的聚類算法;本文有效性指標也較傳統(tǒng)聚類有效性指標正確率有較大提升,對高維數(shù)據(jù)集也表現(xiàn)出良好的評價效果。
【關鍵詞】:多尺度聚類挖掘 尺度轉換 尺度效應 克里格法 信息熵
【學位授予單位】:河北師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.13
【目錄】:
  • 摘要4-6
  • Abstract6-12
  • 1 緒論12-19
  • 1.1 選題背景及研究意義12-13
  • 1.2 國內外研究現(xiàn)狀13-16
  • 1.2.1 聚類挖掘13-14
  • 1.2.2 多尺度聚類挖掘14-15
  • 1.2.3 尺度轉換15-16
  • 1.3 論文主要研究內容16-18
  • 1.4 論文組織與結構18-19
  • 2 聚類挖掘19-36
  • 2.1 聚類數(shù)據(jù)挖掘19-22
  • 2.1.1 聚類挖掘定義19-20
  • 2.1.2 類內相似性度量20-21
  • 2.1.3 類間距離測度21-22
  • 2.2 聚類算法與分類22-30
  • 2.2.1 基于劃分的聚類挖掘算法24-25
  • 2.2.2 基于層次的聚類挖掘算法25-27
  • 2.2.3 基于密度的聚類挖掘算法27-28
  • 2.2.4 基于網(wǎng)格的聚類挖掘算法28-29
  • 2.2.5 其它聚類挖掘算法29-30
  • 2.3 聚類算法衡量標準及比較30-31
  • 2.4 聚類有效性評價31-35
  • 2.4.1 外部評價指標32-33
  • 2.4.2 內部評價指標33-34
  • 2.4.3 相對評價指標34
  • 2.4.4 模糊評價指標34-35
  • 2.5 本章小結35-36
  • 3 多尺度聚類挖掘理論36-47
  • 3.1 尺度與多尺度數(shù)據(jù)集36-39
  • 3.1.1 尺度36-37
  • 3.1.2 尺度劃分37-38
  • 3.1.3 多尺度數(shù)據(jù)集38-39
  • 3.2 尺度轉換39-42
  • 3.2.1 多尺度聚類尺度轉換定義40
  • 3.2.2 尺度轉換原因40
  • 3.2.3 尺度轉換分類40-41
  • 3.2.4 尺度轉換途徑41-42
  • 3.3 尺度效應42
  • 3.4 多尺度聚類挖掘系統(tǒng)結構42-46
  • 3.4.1 數(shù)據(jù)預處理44
  • 3.4.2 構建多尺度數(shù)據(jù)集44
  • 3.4.3 基準尺度聚類挖掘44-45
  • 3.4.4 尺度轉換45
  • 3.4.5 模式評估45
  • 3.4.6 可視化表示45-46
  • 3.5 本章小結46-47
  • 4 多尺度聚類挖掘算法47-64
  • 4.1 多尺度聚類挖掘算法框架47-48
  • 4.2 克里格法可用于一般數(shù)據(jù)集的本質48-49
  • 4.3 多尺度聚類尺度上推算法MSCSUA49-52
  • 4.3.1 塊狀克里格法BK50-51
  • 4.3.2 MSCSUA算法實現(xiàn)51-52
  • 4.4 多尺度聚類尺度下推算法MSCSDA52-56
  • 4.4.1 回歸面到點克里格法ATPRK52-56
  • 4.4.2 MSCSDA算法步驟56
  • 4.5 實驗分析與驗證56-63
  • 4.5.1 實驗數(shù)據(jù)集57
  • 4.5.2 聚類評價指標57-58
  • 4.5.3 尺度上推實驗分析58-61
  • 4.5.4 尺度下推實驗分析61-63
  • 4.6 本章小結63-64
  • 5 多尺度聚類有效性指標64-73
  • 5.1 信息熵65
  • 5.2 多尺度聚類有效性指標MSCVI65-68
  • 5.2.1 Xie_Beni有效性指標XB66
  • 5.2.2 S.H.Kown有效性指標VK66-67
  • 5.2.3 Rezaee.M有效性指標VW67
  • 5.2.4 Sun.H有效性指標PBMF67-68
  • 5.2.5 MSCVI68
  • 5.3 實驗分析與驗證68-72
  • 5.3.1 實驗數(shù)據(jù)集69
  • 5.3.2 實驗結果分析69-72
  • 5.4 本章小結72-73
  • 6 總結與展望73-76
  • 6.1 總結73-75
  • 6.2 展望75-76
  • 參考文獻76-84
  • 致謝84-85
  • 攻讀學位期間取得的科研成果清單85

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 李勇;王新穎;;聚類挖掘在電子商務中的應用[J];商場現(xiàn)代化;2007年25期

2 時念云;孔靜;;基于語義和領域相關的聚類挖掘方法研究[J];微計算機應用;2008年11期

3 劉洪偉;石雅強;梁周揚;肖岳;;面向聚類挖掘的局部旋轉擾動隱私保護算法[J];廣東工業(yè)大學學報;2012年03期

4 陳平;宋玉蓉;蔣國平;;基于多維聚類挖掘的異常檢測方法研究[J];計算機技術與發(fā)展;2012年07期

5 張文華;王新穎;;聚類挖掘在遠程教育中的應用[J];唐山師范學院學報;2007年05期

6 王新穎;王向麗;張文華;;基于關聯(lián)規(guī)則的聚類挖掘在遠程教育中的應用[J];現(xiàn)代遠距離教育;2008年04期

7 關莉莉;;銀行卡客戶群體聚類挖掘研究[J];微計算機信息;2008年30期

8 韓存鴿;;聚類挖掘在高校圖書館管理系統(tǒng)中的應用[J];重慶理工大學學報(自然科學);2012年11期

9 王東;羅可;;基于變異粒子群的聚類挖掘[J];計算機工程與應用;2011年21期

10 尹云飛,鐘智;一種聚類挖掘軟件數(shù)據(jù)的方法[J];河南科技大學學報(自然科學版);2004年02期

中國重要會議論文全文數(shù)據(jù)庫 前2條

1 張德輝;唐世渭;楊冬青;馬秀莉;姜力爭;;一種在OLAP中保持聚類挖掘結果的有效方法[A];第二十四屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2007年

2 金妮;;一種基于數(shù)據(jù)倉庫和OLAP技術的聚類挖掘系統(tǒng)[A];中國儀器儀表學會第九屆青年學術會議論文集[C];2007年

中國博士學位論文全文數(shù)據(jù)庫 前2條

1 熊文;基于群智的特征選擇、分類與聚類挖掘的研究[D];北京郵電大學;2010年

2 劉兵;時間序列與聚類挖掘相關技術研究[D];復旦大學;2006年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 王玉雷;面向大數(shù)據(jù)的聚類挖掘算法研究[D];南京郵電大學;2015年

2 韓玉輝;多尺度聚類挖掘方法[D];河北師范大學;2016年

3 李雄;面向大數(shù)據(jù)的聚類挖掘算法研究[D];南京郵電大學;2014年

4 劉宇;基于云計算的聚類挖掘算法及其應用研究[D];南京郵電大學;2014年

5 江哲雅;聚類挖掘在電信客戶分類中的研究與應用[D];上海交通大學;2013年

6 董瑋;可視化空間聚類挖掘算法的研究與應用[D];吉林農(nóng)業(yè)大學;2012年

7 徐鵬;零售業(yè)顧客忠誠度的模型研究與聚類挖掘[D];大連交通大學;2008年

8 蘇東海;基于加權向量提升的多尺度聚類挖掘算法[D];河北師范大學;2014年

9 管明君;Ramsey理論在聚類挖掘中的應用研究及實現(xiàn)[D];云南大學;2014年

10 顏小林;基于本體的Web頁面聚類挖掘[D];太原理工大學;2007年


  本文關鍵詞:多尺度聚類挖掘方法,由筆耕文化傳播整理發(fā)布。

,

本文編號:450693

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/450693.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶c675c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com