區(qū)間值數據的概率處理方法
發(fā)布時間:2017-07-15 17:08
本文關鍵詞:區(qū)間值數據的概率處理方法
更多相關文章: 區(qū)間值數據 概率 差異性度量 回歸 聚類
【摘要】:隨著計算機和互聯(lián)網技術的高速發(fā)展,人們采集和處理的數據格式越來越豐富。對于常見的實數數據已有大量研究工作,而相對來說區(qū)間值數據的研究比較少。區(qū)間值數據在多變量分析,模式識別,數據挖掘,控制等多領域有著廣泛的應用。區(qū)間值數據與實數數據不同的地方在于用一個區(qū)間范圍表示一個特征值,而不是一個精確值,這決定了其本身包含不確定性。因此,與實數數據相比,區(qū)間值數據需要特殊的處理。隨機事件在自然界廣泛存在。區(qū)間值數據的一大來源也是源于未觀察到的隨機變量。概率論是一門比較成熟的學科,有大量的技術和理論支持,也適用于對不確定性進行建模。因此,本文從區(qū)間值數據本身的不確定性特點出發(fā),嘗試用概率模型對區(qū)間值進行處理,解釋了概率模型對應的現(xiàn)實基礎,并改造和提出了一些適用于區(qū)間值的差異性度量和回歸,聚類算法。本文的研究成果主要如下:1).給出了兩個例子說明用概率模型處理區(qū)間值的合理性。把區(qū)間映射到一定的分布函數上,并在其基礎上定義了3個差異性度量,證明了它們的一些性質。2).在概率模型基礎上,結合區(qū)間值不確定性的特點,提出了應用于區(qū)間值數據的回歸算法,包括:多變量線性回歸和核回歸算法。3).基于新的聚類目標函數,提出了一種新的應用于區(qū)間值數據的聚類算法,此算法同樣也適用于實數數據,并且證明了算法的收斂性。
【關鍵詞】:區(qū)間值數據 概率 差異性度量 回歸 聚類
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP311.13;O212.1
【目錄】:
- 摘要4-5
- Abstract5-10
- 第1章 緒論10-14
- 1.1 區(qū)間值信息系統(tǒng)的研究背景10-12
- 1.2 本文的主要內容12-14
- 1.2.1 本文的主要研究內容12-13
- 1.2.2 本文結構安排13-14
- 第2章 區(qū)間值數據相關技術綜述14-19
- 2.1 區(qū)間值差異性度量14-15
- 2.2 區(qū)間值聚類算法15-16
- 2.3 區(qū)間值PCA算法16-17
- 2.4 區(qū)間值特征選擇17-18
- 2.5 本章小結18-19
- 第3章 區(qū)間值數據的概率模型19-26
- 3.1 區(qū)間值概率解釋的例子19-21
- 3.2 兩個常用的分布21-22
- 3.3 區(qū)間值數據差異性度量22-23
- 3.4 基于概率模型的區(qū)間值差異性度量23-25
- 3.5 本章小結25-26
- 第4章 區(qū)間值數據多變量回歸26-33
- 4.1 線性回歸簡介26-27
- 4.2 區(qū)間值線性回歸模型27-29
- 4.2.1 權回歸27-28
- 4.2.2 帶懲罰回歸28-29
- 4.2.3 隨機期望回歸29
- 4.3 核回歸29-30
- 4.4 區(qū)間值核回歸算法30-32
- 4.5 本章小結32-33
- 第5章 區(qū)間數據聚類33-42
- 5.1 聚類簡介33-34
- 5.2 bucketKmeans算法34-41
- 5.2.1 概率密度估計34-36
- 5.2.2 區(qū)間值直方圖估計36
- 5.2.3 bucketKmeans36-39
- 5.2.4 bucketKmeans收斂性證明39-41
- 5.3 本章小結41-42
- 第6章 實驗結果與分析42-56
- 6.1 區(qū)間值回歸算法實驗結果42-48
- 6.2 區(qū)間值聚類實驗結果48-54
- 6.3 本章小結54-56
- 第7章 總結與展望56-58
- 7.1 總結56
- 7.2 展望56-58
- 參考文獻58-62
- 附錄62-64
- 致謝64
【參考文獻】
中國期刊全文數據庫 前2條
1 徐澤水,達慶利;區(qū)間型多屬性決策的一種新方法[J];東南大學學報(自然科學版);2003年04期
2 徐澤水;;區(qū)間直覺模糊信息的集成方法及其在決策中的應用[J];控制與決策;2007年02期
,本文編號:544864
本文鏈接:http://sikaile.net/kejilunwen/yysx/544864.html