模糊多準(zhǔn)則決策在大數(shù)據(jù)聚類(lèi)分析中的應(yīng)用與研究
發(fā)布時(shí)間:2021-07-17 20:37
大數(shù)據(jù)聚類(lèi)分析是目前大數(shù)據(jù)處理中的非常重要的一環(huán),聚類(lèi)分析就是把屬性相似的數(shù)據(jù)元素分到一起,不相似的盡可能分開(kāi)。同一種聚類(lèi)算法處理不同數(shù)據(jù)集的效果可能是不盡相同的,有的甚至差別很大。目前有很多關(guān)于聚類(lèi)算法的改進(jìn)或者并行化的研究,但是針對(duì)某一數(shù)據(jù)集的聚類(lèi)算法選擇或者k值選擇的問(wèn)題,研究的相對(duì)較少。本文主要研究針對(duì)某一數(shù)據(jù)集的最優(yōu)聚類(lèi)算法和最佳聚類(lèi)數(shù)目,數(shù)據(jù)集可以是普通數(shù)據(jù)集和大數(shù)據(jù)集。關(guān)于普通數(shù)據(jù)集的算法選擇問(wèn)題,需要先對(duì)部分經(jīng)典聚類(lèi)算法進(jìn)行綜合比較分析,分別包括基于劃分、層次、密度以及模型的聚類(lèi)算法等;本文選擇多種聚類(lèi)外部評(píng)價(jià)指標(biāo)對(duì)算法質(zhì)量進(jìn)行驗(yàn)證,將這些評(píng)價(jià)數(shù)據(jù)組成決策矩陣,并用多準(zhǔn)則決策模型處理矩陣。對(duì)于聚類(lèi)算法的k值選擇,文章選取部分內(nèi)部有效性評(píng)價(jià)指標(biāo),然后選取不同的k值組成決策矩陣,使用多準(zhǔn)則決策模型處理矩陣。要構(gòu)建模糊多準(zhǔn)則決策模型,首先要確定多種不同的權(quán)重確定法,主要包括主觀、客觀和綜合權(quán)重確定方法;另外還有模糊數(shù)中的語(yǔ)言術(shù)語(yǔ)集和直覺(jué)模糊集,這些可以用來(lái)表示不確定信息;語(yǔ)言術(shù)語(yǔ)集可以針對(duì)聚類(lèi)算法的具體特點(diǎn)賦予不同的評(píng)價(jià)值,組成主觀權(quán)重。還有目前較為流行的多準(zhǔn)則決策方法,比如...
【文章來(lái)源】:齊魯工業(yè)大學(xué)山東省
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景
1.2 研究目的及意義
1.3 研究現(xiàn)狀
1.3.1 聚類(lèi)算法和評(píng)價(jià)研究現(xiàn)狀
1.3.2 模糊多準(zhǔn)則決策的研究現(xiàn)狀
1.4 創(chuàng)新點(diǎn)和技術(shù)方案分析
1.4.1 主要?jiǎng)?chuàng)新點(diǎn)及研究?jī)?nèi)容
1.4.2 技術(shù)方案分析
第2章 聚類(lèi)分析相關(guān)理論
2.1 聚類(lèi)分析的概念
2.1.1 聚類(lèi)算法的概念
2.1.2 大數(shù)據(jù)的相關(guān)概念
2.2 聚類(lèi)算法的分類(lèi)
2.3 聚類(lèi)算法比較分析
2.4 聚類(lèi)有效性評(píng)價(jià)方法
2.4.1 外部有效性評(píng)價(jià)
2.4.2 內(nèi)部有效性評(píng)價(jià)
2.5 本章總結(jié)
第3章 模糊多準(zhǔn)則決策方法
3.1 多準(zhǔn)則決策的概念
3.2 模糊集的概念
3.3 MSM算子簡(jiǎn)介
3.3.1 MSM算子
3.3.2 加權(quán)MSM算子
3.3.3 直覺(jué)模糊加權(quán)MSM算子
3.4 權(quán)重計(jì)算方法
3.4.1 客觀權(quán)重計(jì)算
3.4.2 主觀權(quán)重計(jì)算
3.4.3 綜合權(quán)重計(jì)算
3.5 多準(zhǔn)則決策模型
3.6 本章總結(jié)
第4章 基于模糊多準(zhǔn)則決策的最優(yōu)聚類(lèi)選擇方法
4.1 最優(yōu)聚類(lèi)選擇模型
4.2 模糊多準(zhǔn)則決策
4.2.1 多準(zhǔn)則決策模塊
4.2.2 模糊數(shù)的轉(zhuǎn)換
4.2.3 語(yǔ)言術(shù)語(yǔ)模塊
4.3 最優(yōu)聚類(lèi)和K值選擇方法
4.3.1 最優(yōu)聚類(lèi)選擇方法
4.3.2 K值選擇方法
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 最優(yōu)聚類(lèi)算法選擇
4.4.2 最優(yōu)聚類(lèi)k值選擇
4.5 本章總結(jié)
第5章 基于模糊多準(zhǔn)則決策的大數(shù)據(jù)聚類(lèi)算法比較研究
5.1 基于大數(shù)據(jù)平臺(tái)的k-means算法改進(jìn)
5.1.1 Spark大數(shù)據(jù)平臺(tái)簡(jiǎn)介
5.1.2 改進(jìn)的k-means算法及其并行化
5.2 基于模糊多準(zhǔn)則決策的算法比較方法
5.3 實(shí)驗(yàn)結(jié)果與分析
5.3.1 實(shí)驗(yàn)平臺(tái)搭建
5.3.2 實(shí)驗(yàn)結(jié)果分析
5.3.3 算法比較
5.4 本章總結(jié)
第6章 總結(jié)與展望
參考文獻(xiàn)
致謝
在學(xué)期間主要科研成果
一、發(fā)表學(xué)術(shù)論文
二、申請(qǐng)發(fā)明專(zhuān)利
三、參加項(xiàng)目
【參考文獻(xiàn)】:
期刊論文
[1]基于Spark的K-means改進(jìn)算法的并行化實(shí)現(xiàn)[J]. 宋董飛,徐華. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(04)
[2]基于猶豫模糊語(yǔ)言術(shù)語(yǔ)的供應(yīng)商多準(zhǔn)則群決策研究[J]. 彭建剛,夏光. 工業(yè)工程. 2018(01)
[3]基于數(shù)據(jù)特性的Spark任務(wù)性能優(yōu)化[J]. 柴寧,吳毅堅(jiān),趙文耘. 計(jì)算機(jī)應(yīng)用與軟件. 2018(01)
[4]K-means算法最佳聚類(lèi)數(shù)評(píng)價(jià)指標(biāo)研究[J]. 郭靖,侯蘇. 軟件導(dǎo)刊. 2017(11)
[5]基于數(shù)據(jù)約減的聚類(lèi)有效性分析[J]. 于曉,李晨,王亞茹. 傳感器與微系統(tǒng). 2017(03)
[6]一種基于聚類(lèi)分析與熵權(quán)模糊評(píng)價(jià)的虛擬企業(yè)綜合決策算法研究[J]. 王妮,孫建民,李凱,于天彪,張?zhí)烊? 工業(yè)工程與管理. 2016(03)
[7]基于Spark框架的聚類(lèi)算法研究[J]. 陳虹君. 電腦知識(shí)與技術(shù). 2015(04)
[8]基于網(wǎng)格最小生成樹(shù)的聚類(lèi)算法選擇[J]. 李翔宇,王開(kāi)軍,郭躬德. 模式識(shí)別與人工智能. 2013(01)
[9]基于屬性加權(quán)的改進(jìn)K-Means算法[J]. 陳東,皮德常. 電腦知識(shí)與技術(shù). 2009(09)
[10]組合賦權(quán)法新探[J]. 曾憲報(bào). 預(yù)測(cè). 1997(05)
博士論文
[1]基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評(píng)估與應(yīng)用[D]. 鄔文帥.電子科技大學(xué) 2015
[2]基于多目標(biāo)決策的數(shù)據(jù)挖掘模型選擇研究[D]. 王國(guó)勛.電子科技大學(xué) 2013
[3]基于模糊多屬性決策的企業(yè)信息化水平評(píng)價(jià)方法與應(yīng)用研究[D]. 劉培德.北京交通大學(xué) 2010
碩士論文
[1]基于Spark的機(jī)器學(xué)習(xí)模型分析與研究[D]. 侯敬儒.昆明理工大學(xué) 2017
[2]基于Spark平臺(tái)的CURE算法并行化設(shè)計(jì)與應(yīng)用[D]. 邱榮財(cái).華南理工大學(xué) 2014
本文編號(hào):3288876
【文章來(lái)源】:齊魯工業(yè)大學(xué)山東省
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景
1.2 研究目的及意義
1.3 研究現(xiàn)狀
1.3.1 聚類(lèi)算法和評(píng)價(jià)研究現(xiàn)狀
1.3.2 模糊多準(zhǔn)則決策的研究現(xiàn)狀
1.4 創(chuàng)新點(diǎn)和技術(shù)方案分析
1.4.1 主要?jiǎng)?chuàng)新點(diǎn)及研究?jī)?nèi)容
1.4.2 技術(shù)方案分析
第2章 聚類(lèi)分析相關(guān)理論
2.1 聚類(lèi)分析的概念
2.1.1 聚類(lèi)算法的概念
2.1.2 大數(shù)據(jù)的相關(guān)概念
2.2 聚類(lèi)算法的分類(lèi)
2.3 聚類(lèi)算法比較分析
2.4 聚類(lèi)有效性評(píng)價(jià)方法
2.4.1 外部有效性評(píng)價(jià)
2.4.2 內(nèi)部有效性評(píng)價(jià)
2.5 本章總結(jié)
第3章 模糊多準(zhǔn)則決策方法
3.1 多準(zhǔn)則決策的概念
3.2 模糊集的概念
3.3 MSM算子簡(jiǎn)介
3.3.1 MSM算子
3.3.2 加權(quán)MSM算子
3.3.3 直覺(jué)模糊加權(quán)MSM算子
3.4 權(quán)重計(jì)算方法
3.4.1 客觀權(quán)重計(jì)算
3.4.2 主觀權(quán)重計(jì)算
3.4.3 綜合權(quán)重計(jì)算
3.5 多準(zhǔn)則決策模型
3.6 本章總結(jié)
第4章 基于模糊多準(zhǔn)則決策的最優(yōu)聚類(lèi)選擇方法
4.1 最優(yōu)聚類(lèi)選擇模型
4.2 模糊多準(zhǔn)則決策
4.2.1 多準(zhǔn)則決策模塊
4.2.2 模糊數(shù)的轉(zhuǎn)換
4.2.3 語(yǔ)言術(shù)語(yǔ)模塊
4.3 最優(yōu)聚類(lèi)和K值選擇方法
4.3.1 最優(yōu)聚類(lèi)選擇方法
4.3.2 K值選擇方法
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 最優(yōu)聚類(lèi)算法選擇
4.4.2 最優(yōu)聚類(lèi)k值選擇
4.5 本章總結(jié)
第5章 基于模糊多準(zhǔn)則決策的大數(shù)據(jù)聚類(lèi)算法比較研究
5.1 基于大數(shù)據(jù)平臺(tái)的k-means算法改進(jìn)
5.1.1 Spark大數(shù)據(jù)平臺(tái)簡(jiǎn)介
5.1.2 改進(jìn)的k-means算法及其并行化
5.2 基于模糊多準(zhǔn)則決策的算法比較方法
5.3 實(shí)驗(yàn)結(jié)果與分析
5.3.1 實(shí)驗(yàn)平臺(tái)搭建
5.3.2 實(shí)驗(yàn)結(jié)果分析
5.3.3 算法比較
5.4 本章總結(jié)
第6章 總結(jié)與展望
參考文獻(xiàn)
致謝
在學(xué)期間主要科研成果
一、發(fā)表學(xué)術(shù)論文
二、申請(qǐng)發(fā)明專(zhuān)利
三、參加項(xiàng)目
【參考文獻(xiàn)】:
期刊論文
[1]基于Spark的K-means改進(jìn)算法的并行化實(shí)現(xiàn)[J]. 宋董飛,徐華. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(04)
[2]基于猶豫模糊語(yǔ)言術(shù)語(yǔ)的供應(yīng)商多準(zhǔn)則群決策研究[J]. 彭建剛,夏光. 工業(yè)工程. 2018(01)
[3]基于數(shù)據(jù)特性的Spark任務(wù)性能優(yōu)化[J]. 柴寧,吳毅堅(jiān),趙文耘. 計(jì)算機(jī)應(yīng)用與軟件. 2018(01)
[4]K-means算法最佳聚類(lèi)數(shù)評(píng)價(jià)指標(biāo)研究[J]. 郭靖,侯蘇. 軟件導(dǎo)刊. 2017(11)
[5]基于數(shù)據(jù)約減的聚類(lèi)有效性分析[J]. 于曉,李晨,王亞茹. 傳感器與微系統(tǒng). 2017(03)
[6]一種基于聚類(lèi)分析與熵權(quán)模糊評(píng)價(jià)的虛擬企業(yè)綜合決策算法研究[J]. 王妮,孫建民,李凱,于天彪,張?zhí)烊? 工業(yè)工程與管理. 2016(03)
[7]基于Spark框架的聚類(lèi)算法研究[J]. 陳虹君. 電腦知識(shí)與技術(shù). 2015(04)
[8]基于網(wǎng)格最小生成樹(shù)的聚類(lèi)算法選擇[J]. 李翔宇,王開(kāi)軍,郭躬德. 模式識(shí)別與人工智能. 2013(01)
[9]基于屬性加權(quán)的改進(jìn)K-Means算法[J]. 陳東,皮德常. 電腦知識(shí)與技術(shù). 2009(09)
[10]組合賦權(quán)法新探[J]. 曾憲報(bào). 預(yù)測(cè). 1997(05)
博士論文
[1]基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評(píng)估與應(yīng)用[D]. 鄔文帥.電子科技大學(xué) 2015
[2]基于多目標(biāo)決策的數(shù)據(jù)挖掘模型選擇研究[D]. 王國(guó)勛.電子科技大學(xué) 2013
[3]基于模糊多屬性決策的企業(yè)信息化水平評(píng)價(jià)方法與應(yīng)用研究[D]. 劉培德.北京交通大學(xué) 2010
碩士論文
[1]基于Spark的機(jī)器學(xué)習(xí)模型分析與研究[D]. 侯敬儒.昆明理工大學(xué) 2017
[2]基于Spark平臺(tái)的CURE算法并行化設(shè)計(jì)與應(yīng)用[D]. 邱榮財(cái).華南理工大學(xué) 2014
本文編號(hào):3288876
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3288876.html
最近更新
教材專(zhuān)著