傳統(tǒng)的聚類算法僅從單一視角對數(shù)據(jù)進(jìn)行分析,并且由于聚類分析缺乏帶有語義的類標(biāo)簽,因此得到的聚類劃分不具有可解釋性。聚類劃分的可解釋性即聚類劃分由決策規(guī)則推理得到,并且聚類劃分可以被定性和定量地描述。多視角的和可解釋的聚類劃分將給決策者提供更多地選擇空間,并且可以使決策者批判性、改善性和探索性地相信和使用聚類劃分。本文針對聚類的多視角性和可解釋性問題,提出多視角生成模型的可解釋性聚類(Interpretable Clustering with Multi-view Generative model,ICMG)。ICMG能夠生成多個(gè)視角,并且基于視角得到多個(gè)有效的和無冗余的聚類劃分,最后通過視角的語義信息對聚類劃分進(jìn)行定性和定量地解釋。本文完成的工作如下:(1)構(gòu)建嵌入多視角因素的貝葉斯案例模型(Muti-view Bayesian Case Model,MBCM)。MBCM是將多視角因素引入到貝葉斯案例模型上的一個(gè)生成模型,MBCM可以生成含有多視角因素的數(shù)據(jù)。(2)構(gòu)建多視角生成模型(Multi-view Generative Model,MGM)。MGM基于有效原則和無冗余原則使用貝葉斯程序?qū)W習(xí)(BPL)的組合思想和MBCM生成多個(gè)有效的無冗余視角,并使用原型和子空間描述視角。(3)提出多視角生成模型的可解釋性聚類(ICMG)。ICMG首先使用MGM得到多個(gè)使用原型和子空間描述的視角;然后利用原型和子空間構(gòu)建規(guī)則集,基于規(guī)則集進(jìn)行聚類;最后使用原型和子空間所附帶的語義信息定性和定量地解釋聚類劃分,進(jìn)而得到有語義的類標(biāo)簽。本文使用多組數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明ICMG能夠得到多種可解釋的聚類劃分并且相比于傳統(tǒng)聚類算法具有較明顯的優(yōu)勢,同時(shí)通過聚類劃分可解釋性的驗(yàn)證實(shí)驗(yàn)表明ICMG得到的聚類劃分比傳統(tǒng)多視角聚類的聚類劃分更易理解。
【學(xué)位授予單位】:鄭州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP311.13
文章目錄
摘要
Abstract
1 緒論
1.1 研究意義與背景
1.2 國內(nèi)外的研究現(xiàn)狀
1.3 本文的主要研究內(nèi)容
1.4 本文的主要貢獻(xiàn)
1.5 論文的結(jié)構(gòu)
1.6 本章小結(jié)
2 相關(guān)知識(shí)
2.1 共軛先驗(yàn)分布
2.2 Gibbs Sampling算法
2.3 基于案例推理的方法
2.4 貝葉斯案例模型
2.5 One-shot學(xué)習(xí)
2.6 貝葉斯程序?qū)W習(xí)算法
2.7 多視角聚類
2.8 本章小結(jié)
3 多視角生成模型的可解釋性聚類
3.1 嵌入多視角因素的貝葉斯案例模型
3.2 多視角生成模型
3.3 多視角生成模型的可解釋性聚類的過程
3.4 多視角生成模型的可解釋性聚類算法
3.4.1 算法的實(shí)現(xiàn)
3.4.2 算法分析
3.4.3 算法的貢獻(xiàn)
3.5 定性和定量解釋聚類劃分的優(yōu)點(diǎn)
3.6 本章小結(jié)
4 實(shí)驗(yàn)
4.1 實(shí)驗(yàn)數(shù)據(jù)集
4.2 實(shí)驗(yàn)設(shè)計(jì)
4.3 實(shí)驗(yàn)結(jié)果及分析
4.3.1 人工數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果及分析
4.3.2 三組UCI數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果及分析
4.3.3 圖像數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果及分析
4.4 ICMG算法與其它多視角算法可解釋性的對比分析
4.5 聚類劃分可解釋性的驗(yàn)證
4.6 本章小結(jié)
5 總結(jié)與下一步工作
5.1 總結(jié)
5.2 下一步工作
參考文獻(xiàn)
個(gè)人簡介
致謝
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 譚顯勝;王志明;譚泗橋;袁哲明;熊興耀;;支持向量回歸可解釋性體系的建立[J];系統(tǒng)仿真學(xué)報(bào);2009年24期
2 王曉蘭;曾賢強(qiáng);王文琰;;一種基于模糊聚類的可解釋性建模方法[J];甘肅科學(xué)學(xué)報(bào);2006年04期
3 閻嶺,鄭洪濤,蔣靜坪;基于進(jìn)化策略生成可解釋性模糊系統(tǒng)[J];電子學(xué)報(bào);2005年01期
4 周國亮;宋亞奇;王桂蘭;朱永利;;狀態(tài)監(jiān)測大數(shù)據(jù)存儲(chǔ)及聚類劃分研究[J];電工技術(shù)學(xué)報(bào);2013年S2期
5 董紅召;史彩霞;陳寧;劉冬旭;;基于關(guān)聯(lián)規(guī)則的公共自行車調(diào)度區(qū)域聚類劃分[J];科技通報(bào);2013年09期
6 周德云;張X;;空戰(zhàn)多目標(biāo)集群攻擊算法研究[J];西北工業(yè)大學(xué)學(xué)報(bào);2009年05期
7 王守強(qiáng);朱大銘;史士英;;基于最小聚類劃分的K-means聚類(1+ε)近似算法[J];計(jì)算機(jī)研究與發(fā)展;2008年S1期
8 劉建剛;唐敦兵;楊春;韓向東;江濤濤;王寧生;;基于物理DSM與行列變換的產(chǎn)品結(jié)構(gòu)聚類劃分[J];系統(tǒng)工程與電子技術(shù);2008年10期
9 黃丹;邱旭民;;AMOI管理模式下產(chǎn)品并行開發(fā)的產(chǎn)品結(jié)構(gòu)聚類劃分研究[J];湖南農(nóng)機(jī);2014年04期
10 王紅軍,陳慶新,陳新,鄭德濤;基于效用分析的客戶聚類方法研究[J];計(jì)算機(jī)集成制造系統(tǒng)-CIMS;2003年03期
相關(guān)碩士學(xué)位論文 前4條
1 潘笑顏;多視角生成模型的可解釋性聚類研究[D];鄭州大學(xué);2017年
2 張佳殨;基于特征選擇聚類方法的模糊系統(tǒng)應(yīng)用與研究[D];江南大學(xué);2016年
3 劉智斌;基于廣義熵的加權(quán)模糊聚類算法研究[D];河北大學(xué);2012年
4 黃清蘭;基于聚類劃分的Web日志關(guān)聯(lián)規(guī)則增量式挖掘方法研究[D];南昌大學(xué);2013年
本文編號(hào):
1364648
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1364648.html