基于懲罰高斯混合模型的高維數(shù)據(jù)聚類分析
本文關(guān)鍵詞:基于懲罰高斯混合模型的高維數(shù)據(jù)聚類分析,由筆耕文化傳播整理發(fā)布。
【摘要】:高維小樣本數(shù)據(jù)的聚類分析有著廣泛的應(yīng)用背景。本文假設(shè)數(shù)據(jù)來自高斯混合模型,通過對該類模型施加懲罰函數(shù),實現(xiàn)變量選擇及聚類分析。我們選取了三種關(guān)于均值參數(shù)的懲罰函數(shù):L_1-懲罰、Adaptive-L_1-懲罰、Adaptive-分層-懲罰,對應(yīng)的模型分別記為L_1-GMM、Adaptive-L_1-GMM、Adaptive-H-GMM。模型確立后,我們首先利用Gap Statistics對聚類個數(shù)進行估計,然后利用EM算法對模型中(s)kp,(s)kpm,(s)ps三組參數(shù)進行估計,在此過程中通過kpm的值可判斷第p變量是否為信息變量,同時將改進的BIC作為模型選擇準則,實現(xiàn)對懲罰系數(shù)l的選擇。模型的有效性通過模擬數(shù)據(jù)及基因表達數(shù)據(jù)實驗得以檢驗。對模擬數(shù)據(jù)集,三種模型效果良好,聚類情況與原數(shù)據(jù)一致,并且正確選擇出了非信息變量。對基因表達數(shù)據(jù)集,三種模型效果不一,Adaptive-H-GMM模型最終在300個變量中選擇出了14個信息變量,有效地減少了計算量和復(fù)雜度,聚類錯誤率為4/72,效果較好。
【關(guān)鍵詞】:Gap Statistics BIC 變量選擇 Adaptive-H-GMM模型
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:O212.1
【目錄】:
- 摘要3-4
- Abstract4-7
- 第一章 緒論7-11
- 1.1 研究背景7
- 1.2 國內(nèi)外研究現(xiàn)狀7-9
- 1.3 研究方向與思路9
- 1.4 本文的主要工作和結(jié)構(gòu)安排9-11
- 第二章 基于懲罰高斯混合模型的聚類11-19
- 2.1 標準的基于高斯混合模型的聚類11-14
- 2.1.1 基本模型11-12
- 2.1.2 參數(shù)估計12-14
- 2.1.3 模型小結(jié)14
- 2.2 基于懲罰高斯混合模型的聚類14-18
- 2.2.1 函數(shù)形式14-15
- 2.2.2 懲罰函數(shù)15
- 2.2.3 L_1-GMM模型參數(shù)估計15-16
- 2.2.4 Adaptive-L_1-GMM模型參數(shù)估計16-17
- 2.2.5 Adaptive-H-GMM模型參數(shù)估計17-18
- 2.3 本章小結(jié)18-19
- 第三章 模型選擇19-22
- 3.1 聚類個數(shù)的估計19-20
- 3.2 模型選擇20-22
- 第四章 模擬數(shù)據(jù)實驗22-28
- 4.1 數(shù)據(jù)模擬22
- 4.2 結(jié)果及分析22-28
- 4.2.1 估計聚類個數(shù)22-24
- 4.2.2 模型選擇24-26
- 4.2.3 模型總結(jié)26-28
- 第五章 基因表達數(shù)據(jù)實驗28-34
- 5.1 基因表達數(shù)據(jù)聚類分析簡述28-29
- 5.2 結(jié)果及分析29-34
- 5.2.1 估計聚類個數(shù)29-30
- 5.2.2 模型選擇30-32
- 5.2.3 模型總結(jié)32-34
- 第六章 總結(jié)與展望34-36
- 6.1 本文總結(jié)34-35
- 6.2 進一步的工作35-36
- 參考文獻36-38
- 致謝38
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李偉超;林國;管濤;;高斯混合模型在錯誤隱藏技術(shù)中的應(yīng)用[J];實驗室研究與探索;2012年06期
2 張欽禮;王士同;譚左平;;二型Takagi-Sugeno-Kang模糊模型和不確定高斯混合模型的等價性[J];控制理論與應(yīng)用;2009年02期
3 余鵬;童行偉;封舉富;;基于最大懲罰似然的高斯混合模型無監(jiān)督分類研究[J];應(yīng)用概率統(tǒng)計;2008年05期
4 向晶;周紹光;陳超;;基于改進高斯混合模型的遙感影像道路提取[J];測繪工程;2014年03期
5 何非;張學(xué)杰;;一種基于高斯混合模型的實時色彩轉(zhuǎn)換算法[J];云南大學(xué)學(xué)報(自然科學(xué)版);2009年S1期
6 余鵬,封舉富,童行偉;一種新的基于高斯混合模型的紋理圖像分割方法[J];武漢大學(xué)學(xué)報(信息科學(xué)版);2005年06期
7 石玉;;基于懲罰高斯混合模型的微陣列基因表達數(shù)據(jù)分析[J];中山大學(xué)學(xué)報(自然科學(xué)版);2009年03期
8 蘭志剛;靳衛(wèi)衛(wèi);朱明亮;于新生;國建鳳;周振濤;李凱寶;;基于高斯混合模型的海冰圖像非監(jiān)督聚類分割研究[J];海洋科學(xué);2011年11期
9 胡波;朱谷昌;張遠飛;冷超;;基于高斯混合模型的遙感信息提取方法研究[J];國土資源遙感;2012年04期
10 陶建斌;舒寧;沈照慶;;基于高斯混合模型的遙感影像連續(xù)型樸素貝葉斯網(wǎng)絡(luò)分類器[J];遙感信息;2010年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 駱俊;馬盡文;;高斯混合模型的遺傳分基融合算法[A];第十二屆全國信號處理學(xué)術(shù)年會(CCSP-2005)論文集[C];2005年
2 廖頻;沈理;;基于高斯混合模型的人臉圖象識別研究[A];2001年中國智能自動化會議論文集(上冊)[C];2001年
3 馬盡文;何學(xué)鋒;;高斯混合模型的數(shù)據(jù)尺度可壓縮參數(shù)學(xué)習(xí)算法[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
4 瞿俊;姜青山;董槐林;;基于高斯混合模型的層次聚類算法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2006年
5 蔡念;郭文婷;陳世文;潘晴;;融合高斯混合模型和小波變換的運動目標檢測[A];第十五屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2010年
6 龍艷花;郭武;戴禮榮;;一種應(yīng)用于SVM說話者確認系統(tǒng)的新型序列核[A];第九屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2007年
7 劉李漫;陶文兵;田金文;;融合多高斯混合模型與Graph Cuts優(yōu)化技術(shù)的目標自動檢測方法[A];第十五屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2010年
8 康永國;雙志偉;陶建華;張維;徐波;;高斯混合模型和碼本映射相結(jié)合的語音轉(zhuǎn)換算法[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年
9 應(yīng)冬文;顏永紅;付強;國雁萌;;基于約束高斯混合模型的噪聲功率譜估計[A];2010年通信理論與信號處理學(xué)術(shù)年會論文集[C];2010年
10 唐英干;劉東;關(guān)新平;;基于高斯混合模型的多分辨率圖像分割[A];第十二屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 王益文;復(fù)雜網(wǎng)絡(luò)節(jié)點影響力模型及其應(yīng)用[D];浙江大學(xué);2015年
2 羅林;基于數(shù)據(jù)驅(qū)動的非線性過程故障診斷若干問題研究[D];浙江大學(xué);2015年
3 陳雪峰;圖像高斯混合模型的判別學(xué)習(xí)方法[D];北京理工大學(xué);2009年
4 賴裕平;非高斯混合模型的變分學(xué)習(xí)算法研究[D];北京郵電大學(xué);2014年
5 劉輝;miRNA靶標預(yù)測的系統(tǒng)生物學(xué)方法研究[D];中國礦業(yè)大學(xué);2009年
6 陶建斌;貝葉斯網(wǎng)絡(luò)模型在遙感影像分類中的應(yīng)用方法研究[D];武漢大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 范苗;基于高斯混合模型的時變過程軟測量建模[D];浙江大學(xué);2015年
2 許莉薇;基于高斯混合模型林業(yè)信息文本分類的技術(shù)研究[D];東北林業(yè)大學(xué);2015年
3 車瀅霞;約束條件下的結(jié)構(gòu)化統(tǒng)計聲學(xué)模型及非平行語料語音轉(zhuǎn)換[D];蘇州大學(xué);2015年
4 張曉紅;基于候選生成的貓臉檢測[D];哈爾濱工業(yè)大學(xué);2015年
5 付娜;基于視頻的運動人體行為捕捉算法研究[D];北京理工大學(xué);2015年
6 王炳輝;基于層次貝葉斯自適應(yīng)稀疏的高斯混合模型[D];大連理工大學(xué);2015年
7 邱藤;基于高斯混合模型的EM算法及其應(yīng)用研究[D];電子科技大學(xué);2015年
8 張小林;基于高斯混合模型和非負矩陣分解的復(fù)雜網(wǎng)絡(luò)社區(qū)檢測[D];西安電子科技大學(xué);2014年
9 姚紹芹;基于聲道譜參數(shù)的語音轉(zhuǎn)換算法研究[D];南京郵電大學(xué);2015年
10 閆昊;基于高斯混合模型的文本無關(guān)說話人年齡識別[D];蘇州大學(xué);2015年
本文關(guān)鍵詞:基于懲罰高斯混合模型的高維數(shù)據(jù)聚類分析,由筆耕文化傳播整理發(fā)布。
,本文編號:317113
本文鏈接:http://sikaile.net/kejilunwen/yysx/317113.html