基于增量高斯混合模型的在線密度估計研究
本文關(guān)鍵詞:基于增量高斯混合模型的在線密度估計研究
更多相關(guān)文章: 密度估計 高斯混合模型 增量學習 自組織增量學習神經(jīng)網(wǎng)絡(luò)
【摘要】:密度估計是統(tǒng)計推斷中的經(jīng)典問題,一組數(shù)據(jù)背后的概率密度函數(shù)反映了其在特征空間上的分布情況,能夠為數(shù)據(jù)驅(qū)動的決策過程提供非常重要的信息。在聚類、異常檢測以及可視化領(lǐng)域中,密度估計算法有著非常廣泛的應(yīng)用。隨著移動互聯(lián)網(wǎng)、社交媒體等新興模式的快速發(fā)展,流式大數(shù)據(jù)正普遍成為數(shù)據(jù)挖掘與分析的對象,其實時性、易失性、突發(fā)性、無序性、無限性的特點使得在線密度估計成為了必要。傳統(tǒng)的密度估計算法,無論是參數(shù)式還是非參數(shù)式方法都無法在這樣的情形下直接應(yīng)用。參數(shù)式的算法適合進行在線化任務(wù),但是表達能力有限;非參數(shù)式算法具有更加廣泛的表達能力,但是往往時間和空間復(fù)雜度較高,而且需要保存所有歷史數(shù)據(jù),無法處理大規(guī)模的數(shù)據(jù)流。因此,需要能夠把兩者的優(yōu)點結(jié)合起來的新方法以達到在線密度估計的需求。本文從自組織增量學習神經(jīng)網(wǎng)絡(luò)(SOINN)的增量學習框架出發(fā),通過分析其學習算法,指出其與高斯混合模型之間的密切關(guān)系;诖擞^察提出了一種對流式大數(shù)據(jù)進行在線密度估計的增量高斯混合模型LAIM,同現(xiàn)有的在線式和離線式密度估計算法分別進行了對比實驗和分析討論。本文的主要工作有以下三點:1.對密度估計這一問題和常用的算法進行了分類總結(jié),并梳理了參數(shù)式方法和非參數(shù)式方法各自的優(yōu)缺點;2.介紹了自組織增量學習神經(jīng)網(wǎng)絡(luò)(SOINN),通過對其學習算法的分析指出其本質(zhì)上是一種高斯混合模型的增量化實現(xiàn),這使得它能夠進行在線密度估計,而且以較低的模型復(fù)雜度取得非參數(shù)式方法的靈活性;3.為學習局部復(fù)雜的密度分布的同時加速算法收斂的速度,在SOINN增量學習的結(jié)構(gòu)上提出了基于局部參數(shù)更新策略的在線密度估計算法LAIM(Local Adaptive and Inremental gaussian Mixture),該模型通過將每次迭代的過程限制在一個局部區(qū)域,能夠增量式地學習數(shù)據(jù)流中變化的密度分布,同時不破壞先前已經(jīng)學習到的有效信息。實驗表明,無論是在人造數(shù)據(jù)還是真實數(shù)據(jù)集上,LAIM都比同類型的在線密度估計算法取得了更好的密度估計結(jié)果,在許多情況下能夠取得與復(fù)雜度更高的批處理算法相當?shù)慕Y(jié)果。
【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP181
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 夏威;單洪明;;采用密度估計進行物體計數(shù)[J];計算機科學與探索;2013年11期
2 楊華;蘇航;鄭世寶;;大規(guī)模群體密度估計算法[J];電視技術(shù);2010年05期
3 衷路生;宋執(zhí)環(huán);;基于自適應(yīng)密度估計的系統(tǒng)參數(shù)辨識[J];控制理論與應(yīng)用;2007年05期
4 洪英漢;陳平華;劉竹松;熊建斌;;基于物聯(lián)網(wǎng)人流圖像匹配的密度估計方法[J];計算機仿真;2013年06期
5 陳斌;李斌;馮愛民;潘志松;;基于支撐域的單分類器和密度估計的本質(zhì)關(guān)系(英文)[J];Transactions of Nanjing University of Aeronautics & Astronautics;2008年04期
6 魏云華;;計算數(shù)據(jù)流上的小波密度估計[J];計算機應(yīng)用與軟件;2006年12期
7 徐慶,孫濟洲,段忠毅;面向撞擊點的密度估計全局光照算法[J];天津大學學報;2000年06期
8 趙平,劉貴忠,趙春;基于Riesz基的含噪聲密度估計[J];電子學報;2004年10期
9 趙峰;張軍英;劉敬;梁軍利;;基于Gamma-SLC混合密度估計的雷達目標識別[J];系統(tǒng)工程與電子技術(shù);2008年03期
10 趙春暉;李曉慧;田明華;;采用主成分量化和密度估計期望最大聚類的高光譜異常目標檢測[J];光子學報;2013年10期
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 牛君;基于非參數(shù)密度估計點樣本分析建模的應(yīng)用研究[D];山東大學;2007年
中國碩士學位論文全文數(shù)據(jù)庫 前9條
1 邱天宇;基于增量高斯混合模型的在線密度估計研究[D];南京大學;2016年
2 王媛媛;大型廣場視頻的人流密度估計技術(shù)研究[D];南京郵電大學;2011年
3 石磊;兩種密度估計方法的比較[D];東北師范大學;2010年
4 王天啟;強混合樣本下邊緣頻率插值密度估計的漸近性質(zhì)[D];廣西師范大學;2014年
5 宮賀;視頻中物體密度估計技術(shù)研究[D];北方工業(yè)大學;2015年
6 黃守勇;基于多小波的密度估計及其應(yīng)用研究[D];北京化工大學;2015年
7 辛勇;基于快速擁阻密度估計的布局優(yōu)化[D];上海交通大學;2006年
8 梁丹;相依序列下頻率插值密度估計的漸近性質(zhì)[D];廣西師范大學;2012年
9 朱干江;非參數(shù)密度估計在判別分析中的應(yīng)用[D];南京信息工程大學;2007年
,本文編號:1178890
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1178890.html