【摘要】:本論文主要研究了多指標面板數(shù)據(jù)系統(tǒng)聚類分析的兩大核心問題:一個是采用何種統(tǒng)計量來測定橫截面?zhèn)體之間的相似程度或者說采用何種相似性指標,即聚類算法的問題;另一個是采用何種具體的系統(tǒng)聚類方法或者說采用何種準則確定類與類之間的相似性,即聚類過程的問題。Bonzo和Hermosilla(2002)提出了用“概率連接函數(shù)”來代替一般的平面距離作為橫截面?zhèn)體間相似性指標,提出了新的聚類算法。與主成分分析法和指標距離進行求和作為橫截面?zhèn)體間相似性指標相比,這種概率連接函數(shù)的方法能夠保留面板數(shù)據(jù)的“概率性結(jié)構(gòu)”。本論文考慮概率連接函數(shù)作為多指標面板數(shù)據(jù)系統(tǒng)聚類的算法,并研究了基于概率連接函數(shù)的系統(tǒng)聚類分析。 本論文首先回顧了Bonzo和Hermosilla(2002)提出的“概率連接函數(shù)”,介紹了概率連接函數(shù)的定義,以及其作為度量多指標面板數(shù)據(jù)中橫截面?zhèn)體間相似性指標所具有的優(yōu)良性質(zhì)。但是,Bonzo和Hermosilla(2002)僅考慮了在同一個類中不同橫截面?zhèn)體間的協(xié)方差矩陣等于其自身的方差矩陣。但是在實際情況中,在同一類中不同橫截面?zhèn)體間的協(xié)方差矩陣不一定就等于其自身的方差矩陣。Zhao和Hang(2010)研究了在整個面板數(shù)據(jù)中橫截面?zhèn)體互不相關(guān)情況下,概率連接函數(shù)的定義及其性質(zhì)。因此,本論文同時也介紹了Zhao和Hang(2010)提出的概率連接函數(shù)。 本論文從更加合理且更加符合實際的一般情況出發(fā)。本論文主要在Bonzo和Hermosilla(2002)以及Zhao和Hang(2010)的研究基礎(chǔ)上,進一步考慮了更加一般情況下的概率連接函數(shù),即在同一類中橫截面?zhèn)體間協(xié)方差矩陣不等于它們自身方差矩陣且橫截面?zhèn)體相關(guān)的情況。本論文主要研究了在該情況下概率連接函數(shù)的定義及其估計,并且進一步分析了在該情況下概率連接函數(shù)的性質(zhì)。在本論文中,研究發(fā)現(xiàn)Zhao和Hang(2010)所研究的橫截面?zhèn)體互不相關(guān)情況只是上述該情況的一個特例而已。 Bonzo和Hermosilla(2002)僅研究了多指標面板聚類的算法即概率連接函數(shù),并沒有進一步研究在該算法基礎(chǔ)上的聚類過程。在研究面板數(shù)據(jù)中橫截面?zhèn)體的分類時,他們沒有結(jié)合多元統(tǒng)計中的系統(tǒng)聚類方法,沒有在已有基礎(chǔ)上提出基于概率連接函數(shù)的多指標面板數(shù)據(jù)系統(tǒng)聚類方法。Zhao和Hang(2010)在研究橫截面?zhèn)體互不相關(guān)情況下的概率連接函數(shù)時,提出了在該情況下基于概率連接函數(shù)的多指標面數(shù)據(jù)重心系統(tǒng)聚類法(簡稱為“重心法”)。因此,本論文也考慮了在橫截面?zhèn)體相關(guān)情況下如何應用概率連接函數(shù)進行系統(tǒng)聚類的問題。本論文將橫截面?zhèn)體相關(guān)的概率連接函數(shù)作為聚類算法,進一.步研究了基于該算法的聚類過程。除了“重心法”外,本論文還提出了在基于概率連接函數(shù)的其他三種系統(tǒng)聚類方法:最短距離法、最長距離法和類平均法。 本論文還對上述基于概率連接函數(shù)的四種系統(tǒng)聚類方法,進行了Monte Carlo模擬研究,比較這四種方法的聚類效果。通過大量的模擬實驗發(fā)現(xiàn):重心法和類平均法在聚類時類的代表性較好,這兩種系統(tǒng)聚類方法在各種情況下聚類效果是穩(wěn)健且有效的,而最短距離法和最長距離法由于在聚類時沒有考慮類中橫截面?zhèn)體數(shù),類的代表性較差,聚類效果不太理想。 本論文最后對2000~2009年我國31個省市城鎮(zhèn)居民家庭平均每人全年消費性支出的面板數(shù)據(jù)進行了實證分析。本論文按照我國城鎮(zhèn)居民消費支出水平的不同,采用重心法對全國31個省市地區(qū)進行了系統(tǒng)聚類分析,聚類的結(jié)果較為滿意,基本與實際情況相符合。本論文同時還考慮了將全國31個省市地區(qū)分為了3個類,而且對這3類地區(qū)的各項目進行一些比較分析。
【學位授予單位】:浙江工商大學
【學位級別】:碩士
【學位授予年份】:2012
【分類號】:F224;F124.7
【參考文獻】
相關(guān)期刊論文 前10條
1 田青;馬健;高鐵梅;;我國城鎮(zhèn)居民消費影響因素的區(qū)域差異分析[J];管理世界;2008年07期
2 王春清;郝黎明;趙小萍;劉文;尹軍;韋新東;;住宅能源消費結(jié)構(gòu)模型的預測研究[J];節(jié)能技術(shù);2006年01期
3 杭斌;申春蘭;;習慣形成下的緩沖儲備行為[J];數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究;2008年10期
4 鄭兵云;;多指標面板數(shù)據(jù)的聚類分析及其應用[J];數(shù)理統(tǒng)計與管理;2008年02期
5 肖澤磊;李幫義;劉思峰;;基于多維面板數(shù)據(jù)的聚類方法探析及實證研究[J];數(shù)理統(tǒng)計與管理;2009年05期
6 趙衛(wèi)亞;中國城鎮(zhèn)居民文教消費的地區(qū)差異分析[J];統(tǒng)計研究;2005年01期
7 樊茂清;任若恩;;我國城鎮(zhèn)居民消費結(jié)構(gòu)的實證研究[J];統(tǒng)計研究;2006年12期
8 朱建平;陳民懇;;面板數(shù)據(jù)的聚類分析及其應用[J];統(tǒng)計研究;2007年04期
9 殷瑞飛;朱建平;;數(shù)據(jù)挖掘中一種新的聚類方法——基于對應分析與因子旋轉(zhuǎn)[J];統(tǒng)計研究;2008年01期
10 魏貴祥;陳小龍;馮怡琳;;我國城鎮(zhèn)居民消費需求分析[J];統(tǒng)計研究;2009年02期
本文編號:
2718166
本文鏈接:http://sikaile.net/jingjilunwen/zhongguojingjilunwen/2718166.html