多指標(biāo)面板數(shù)據(jù)聚類方法研究及其實證分析
發(fā)布時間:2022-01-28 02:20
當(dāng)今世界是一個數(shù)據(jù)爆炸的大數(shù)據(jù)時代,隨著信息技術(shù)的空前發(fā)展,海量的數(shù)據(jù)成為最有價值的財富。聚類作為數(shù)據(jù)挖掘的一種常用技術(shù)手段,廣泛應(yīng)用于數(shù)據(jù)分析過程的各個環(huán)節(jié)。面板數(shù)據(jù)(Panel Data)又稱時間序列-截面數(shù)據(jù),因兼具多種數(shù)據(jù)特性而被廣泛采用。相較于單一結(jié)構(gòu)的數(shù)據(jù),面板數(shù)據(jù)的特殊數(shù)據(jù)結(jié)構(gòu)除可提供更多信息外,還能體現(xiàn)數(shù)據(jù)的動態(tài)性。聚類的兩個關(guān)鍵步驟在于樣本相似度的表征及聚類算法的選擇,面板數(shù)據(jù)三維結(jié)構(gòu)的動態(tài)性和復(fù)雜性導(dǎo)致聚類過程中樣本間與類間的相似性均難以測度;诖吮尘,本文從相似性統(tǒng)計量設(shè)計角度入手研究,提出了兩種適用于多指標(biāo)面板數(shù)據(jù)的聚類方法,實證結(jié)果顯示兩種方法都能有效地完成對研究對象的聚類,且對面板數(shù)據(jù)的特征提取角度各有側(cè)重。本文的研究內(nèi)容可概括為如下幾個方面:(1)概述了面板數(shù)據(jù)聚類方法的研究背景、發(fā)展歷程及研究現(xiàn)狀,總結(jié)了現(xiàn)有方法中存在的一些不足之處及可優(yōu)化的地方,并在此基礎(chǔ)上給出了本文的研究內(nèi)容、創(chuàng)新點及技術(shù)路線。(2)剖析了面板數(shù)據(jù)的結(jié)構(gòu),詳細地闡述了面板數(shù)據(jù)聚類模型構(gòu)建過程中涉及到的數(shù)據(jù)處理方法原理及計算步驟,具體方法包括主成分分析法、熵權(quán)法、時間序列數(shù)據(jù)的符號化...
【文章來源】:桂林理工大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
實證分析數(shù)據(jù)處理路線圖
桂林理工大學(xué)碩士學(xué)位論文37圖5.1基于綜合趨勢距離的聚類樹形圖綜合考慮碎石圖和實際研究問題背景,聚類數(shù)目選六個較為合適,聚類結(jié)果見表5.9。表5.9基于綜合趨勢距離的34個地區(qū)聚類結(jié)果類別地區(qū)數(shù)量第一類西藏自治區(qū)1第二類吉林盛江西盛甘肅盛河北盛寧夏回族自治區(qū)、山西盛黑龍江盛河南盛貴州盛青海盛新疆維吾爾自治區(qū)11第三類遼寧省1第四類天津市、福建盛江蘇盛重慶市4第五類北京市、浙江盛廣東盛上海市4第六類內(nèi)蒙古自治區(qū)、山東盛安徽盛湖北盛陜西盛海南盛湖南盛四川盛廣西壯族自治區(qū)、云南省10聚類分析本身是一種無監(jiān)督的學(xué)習(xí)過程。為驗證聚類結(jié)果的合理性,利用MATLAB軟件編寫繪圖程序繪制出各類地區(qū)的綜合得分趨勢圖,見圖5.2。
桂林理工大學(xué)碩士學(xué)位論文38圖5.2基于綜合趨勢距離的2002-2012年各類地區(qū)的綜合得分趨勢圖5.1.5基于歐式距離的面板數(shù)據(jù)聚類結(jié)果通過歐氏距離計算省際間的距離矩陣,為保證對比的客觀性同樣用ward法完成聚類,聚類結(jié)果見表5.10。表5.10基于歐氏距離的31個地區(qū)聚類結(jié)果類別地區(qū)數(shù)量第一類西藏自治區(qū)1第二類內(nèi)蒙古自治區(qū)、山東盛安徽盛遼寧盛湖北盛陜西盛海南盛湖南盛四川盛廣西壯族自治區(qū)、云南省11第三類上海市1第四類北京市、浙江盛廣東盛3第五類吉林盛江西盛甘肅盛河北盛寧夏回族自治區(qū)、山西盛黑龍江盛河南盛貴州盛青海盛新疆維吾爾自治區(qū)11第六類天津市、福建盛江蘇盛重慶市4根據(jù)聚類結(jié)果可繪制出的基于歐氏距離的綜合得分趨勢圖,見圖5.3。
【參考文獻】:
期刊論文
[1]基于小波特征提取的高頻面板數(shù)據(jù)聚類方法[J]. 戴大洋,鄧光明. 統(tǒng)計與信息論壇. 2018(02)
[2]基于灰關(guān)聯(lián)度的面板數(shù)據(jù)聚類方法及在空氣污染分析中的應(yīng)用[J]. 黨耀國,朱曉月,丁松,王俊杰. 控制與決策. 2017(12)
[3]面板數(shù)據(jù)加權(quán)聚類分析方法研究[J]. 張立軍,彭浩. 統(tǒng)計與信息論壇. 2017(04)
[4]基于數(shù)值符號和形態(tài)特征的時間序列相似性度量方法[J]. 李海林,梁葉. 控制與決策. 2017(03)
[5]非線性面板數(shù)據(jù)聚類方法研究[J]. 孫艷,黃詠寧. 統(tǒng)計與信息論壇. 2017(02)
[6]多元時間序列相似性度量方法[J]. 李正欣,郭建勝,毛紅保,高楊軍. 控制與決策. 2017(02)
[7]基于動態(tài)時間規(guī)整的面板數(shù)據(jù)聚類方法研究及應(yīng)用[J]. 劉云霞. 統(tǒng)計研究. 2016(11)
[8]基于特征提取的多指標(biāo)面板數(shù)據(jù)聚類方法[J]. 黨耀國,侯荻青. 統(tǒng)計與決策. 2016(19)
[9]面板數(shù)據(jù)的灰色矩陣相似關(guān)聯(lián)模型及其應(yīng)用[J]. 崔立志,劉思峰. 中國管理科學(xué). 2015(11)
[10]面板數(shù)據(jù)下的灰色指標(biāo)關(guān)聯(lián)聚類模型與應(yīng)用[J]. 李雪梅,黨耀國,王俊杰. 控制與決策. 2015(08)
碩士論文
[1]房地產(chǎn)投資與經(jīng)濟波動的相互影響問題研究[D]. 劉章生.江西師范大學(xué) 2012
[2]面板數(shù)據(jù)的灰色聚類方法研究及應(yīng)用[D]. 趙潔玨.南京航空航天大學(xué) 2012
[3]面板數(shù)據(jù)的灰色關(guān)聯(lián)與聚類模型構(gòu)建及應(yīng)用[D]. 穆森.南京航空航天大學(xué) 2012
本文編號:3613506
【文章來源】:桂林理工大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
實證分析數(shù)據(jù)處理路線圖
桂林理工大學(xué)碩士學(xué)位論文37圖5.1基于綜合趨勢距離的聚類樹形圖綜合考慮碎石圖和實際研究問題背景,聚類數(shù)目選六個較為合適,聚類結(jié)果見表5.9。表5.9基于綜合趨勢距離的34個地區(qū)聚類結(jié)果類別地區(qū)數(shù)量第一類西藏自治區(qū)1第二類吉林盛江西盛甘肅盛河北盛寧夏回族自治區(qū)、山西盛黑龍江盛河南盛貴州盛青海盛新疆維吾爾自治區(qū)11第三類遼寧省1第四類天津市、福建盛江蘇盛重慶市4第五類北京市、浙江盛廣東盛上海市4第六類內(nèi)蒙古自治區(qū)、山東盛安徽盛湖北盛陜西盛海南盛湖南盛四川盛廣西壯族自治區(qū)、云南省10聚類分析本身是一種無監(jiān)督的學(xué)習(xí)過程。為驗證聚類結(jié)果的合理性,利用MATLAB軟件編寫繪圖程序繪制出各類地區(qū)的綜合得分趨勢圖,見圖5.2。
桂林理工大學(xué)碩士學(xué)位論文38圖5.2基于綜合趨勢距離的2002-2012年各類地區(qū)的綜合得分趨勢圖5.1.5基于歐式距離的面板數(shù)據(jù)聚類結(jié)果通過歐氏距離計算省際間的距離矩陣,為保證對比的客觀性同樣用ward法完成聚類,聚類結(jié)果見表5.10。表5.10基于歐氏距離的31個地區(qū)聚類結(jié)果類別地區(qū)數(shù)量第一類西藏自治區(qū)1第二類內(nèi)蒙古自治區(qū)、山東盛安徽盛遼寧盛湖北盛陜西盛海南盛湖南盛四川盛廣西壯族自治區(qū)、云南省11第三類上海市1第四類北京市、浙江盛廣東盛3第五類吉林盛江西盛甘肅盛河北盛寧夏回族自治區(qū)、山西盛黑龍江盛河南盛貴州盛青海盛新疆維吾爾自治區(qū)11第六類天津市、福建盛江蘇盛重慶市4根據(jù)聚類結(jié)果可繪制出的基于歐氏距離的綜合得分趨勢圖,見圖5.3。
【參考文獻】:
期刊論文
[1]基于小波特征提取的高頻面板數(shù)據(jù)聚類方法[J]. 戴大洋,鄧光明. 統(tǒng)計與信息論壇. 2018(02)
[2]基于灰關(guān)聯(lián)度的面板數(shù)據(jù)聚類方法及在空氣污染分析中的應(yīng)用[J]. 黨耀國,朱曉月,丁松,王俊杰. 控制與決策. 2017(12)
[3]面板數(shù)據(jù)加權(quán)聚類分析方法研究[J]. 張立軍,彭浩. 統(tǒng)計與信息論壇. 2017(04)
[4]基于數(shù)值符號和形態(tài)特征的時間序列相似性度量方法[J]. 李海林,梁葉. 控制與決策. 2017(03)
[5]非線性面板數(shù)據(jù)聚類方法研究[J]. 孫艷,黃詠寧. 統(tǒng)計與信息論壇. 2017(02)
[6]多元時間序列相似性度量方法[J]. 李正欣,郭建勝,毛紅保,高楊軍. 控制與決策. 2017(02)
[7]基于動態(tài)時間規(guī)整的面板數(shù)據(jù)聚類方法研究及應(yīng)用[J]. 劉云霞. 統(tǒng)計研究. 2016(11)
[8]基于特征提取的多指標(biāo)面板數(shù)據(jù)聚類方法[J]. 黨耀國,侯荻青. 統(tǒng)計與決策. 2016(19)
[9]面板數(shù)據(jù)的灰色矩陣相似關(guān)聯(lián)模型及其應(yīng)用[J]. 崔立志,劉思峰. 中國管理科學(xué). 2015(11)
[10]面板數(shù)據(jù)下的灰色指標(biāo)關(guān)聯(lián)聚類模型與應(yīng)用[J]. 李雪梅,黨耀國,王俊杰. 控制與決策. 2015(08)
碩士論文
[1]房地產(chǎn)投資與經(jīng)濟波動的相互影響問題研究[D]. 劉章生.江西師范大學(xué) 2012
[2]面板數(shù)據(jù)的灰色聚類方法研究及應(yīng)用[D]. 趙潔玨.南京航空航天大學(xué) 2012
[3]面板數(shù)據(jù)的灰色關(guān)聯(lián)與聚類模型構(gòu)建及應(yīng)用[D]. 穆森.南京航空航天大學(xué) 2012
本文編號:3613506
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3613506.html
最近更新
教材專著