天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于拉丁美洲國(guó)家數(shù)據(jù)的高維多元可視分析

發(fā)布時(shí)間:2021-09-06 10:43
  國(guó)家的研究涉及復(fù)雜數(shù)據(jù),設(shè)計(jì)一個(gè)可視化系統(tǒng)進(jìn)行國(guó)家研究具有重要意義。本文基于世界銀行關(guān)于拉丁美洲及加勒比地區(qū)17個(gè)國(guó)家19602016年期間1441項(xiàng)數(shù)據(jù),研究高維多元數(shù)據(jù)的可視化方法,設(shè)計(jì)了國(guó)家可視分析模型和可視分析系統(tǒng)。本文的主要工作主要體現(xiàn)在以下三個(gè)方面:1.對(duì)拉丁美洲國(guó)家數(shù)據(jù)的屬性的多層次特征進(jìn)行構(gòu)建。高維多元數(shù)據(jù)屬性過(guò)多,會(huì)造成人工篩選任務(wù)負(fù)擔(dān)過(guò)重的問(wèn)題,因此,利用文本分類對(duì)數(shù)據(jù)集的屬性進(jìn)行層次構(gòu)建,方便用戶快速篩選數(shù)據(jù)子集同時(shí)提供數(shù)據(jù)整個(gè)維度的概覽。2.對(duì)拉丁美洲國(guó)家數(shù)據(jù)進(jìn)行維度空間探索模型構(gòu)建。針對(duì)高維數(shù)據(jù)中蘊(yùn)含重要信息且會(huì)被無(wú)關(guān)信息干擾的問(wèn)題,同時(shí)從屬性和數(shù)據(jù)對(duì)象兩個(gè)角度完成對(duì)數(shù)據(jù)維度空間的探尋。首先,利用基于子空間聚類的高維多元數(shù)據(jù)處理的3種方法(特征選擇、子空間探索、子空間聚類算法)相結(jié)合的方式從屬性的角度來(lái)分析拉丁美洲國(guó)家數(shù)據(jù)。采用特征選擇方法在原始維度空間選擇出合適的特征子集后,利用子空間聚類算法對(duì)特征子集進(jìn)行分組成簇,再將子空間探索方法結(jié)合可視分析來(lái)輔助用戶發(fā)現(xiàn)新的興趣子空間。接著在重構(gòu)的局部子空間中從數(shù)據(jù)對(duì)象的角度,利用基于密度峰值的快... 

【文章來(lái)源】:西南科技大學(xué)四川省

【文章頁(yè)數(shù)】:58 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于拉丁美洲國(guó)家數(shù)據(jù)的高維多元可視分析


基于子空間聚類的高維多元數(shù)據(jù)可視過(guò)程

數(shù)據(jù)分布,二維空間,數(shù)據(jù)分布,樣本點(diǎn)


相關(guān)理論11=min:>()(2-4)計(jì)算出樣本點(diǎn)密度ρ和與最近的較高密度點(diǎn)的距離δ兩個(gè)參數(shù)后,以樣本點(diǎn)密度ρ為y軸,距離δ為x軸畫(huà)出決策圖,如圖2-2(a)所示。該算法中,具有較大局部密度和高局部密度距離δ兩個(gè)特征的樣本點(diǎn)為聚類中心。在決策圖2-2(a)中,1和10兩個(gè)樣本點(diǎn)為聚類中心。高局部密度距離δ較大,但局部密度卻很小的樣本點(diǎn)被認(rèn)為是離散點(diǎn),在圖2-2(a)的離散點(diǎn)為28、26和27三個(gè)樣本點(diǎn)。數(shù)據(jù)在二維空間的分布特征如圖2-2(b)所示,離散點(diǎn)明顯也是28、26和27三個(gè)樣本點(diǎn),其他的樣本點(diǎn)則以離簇中心最近的距離進(jìn)行分類。如圖2-2(b)所示,觀察到原始數(shù)據(jù)圍繞已知的兩個(gè)聚類中心1和10分布,最后被分成了兩類。圖2-2決策圖和二維空間的數(shù)據(jù)分布Figure2-2Decisiongraphanddatadistributionintwo-dimensionalspace

拉丁美洲,國(guó)家,數(shù)據(jù)


西南科技大學(xué)碩士學(xué)位論文123拉丁美洲國(guó)家數(shù)據(jù)的多層次特征模型構(gòu)建3.1數(shù)據(jù)介紹拉丁美洲國(guó)家數(shù)據(jù)是典型的高維多元數(shù)據(jù),故用其作為本文研究的基礎(chǔ)數(shù)據(jù)。該數(shù)據(jù)來(lái)源于WorldBank,可從其中獲取世界各國(guó)的發(fā)展數(shù)據(jù)和指標(biāo),是各研究員研究特定問(wèn)題獲取數(shù)據(jù)的主要方式之一。從WorldBank中獲得的拉丁美洲國(guó)家數(shù)據(jù)是拉丁美洲研究員分析研究拉丁美洲具體問(wèn)題的主要數(shù)據(jù),該數(shù)據(jù)中包含了1960~2016年這個(gè)時(shí)間段內(nèi)拉丁美洲及加勒比地區(qū)17個(gè)國(guó)家的數(shù)據(jù),其中每個(gè)國(guó)家有1441個(gè)屬性,例如:農(nóng)業(yè)機(jī)械數(shù)量、國(guó)外直接投資(BoP,現(xiàn)價(jià)美元)、在職兒童比例等國(guó)家數(shù)據(jù)多個(gè)方面的屬性。其數(shù)據(jù)結(jié)構(gòu)如表3-1所示。表3-1拉丁美洲國(guó)家數(shù)據(jù)結(jié)構(gòu)表Table3-1DatastructureofLatinAmericancountries字段描述樣例countryname國(guó)家名稱“Argentina”Year年份“1960”Attribute_id屬性名稱“Agriculturalmachinery,tractors”Attribute_value屬性值“5200”拉丁美洲國(guó)家數(shù)據(jù)集部分?jǐn)?shù)據(jù)如圖3-1所示:圖3-1部分拉丁美洲國(guó)家數(shù)據(jù)Figure3-1DataforsomeLatinAmericancountries

【參考文獻(xiàn)】:
期刊論文
[1]基于子空間聚類的高維數(shù)據(jù)可視分析方法綜述[J]. 田帥,陳誼.  計(jì)算機(jī)工程與應(yīng)用. 2018(13)
[2]一種基于維度投影的多維數(shù)據(jù)相關(guān)性可視分析方法[J]. 陳誼,張聰.  計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2018(04)
[3]多維視角下的拉美貧困及扶貧政策[J]. 吳孫沛璟,趙雪梅.  拉丁美洲研究. 2016(03)
[4]拉美一體化的多層次發(fā)展及其效應(yīng)[J]. 蒲俜.  拉丁美洲研究. 2016(03)
[5]可視化驅(qū)動(dòng)的交互式數(shù)據(jù)挖掘方法綜述[J]. 馬昱欣,曹震東,陳為.  計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2016(01)
[6]巴西城市化進(jìn)程及其啟示[J]. 吳國(guó)平,武小琦.  拉丁美洲研究. 2014(02)
[7]數(shù)據(jù)降維方法分析與研究[J]. 吳曉婷,閆德勤.  計(jì)算機(jī)應(yīng)用研究. 2009(08)
[8]一種改進(jìn)的基于VSM的文本分類算法[J]. 張彰,樊孝忠.  計(jì)算機(jī)工程與設(shè)計(jì). 2006(21)

博士論文
[1]高維數(shù)據(jù)的降維理論及應(yīng)用[D]. 譚璐.國(guó)防科學(xué)技術(shù)大學(xué) 2005



本文編號(hào):3387311

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3387311.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶89965***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com