基于Web的機器學(xué)習(xí)可視化系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2022-01-07 15:22
隨著大數(shù)據(jù)時代的來臨,人們每天都在接觸各種各樣的數(shù)據(jù)信息。據(jù)統(tǒng)計,人類從外界獲取的信息約有80%以上都是來自視覺系統(tǒng),良好的可視化更能有效的幫助人們理解數(shù)據(jù)背后隱藏的信息,發(fā)掘出數(shù)據(jù)之間的規(guī)律。但隨著計算機行業(yè)高新技術(shù)的興起,數(shù)據(jù)模型也越來越復(fù)雜多變,因此需要將可視化技術(shù)與機器學(xué)習(xí)技術(shù)相結(jié)合更高效的去處理數(shù)據(jù)。然而目前大多數(shù)的研究者都關(guān)注于機器學(xué)習(xí)算法本身的優(yōu)化,卻忽略了對算法輸出結(jié)果的可視化,無法直觀地看到算法的運行過程。因此本文重點分析了與機器學(xué)習(xí)技術(shù)相關(guān)的三個可視化領(lǐng)域的研究現(xiàn)狀,同時也對國內(nèi)外現(xiàn)有的數(shù)據(jù)可視化工具進行了調(diào)研和對比,發(fā)現(xiàn)目前存在較少的機器學(xué)習(xí)可視化工具。針對以上問題,本文的具體研究工作如下:1.提出了一種基于Web的機器學(xué)習(xí)可視化方案;將機器學(xué)習(xí)技術(shù)與Web前端D3.js可視化技術(shù)進行結(jié)合,同時使用jQuery、JavaScript以及Bootstrap等Web前端技術(shù),對K近鄰算法(KNN)和支持向量機(SVM)算法進行Web前端可視化開發(fā),并實現(xiàn)了Web前端界面實時調(diào)參的功能。2.設(shè)計并實現(xiàn)了一個基于Web的機器學(xué)習(xí)可視化系統(tǒng);給出了機器學(xué)習(xí)可視化系統(tǒng)的總體設(shè)...
【文章來源】:浙江工商大學(xué)浙江省
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
拿破侖進軍莫斯科的事件流圖
41.3.1網(wǎng)絡(luò)或空間數(shù)據(jù)可視化網(wǎng)絡(luò)數(shù)據(jù)可視化是大數(shù)據(jù)領(lǐng)域內(nèi)最常見的研究領(lǐng)域,它可以通過網(wǎng)絡(luò)結(jié)點或者相連的網(wǎng)絡(luò)拓撲關(guān)系有效的展示網(wǎng)絡(luò)中存在的模式關(guān)系,如何對網(wǎng)絡(luò)特性進行可視化[15]也成了近些年研究的熱點。2011年,Gou等人在基于Voronoi圖填充[16]、矩形填充等樹可視化技術(shù)之上,提出了一種TreeNetViz網(wǎng)絡(luò)圖可視化技術(shù),直觀有效的展示了圖結(jié)點之間的關(guān)系。在網(wǎng)絡(luò)或空間數(shù)據(jù)可視化中,聚類和分類也已經(jīng)被廣泛用于識別感興趣的領(lǐng)域。2014年,SeungJinLim[17]提出了一個可視化工具來增強支持向量機的實用性,它提供對每個數(shù)據(jù)點到最佳超平面的距離測量的訪問,此外,還提供特征空間中距離值的分布,支持平移、縮放等交互功能,以此來提高SVM的性能。2015年,F(xiàn)elixBrodkorb[18]等人提出了一種基于時空圖和聚類的質(zhì)量流動動力學(xué)可視化分析方法[19],并開發(fā)出一種基于圖形的方法,稱為MobilityGraphs。如圖1.2所示,它能夠在長時間序列的空間情境中實現(xiàn)運動的時空變化的視覺表示。2018年,王文波等人提出利用可視化改進異構(gòu)信息網(wǎng)絡(luò)的聚類分析[20],使用經(jīng)典的聚類方法Rankclus,使得整個集群的聚類[21]計算過程對用戶來說是透明的,通過可視化結(jié)果,用戶可以根據(jù)需求調(diào)整算法參數(shù),最后通過熱力圖和DOItree[22]兩種可視化技術(shù)來提高可視化質(zhì)量。圖1.2倫敦城市原始地圖圖像的移動圖示例1.3.2時間序列可視化在時間序列數(shù)據(jù)可視化中,一個巨大的挑戰(zhàn)就是在有限的顯示空間上呈現(xiàn)大型數(shù)據(jù)集并且不會過度繪圖。為了解決時空立方體面臨的數(shù)據(jù)集雜亂問題,2012年,Tominski[23]
5等人使用密度圖[24]與散點圖結(jié)合的方式對時空立方體進行優(yōu)化,引入了堆積圖(stackgraph),將二維與三維進行融合,拓展了多維展示空間。在圖1.3時間序列可視化圖中,2015年,JamesWalker等人提出一種有效的方法[25],當(dāng)屏幕分辨率與數(shù)據(jù)相比較小時,將數(shù)據(jù)點聚合成時間段,并創(chuàng)建多焦點縮放線圖的層次結(jié)構(gòu)。同年,YoshihiroOkada等人提出一種基于Web的Time-tunnel可視化方案[26],它可以在Web瀏覽器中呈現(xiàn)時間序列多維數(shù)據(jù)的3D圖表,支持將圖表重疊在一起來查找多個數(shù)據(jù)之間的差異和相似之處,使用遺傳算法優(yōu)化數(shù)據(jù)進行分類,然后將幾個數(shù)據(jù)圖表可視化為一組,此外,用戶還可以通過指定系統(tǒng)生成的URL與其他用戶共享可視化結(jié)果。2016年,PatrickM.J.Dubois等人提出一種用于頻繁模式挖掘的交互式可視化工具分析(icVAT)[27],它使用無方向的圓形布局來顯示頻繁的圖案。此外,它還為用戶提供交互式功能,以明確顯示超集和訪問過的網(wǎng)頁集的子集之間的連接。圖1.3時間序列數(shù)據(jù)可視化示例1.3.3文本數(shù)據(jù)可視化文本信息是當(dāng)前互聯(lián)網(wǎng)領(lǐng)域內(nèi)最重要的信息類型之一,人們在日常生活中接觸最多的信息主要也是以文本形式存在的。在文本數(shù)據(jù)可視化中[28],諸如實體提娶主題識別以及情感分析之類的文本可視化技術(shù)變得至關(guān)重要。因為海量信息使人們處理和理解難度日益增大,傳統(tǒng)的文本分析技術(shù)提取的信息仍然無法滿足人們對信息的獲齲2008年,Hipp[29]等人提出一種基于層次化點排布的投影技術(shù),將一維的文本內(nèi)容通過投影的形式投射到高維空間中,以此來展示文本中的聚類關(guān)系。2012年,Chevalier[30]等人提出
【參考文獻】:
期刊論文
[1]面向文本的標(biāo)簽云可視化度量模型的研究[J]. 馬明明,胡俊. 軟件. 2018(05)
[2]一種三維網(wǎng)絡(luò)GIS空間數(shù)據(jù)可視化方法的研究[J]. 江勇. 北京測繪. 2018(02)
[3]基于QlikView的電網(wǎng)規(guī)劃數(shù)據(jù)集成方法研究[J]. 屈少青,隆輝,王鵬,張超,柳明,韋朦. 湖南電力. 2017(04)
[4]文本數(shù)據(jù)可視化之標(biāo)簽云[J]. 駱逸欣. 電子技術(shù)與軟件工程. 2017(13)
[5]基于標(biāo)簽云系統(tǒng)共現(xiàn)分析的用戶興趣預(yù)測模型[J]. 周樸雄,陳蓓蓉. 情報雜志. 2017(05)
[6]基于eCharts的動態(tài)統(tǒng)計圖表繪制技術(shù)研究[J]. 宋佳慧,劉遠剛,林琳,李紳弘,許帆. 電腦知識與技術(shù). 2017(12)
[7]信息可視化的發(fā)展與思考[J]. 付心儀,劉世霞,徐迎慶. 裝飾. 2017(04)
[8]大數(shù)據(jù)分析技術(shù)發(fā)展迅猛,機遇挑戰(zhàn)并存[J]. 賈焰,周斌. 信息通信技術(shù). 2016(06)
[9]基于SVG/GML的WebGIS空間數(shù)據(jù)可視化模型研究與應(yīng)用[J]. 李心穎,李峰,吳洪麗. 數(shù)字技術(shù)與應(yīng)用. 2016(11)
[10]基于可視化技術(shù)的中國代建制研究綜述[J]. 呂途,戴大雙. 建筑經(jīng)濟. 2016(09)
本文編號:3574784
【文章來源】:浙江工商大學(xué)浙江省
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
拿破侖進軍莫斯科的事件流圖
41.3.1網(wǎng)絡(luò)或空間數(shù)據(jù)可視化網(wǎng)絡(luò)數(shù)據(jù)可視化是大數(shù)據(jù)領(lǐng)域內(nèi)最常見的研究領(lǐng)域,它可以通過網(wǎng)絡(luò)結(jié)點或者相連的網(wǎng)絡(luò)拓撲關(guān)系有效的展示網(wǎng)絡(luò)中存在的模式關(guān)系,如何對網(wǎng)絡(luò)特性進行可視化[15]也成了近些年研究的熱點。2011年,Gou等人在基于Voronoi圖填充[16]、矩形填充等樹可視化技術(shù)之上,提出了一種TreeNetViz網(wǎng)絡(luò)圖可視化技術(shù),直觀有效的展示了圖結(jié)點之間的關(guān)系。在網(wǎng)絡(luò)或空間數(shù)據(jù)可視化中,聚類和分類也已經(jīng)被廣泛用于識別感興趣的領(lǐng)域。2014年,SeungJinLim[17]提出了一個可視化工具來增強支持向量機的實用性,它提供對每個數(shù)據(jù)點到最佳超平面的距離測量的訪問,此外,還提供特征空間中距離值的分布,支持平移、縮放等交互功能,以此來提高SVM的性能。2015年,F(xiàn)elixBrodkorb[18]等人提出了一種基于時空圖和聚類的質(zhì)量流動動力學(xué)可視化分析方法[19],并開發(fā)出一種基于圖形的方法,稱為MobilityGraphs。如圖1.2所示,它能夠在長時間序列的空間情境中實現(xiàn)運動的時空變化的視覺表示。2018年,王文波等人提出利用可視化改進異構(gòu)信息網(wǎng)絡(luò)的聚類分析[20],使用經(jīng)典的聚類方法Rankclus,使得整個集群的聚類[21]計算過程對用戶來說是透明的,通過可視化結(jié)果,用戶可以根據(jù)需求調(diào)整算法參數(shù),最后通過熱力圖和DOItree[22]兩種可視化技術(shù)來提高可視化質(zhì)量。圖1.2倫敦城市原始地圖圖像的移動圖示例1.3.2時間序列可視化在時間序列數(shù)據(jù)可視化中,一個巨大的挑戰(zhàn)就是在有限的顯示空間上呈現(xiàn)大型數(shù)據(jù)集并且不會過度繪圖。為了解決時空立方體面臨的數(shù)據(jù)集雜亂問題,2012年,Tominski[23]
5等人使用密度圖[24]與散點圖結(jié)合的方式對時空立方體進行優(yōu)化,引入了堆積圖(stackgraph),將二維與三維進行融合,拓展了多維展示空間。在圖1.3時間序列可視化圖中,2015年,JamesWalker等人提出一種有效的方法[25],當(dāng)屏幕分辨率與數(shù)據(jù)相比較小時,將數(shù)據(jù)點聚合成時間段,并創(chuàng)建多焦點縮放線圖的層次結(jié)構(gòu)。同年,YoshihiroOkada等人提出一種基于Web的Time-tunnel可視化方案[26],它可以在Web瀏覽器中呈現(xiàn)時間序列多維數(shù)據(jù)的3D圖表,支持將圖表重疊在一起來查找多個數(shù)據(jù)之間的差異和相似之處,使用遺傳算法優(yōu)化數(shù)據(jù)進行分類,然后將幾個數(shù)據(jù)圖表可視化為一組,此外,用戶還可以通過指定系統(tǒng)生成的URL與其他用戶共享可視化結(jié)果。2016年,PatrickM.J.Dubois等人提出一種用于頻繁模式挖掘的交互式可視化工具分析(icVAT)[27],它使用無方向的圓形布局來顯示頻繁的圖案。此外,它還為用戶提供交互式功能,以明確顯示超集和訪問過的網(wǎng)頁集的子集之間的連接。圖1.3時間序列數(shù)據(jù)可視化示例1.3.3文本數(shù)據(jù)可視化文本信息是當(dāng)前互聯(lián)網(wǎng)領(lǐng)域內(nèi)最重要的信息類型之一,人們在日常生活中接觸最多的信息主要也是以文本形式存在的。在文本數(shù)據(jù)可視化中[28],諸如實體提娶主題識別以及情感分析之類的文本可視化技術(shù)變得至關(guān)重要。因為海量信息使人們處理和理解難度日益增大,傳統(tǒng)的文本分析技術(shù)提取的信息仍然無法滿足人們對信息的獲齲2008年,Hipp[29]等人提出一種基于層次化點排布的投影技術(shù),將一維的文本內(nèi)容通過投影的形式投射到高維空間中,以此來展示文本中的聚類關(guān)系。2012年,Chevalier[30]等人提出
【參考文獻】:
期刊論文
[1]面向文本的標(biāo)簽云可視化度量模型的研究[J]. 馬明明,胡俊. 軟件. 2018(05)
[2]一種三維網(wǎng)絡(luò)GIS空間數(shù)據(jù)可視化方法的研究[J]. 江勇. 北京測繪. 2018(02)
[3]基于QlikView的電網(wǎng)規(guī)劃數(shù)據(jù)集成方法研究[J]. 屈少青,隆輝,王鵬,張超,柳明,韋朦. 湖南電力. 2017(04)
[4]文本數(shù)據(jù)可視化之標(biāo)簽云[J]. 駱逸欣. 電子技術(shù)與軟件工程. 2017(13)
[5]基于標(biāo)簽云系統(tǒng)共現(xiàn)分析的用戶興趣預(yù)測模型[J]. 周樸雄,陳蓓蓉. 情報雜志. 2017(05)
[6]基于eCharts的動態(tài)統(tǒng)計圖表繪制技術(shù)研究[J]. 宋佳慧,劉遠剛,林琳,李紳弘,許帆. 電腦知識與技術(shù). 2017(12)
[7]信息可視化的發(fā)展與思考[J]. 付心儀,劉世霞,徐迎慶. 裝飾. 2017(04)
[8]大數(shù)據(jù)分析技術(shù)發(fā)展迅猛,機遇挑戰(zhàn)并存[J]. 賈焰,周斌. 信息通信技術(shù). 2016(06)
[9]基于SVG/GML的WebGIS空間數(shù)據(jù)可視化模型研究與應(yīng)用[J]. 李心穎,李峰,吳洪麗. 數(shù)字技術(shù)與應(yīng)用. 2016(11)
[10]基于可視化技術(shù)的中國代建制研究綜述[J]. 呂途,戴大雙. 建筑經(jīng)濟. 2016(09)
本文編號:3574784
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3574784.html
最近更新
教材專著