基于聚類算法的標(biāo)準(zhǔn)化K12教育在線平臺(tái)關(guān)鍵技術(shù)研究
【圖文】:
第 2 章 聚類分析數(shù)據(jù)挖掘算法分析我們會(huì)給出衡量數(shù)據(jù)點(diǎn)之間相似度定義的函數(shù)。接著進(jìn)行聚類和分組。步驟 6:數(shù)據(jù)評(píng)估按照步驟 5 的做法,,當(dāng)我們?cè)跀?shù)據(jù)集上采用一定的算法,得到聚類結(jié)果的時(shí)候,我們需要對(duì)聚類的結(jié)果進(jìn)行評(píng)估,評(píng)估的任務(wù)主要包括估計(jì)聚類趨勢(shì)、確實(shí)數(shù)據(jù)集中的簇?cái)?shù)、測(cè)定聚類質(zhì)量。對(duì)于聚類趨勢(shì),我們之前提到的霍普金斯統(tǒng)計(jì)量在我們的算法中將得以體現(xiàn)。2.4 聚類分析的分類聚類分析經(jīng)過(guò)長(zhǎng)期的發(fā)展,隨著科技的發(fā)展,大量的科研人員加入到了聚類算法的研究之中,獲得了海量的實(shí)驗(yàn)成果。目前依然不能對(duì)聚類算法做出一個(gè)簡(jiǎn)潔的分類,好多的聚類算法在效率和思想上是比較重疊的,但是根據(jù)文獻(xiàn)提供的資料,本文把聚類算法分為以下幾類:
圖 4-1 雙聚類輸出結(jié)果截圖其中第一行的內(nèi)容為該矩陣包含的行數(shù),包含的列數(shù),以及包含均方殘差,第二行我們輸出的是具體包含了一些列,第三行我們包含了那些的行。每發(fā)現(xiàn)的雙簇,雙聚類的輸出的格式,很有利于我觀察分類的結(jié)果。 值代表的是波動(dòng)性的判定標(biāo)準(zhǔn), 值的值和矩陣的大小有很大的關(guān)系,當(dāng) 50 簇時(shí)候, 值與矩陣存在如下的關(guān)系:表 4.1 值與矩陣關(guān)系表 300 280 260 240 220矩陣平均值 2200 2000 1800 1600 12005 實(shí)現(xiàn)驗(yàn)證與應(yīng)用對(duì)于 K12 平臺(tái)而言,能夠應(yīng)用雙聚類技術(shù),發(fā)掘潛在的價(jià)值,滿足用戶在過(guò)程中可能遇到的問(wèn)題,是一項(xiàng)非常復(fù)雜的工作,現(xiàn)在我們就數(shù)據(jù)集 yeast 行實(shí)驗(yàn),數(shù)據(jù)中每一行代表的的是基因在不同條件下的表達(dá)水平,一共有 2基因,在對(duì)數(shù)據(jù)進(jìn)行挖掘之前,我們用 log(ratio)進(jìn)行數(shù)據(jù)的歸一化處理,使
【學(xué)位授予單位】:西華師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:G434;TP311.13
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李仕偉;周坤;楊艷秋;李寶林;;大數(shù)據(jù)挖掘技術(shù)在在線教育平臺(tái)中的應(yīng)用淺析[J];信息通信;2016年09期
2 李仕偉;周坤;劉新蕊;李寶林;;MySQL數(shù)據(jù)庫(kù)優(yōu)化技術(shù)[J];信息與電腦(理論版);2016年12期
3 周芳芳;高飛;劉勇剛;梁興;趙穎;;基于密度-距離圖的交互式體數(shù)據(jù)分類方法[J];軟件學(xué)報(bào);2016年05期
4 張士豪;顧益軍;張俊豪;;基于用戶聚類的熱門微博分類研究[J];信息網(wǎng)絡(luò)安全;2015年07期
5 楊震;王來(lái)濤;賴英旭;;基于改進(jìn)語(yǔ)義距離的網(wǎng)絡(luò)評(píng)論聚類研究[J];軟件學(xué)報(bào);2014年12期
6 周濤;陸惠玲;;數(shù)據(jù)挖掘中聚類算法研究進(jìn)展[J];計(jì)算機(jī)工程與應(yīng)用;2012年12期
7 顧洪博;;基于k-means算法的k值優(yōu)化的研究與應(yīng)用[J];海南大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年04期
8 龍真真;張策;劉飛裔;張正文;;一種改進(jìn)的Chameleon算法[J];計(jì)算機(jī)工程;2009年20期
9 汪強(qiáng);;軟件體系結(jié)構(gòu)研究[J];電腦知識(shí)與技術(shù);2008年35期
10 孫吉貴;劉杰;趙連宇;;聚類算法研究[J];軟件學(xué)報(bào);2008年01期
相關(guān)碩士學(xué)位論文 前10條
1 王洪巖;MOOC中的學(xué)習(xí)行為挖掘研究[D];山東大學(xué);2016年
2 李錄峰;基于Web信息的數(shù)據(jù)挖掘[D];天津大學(xué);2014年
3 吳細(xì)花;“智慧校園”云平臺(tái)的關(guān)鍵模塊設(shè)計(jì)與實(shí)現(xiàn)[D];湖南大學(xué);2014年
4 劉暢;云環(huán)境下虛擬機(jī)異常的多屬性分析[D];大連理工大學(xué);2014年
5 樵建剛;新的基于概率模型的聚類算法研究[D];蘭州大學(xué);2014年
6 耿濤;ECG波形可視化聚類策略研究[D];天津理工大學(xué);2013年
7 王威;MySQL數(shù)據(jù)庫(kù)源代碼分析及存儲(chǔ)引擎的設(shè)計(jì)[D];南京郵電大學(xué);2012年
8 張鵬;基于物理模型的聚類方法研究[D];電子科技大學(xué);2011年
9 于寧;聚類分析方法在學(xué)生信息管理系統(tǒng)中的應(yīng)用[D];中國(guó)海洋大學(xué);2010年
10 周騁;基于高維數(shù)據(jù)的雙聚類算法研究與應(yīng)用[D];南京理工大學(xué);2009年
本文編號(hào):2568463
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyutizhilunwen/2568463.html