天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

基于模型的聚類在蛋白質(zhì)分類研究中的應(yīng)用

發(fā)布時(shí)間:2020-10-12 01:50
   聚類分析作為數(shù)據(jù)挖掘的重要組成部分,在各個(gè)研究領(lǐng)域都發(fā)揮著極大的作用,近年來更受到了高度的重視。了解并掌握其原理,將其妥善運(yùn)用在各種數(shù)據(jù)分析中是十分必要的。作為聚類的重要方法,基于模型的聚類已經(jīng)被廣泛用于聚類應(yīng)用中,包括手寫識(shí)別、文本聚類、圖像分割等多個(gè)領(lǐng)域。生物信息學(xué)近年來得到了極大的發(fā)展,作為其中重要的組成部分,蛋白質(zhì)序列數(shù)據(jù)的研究也成為了人們關(guān)注的重點(diǎn)。鑒于此,本文將基于模型的聚類方法應(yīng)用在蛋白質(zhì)序列的分類研究上,以彌補(bǔ)前人常用聚類方法的不足,注入新的思想。本文首先回顧了基于模型的聚類方法的發(fā)展歷程和國內(nèi)外學(xué)者的研究成果。隨后重點(diǎn)闡述了聚類分析的理論知識(shí):簡要介紹了聚類分析的含義,詳細(xì)總結(jié)了目前聚類常用的經(jīng)典算法、高級(jí)算法和多源數(shù)據(jù)算法的內(nèi)涵,著重闡釋了基于模型的聚類方法所涉及的混合模型、參數(shù)估計(jì)的期望最大化算法和模型選擇準(zhǔn)則方面的理論知識(shí),并簡單分析了基于模型的聚類方法存在的優(yōu)勢和局限性,最后總結(jié)了當(dāng)前聚類分析的實(shí)際應(yīng)用情況。接下來,利用多種具體方法,建立不同的模型,進(jìn)行參數(shù)估計(jì),從而對(duì)蛋白質(zhì)序列進(jìn)行分類研究。將聚類分析的理論運(yùn)用在了一個(gè)預(yù)測蛋白質(zhì)定位位點(diǎn)的具體實(shí)例中:該數(shù)據(jù)集包含1484個(gè)酵母氨基酸序列,共有8個(gè)屬性變量,10個(gè)具體的定位位點(diǎn)。采用k-均值法和基于模型的聚類方法對(duì)問題進(jìn)行處理和分析,其中k-均值法以聚為5類和聚為8類加以說明,基于模型的聚類方法則分別運(yùn)用基于高斯混合模型法(mclust)、子空間聚類法(hddc)和混合法(Rmixmod)進(jìn)行運(yùn)算并得到結(jié)果。最后,將理論結(jié)果與實(shí)際含義相結(jié)合,對(duì)不同方法的運(yùn)算結(jié)果進(jìn)行詳細(xì)的探討并加以評(píng)判。首先,可以清楚地看到,基于模型的聚類方法對(duì)蛋白質(zhì)序列做分類可以得到比較好的效果:分類清晰,各類之間差異顯著,類的含義更具有代表性;在聚類的簇的個(gè)數(shù)選擇方面有明確的理論支持;以概率形式對(duì)每一類進(jìn)行表示,每一類的特征也可以用相應(yīng)的參數(shù)來表達(dá),將類別問題轉(zhuǎn)化為最優(yōu)化模型的問題,在對(duì)每一類的性質(zhì)進(jìn)行更專業(yè)的研究時(shí),可以更好地應(yīng)用統(tǒng)計(jì)的思想和方法,提供一種新的思路。其次,基于模型的聚類方法與k-均值法相比,也有明確的優(yōu)勢:它很好地彌補(bǔ)了k-均值法在聚類個(gè)數(shù)選擇上的欠缺,分類結(jié)果的代表性也更為明確和合理。再次,為了從基于模型的聚類方法中選出最為合適的聚類算法,采用了三種不同的具體方法,通過比較這三種方法的結(jié)果,針對(duì)這一具體問題,基于高斯混合模型法和混合法所得結(jié)果比子空間聚類法更為合理,且基于高斯混合模型法操作起來更為簡便,對(duì)于初學(xué)者來說也更容易理解?梢哉f,基于模型的聚類方法,為相關(guān)問題的研究提供了一個(gè)新的思路和發(fā)展方向,相信在生物信息學(xué)領(lǐng)域會(huì)有很好的應(yīng)用前景。
【學(xué)位單位】:云南財(cái)經(jīng)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:Q51;TP311.13
【部分圖文】:

分布情況,箱線圖,四分位數(shù)


聚類分析在蛋白質(zhì)分類中的應(yīng)用表 3.1 各變量描述統(tǒng)計(jì)量變量計(jì)量Mcg Gvh Alm Mit Erl pox vac n均值 0.5001 0.4999 0.5000 0.2612 0.5047 0.0075 0.4999 0.2最小值 0.1100 0.1300 0.2100 0 0.5000 0 0 四分位數(shù) 0.4100 0.4200 0.4600 0.1700 0.5000 0 0.4800 0.2中位數(shù) 0.4900 0.4900 0.5100 0.2200 0.5000 0 0.5100 0.2四分位數(shù) 0.5800 0.5700 0.5500 0.3200 0.5000 0 0.5300 0.3最大值 1 1 1 1 1 0.8300 0.7300 標(biāo)準(zhǔn)差 0.1373 0.1239 0.0867 0.1371 0.0484 0.0757 0.0578 0.1箱線圖如下圖 3.1 所示,從箱線圖可以看出各變量的大致分布情況,箱形條橫線由下到上分別代表下四分位數(shù)、中位數(shù)和上四分位數(shù)。

示意圖,高斯混合模型


30圖 3.2 簇個(gè)數(shù) 1-9 的 14 種高斯混合模型的 BIC 值從表 3.4 和圖 3.2 中可以明顯看出,EEV 模型聚成 5 個(gè)簇的情況(圖 3.2 中紫色方框十字),BIC 值最大,為 39181.05,根據(jù)前述 BIC 準(zhǔn)則,選擇該模型作為聚類使用的混合模型。此外,還可以畫出以下三個(gè)關(guān)于不同特征組合的分類、不確定性和密度函數(shù)的示意圖。

示意圖,示意圖


不同特征組合得到的分類示意圖
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 魏鐵華;相似事物的聚類方法[J];成組生產(chǎn)系統(tǒng);1988年01期

2 盛利元;三次重組聚類方法[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);1988年03期

3 李成智,陳繼東,丁瑞云;應(yīng)用逐步聚類法進(jìn)行六安地區(qū)馬尾松苗木分級(jí)[J];浙江林業(yè)科技;1988年02期

4 蔣佐升;作物育種中三種聚類方法的比較分析[J];湖南農(nóng)學(xué)院學(xué)報(bào);1988年01期

5 張力;胡先菊;;模糊目標(biāo)函數(shù)聚類法在種源研究中的應(yīng)用[J];貴州農(nóng)學(xué)院學(xué)報(bào);1988年01期

6 俞世蓉;郭藹平;;基因型聚類的終止判據(jù)[J];生物數(shù)學(xué)學(xué)報(bào);1988年01期

7 張鵠藻;機(jī)械零件的包容聚類法[J];成組生產(chǎn)系統(tǒng);1989年02期

8 華堯楠,華崇釗;Fuzzy綜合評(píng)估聚類法分區(qū)預(yù)報(bào)二代棉鈴蟲發(fā)生量[J];山東農(nóng)業(yè)科學(xué);1989年04期

9 楊繼龍;陳曦;楊偉康;張瓊文;;基于譜系聚類法的用戶擊鍵特征識(shí)別[J];電腦編程技巧與維護(hù);2010年04期

10 鄭鵬;李金銘;賴曉燕;趙艷萍;王霞;;主成分分析法與逐步聚類法在樹種分類中的應(yīng)用[J];福建電腦;2006年02期


相關(guān)博士學(xué)位論文 前3條

1 周瑞紅;基于群智能優(yōu)化理論的聚類改進(jìn)方法及應(yīng)用研究[D];吉林大學(xué);2017年

2 杭文龍;有監(jiān)督智能聚類與分類技術(shù)及其應(yīng)用研究[D];江南大學(xué);2017年

3 殷瑞飛;數(shù)據(jù)挖掘中的聚類方法及其應(yīng)用[D];廈門大學(xué);2008年


相關(guān)碩士學(xué)位論文 前10條

1 趙楊;基于KQPSO聚類的股票投資價(jià)值分析[D];中國石油大學(xué)(北京);2018年

2 張盛;基于評(píng)價(jià)對(duì)象抽取的影視劇評(píng)論聚類研究[D];上海交通大學(xué);2016年

3 朱樂為;模糊C-means聚類算法的拓展研究[D];云南師范大學(xué);2019年

4 王星;基于矩陣分解的多聚類算法研究[D];西南大學(xué);2019年

5 陸葉;我國區(qū)域經(jīng)濟(jì)發(fā)展水平的動(dòng)態(tài)分析[D];杭州電子科技大學(xué);2018年

6 曹延姍;基于模型的聚類在蛋白質(zhì)分類研究中的應(yīng)用[D];云南財(cái)經(jīng)大學(xué);2019年

7 郭旭東;基于深度學(xué)習(xí)和半監(jiān)督聚類的入侵檢測技術(shù)研究[D];寧夏大學(xué);2019年

8 夏典;經(jīng)典葡萄酒數(shù)據(jù)集的聚類、降維及可視化實(shí)證研究[D];云南師范大學(xué);2019年

9 沈涵生;基于WIFI信號(hào)特征的聚類過濾定位算法研究[D];浙江科技學(xué)院;2019年

10 卞汛;基于Spark的分布式聚類算法研究及其在社交媒體分析中的應(yīng)用[D];北京郵電大學(xué);2018年



本文編號(hào):2837454

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2837454.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶287fa***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
少妇人妻中出中文字幕| 国产激情国产精品久久源| 成年人黄片大全在线观看| 欧美熟妇一区二区在线| 国产成人午夜福利片片| 亚洲熟妇熟女久久精品 | 国产一区二区三中文字幕| 亚洲中文字幕在线乱码av| 国产一区二区三区草莓av| 亚洲综合色婷婷七月丁香| 国产精品白丝一区二区| 久热在线视频这里只有精品| 色婷婷国产熟妇人妻露脸| 熟女少妇一区二区三区蜜桃| 久久福利视频在线观看| 欧美乱视频一区二区三区| 国产精品九九九一区二区| 最近最新中文字幕免费| 日韩少妇人妻中文字幕| 日本精品中文字幕人妻| 91亚洲精品综合久久| 日系韩系还是欧美久久| 国产精品午夜福利免费在线| 精品熟女少妇av免费久久野外| 激情五月综五月综合网| 欧美精品日韩精品一区| 亚洲专区一区中文字幕| 国产免费人成视频尤物| 国产一级内片内射免费看| 国产福利一区二区三区四区| 亚洲精品偷拍一区二区三区| 欧美一本在线免费观看| 91人妻人人做人碰人人九色| 人体偷拍一区二区三区| 91亚洲国产—区=区a| 久久精品a毛片看国产成人| 日本一区不卡在线观看| 日韩欧美国产亚洲一区| 九九热精品视频免费观看| 欧美视频在线观看一区| 亚洲黑人精品一区二区欧美|