天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于粒計(jì)算的疾病差異表達(dá)基因研究

發(fā)布時(shí)間:2020-03-28 23:19
【摘要】:本文基于粒計(jì)算理論,結(jié)合已有的聚類(lèi)算法以及Logistic Regression、Random Forest等數(shù)據(jù)挖掘算法,對(duì)其進(jìn)行改進(jìn)和優(yōu)化,并建立優(yōu)化模型。從NCBI以及GEO數(shù)據(jù)庫(kù)中分別下載病毒蛋白質(zhì)序列和基因芯片數(shù)據(jù),通過(guò)對(duì)其進(jìn)行預(yù)處理與數(shù)字特征化后,應(yīng)用到模型中,結(jié)合實(shí)驗(yàn)結(jié)果,證實(shí)本文提出的模型能為生物信息大數(shù)據(jù)的處理提供新的有效的方法。文章的主要工作內(nèi)容可以概括如下:第二章是準(zhǔn)備知識(shí),對(duì)各類(lèi)聚類(lèi)算法、粒度空間中的一些基本概念、最小生成樹(shù)算法、Logistic Regression模型和Random Forest模型的原理進(jìn)行了介紹。第三章在粒計(jì)算理論的基礎(chǔ)上,進(jìn)行了基于歸一化距離的最小生成樹(shù)分類(lèi)算法研究。首先,根據(jù)統(tǒng)計(jì)學(xué)中類(lèi)內(nèi)偏差和類(lèi)間偏差的性質(zhì),定義了新的最優(yōu)聚類(lèi)指標(biāo),然后在已有的粒度空間生成算法的基礎(chǔ)上,引入最小生成樹(shù)以及新的最優(yōu)聚類(lèi)指標(biāo),給出了最小生成樹(shù)分類(lèi)算法并建立最優(yōu)聚類(lèi)模型。最后,將最優(yōu)聚類(lèi)模型應(yīng)用于898條同時(shí)含有HA和NA并且能夠感染人的禽流感病毒的蛋白質(zhì)序列上,基于距離中心最近原則,先后兩次運(yùn)行最小生成樹(shù)分類(lèi)算法,得到了最優(yōu)層次結(jié)構(gòu),相應(yīng)地,選出了6條具有代表性的病毒序列。第四章的研究對(duì)象是癌癥,通過(guò)將Logistic Regression算法和Random Forest算法進(jìn)行組合,提出了一種新的混合模型——LR-RF模型,基于FWER錯(cuò)誤測(cè)度的Bonferroni檢驗(yàn),將模型應(yīng)用在兩個(gè)乳腺癌DNA微陣列數(shù)據(jù)集上,篩選乳腺癌中差異表達(dá)的基因。通過(guò)十次重復(fù)隨機(jī)試驗(yàn),本文所提出的LR-RF模型的平均預(yù)測(cè)準(zhǔn)確率達(dá)到93.11%,方差低至0.00045。當(dāng)Random Forest算法中基因重要性評(píng)分進(jìn)行排序時(shí)選取的閾值?=0.2,預(yù)測(cè)準(zhǔn)確率達(dá)到最大值95.57%,并且篩選出來(lái)的差異表達(dá)基因數(shù)量相對(duì)較少。另外,建立差異表達(dá)基因的相互作用網(wǎng)絡(luò),通過(guò)分析基因相互作用網(wǎng)絡(luò),可以發(fā)現(xiàn)本文選擇的前20個(gè)基因中的大多數(shù)都涉及乳腺癌的發(fā)生與發(fā)展過(guò)程。這些結(jié)果都證明了LR-RF模型的可靠性和有效性。
【圖文】:

流程圖,聚類(lèi)算法,分裂算法,聚類(lèi)


第二章 準(zhǔn)備知識(shí)類(lèi)算法簡(jiǎn)介類(lèi)算法與粒計(jì)算有著密切的聯(lián)系,聚類(lèi)算法是將數(shù)據(jù)樣本進(jìn)行分類(lèi),而粒計(jì)算樣本進(jìn)行;R虼,聚類(lèi)算法將粒計(jì)算思想進(jìn)行具體的實(shí)現(xiàn),而粒計(jì)算是將的思想進(jìn)行了抽象的描述。下面介紹一些常用的聚類(lèi)算法。于劃分的聚類(lèi)-means 算法是數(shù)據(jù)挖掘中最常用的一種劃分聚類(lèi)算法[18]。K-means 算法是在給類(lèi)數(shù) n 之后,能夠?qū)?shù)據(jù)集分成 n 個(gè)簇,,算法需要使得平方誤差達(dá)到最小化,目的是找到我們想要的 n 個(gè)簇,并且使得每個(gè)簇內(nèi)所有的樣本點(diǎn)之間的相似度。K-means 算法簡(jiǎn)單,并且運(yùn)行速度快,適用于大數(shù)據(jù)集,但是算法本身也有,由于初始值選擇的不同,會(huì)導(dǎo)致最終的分類(lèi)結(jié)果也不同,而且 K-means 算法分布的數(shù)據(jù)集也不能得到合理的分類(lèi)結(jié)果。K-means 算法的流程圖如圖 2-1 所

流程圖,層次聚類(lèi)算法,流程圖


圖 2-2 層次聚類(lèi)算法流程圖層次聚類(lèi)算法形成的類(lèi)一般通過(guò)樹(shù)狀圖來(lái)表示。層次聚類(lèi)算法具有不需要預(yù)先數(shù)目、容易發(fā)現(xiàn)類(lèi)與類(lèi)之間的層次關(guān)系等優(yōu)點(diǎn),但是層次聚類(lèi)算法的計(jì)算復(fù)雜且很可能將數(shù)據(jù)樣本聚類(lèi)成鏈狀。3 基于密度的聚類(lèi)密度聚類(lèi)的思想不同于 K-means 算法的思想,但是密度聚類(lèi)的思想更符合人類(lèi)密度聚類(lèi)的基本思想是通過(guò)是否緊密相連來(lái)判斷數(shù)據(jù)樣本點(diǎn)是否屬于一個(gè)簇。度聚類(lèi)的算法中,比較有代表性的算法是 Density-Based Spatial Clusterilications with Noise (DBSCAN)[20],它基于一組鄰域( , MinPts)來(lái)表征整個(gè)數(shù)據(jù)處的樣本是否是緊密的,下面是 DBSCAN 的基本算法步驟:
【學(xué)位授予單位】:江南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:TP311.13;R-05

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 ;MNNG致小鼠肢體異常發(fā)育差異表達(dá)基因的篩選和鑒定[J];癌變.畸變.突變;2001年04期

2 李剛,壽江;尋找差異表達(dá)基因的新方法:mRNA差異顯示[J];國(guó)外醫(yī)學(xué)(放射醫(yī)學(xué)核醫(yī)學(xué)分冊(cè));1997年03期

3 趙勇,丁金鳳;尋找差異表達(dá)基因[J];國(guó)外醫(yī)學(xué).遺傳學(xué)分冊(cè);2000年02期

4 李煒弘;許嗣立;張?zhí)於?丁維俊;黃禹峰;曾躍琴;譚雪菊;;老齡腎陽(yáng)虛證差異表達(dá)基因的篩選與鑒定[J];遼寧中醫(yī)雜志;2012年04期

5 劉洪博;劉新龍;蘇火生;陸鑫;徐超華;毛鈞;林秀琴;李純佳;李旭娟;字秋艷;;干旱脅迫下割手密根系轉(zhuǎn)錄組差異表達(dá)分析[J];中國(guó)農(nóng)業(yè)科學(xué);2017年06期

6 任麗萍;章琳;洪貴妮;郭政;;基于蛋白質(zhì)互作評(píng)價(jià)差異表達(dá)基因的重復(fù)性[J];生物信息學(xué);2011年03期

7 王學(xué),徐靜;一種鑒別基因差異表達(dá)的新方法——差異表達(dá)mRNA呈現(xiàn)技術(shù)[J];生物工程進(jìn)展;1998年03期

8 戴建新,孫樹(shù)漢;差示RT-PCR克隆寄生蟲(chóng)差異表達(dá)基因的新策略[J];中國(guó)寄生蟲(chóng)學(xué)與寄生蟲(chóng)病雜志;1997年05期

9 蔣定鋒;潘娟娟;趙耐青;;差異表達(dá)基因篩選方法的比較[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2006年05期

10 齊魯;丁彥青;;基于差異表達(dá)基因探索大腸癌早期轉(zhuǎn)移相關(guān)分子機(jī)制[J];中國(guó)科學(xué):生命科學(xué);2013年07期

相關(guān)會(huì)議論文 前10條

1 胡建達(dá);陳曉梨;陳鑫基;祝亮方;楊月玲;陳元仲;呂聯(lián)煌;;抑制性消減雜交法研究初治和復(fù)發(fā)急性淋巴細(xì)胞白血病基因的差異表達(dá)[A];第九屆全國(guó)實(shí)驗(yàn)血液學(xué)會(huì)議論文摘要匯編[C];2003年

2 尚偉;劉震;來(lái)超;謝兆宏;;應(yīng)用抑制性消減雜交技術(shù)篩選癲癇患者外周血的差異表達(dá)基因[A];中華醫(yī)學(xué)會(huì)第十七次全國(guó)神經(jīng)病學(xué)學(xué)術(shù)會(huì)議論文匯編(下)[C];2014年

3 韓愉;喬洪賓;馮金濤;劉金明;李浩;陸珂;金亞美;;正常發(fā)育與發(fā)育阻遏雌蟲(chóng)差異表達(dá)miRNA分析[A];中國(guó)畜牧獸醫(yī)學(xué)會(huì)獸醫(yī)寄生蟲(chóng)學(xué)分會(huì)第十三次學(xué)術(shù)研討會(huì)論文集[C];2015年

4 狄冉;儲(chǔ)明星;;高通量篩選差異表達(dá)基因技術(shù)簡(jiǎn)介[A];中國(guó)畜牧獸醫(yī)學(xué)會(huì)養(yǎng)羊?qū)W分會(huì)全國(guó)養(yǎng)羊生產(chǎn)與學(xué)術(shù)研討會(huì)議論文集[C];2010年

5 葉波平;邊杉;趙艷景;王穎;奚濤;王;吳梧桐;;鯊魚(yú)再生肝組織中差異表達(dá)基因及其產(chǎn)物的活性研究[A];中國(guó)海洋生化學(xué)術(shù)會(huì)議論文薈萃集[C];2005年

6 李尚偉;龍章富;;性逆轉(zhuǎn)石斑魚(yú)性腺中PIN基因的差異表達(dá)及其特征分析(英文)[A];第三屆貴州省自然科學(xué)優(yōu)秀學(xué)術(shù)論文評(píng)選獲獎(jiǎng)?wù)撐募?010年)[C];2010年

7 張計(jì)育;黃勝男;莫正海;郭忠仁;王剛;宣繼萍;賈曉東;;澇害脅迫下獼猴桃差異表達(dá)基因的轉(zhuǎn)錄組測(cè)序及比較分析[A];中國(guó)園藝學(xué)會(huì)2015年學(xué)術(shù)年會(huì)論文摘要集[C];2015年

8 秦國(guó)政;田世平;王清;劉嘉;;線粒體蛋白差異表達(dá)及氧化修飾與果實(shí)成熟衰老的關(guān)系[A];第三屆全國(guó)植物蛋白質(zhì)組學(xué)大會(huì)摘要集[C];2010年

9 余鑫煜;董學(xué)君;張卉;邵健忠;項(xiàng)黎新;;小鼠肝損傷過(guò)程中差異表達(dá)基因的cDNA芯片篩選及功能分析[A];2009年浙江省檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)年會(huì)論文匯編[C];2009年

10 黨平;聶敏媛;孟慶巖;安鈺;孔磊;董蕊;鄭翰圣;施生根;;基于GO分析的全基因組芯片篩選小鼠牙囊發(fā)育早期差異表達(dá)基因的研究[A];第八次全國(guó)口腔修復(fù)學(xué)學(xué)術(shù)年會(huì)論文匯編[C];2014年

相關(guān)重要報(bào)紙文章 前1條

1 ;腎癌差異表達(dá)基因鑒定及功能研究[N];中國(guó)醫(yī)藥報(bào);2002年

相關(guān)博士學(xué)位論文 前10條

1 唐堯;SEPT家族基因異常表達(dá)在食管鱗癌中的臨床意義及作用機(jī)制[D];北京協(xié)和醫(yī)學(xué)院;2017年

2 姚穎垠;小麥雜交種與親本之間差異表達(dá)基因的分離、克隆與功能鑒定[D];中國(guó)農(nóng)業(yè)大學(xué);2005年

3 苑純秀;日本血吸蟲(chóng)發(fā)育期別差異表達(dá)基因的篩選研究及新基因的克隆分析[D];中國(guó)農(nóng)業(yè)科學(xué)院;2005年

4 胡國(guó)章;利用生物信息學(xué)方法篩選膠質(zhì)瘤的差異表達(dá)基因及其相關(guān)機(jī)制[D];吉林大學(xué);2015年

5 齊湘杰;高惡性膀胱移行細(xì)胞癌與相應(yīng)正常上皮差異表達(dá)基因的克隆及功能研究[D];天津醫(yī)科大學(xué);2003年

6 張曉文;銀杏雌雄花芽差異表達(dá)基因研究[D];山東農(nóng)業(yè)大學(xué);2014年

7 戚大川;應(yīng)用基因芯片篩選膽管癌相關(guān)差異表達(dá)基因及對(duì)其功能的研究[D];蘇州大學(xué);2015年

8 陳杰;人肺腺癌多藥耐藥細(xì)胞差異表達(dá)基因的克隆與初步鑒定[D];第三軍醫(yī)大學(xué);2001年

9 彭依群;雌二醇誘導(dǎo)人成骨樣MG-63細(xì)胞差異表達(dá)基因的分離和鑒定[D];中南大學(xué);2003年

10 陳蓉芳;N-甲基-N'-硝基-N-甲基亞硝基胍致小鼠肢體異常發(fā)育差異表達(dá)基因的篩選和鑒定[D];第二軍醫(yī)大學(xué);2001年

相關(guān)碩士學(xué)位論文 前10條

1 孫夢(mèng)夢(mèng);基于粒計(jì)算的疾病差異表達(dá)基因研究[D];江南大學(xué);2018年

2 方春曉;新疆漢族食管淲癌mRNA差異表達(dá)基因的篩選[D];石河子大學(xué);2018年

3 李佼旬;基因芯片篩選非綜合征型唇腭裂差異表達(dá)基因的初步研究[D];重慶醫(yī)科大學(xué);2018年

4 何聰;非酒精性脂肪肝病的血清miRNA差異表達(dá)譜的初步研究[D];江蘇大學(xué);2017年

5 王菁菁;食管鱗癌中差異表達(dá)的lncRNA的篩選及分析[D];江蘇大學(xué);2017年

6 任麗萍;根據(jù)功能相關(guān)性評(píng)價(jià)差異表達(dá)基因的可重復(fù)性[D];電子科技大學(xué);2011年

7 魏婷;基于轉(zhuǎn)錄組數(shù)據(jù)的造血干細(xì)胞差異表達(dá)基因研究[D];北京交通大學(xué);2015年

8 張遠(yuǎn)嬋;聯(lián)用激光顯微切割與基因芯片技術(shù)篩選肝細(xì)胞癌差異表達(dá)基因[D];廣州醫(yī)學(xué)院;2009年

9 徐勁松;應(yīng)用抑制消減雜交技術(shù)研究外周血嗜酸細(xì)胞支氣管哮喘相關(guān)基因的差異表達(dá)[D];第一軍醫(yī)大學(xué);2004年

10 張小蒙;雜交稻差異表達(dá)的基因分析及其與雜種優(yōu)勢(shì)的關(guān)系[D];揚(yáng)州大學(xué);2010年



本文編號(hào):2605056

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2605056.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4c191***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com