天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 基因論文 >

融合自訓(xùn)練和低秩表示的基因表達數(shù)據(jù)癌癥分類方法

發(fā)布時間:2020-04-08 14:52
【摘要】:在生物信息學(xué)領(lǐng)域中,由于許多疾病的病理不明,使用傳統(tǒng)的診斷方式無法準(zhǔn)確判斷疾病類型,所以借助分子生物學(xué)數(shù)據(jù)和機器學(xué)習(xí)進行輔助的診斷方式近年來開始得到關(guān)注。癌癥是一種基因疾病,有超過100種類型,通常由它們所處的組織或器官來命名。對于癌癥的診斷和治療而言,準(zhǔn)確識別癌癥類型是十分必要的。由于癌癥組織和正常組織有著不同的基因表達,基因表達數(shù)據(jù)可以作為有效的特征源用于癌癥分類。由于高通量測序技術(shù)的發(fā)展,獲得全基因組的基因表達數(shù)據(jù)成為可能。然而,直接使用原始的基因表達譜進行準(zhǔn)確的癌癥分類仍然很有挑戰(zhàn)性,因為基因表達數(shù)據(jù)有著極高的特征維度和較小的樣本數(shù),且存在著大量的噪聲和冗余。(1)為了解決上述問題,我們提出了一種新的融合低秩表示和自訓(xùn)練的半監(jiān)督分類方法(SSC-LRR),它可以利用基因表達數(shù)據(jù)進行癌癥分類。低秩表示(Low Rank Representation,LRR)首先被用于從高維基因表達數(shù)據(jù)中提取有判別力的特征,然后一種改進的半監(jiān)督自訓(xùn)練分類(Semi-supervised Self-training Classification,SSC)方法被用于進行癌癥分類預(yù)測。為了評估SSC-LRR的分類效果,我們在兩個不同類型的基準(zhǔn)數(shù)據(jù)集上進行測試,并與四種當(dāng)前情況下性能最好的方法進行比較。它在癌癥分類預(yù)測中取得了 89.7%的總體準(zhǔn)確率和0.920的泛化相關(guān)性,比其它方法中最好的一個分別高出18.9%和24.4%?偠灾,我們的研究展示了一種新的高靈敏度方法,可以從大規(guī);虮磉_數(shù)據(jù)中識別癌癥類型。(2)此外,我們在矩陣低秩表示的基礎(chǔ)上對數(shù)據(jù)進行可視化,并提出了一種關(guān)鍵基因選擇方法對基因的鑒別能力進行排序,一些基因(RNF-114,HLA-DRB5,USP9Y,PTPN20)被該方法識別為可能的新癌癥標(biāo)志,以用于進一步的臨床研究。(3)為了方便其他生物醫(yī)學(xué)研究者的使用,我們基于Flask框架開發(fā)了一個網(wǎng)絡(luò)平臺用于提供在線的癌癥類別預(yù)測服務(wù)。
【圖文】:

層次聚類,肺腺癌,亞型,癌癥


邐存在不同的組織,所以還要考慮癌細(xì)胞所在的細(xì)胞類型,主要包括:逡逑(carcinoma):癌癥(cancer)是總稱,其中起源于上皮細(xì)胞的類型被稱rcinoma),多發(fā)于老年人,癌(carcinoma)中包括了大部分最常見的癌癥,乳腺、胰腺、肺、前列腺和結(jié)腸上的癌癥(cancer)都是癌(carcinoma);逡逑瘤:發(fā)生于結(jié)締組織上的癌癥(如脂肪、神經(jīng)、骨骼和軟骨),源于骨髓外胞;逡逑巴瘤和白血病:這兩類癌癥源于造血細(xì)胞,其中白血病是最常見的兒童癌癥占30%,但還是遠(yuǎn)少于成人的淋巴瘤和白血病患者;逡逑生殖細(xì)胞腫瘤:源于多能細(xì)胞的癌癥,大多出現(xiàn)于睪丸和卵巢;逡逑胚細(xì)胞瘤:源于未成熟的前體細(xì)胞或胚胎組織,在兒童中更為常見。逡逑,癌癥的名稱通常會包含其所在器官和組織,如肺腺癌(lung邋carcinoma)。腫瘤組織有著不同的病理學(xué)特征,通過組織類區(qū)別癌癥幫助醫(yī)生提供更為準(zhǔn)案。但是這種分類方法仍然過于寬泛,導(dǎo)致同種類型的癌癥實際上有著不同理。逡逑

數(shù)據(jù)集,參數(shù),自訓(xùn)練,學(xué)習(xí)模型


邐融合自訓(xùn)練和低秩表示的基因表達數(shù)據(jù)癌癥分類方法逡逑圖3.1中的數(shù)據(jù)顯示,所有方法的表現(xiàn)都略微依賴于M。從常識上來說,學(xué)習(xí)模型逡逑的效果會隨著訓(xùn)練集中標(biāo)注樣本數(shù)量的提升而提升,大體上預(yù)測效果的趨勢與我們的認(rèn)逡逑知相符,盡管對于標(biāo)簽遷移算法有些小的波動。同時,不同方法間的相對效果也大體上逡逑一致,其中SSC-LRR在M邋>邋2時效果好于其它方法,說明了邋SSC-LRR的魯棒性。但逡逑是,我們也發(fā)現(xiàn)在SSC-LRR在M邋=邋2時的預(yù)測準(zhǔn)確率要略低于Semi-PNMF,可能的原逡逑因是當(dāng)M過小時,,初始的訓(xùn)練樣本過少,導(dǎo)致SSC-LRR的錯誤加深現(xiàn)象出現(xiàn),盡管逡逑SSC-LRR己經(jīng)通過設(shè)計來減少迭代訓(xùn)練過程中的錯誤加深。逡逑0.8邋1^邋SVM邐KS3RPCA+SVM逡逑mm邋Label邋Propagation邋[Z22邋SSC-LRR邐r-r^邐r//^逡逑S23邋Semi-PNMF邐—邐:’::邐pt邋:逡逑0邋6邐邐邋_邋..網(wǎng)H邐N邋衫.逡逑IXXI邋邋邋。0<邋\//邋邋邋1邋aX,'--邋-A邋:..丨邋i邋X邋>^—邐邐1邐\逡逑Q邋'…_邋冒邋_#T——_媭邋_邋__逡逑目邐、必7邐自邐p^S--:-y0邐=邐^邐pv-:w>逡逑0-4邐國衫g.悔々:物.曰逡逑0.2邐|邐|影W╁義息葖p翁j;.邐_丨||:邐I邐|i邋i邐11邐lltllL逡逑Q邋Q邋邐邐Hill邋.邋?邋-邐r^dlllh>'v.】邋;—.邋-FH邋ll>:.K邐:邋Jllll邋!邋?,邋\逡逑1邐2邐3邐4邐5邐6逡逑M逡逑0.8i
【學(xué)位授予單位】:南京理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP181;R73-3

【相似文獻】

相關(guān)期刊論文 前10條

1 王長本,劉興暉,王偉靈,周新;基因表達數(shù)據(jù)的聚類分析[J];國外醫(yī)學(xué)(臨床生物化學(xué)與檢驗學(xué)分冊);2004年04期

2 王修竹;劉自偉;齊陽;鮑競;;基因表達數(shù)據(jù)的預(yù)處理方法[J];兵工自動化;2006年07期

3 孔薇;牟曉陽;;基于大腦不同區(qū)域的阿爾茨海默癥基因表達數(shù)據(jù)分析[J];上海交通大學(xué)學(xué)報;2013年06期

4 馬李冰;侯艷;李貞子;李康;;多步驟決策樹方法在基因表達數(shù)據(jù)上的應(yīng)用研究[J];中國衛(wèi)生統(tǒng)計;2017年01期

5 莊振華;王年;李學(xué)俊;梁棟;王繼;;癌癥基因表達數(shù)據(jù)的熵度量分類方法[J];安徽大學(xué)學(xué)報(自然科學(xué)版);2010年02期

6 劉英;;蛋白質(zhì)網(wǎng)絡(luò)和基因表達數(shù)據(jù)與癌癥轉(zhuǎn)移的預(yù)測[J];國際藥學(xué)研究雜志;2008年02期

7 顧明亮;為基因表達數(shù)據(jù)的發(fā)表制訂標(biāo)準(zhǔn)[J];基礎(chǔ)醫(yī)學(xué)與臨床;2002年04期

8 劉瓏龍;周西龍;劉雪峰;;基于遺傳算法和學(xué)習(xí)向量化網(wǎng)絡(luò)的基因表達數(shù)據(jù)的閾值分析[J];中國海洋大學(xué)學(xué)報(自然科學(xué)版);2013年12期

9 孔薇;陶偉杰;牟曉陽;;基于非負(fù)矩陣分解的大腦不同區(qū)域基因表達數(shù)據(jù)分析[J];中國生物醫(yī)學(xué)工程學(xué)報;2012年06期

10 趙潔茹;;淺談模式識別中的支持向量機技術(shù)分析腫瘤基因表達數(shù)據(jù)[J];科技資訊;2011年33期

相關(guān)會議論文 前7條

1 劉會娟;侯艷;李康;;ARTIVA在時間序列基因表達數(shù)據(jù)網(wǎng)絡(luò)構(gòu)建中的應(yīng)用[A];2017年中國衛(wèi)生統(tǒng)計學(xué)學(xué)術(shù)年會論文集[C];2017年

2 楊昆;李建中;王朝坤;徐繼偉;;基因表達數(shù)據(jù)的基于類別樹和SVMs的多類癌癥分類算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年

3 崔光照;曹祥紅;張華;;基于小波變換的基因表達數(shù)據(jù)去噪聚類分析[A];第十二屆全國信號處理學(xué)術(shù)年會(CCSP-2005)論文集[C];2005年

4 武曉巖;方慶偉;;基因表達數(shù)據(jù)分析的隨機森林方法及算法改進[A];黑龍江省第十次統(tǒng)計科學(xué)討論會論文集[C];2008年

5 馮晶;夏冉;曾勇華;劉娟;周懷北;;腫瘤基因表達數(shù)據(jù)庫系統(tǒng)[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年

6 梅楨;申琦;冶保獻;;用于基因表達數(shù)據(jù)模式識別的KNN和SVM集成算法[A];中國化學(xué)會第26屆學(xué)術(shù)年會化學(xué)信息學(xué)與化學(xué)計量學(xué)分會場論文集[C];2008年

7 王章輝;趙宇海;王國仁;李源;;一種基于投影聚類的無監(jiān)督表型區(qū)分算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年

相關(guān)博士學(xué)位論文 前10條

1 姜濤;基因表達數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];西北工業(yè)大學(xué);2016年

2 陸慧娟;基于基因表達數(shù)據(jù)的腫瘤分類算法研究[D];中國礦業(yè)大學(xué);2012年

3 張麗娟;微陣列基因表達數(shù)據(jù)分類問題中的屬性選擇技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2008年

4 黃德生;基因表達數(shù)據(jù)在腫瘤診斷、基因功能預(yù)測中的應(yīng)用研究[D];中國醫(yī)科大學(xué);2009年

5 劉亞杰;基于智能優(yōu)化算法的腫瘤微陣列基因表達數(shù)據(jù)分類研究[D];云南大學(xué);2014年

6 王文俊;基因表達數(shù)據(jù)的相似性度量和特征提取研究[D];西安電子科技大學(xué);2011年

7 毛志毅;基因表達數(shù)據(jù)基因篩選與近紅外光譜微量成分模型優(yōu)化方法研究[D];南開大學(xué);2014年

8 楊博;基因調(diào)控網(wǎng)絡(luò)構(gòu)建及在癌癥基因預(yù)測中的應(yīng)用[D];西安電子科技大學(xué);2014年

9 殷路;基因表達數(shù)據(jù)的雙聚類分析與研究[D];電子科技大學(xué);2017年

10 石金龍;基因表達及其轉(zhuǎn)錄調(diào)控機制的計算分析[D];國防科學(xué)技術(shù)大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 劉鴻儒;面向基因表達數(shù)據(jù)快速聚類的算法研究[D];哈爾濱工業(yè)大學(xué);2018年

2 劉圣輝;基于基因表達數(shù)據(jù)的新型特征提取算法研究[D];山東大學(xué);2018年

3 夏春秋;融合自訓(xùn)練和低秩表示的基因表達數(shù)據(jù)癌癥分類方法[D];南京理工大學(xué);2018年

4 余顯學(xué);基于基因表達數(shù)據(jù)的癌癥亞型發(fā)現(xiàn)雙聚類方法研究[D];西南大學(xué);2018年

5 張錦鋒;基于腦網(wǎng)絡(luò)組圖譜的轉(zhuǎn)錄組分析軟件開發(fā)與應(yīng)用研究[D];電子科技大學(xué);2018年

6 馬春霞;非負(fù)矩陣分解及在基因表達數(shù)據(jù)分析中的應(yīng)用研究[D];曲阜師范大學(xué);2015年

7 張秋水;支持向量機在基因表達數(shù)據(jù)中的研究[D];廈門大學(xué);2007年

8 任叢林;基于壓縮感知算法的基因表達數(shù)據(jù)分類的研究[D];北京交通大學(xué);2012年

9 高雪峰;膜計算在基因表達數(shù)據(jù)分析中的應(yīng)用[D];西華大學(xué);2015年

10 黃靜;基于阿爾茨海默病的基因表達數(shù)據(jù)改進的聚類方法[D];四川師范大學(xué);2016年



本文編號:2619484

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2619484.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶aa736***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com