天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 醫(yī)學論文 > 腫瘤論文 >

泛癌中驅動突變模式挖掘方法研究

發(fā)布時間:2020-08-21 21:52
【摘要】:癌癥是一種常見的擁有復雜致病機理的疾病之一。目前學術界和醫(yī)學界對于癌癥的治愈還沒有有效的手段提出,但人們對于攻克癌癥的熱情和迫切從未減退。隨著高通量基因組項目的開展以及對泛癌分析技術研究的不斷深入,研究者們逐漸認清了體細胞突變對癌癥形成的重要影響。氨基酸編碼區(qū)的功能性體細胞突變在癌癥致病過程中往往具有選擇性表達的優(yōu)勢,這種選擇性表達優(yōu)勢極有可能會引起細胞或者組織器官的癌變。然而,以往對體細胞突變的研究方法只停留在單個基因或單個氨基酸層面。事實上氨基酸序列上的體細胞突變事件是成簇地存在的,為了識別氨基酸序列上對癌癥的形成具有促進作用的體細胞驅動突變類,本文提出了兩種基于體細胞聚類的驅動突變模式挖掘方法,分別利用數據自適應核密度估計和熱點突變識別的技術對氨基酸序列上的體細胞突變類進行探索。本文的主要工作包括以下兩點:(1)提出了一種基于自適應核密度估計的驅動突變模式挖掘方法DMCM(Data-adaptive Mutation Clustering Method)。該方法改進了傳統(tǒng)的依賴于固定核帶寬的核密度估計模型,首先構造了一個數據自適應核帶寬,從而形成自適應的核密度估計模型。然后利用該模型對泛癌體細胞突變數據進行突變密度估計,通過高斯分布模型確定突變類的邊界,最后使用EM算法優(yōu)化突變類的邊界,得到最終體細胞突變類。試驗結果表明,DMCM方法具有高魯棒性,識別出的突變類是具有驅動意義的。(2)提出了 一種基于熱點突變聚類的驅動突變模式挖掘方法HMCM(Hotspot Mutation Clustering Method)。該方法改進了傳統(tǒng)熱點突變研究方法只針對于單個氨基酸突變的不足,利用統(tǒng)計方法構造突變類得分,然后將突變熱點從單個氨基酸位置向序列的兩端擴展,并不斷更新突變類得分,直到類得分收斂于最大值。通過對泛癌體細胞突變類型中錯義突變和無義突變的分開識別,證明了HMCM方法具有識別和區(qū)分致癌驅動突變類和抑癌驅動突變類的能力。實驗結果表明該方法是切實可行的。因此,DMCM和HMCM方法的提出,對于癌癥致病機制的研究提供了新的方法和思路,對人類健康發(fā)展具有重要的意義。
【學位授予單位】:湖南大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP311.13;R730.2
【圖文】:

模擬圖,核函數,核密度,識別方法


Triangular核以及Biweight核)對同一模擬數據進行核密度估計。結果表明,對于逡逑相同分布的數據,在保證核密度相同的情況下,不同核函數的選擇對KDE結果的逡逑影響非常小,產生的估計偏差可以忽略。圖3.1B在核函數相同(選擇Gaussian核逡逑作為核函數)的情況下,選擇了五種不同的核帶寬取值(h=0.8,邋1,邋2,邋4,邋8)對逡逑同一模擬數據進行核密度估計。結果表明,對于相同分布的數據,在保證核函數逡逑相同的情況下,不同核帶寬的選擇對KDE結果的影響非常明顯。因此,KDE結果逡逑對核帶寬的選擇非常敏感,核帶寬的選擇對于KDE的結果具有重要作用。逡逑A邐KDE邋with邋different邋kernels邐B邐KDE邋with邋different邋bandwidths逡逑S'邐1邐邐邋Gaussia'TI邐3 ̄邐1邐邐邋h=0.8""|逡逑I邋Mm,邋:邋UllteL;逡逑6邋*邋 ̄ ̄i邐i邐i邐i邐i邐i邐I邐i邋 ̄邐?邐 ̄i邐i邐i邐i邐i邐i邐i邐i邋 ̄逡逑5邐10邐15邐20邐25邐30邐35邐40邐5邐10邐15邐20邐25邐30邐35邐40逡逑X邐x逡逑圖3.1不同核帶寬和核函數的選擇對KDE結果的模擬圖逡逑傳統(tǒng)基于KDE的驅動突變識別方法絕大多數都使用了固定核帶寬的核密度估逡逑計模型。這類方法無法體現出數據的實時變化,可能導致估計結果的不精確。為逡逑了解決這一問題

曲線,細胞突,變數,柱形圖


度函數模型(non-data-adaptive邋model),用來作為自適應核密度函數模型的對照模逡逑型。使用DMCM方法和non-data-adaptive方法分別對模擬的突變數據進行核密度估逡逑計,最終產生兩條核密度曲線,實驗結果如圖3.3所示。逡逑由圖3.3A和3.3B可以看出,DMCM方法生成的密度估計曲線與真實密度曲逡逑線之間的誤差比非自適應核密度方法生成的密度估計曲線與真實密度曲線之間的逡逑誤差更小。即DMCM方法通過自適應核帶寬構造的自適應核密度函數模型的估計逡逑效果比非自適應核密度函數模型跟更好。圖3.3C展示的核帶寬明顯地表明了,逡逑自適應核帶寬隨著數據樣本特征的變化而變化,相比于固定核帶寬,自適應核帶逡逑寬更逼近真實數據樣本特征空間。圖3.3D則展示了兩種方法生成的密度估計曲逡逑線與分別真實密度估計曲線之間的偏差。我們使用擬合優(yōu)度評價指標對兩種方法逡逑的擬合效果進行比較,經計算,DMCM方法的擬合優(yōu)度值為0.00078,而非自適應逡逑21逡逑

對比圖,核密度,自適應,與非


3.3.2.2突變類識別結果逡逑為了進一步驗證DMCM方法的優(yōu)越性,我們使用DMCM方法和非自適應核密逡逑度方法分別對模擬體細胞突變數據進行突變類的識別實驗,實驗結果如圖3.4所逡逑不。逡逑圖3.4A為模擬數據的真實分布情況,圖3.4B和圖3.4C分別是非自適應核密逡逑度方法和DMCM方法的突變類識別結果光譜圖,由圖可以看出,DMCM方法識別逡逑的突變區(qū)域界限更明顯。圖3.4D和圖3.4E分別是非自適應核密度方法逡逑和DMCM方法識別的突變類結果,相比之后我們可以發(fā)現,DMCM方法更能檢測逡逑到數據的特征,在突變類邊界明顯的情況下,能識別出更多的突變類。而一般情逡逑況下非自適應核密度方法識別的類長度都大于DMCM方法。這是由于非自適應核逡逑密度方法采用固定核帶寬構造核密度估計函數模型的原因,導致核帶寬在某些數逡逑據位點上過高或者過低地估計了數據本身所表達的特征,從而使得最終的密度估逡逑計結果與真實密度結果的誤差較大。而DMCM方法克服了這一點,有效地估計數逡逑據的特征

【相似文獻】

相關期刊論文 前10條

1 李安亞;王少妮;;對比模式挖掘研究進展[J];科研信息化技術與應用;2017年05期

2 魏芹雙;;對比模式挖掘研究進展[J];網絡安全技術與應用;2017年01期

3 李中元;邊馥苓;;空間同位模式挖掘研究進展[J];地理空間信息;2013年06期

4 王琳;羅可;;基于頻繁項集的條件模式挖掘[J];計算機工程與設計;2009年16期

5 張雪;陳未如;;面向生物信息的結構關系模式挖掘約束條件分析[J];科技咨詢導報;2007年05期

6 周歡;王海濤;鐘之陽;劉方鑫;;時空軌跡數據智能處理與模式挖掘技術研究[J];電信快報;2018年07期

7 史殿習;李寒;楊若松;莫曉峗;魏菁;;用戶日常頻繁行為模式挖掘[J];國防科技大學學報;2017年01期

8 鄒蕾;;時間序列周期模式挖掘算法分析[J];中國管理信息化;2016年03期

9 陸瑤;;基于頻繁特征模式挖掘的期貨市場單邊運行深度的預測[J];中國管理信息化;2015年17期

10 陸億紅;王子仁;黃燕;;適合稀少空間特征的同位模式挖掘算法[J];浙江工業(yè)大學學報;2007年04期

相關會議論文 前10條

1 繆裕青;尹東;;分布式存儲結構的頻繁閉合模式挖掘并行算法[A];2007年全國開放式分布與并行計算機學術會議論文集(下冊)[C];2007年

2 王淼;尚學群;謝華博;李戰(zhàn)懷;;行常量差異共表達基因模式挖掘算法研究[A];第29屆中國數據庫學術會議論文集(B輯)(NDBC2012)[C];2012年

3 陸葉;王麗珍;陳紅梅;趙麗紅;;基于可能世界的不確定空間co-location模式挖掘研究[A];NDBC2010第27屆中國數據庫學術會議論文集(B輯)[C];2010年

4 呂靜;陳未如;劉俊;Osei Adjei;;并發(fā)分支模式挖掘[A];第二十一屆中國數據庫學術會議論文集(技術報告篇)[C];2004年

5 劉玉葆;蔡嘉榮;印鑒;黃志蘭;;基于最大訪問模式挖掘的數據庫異常行為檢測[A];第二十三屆中國數據庫學術會議論文集(研究報告篇)[C];2006年

6 胡偉成;曹三省;李丹;;一種基于QPop增量時域分割升維的媒體內容應用模式挖掘改進算法[A];第二十二屆中國數據庫學術會議論文集(技術報告篇)[C];2005年

7 薛丹;李德敏;裴仁林;;移動計算中基于PrefixSpan算法的用戶移動模式挖掘[A];第二十一屆中國數據庫學術會議論文集(技術報告篇)[C];2004年

8 王麗珍;陸葉;陳紅梅;肖清;;基于前綴樹結構的空間co-location模式挖掘算法研究[A];NDBC2010第27屆中國數據庫學術會議論文集(B輯)[C];2010年

9 宋國杰;馬帥;唐世渭;楊冬青;;基于模式挖掘的交通預測模型[A];第十九屆全國數據庫學術會議論文集(技術報告篇)[C];2002年

10 夏慶;馬元元;孫志揮;;路徑遍歷模式挖掘方法的改進[A];第十六屆全國數據庫學術會議論文集[C];1999年

相關重要報紙文章 前6條

1 東方通CEO 沈惠中;以PPP模式挖掘產業(yè)大數據金礦[N];中國電子報;2015年

2 記者 溫婷 編輯 全澤源;上海文交所總裁張?zhí)欤河脛?chuàng)新模式挖掘“文化的北大荒”[N];上海證券報;2010年

3 本報記者 姜旭 實習記者 侯偉;“互聯網+音樂”:創(chuàng)新模式挖掘商機[N];中國知識產權報;2015年

4 冉鳳林 本報記者 曾小清;線上線下融合 O2O模式挖掘消費潛力[N];四川日報;2015年

5 本報記者 于萍;園林上市公司試水PPP模式挖掘千億級市場[N];中國證券報;2015年

6 ;成功模式挖掘資源潛在價值[N];人民郵電;2006年

相關博士學位論文 前10條

1 楊曉飛;基于表觀遺傳數據的功能模式挖掘與分析[D];西安電子科技大學;2016年

2 錢烽;同位模式挖掘研究[D];浙江大學;2012年

3 Shafqat Ali Shad;移動用戶軌跡與行為模式挖掘方法研究[D];中國科學技術大學;2013年

4 覃桂敏;復雜網絡模式挖掘算法研究[D];西安電子科技大學;2012年

5 劉勇;圖模式挖掘技術的研究[D];哈爾濱工業(yè)大學;2010年

6 朱麗達;基因調控網絡的模式挖掘及其在藥物篩選中的應用[D];武漢大學;2014年

7 張峻銘;基于軌跡數據的移動對象聚集模式挖掘方法研究[D];北京郵電大學;2016年

8 董曉莉;時間序列數據挖掘相似性度量和周期模式挖掘研究[D];天津大學;2007年

9 王樂;數據流模式挖掘算法及應用研究[D];大連理工大學;2013年

10 沙朝鋒;基于信息論的數據挖掘算法[D];復旦大學;2008年

相關碩士學位論文 前10條

1 孫鴻艷;云環(huán)境下時空軌跡漸變移動簇模式挖掘算法研究[D];南京師范大學;2018年

2 呂夢瑤;基于知識圖譜的需求模式挖掘方法的研究[D];哈爾濱工業(yè)大學;2018年

3 魯潤澤;基于子圖同構和機器學習的設計模式挖掘方法研究[D];杭州電子科技大學;2018年

4 張萍;度量驅動的設計模式挖掘及基于模板的定制化重構[D];杭州電子科技大學;2018年

5 馬佳麗;基于時空數據的頻繁軌跡挖掘算法研究[D];西北大學;2018年

6 錢鑫;泛癌中驅動突變模式挖掘方法研究[D];湖南大學;2018年

7 劉暢;城市交通中聚集模式的挖掘方法研究[D];西南交通大學;2018年

8 于重生;基于時空規(guī)律的位置預測方法研究[D];山東大學;2018年

9 歐陽雙;基于高效用模式挖掘的微博文本突發(fā)話題檢測方法研究[D];武漢大學;2018年

10 陳京;移動云服務環(huán)境下的用戶異常行為檢測[D];河南科技大學;2017年



本文編號:2799900

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/zlx/2799900.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶07e6c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com