腫瘤基因表達譜的數據挖掘與識別分類
發(fā)布時間:2019-09-06 08:28
【摘要】:腫瘤種類繁多,其致病機理復雜,是危及人類身體健康的主要惡性疾病之一,盡早確診對患者的治療至關重要。基因芯片技術是功能基因組學的一個突破,它所產生的基因表達譜數據極大的推進了功能基因組學的發(fā)展;诨虮磉_譜的數據挖掘,可以讓我們更好地認識腫瘤,從分子生物學角度去探索其發(fā)生機理,對腫瘤診斷、治療以及新藥物的研制都具有積極的意義。由于基因表達譜數據具有維度高、樣本小、高冗余以及高噪聲等特點,本課題采用時頻分析工具從三個角度研究了腫瘤基因表達譜數據的特征提取。本課題提出了利用小波包變換對基因表達譜進行分解,進而提取相應各頻帶的樣本熵值構成特征向量。然后本課題針對基因表達譜數據的高噪聲特性,提出對腫瘤基因表達譜數據進行EMD分解,計算出相應各IMF與原始數據的相關系數,保留相關系數較大的IMF分量并重構數據,進而篩選獲得特征向量。此外,利用基因表達譜數據在分數階傅里葉變換最優(yōu)階次上的全局特性,篩選分數階傅里葉系數幅值的熵權較大的位置的分數階傅里葉系數作為特征向量。最后針對分別來自美國MIT大學和普林斯頓大學數據庫的急性白血病、結腸癌等基因表達譜數據集進行了仿真驗證,分類結果正確率都達到了90%以上。
【圖文】:
北京理工大學碩士學位論文的基因表情況。所謂基因表達就是 DNA 到 mRNA 再到蛋白的過程,其中基因表達水平常常通過該基因所轉錄的 mRNA 的數量來衡量。在基因芯片實驗中,,先選擇不同狀態(tài)的樣本,并將其分為實驗樣本和參考樣本。在其 mRNA 轉錄過程分別用紅、綠熒光基團進行標記并混合,再與微陣列的探針序列進行雜交等步驟獲得微陣列上每個點的紅光強度和綠光強度(Cy5 和 Cy3),那么基因在實驗樣本中的表達水平就是其比值。圖 1.1展示了基因芯片從制備到實驗獲取基因表達譜數據的全過程[21]。
從小波包庫中選擇能構成 2L R 空間的一個基函數系稱為 任意固定的 j 值, / 22 2 , , ,j jn n t t k j k Z n Z 均可構成個正交基與短時傅立葉基類似,稱為子帶基。一個正交小波來構造小波包時,那么與所選擇的小波所對應的,kg 分別是低通分解濾波器以及高通分解濾波器被 2 除后的重函數序列 ( 0,1,2,...)nW t n : 2 1202 2Nn k nkW t h W t k 2 12 102 2Nn k nkW t g W t k 0W t t是尺度函數; 1W t t是小波函數。包對信號的分解特性變換不僅對低頻部分進行分解,而且還對高頻部分進行分解方法。圖 3.1 為信號的小波包分解示意圖。
【學位授予單位】:北京理工大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP311.13;R730.2
【圖文】:
北京理工大學碩士學位論文的基因表情況。所謂基因表達就是 DNA 到 mRNA 再到蛋白的過程,其中基因表達水平常常通過該基因所轉錄的 mRNA 的數量來衡量。在基因芯片實驗中,,先選擇不同狀態(tài)的樣本,并將其分為實驗樣本和參考樣本。在其 mRNA 轉錄過程分別用紅、綠熒光基團進行標記并混合,再與微陣列的探針序列進行雜交等步驟獲得微陣列上每個點的紅光強度和綠光強度(Cy5 和 Cy3),那么基因在實驗樣本中的表達水平就是其比值。圖 1.1展示了基因芯片從制備到實驗獲取基因表達譜數據的全過程[21]。
從小波包庫中選擇能構成 2L R 空間的一個基函數系稱為 任意固定的 j 值, / 22 2 , , ,j jn n t t k j k Z n Z 均可構成個正交基與短時傅立葉基類似,稱為子帶基。一個正交小波來構造小波包時,那么與所選擇的小波所對應的,kg 分別是低通分解濾波器以及高通分解濾波器被 2 除后的重函數序列 ( 0,1,2,...)nW t n : 2 1202 2Nn k nkW t h W t k 2 12 102 2Nn k nkW t g W t k 0W t t是尺度函數; 1W t t是小波函數。包對信號的分解特性變換不僅對低頻部分進行分解,而且還對高頻部分進行分解方法。圖 3.1 為信號的小波包分解示意圖。
【學位授予單位】:北京理工大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP311.13;R730.2
【參考文獻】
相關期刊論文 前6條
1 應鳳祥,楊式升,張敏,李豫喜,周宏燕;激光掃描共聚焦顯微鏡研究儲層孔隙結構[J];沉積學報;2002年01期
2 李穎新,阮曉鋼;基于支持向量機的腫瘤分類特征基因選取[J];計算機研究與發(fā)展;2005年10期
3 龐廣昌,陶|
本文編號:2532509
本文鏈接:http://sikaile.net/yixuelunwen/zlx/2532509.html
最近更新
教材專著