基于低秩變異字典和反投影組稀疏表示的腫瘤分類
發(fā)布時間:2021-12-10 17:56
惡性腫瘤是嚴(yán)重危害人類生命和健康的重大疾病,隨著生物信息技術(shù)的快速發(fā)展,利用微陣列基因表達(dá)數(shù)據(jù)在基因水平上研究腫瘤發(fā)生發(fā)展機(jī)理,有助于腫瘤診斷和個性化治療.稀疏表示和低秩分解是基于微陣列基因表達(dá)數(shù)據(jù)的腫瘤分類方法研究的重點方法.稀疏表示分類當(dāng)每類有足夠多的訓(xùn)練樣本時,能獲得理想的識別結(jié)果,隨著訓(xùn)練樣本的減少,分類效果受到較大的影響.基于反投影的偽全空間表示分類是一種改進(jìn)的稀疏表示分類方法,旨在挖掘現(xiàn)有的少量有標(biāo)簽的訓(xùn)練樣本和大量沒有標(biāo)簽的樣本之間的互補(bǔ)信息,成功用于人臉識別.然而,微陣列基因表達(dá)數(shù)據(jù)不具有這種互補(bǔ)性.低秩分解將數(shù)據(jù)分解為低秩部分和稀疏部分,并利用體現(xiàn)樣本間共同信息的低秩部分恢復(fù)原始樣本信息,然而,忽略了反映樣本間病變信息的稀疏部分對腫瘤分類的影響.基于此,本文主要做了如下研究工作:(1)構(gòu)造了兩種低秩變異字典.以一個全新的視角,通過探討正常人和患者的微陣列基因表達(dá)數(shù)據(jù)的變化來處理腫瘤分類問題,在此基礎(chǔ)上根據(jù)實際臨床需要構(gòu)建了一種元素固定的低秩變異字典和一種元素變化的低秩變異字典.(2)提出了一種反投影組稀疏表示分類模型.在充分利用少量訓(xùn)練樣本和大量現(xiàn)有樣本的基礎(chǔ)上,結(jié)合...
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
微陣列基因表達(dá)矩陣的獲取.
第二章 腫瘤基因的基本理論習(xí)器的性能作為特征子集的評價準(zhǔn)則, 也就是說, 包裹式的目的是器選擇最有利于其性能的特征子集. 常見的包裹式特征方法有: 拉 (Las Vegas Wrapper, LVW)、包裹式支持向量機(jī) (Wrapper SVM)等嵌入式. 將特征選擇與學(xué)習(xí)器訓(xùn)練過程融為一體的特征選擇方過程被嵌入到訓(xùn)練學(xué)習(xí)器的過程中. 例如: LASSO (Least ge and Selection Operator) 等.
的迭代向量0z 和0y 可取任意值. ADMM 算法理論逐漸趨于成域得到廣泛應(yīng)用.5 腫瘤分類的評價指標(biāo)瘤樣本的分類精度進(jìn)行評價時, 常采用統(tǒng)計學(xué)中的獨(dú)立檢驗交叉驗證[44](Cross Validation), 也稱作循環(huán)估計 (Rotation E計學(xué)上將數(shù)據(jù)樣本切割成較小子集的使用方法. 交叉驗證則進(jìn)行分組, 比如把數(shù)據(jù)分成 K 等份, 輪流將其中 K -1份當(dāng)做訓(xùn)為驗證集, 交叉驗證重復(fù)K 次, K 次結(jié)果的均值作為對算法精當(dāng)K 等于樣本個數(shù)時, 則退化為留一交叉驗證[45], 但是這種交比較長. 由于腫瘤樣本比較少, 為保證預(yù)測精度的可靠性, 本叉驗證方法, 能夠有效地避免過學(xué)習(xí)及欠學(xué)習(xí)狀態(tài)的發(fā)生, 因有說服性. 圖 2-7 展示了一個兩類數(shù)據(jù)集上的十折交叉驗證圖
【參考文獻(xiàn)】:
期刊論文
[1]Robust Face Recognition via Low-rank Sparse Representation-based Classification[J]. Hai-Shun Du,Qing-Pu Hu,Dian-Feng Qiao,Ioannis Pitas. International Journal of Automation and Computing. 2015(06)
[2]基于Gabor低秩恢復(fù)稀疏表示分類的人臉圖像識別方法[J]. 杜海順,張旭東,金勇,侯彥東. 電子學(xué)報. 2014(12)
[3]基于迭代Lasso的腫瘤分類信息基因選擇方法研究[J]. 張靖,胡學(xué)鋼,李培培,張玉紅. 模式識別與人工智能. 2014(01)
[4]腦膠質(zhì)瘤細(xì)胞、組織中PGAM1 mRNA、蛋白的表達(dá)變化及意義[J]. 劉志國,李連陵,王通. 山東醫(yī)藥. 2013(02)
[5]磷酸甘油酸變位酶1(PGAM1)在乳腺癌及癌旁正常組織中的表達(dá)及意義[J]. 王娟,陸彬彬,李娟,德偉,王科明. 現(xiàn)代腫瘤醫(yī)學(xué). 2011(11)
[6]基于聚類的腫瘤亞型發(fā)現(xiàn)模型[J]. 阮曉鋼,周淑娟. 控制工程. 2007(02)
博士論文
[1]基于基因表達(dá)數(shù)據(jù)的腫瘤分類算法研究[D]. 陸慧娟.中國礦業(yè)大學(xué) 2012
本文編號:3533116
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
微陣列基因表達(dá)矩陣的獲取.
第二章 腫瘤基因的基本理論習(xí)器的性能作為特征子集的評價準(zhǔn)則, 也就是說, 包裹式的目的是器選擇最有利于其性能的特征子集. 常見的包裹式特征方法有: 拉 (Las Vegas Wrapper, LVW)、包裹式支持向量機(jī) (Wrapper SVM)等嵌入式. 將特征選擇與學(xué)習(xí)器訓(xùn)練過程融為一體的特征選擇方過程被嵌入到訓(xùn)練學(xué)習(xí)器的過程中. 例如: LASSO (Least ge and Selection Operator) 等.
的迭代向量0z 和0y 可取任意值. ADMM 算法理論逐漸趨于成域得到廣泛應(yīng)用.5 腫瘤分類的評價指標(biāo)瘤樣本的分類精度進(jìn)行評價時, 常采用統(tǒng)計學(xué)中的獨(dú)立檢驗交叉驗證[44](Cross Validation), 也稱作循環(huán)估計 (Rotation E計學(xué)上將數(shù)據(jù)樣本切割成較小子集的使用方法. 交叉驗證則進(jìn)行分組, 比如把數(shù)據(jù)分成 K 等份, 輪流將其中 K -1份當(dāng)做訓(xùn)為驗證集, 交叉驗證重復(fù)K 次, K 次結(jié)果的均值作為對算法精當(dāng)K 等于樣本個數(shù)時, 則退化為留一交叉驗證[45], 但是這種交比較長. 由于腫瘤樣本比較少, 為保證預(yù)測精度的可靠性, 本叉驗證方法, 能夠有效地避免過學(xué)習(xí)及欠學(xué)習(xí)狀態(tài)的發(fā)生, 因有說服性. 圖 2-7 展示了一個兩類數(shù)據(jù)集上的十折交叉驗證圖
【參考文獻(xiàn)】:
期刊論文
[1]Robust Face Recognition via Low-rank Sparse Representation-based Classification[J]. Hai-Shun Du,Qing-Pu Hu,Dian-Feng Qiao,Ioannis Pitas. International Journal of Automation and Computing. 2015(06)
[2]基于Gabor低秩恢復(fù)稀疏表示分類的人臉圖像識別方法[J]. 杜海順,張旭東,金勇,侯彥東. 電子學(xué)報. 2014(12)
[3]基于迭代Lasso的腫瘤分類信息基因選擇方法研究[J]. 張靖,胡學(xué)鋼,李培培,張玉紅. 模式識別與人工智能. 2014(01)
[4]腦膠質(zhì)瘤細(xì)胞、組織中PGAM1 mRNA、蛋白的表達(dá)變化及意義[J]. 劉志國,李連陵,王通. 山東醫(yī)藥. 2013(02)
[5]磷酸甘油酸變位酶1(PGAM1)在乳腺癌及癌旁正常組織中的表達(dá)及意義[J]. 王娟,陸彬彬,李娟,德偉,王科明. 現(xiàn)代腫瘤醫(yī)學(xué). 2011(11)
[6]基于聚類的腫瘤亞型發(fā)現(xiàn)模型[J]. 阮曉鋼,周淑娟. 控制工程. 2007(02)
博士論文
[1]基于基因表達(dá)數(shù)據(jù)的腫瘤分類算法研究[D]. 陸慧娟.中國礦業(yè)大學(xué) 2012
本文編號:3533116
本文鏈接:http://sikaile.net/yixuelunwen/zlx/3533116.html
最近更新
教材專著